注册
登录
看啥推荐读物
专栏名称:
夕小瑶科技说
这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货,有小夕的回忆与日常,还有最重要的:萌!气!
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
知乎回答RSS订阅方法
知乎专栏 RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
Kevin在纽约
·
「路透刚刚: ...
·
5 天前
法务之家
·
#大凉山血色彩礼30多万涉两条人命#最高法: ...
·
5 天前
最高人民检察院
·
最高检第一检察厅负责人就检察机关依法惩治工程 ...
·
5 天前
法信
·
苏无名察丧识盗【最高人民法院数字图书馆荐读: ...
·
1 周前
法信
·
令人心动的offer | ...
·
1 周前
今天看啥
›
专栏
›
夕小瑶科技说
斯坦福发布大模型Alpaca:A100上训3小时,性能比较GPT-3.5,被挤爆!
夕小瑶科技说
·
公众号
· · 2023-03-15 09:56
源|新智元Meta的LLaMA模型开源,让文本大模型迎来了Stable Diffustion时刻。今天,斯坦福发布了一个由LLaMA 7B微调的模型Alpaca,训练3小时,性能比肩GPT-3.5。一觉醒来,斯坦福大模型Alpaca(草泥马)火了。没错,Alpaca是由Meta的LLaMA 7B微调而来的全新模型,仅用了52k数据,性能约等于GPT-3.5。关键是训练成本奇低,不到600美元。具体花费如下:在8个80GB A100上训练了3个小时,不到100美元;生成数据使用OpenAI的API,500美元。斯坦福大学计算机科学副教授Percy Liang称,由于缺乏透明度/无法完全访问像GPT 3.5这样的有能力的指令模型,进而限制了这一重要领域的学术研究。我们在 Alpaca (LLaMA 7B + text-davinci-003)上迈出了一小步。看到又有人在自家大模型上取得了新的成果,Yann LeCun疯狂转发(宣传要到位)。3小时微调70亿参数,600美元搞定话不多说,先试用一波。问 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
分享到微博
推荐文章
Kevin在纽约
·
「路透刚刚: 美国宣布再制裁26家中企,黑名单扩充规模史上最大」-20240517183941
5 天前
法务之家
·
#大凉山血色彩礼30多万涉两条人命#最高法:再次重申!彩礼返还的3个原则+司法解释
5 天前
最高人民检察院
·
最高检第一检察厅负责人就检察机关依法惩治工程建设领域黑恶犯罪典型案例答记者问
5 天前
法信
·
苏无名察丧识盗【最高人民法院数字图书馆荐读:中国古代案例 ④】
1 周前
法信
·
令人心动的offer | 法信召唤你参与法律知识服务和大数据平台建设
1 周前
e棉仓
·
轮出周报|棉价出现大幅回调 纱线订单不及预期
2 年前
罗辑思维
·
今日特惠 | 这款“撑腰神器”有多好用,听听得到员工怎么说
2 年前
芥末堆
·
高职可以学修高铁、管陵墓、滑雪场运营了?教育部发文高职2020年新增9个专业
4 年前
新浪财经
·
300 ㎡豪宅只卖13万元?真有人买到了! 走进一看,懵了
5 年前
创业最前线
·
博士和局长上厕所,故事很短,意味深长
6 年前