每日快报!MosaicML发布大型语言模型 MPT-7B 可商用
时间:2023-05-11 12:16:35 来源:站长之家
(相关资料图)
站长之家(ChinaZ.com)5月11日 消息:MosaicML 的 MPT-7B 是一个具有近70亿个参数的大型语言模型,该团队在自己的近万亿个标记的数据集上对其进行了训练。
MosaicML 遵循 Meta 的LLaMA模型的训练方案。培训花费近200,000美元,使用 MosaicML 平台耗时9.5天。
MosaicML表示,MPT-7B 与 Meta 的70亿参数 LLaMA 模型的性能相匹配,使其成为第一个达到该水平的开源模型,领先于OpenLLaMA。与 Meta 的模型不同,MPT-7B 已获得商业使用许可。
除了“MPT-7B Base”模型,MosaicML 还发布了三个变体:MPT-7B-StoryWriter-65k+、MPT-7B-Instruct 和 MPT-7B-Chat。
借助 MPT-7B-StoryWriter-65k+,MosaicML 还发布了一个模型,该模型能够读取和写入上下文长度非常长的故事。为此,使用 books3数据集的子集对 MPT-7B 进行了微调,上下文长度为65,000个标记。OpenAI 最大的 GPT-4变体能够处理32,000个标记。
根据 MosiacML 的说法,该模型可以通过一些优化扩展到超过65,000个token,并且该团队已经在使用 Nvidia A100-80GB GPU 的单个节点上展示了多达84,000个token。但即使有65,000个token,也可以阅读整部小说并写一篇结语。
项目网址:https://github.com/mosaicml/llm-foundry
(举报)
标签:
最新文章推荐
- 陕西7名核酸检测阳性外省游客活动轨迹公布
- 万人说新疆 | 棉花朵朵赛白云,阿克苏美出新高度!
- 万人说新疆 | 孙芳红:我在新疆每天过得很充实也很快乐
- 万人说新疆 | 棉农阿卜来提开心地笑了
- 万人说新疆 | 阿迪力的棉花合作社年入300万
- 四川乐山犍为县发生4.3级地震 无人员伤亡
- 西安全面开展排查管控 目前20481人核酸检测结果均阴性
- 陕西7名核检阳性者为一旅行团同行人员 活动轨迹公布
- 西安交大举行2021级本科生迎新会 校长:学习是主动作为之事
- 【母亲河畔的中国】黄河岸边的这个村庄如何打好旅游服务牌?
X 关闭
资讯中心
2021-10-18
强冷空气继续影响中东部地区 局地降温14℃以上
2021-10-18
中东部多地将迎立秋后最冷周末 雨雪天气持续
2021-10-18
北京今天阵风7级天气晴冷 夜间最低气温直逼冰点
2021-10-18
X 关闭
热点资讯
-
1
每日快报!MosaicML发布大型语言模型 MPT-7B 可商用
-
2
美国返还2件重要文物_全球资讯
-
3
爱没有错演员表_爱没有错有哪些演员
-
4
环球快看点丨华为登顶!P60 Pro荣获DXOMARK第一,影像王者实至名归
-
5
世界热文:国家统计局:2023年4月份居民消费价格同比上涨0.1%
-
6
每日聚焦:【港股异动】中芯国际(00981.HK)涨3.15%
-
7
重磅!这类银行存款利率加点上限下调
-
8
美国“又一次”陷入债务危机 金融市场能否抵挡冲击
-
9
世界球精选!PNAS:科学家成功将siRNA疗法运输到肺部 有望治疗人类相关肺部疾病
-
10
全球热议:IPv6网络“高速公路”加快协同演进
-
11
产假休息有工资吗
-
12
【世界播资讯】三亚市气象台发布雷电黄色预警【Ⅲ级/较重】【2023-05-11】
-
13
世界热消息:无线网址注册证书_无线网址注册
-
14
【天天速看料】本赛季欧冠数据对比:迈尼昂扑救率84.2%,奥纳纳6次零封
-
15
焦点速讯:1999元起,质价比之王!真我11 Pro+发布会回顾!
-
16
在藏南墨脱,我们要建3个三峡大坝 天天热门
-
17
环球热推荐:国轩高科获大众汽车集团海外市场定点
-
18
天天播报:多公司定增终止 再融资步入买方市场值得肯定
-
19
每日精选:华钰矿业: 2023年营业收入14亿主要为自营产品业务收入,公司将根据经营需要,适时开展部分贸易业务
-
20
6000退保能拿回多少钱?退保是什么? 焦点要闻
