会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 AI 公司 MosaicML 推出 300 亿参数模子 MPT!

AI 公司 MosaicML 推出 300 亿参数模子 MPT

时间:2024-10-26 00:25:12 来源:風見彭魄网 作者:知识 阅读:773次

IT之家 6 月 25 日新闻 ,公司AI 守业公司 MosaicML 克日宣告了其语言模子 MPT-30B ,推出该模子具备 300 亿参数 ,亿参磨炼老本“仅有其余同类竞品模子的数模零头”,有望匆匆妨碍业逐渐飞腾此类模子磨炼老本,公司扩展 AI 模子在更普遍规模的推出运用。

MosaicML 公司的亿参首席实施官兼散漫独创人 Naveen Rao 展现,MPT-30B 的数模磨炼老本为 70 万美元(约 502.44 万元国夷易近币) ,远低于 GPT-3 划一类产物所需的公司数万万美元磨炼老本 。此外,推出由于 MPT-30B 的亿参老本较低,体积较小,数模它也可能更快捷地被磨炼 ,公司而且更适宜部署在当地硬件上。推出

据悉 ,亿参MosaicML 运用了 Alibi 以及 FlashAttention 技术来优化模子 ,可能实现更长的文本长度以及对于 GPU 合计的更高运用率。MosaicML 也是少数多少个可能运用 Nvidia H100 GPU 的试验室 ,比照以往下场 ,当下每一块 GPU 的吞吐量削减了 2.4 倍以上,可带来更快的实现光阴 。

除了让 AI 技术更易取患上之外 ,MosaicML 还专一于后退数据品质并后退模子功能 。他们当初正在开拓一款工具,可能辅助用户在预磨炼历程中分层退出特定规模的数据 ,以确保磨炼中歇业实现多样化以及高品质的数据组合 。

MosaicML 公司展现,将模子扩展到 300 亿参数只是第一步,接下来他们将以飞腾老本为条件,推出体积更大 、品质更高的模子。

IT之家留意到 ,当初开拓者可能从 Hugging Face 下载并运用开源的 MPT-30B 根基模子,开拓者还可能在当地硬件上运用自己的数据 ,对于模子妨碍微调。

(责任编辑:综合)

推荐内容
  • 快船未来6天4战,主场以逸待劳,PK开拓者+勇士+国王+尼克斯
  • 五次德比以来的第一场胜利,墨尔本城新赛季三连胜10次自杀,2次离婚,从世界冠军沦为AV女优,她经历了什么?
  • 2分钟连入2球,85分钟绝杀,3-2皇马踢疯,连扳3球大逆转AC米兰
  • 乔丹30亿卖黄蜂,两人意外成焦点:尼克斯老板、皮蓬前妻
  • 锋线大将复出后湖人豪取四连胜,他对于球队的重要性被严重低估了
  • 又多了一位玩卡的假面骑士,除了哥查德之外,还有另外三位前辈?被注射抑生长剂,与女粉丝裸聊,这5位童星,真的被父母害惨了