Meta推出Llama 3大模型在集成近25000块英伟达H100计算集群上训练_科技_资讯

4月19日消息，据外媒报道，meta公司在当地时间周四推出了他们最新一代大语言模型Llama 3的早期版本，并宣布推出基于这一模型打造的人工智能助手meta AI。

从外媒的报道来看，同前一代大模型Llama 2一样，meta新一代的Llama 3大模型，也注重供用户免费使用，目前已有两种不同参数版本的Llama 3可供用户使用，分别为80亿参数和700亿参数，均已可在meta官网下载。

对于Llama 3大语言模型，meta公司CEO马克•扎克伯格在接受采访时透露，他们在训练700亿参数的模型时，使用了15T tokens的数据，在训练过程中模型从未达到饱和状态，也就是从未在能力提升过程中遇到瓶颈，meta最终也解决了训练过程中遇到的问题，并转向训练其他的模型。

正如外媒在报道中所提到的一样，meta目前推出的还只是Llama 3的早期版本，他们还在训练更强大的模型。外媒在报道中就提到，meta已宣布他们目前正在训练有4000亿参数的Llama 3模型，部分专家认为他们的这一模型，在MMLU、GPQA、Humaneval、MATH等方面的表现，将与OpenAI的GPT-4 Turbo, Anthropic的Claude 3 Opus和谷歌的Gemini Ultra相当。

作为全球人工智能领域重要参与者的英伟达，在meta训练的Llama 3上也发挥了关键作用，提供了大量的GPU。

在meta宣布推出Llama 3之后不久，英伟达就在官网上披露，meta的工程师是在集成了24,576块H100 GPU的计算集群上训练的Llama 3，这些GPU通过英伟达的Quantum-2 InfiniBand网络连接。在英伟达的支持下，meta也为他们的旗舰模型调整了网络、软件和模型架构。（海蓝）

转载请注明出处。

• 和孟晚舟、宗馥莉齐名：贾玲入选年度商界木兰	• 全球首台甲醇汽车起重机成功运用：最大额定起重
• 25787辆理想汽车公布4月交付成绩单：坐稳新势	• iOS 17.5正式版本月推送：支持网页侧载App 玩法
• 超级充电宝！全球最大压缩空气储能电站并网发电	• 480GB QLC SSD魔改秒变120GB SLC！寿命延长30倍
• 不到24小时极速访华！马斯克的时间管理有多厉害	• 豆瓣7.9分！《庆余年》第一季精编版央八定档：5
• 红魔手机跳楼式降价：红魔8S Pro直降1500元	• 微软祭出多部3A大作为Xbox阵营加油打气

Meta推出Llama 3大模型 在集成近25000块英伟达H100计算集群上训练

Meta推出Llama 3大模型在集成近25000块英伟达H100计算集群上训练