发布时间:2025-05-19 05:14:06 分类:公司动态 浏览:

来源:量子位 AI不过周末,硅谷也是如此。 大周日的,Llama家族上新,一群LIama 4就这么突然发布了。 这是Meta首个基于MoE架构模型系列,目前共有三个款: Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。 最后一个尚未推出,只是预告,但Meta已经毫不避讳地称前两者是“我们迄今为止最先进的型号,也是同类产品中最好的多模态型号”。 详细来看一些关键词—— Llama 4 Scout,16位专家的170亿激活参数的多模态模型,单个H100 GPU可运行, 同类SOTA,并拥有10M上下文窗口 Llama 4 Maverick,128位专家的170亿激活参数多模态模型,击败GPT-4o和Gemini 2.0 Flash,与DeepSeek-V3同等代码能力参数只要一半,主打与DeepSeek一样的性价比,单个H100主机即可运行。 Llama 4 Behemoth:2万亿参数的超大超强模型,以上二者都由这个模型蒸馏而来;目前还在训练中;多个基准测试超过GPT-4.5、Claude Sonnet 3.7和 Gemini 2.0 Pro。Meta官推激情表示,这些Llama 4模型标志着Llama生态系统新时代——原生多模态AI创新的开始。与此同时,大模型竞技场排名迎来一轮更新。 此次发布的Llama 4 Maverick,在困难提示、编码、数学、创意写作方面并列第一;得分1417,不仅大大超越了此前Meta自家的Llama-3-405B(提升了149分),还成为史上第4个突破1400分的模型;。 而且跑分明确——超越DeepSeek-V3,实现亮相即登顶,直接成为排名第一的开源模型。谷歌CEO劈柴哥第一时间发来贺电:中杯、大杯首批亮相 了解了Llama 4家族全体成员后,我们先来见识一下首批发布的2个模型: 两者均已能在Llama官网和抱抱脸上下载。我们抓取并提炼出这俩模型的一些特点: Meta首批MoE架构模型 这是Llama系列,第一批使用MoE(混合专家模型)构建的模型。 中杯Llama 4 Scout有17B激活参数,拥有16个专家模型。 大杯Llama 4 Maverick拥有17B激活参数,拥有128个专家模型。 至于还没和大家正式见面的超大杯Llama 4 Maverick,拥有288B激活参数,拥有16个专家模型。 非常长————的上下文 Llama 4系列,均具有很长的上下文窗口。 这一点主要体现在Meta公布的中杯Llama 4 Scout的详细数据里: 这个配置,让它在广泛的测评集上,比Gemma 3、Gemini 2.0 Flash-Lite和Mistral 3.1的结果更优秀。它在‘大海捞针’测试上的表现如下:结果如下:那么之前的Llama系列模型的上下文窗口情况呢? Meta官方博客中是这么写的: 原生多模态设计 Llama 4系列,开启了Llama的原生多模态时代。 而已经公开对外的中杯和大杯,被官方称为“轻量级原生多模态模型”。 给用户的体验就是,上传一张图片,可以直接在对话框中提问关于这张图片的各种问题。 不是我说,Llama终于长眼睛了!!!上面这张动图展示的仅仅是最基础的,“为难”程都升级也不怕。 比如喂它一张铺满工具的图片,问它哪些适合来干某个活。 它会很快地把适用的工具圈出来:要认颜色+认小鸟,也没在怕的:中杯和大杯都在官方介绍中被打上了“世界上同类产品中最好的多模态模型”的tag。 来看和Llama系列前作、Gemma 3、Mistral 3.1、Gemini 2.0 Flash-Lite的对比结果—— 可以看到,在各个测评集上的表现,Llama 4 Scout样样都是新SOTA。语言天赋Max 经过了预训练和微调的Llama 4,掌握全球12种语言,以此“方便全球开发者的部署”。比DeepSeek更狠的“AI模型拼多多” 一定要跟大家分享的一个细节,Meta这次在模型API价格方面,下狠手了! 先说结果: 系列超大杯Llama 4 Maverick,不仅超越了同类型号其它模型,价格还非常之美丽。更直观地来看这张表格,真的狠过DeepSeek——从性能到价格各个纬度。要知道,超大杯Llama 4 Behemoth属于是Llama 4系列的教师模型。 如果说中杯和大杯是轻量级选手,这位就是绝对的重磅玩家。 288B激活参数,16个专家模型。 最重要的是,它的总参数量高达2000B! 在数学、多语言和图像基准测试中,它提供了非推理模型的最先进性能。当“最牛”和“最便宜”摆在一起的时候,试问哪位开发者会不心动?(doge) 训练细节 用他们自己的话来说,Llama系列是进行了彻底的重新设计。目前第一组LIama 4系列模型,他们也公布了具体的训练细节。 预训练 他们首次使用混合专家MoE架构,在MoE架构中,单个token仅激活总参数的一小部分。MoE架构在训练和推理方面具有更高的计算效率,固定训练FLOP成本情况下质量更高。比如,Llama 4Maverick模型有17B个激活参数和400B个总参数。他们使用交替的密集层和混合专家(MoE)层来提高推理效率。 MoE层使用128位路由(Routed)专家和一位共享专家。每个令牌都会发送给共享专家以及128位路由(Routed)专家之一。 因此,虽然所有参数都存储在内存中,但在为这些模型提供服务时,只有总参数的子集被激活。 这通过降低模型服务成本和延迟来提高推理效率——Llama 4 Maverick 可以在单个H100 DGX主机上运行,以便于部署,也可以通过分布式推理实现最高效率。 他们早期融合,将文本和视觉token无缝集成到统一模型中。 他们开发了一种新的训练技术:MetaP,可以设置关键模型超参数,比如每层的学习率和初始化尺度。 结果发现,所选的超参数能在批量大小、模型宽度、深度和训练token的不同值之间很好地扩展和泛化—— Llama 4通过在200种语言(包括100多种语言,每种语言有超过10亿个词库)上进行预训练,实现了开源微调工作,多语言词库总量是Llama 3的10倍。 此外,他们使用FP8精度进行高效模型训练,同时不牺牲质量并确保模型 FLOPs的高利用率—在使用FP8和32K GPU 预训练 Llama 4 Behemoth模型时,结果他们实现了390TFLOPs/GPU。 用于训练的整体混合数据包括30多万亿个token,是Llama 3预训练混合物的两倍多,其中包括各种文本、图像和视频数据集。 在所谓的“中期训练”中继续训练模型,通过新的训练方法(包括使用专业数据集进行长上下文扩展)来提高模型的核心功能。 后训练 后训练阶段,他们提出一个课程策略,与单个模式专家模型相比,该策略不会牺牲性能。 在Llama 4中,采用了一种不同的方法来改造我们的后期训练管道: 轻量级监督微调(SFT)>在线强化学习(RL)>轻量级直接偏好优化 (DPO)。 一个关键的教训是,SFT和DPO可能会过度约束模型,限制在线强化学习阶段的探索,并导致精度降低,尤其是在推理、编码和数学领域。 为了解决这个问题,他们使用Llama模型作为评判标准,删除了50%以上被标记为简单的数据,并对剩余的较难数据集进行了轻量级SFT处理。 在随后的在线强化学习阶段,通过仔细选择较难的提示,我们实现了性能上的飞跃。 此外,他们还实施了一种连续的在线强化学习策略,即交替训练模型,然后利用模型不断过滤并只保留中等难度到较高难度的提示。事实证明,这种策略在计算量和准确性的权衡方面非常有利。 然后,他们采用轻量级DPO来处理与模型响应质量相关的拐角情况,从而有效地在模型的智能性和对话能力之间实现了良好的平衡。流水线架构和带有自适应数据过滤功能的连续在线RL策略,最后造就了现在的LIama 4。 总结来看,Llama 4架构的一项关键创新是使用交错注意力层,而无需位置嵌入。此外,他们还采用了注意力推理时间温度缩放来增强长度泛化。 这些他们称之为iRoPE架构,其中“i”代表 “交错 ”注意力层,突出了支持 “无限”上下文长度的长期目标,而 “RoPE ”指的是大多数层中采用的旋转位置嵌入。 Llama 4 Behemoth 最后,他们还透露了超大模型Llama 4 Behemoth一些蒸馏和训练细节。 我们开发了一种新颖的蒸馏损失函数,可通过训练动态加权软目标和硬目标。 预训练阶段,Llama 4 Behemoth的代码蒸馏功能可以摊销学生训练中使用的大部分训练数据计算蒸馏目标所需的资源密集型前向传递的计算成本。对于纳入学生训练的其他新数据,他们在Behemoth模型上运行前向传递,以创建蒸馏目标。 后训练阶段,为了最大限度地提高性能,他们删减了95%的SFT数据,而小型模型只需删减50%的数据,以实现对质量和效率的必要关注。 他们在进行轻量级SFT后,再进行大规模强化学习(RL),模型的推理和编码能力会有更显著的提高。 强化学习方法侧重于通过对策略模型进行pass@k分析来抽取高难度提示,并根据提示难度的增加精心设计训练课程。 此外还发现,在训练过程中动态过滤掉优势为零的提示语,并构建包含多种能力的混合提示语的训练批次,有助于提高数学、推理和编码的性能。最后,从各种系统指令中取样对于确保模型在推理和编码方面保持指令跟随能力并在各种任务中表现出色至关重要。 由于其规模空前,要为两万亿个参数模型扩展RL,还需要改造底层RL基础设施。 他们优化了MoE并行化的设计,从而加快了迭代速度;并开发了一个完全异步的在线RL训练框架,提高了灵活性。 现有的分布式训练框架会牺牲计算内存以将所有模型堆叠在内存中,相比之下,他们新基础架构能够将不同模型灵活分配到不同GPU上,并根据计算速度在多个模型之间平衡资源。 与前几代产品相比,这一创新使训练效率提高了约10倍。 One More Thing 要知道,由于昨天DeepSeek发了新论文,搞得奥特曼都坐不住了,赶紧出来发声: 但,谁知道半路又杀出个Llama 4?! 前有猛虎,后有豺狼,OpenAI你真的得加油了…… 网友调侃道,当奥特曼一睁眼,看到Llama 4来了,而且Llama 4的成本比GPT-4.5降低了3个数量级后—— 他的状态一定是酱婶儿的:以及相比Llama,现在可能神秘低调的DeepSeek,可能不知道什么时候突然就会推出DeepSeek R2和V4…同在杭州的通义千问也干劲十足,Llama也好GPT也好,基本成为平行参考了。 太平洋这头,已经开始落地应用和智能体了。 参考链接: [1]https://www.llama.com/ [2]https://ai.meta.com/blog/llama-4-multimodal-intelligence/ [3]https://x.com/AIatMeta/status/1908598456144531660 [4]https://x.com/lmarena_ai/status/1908601011989782976 [5]https://x.com/IOHK_Charles/status/1908635624036590070

LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半

缅甸驻华大使:缅甸人民深切感受到中国兄弟的胞波情谊

「活动」MageyydsyidingNb25

78.17MB
版本V01.4.84
下载污到湿的在线免费观看十八🈲~视频安装你想要的应用 更方便 更快捷 发现更多
喜欢 15%好评(96114人)
评论 61
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半截图0 LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半截图1 LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半截图2 LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半截图3 LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半截图4
详细信息
  • 软件大小: 07850.22480MB
  • 最后更新: 2025-05-19 05:14:06
  • 最新版本: V7.44723.5
  • 文件格式: apk
  • 应用分类:ios-Android 🍌视频下载官网
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 8.46884以上
应用介绍
一,成人久久18秘?m 免费网,🍌芒果视频星辰影院
二,原神甘雨安慰部cg?画在哪,青娱乐视觉盛宴大🍌
三,成人污污污视频网㊙站,中国外卖小鲜肉gary吴伟野外
四,🥒黄瓜视频污黄,色㊙黄短视频在线免费放㊙播
五,日韩无人区码卡二卡3卡2025,产㊙国成人片羞羞上映9992Tv
六,色㊙黄91网㊙站软件下载,爽?好舒服?快?想要91,🈚️限资源黄黄片
七,🔞🍌进去里❌❌❌17c视频
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V3.6.78
8❌8❌拔❌拔❌影视在线放㊙播
  • 黑人60厘米全进去

    好爽?好紧?老师别夹免费视频

    粉色视频在线观看导航

    76528.69MB
    107好评

    色㊙黄在线观看视频下载

  • 别昂~哈C

    国产浮力影院

    泡芙app下载汅网㊙站进入安卓u

    40877.64MB
    918201好评

    🌸花季传媒免费下载

  • 成人免费色㊙黄视频软件

    色老老selaoban

    🌿🌿操莓视频下载.c⭕m996

    13.69MB
    311好评

    混乱小镇B级公交

  • 维修工的真实调试教 中字ri本

    女舞蹈老师裸体❌开腿羞羞包臀裙

    黑人大几巴日范冰冰

    53.87MB
    273好评

    中原中也被❌娇喘流白色液体

  • 🥒黄瓜视频官方网㊙站

    雏田和鸣人打扑克

    日韩精品w??码中文字幕第一区

    71.46MB
    705好评

    狠狠🍌🍑套爱

  • 🍌视频在看

    绿巨人www视频网㊙站

    ri本的下水道

    83.55MB
    331好评

    性欧美❌❌潮喷老师

  • 橘里橘气大尺寸R18

    嗯~哼~太大了~要喷了~

    妺妺用🐻夹我的🍌网站在线观看

    23.84MB
    103好评

    污污污🌿🌿操莓视频色㊙黄

  • 色㊙黄视频www软件下载

    🌿🌿操莓视频在线免费观看下载

    🌿🌿操莓视频看片

    50.21MB
    923好评

    日本裸体裸乳🍑无码

  • 樱🍑套色㊙黄视频

    18禁成人🍆🍑🔞猛撞图片

    美女嘿嘿视频网㊙站在线观看大全

    83.24MB
    566好评

    竹菊传影视

  • 才三根手指头就疼了小东西

    俄罗斯砖码砖专区2025

    奴隷松下纱荣子在线观看

    83.16MB
    757好评

    哑剧猫 derpixon

  • 富二代色㊙黄视频在线免费看

    宝宝好久没c你了??视频动漫

    🍌视屏在线放㊙播

    16.97MB
    7675好评

    啊啊轻点好疼啊啊啊

  • 向日葵视频在线看污片

    国产无套精品一区二区

    🍆茄子黄片视频在线观看

    43.71MB
    769好评

    🍆茄子免费色㊙黄视频一级片

  • 91🍌视频下载APP

    岳故意装睡让我挺进去

    性福宝官网🌿🌿操莓视频入👅口

    65.11MB
    743好评

    免费➕无码➕国产优嘿在线观看

  • 全免费A级毛片免费看🥒黄瓜视频

    🌿🌿操莓视频APP污在线观看站长统计

    🥒黄瓜污污

    54.07MB
    757好评

    欧美d⭕dk

  • 久久蜜🍑套

    还是老外猛都站不稳了

    伊人一本东京免费

    57.51MB
    686好评

    芙宁娜裸体被❌涩涩

  • ri本PROXXON

    拨出来我是你小?小海视频

    ❌❌❌羞羞视频免费在线观看

    24.65MB
    355好评

    色污视频在线网㊙站

  • 污污污🌿🌿操莓视频在线

    🌿🌿操莓视频成人app 在线观看

    🌿🌿操莓视频在线观看免费网㊙站

    13.94MB
    312好评

    🍌视频在线下载观看

  • 暖暖欧美日韩新片

    在线观看色㊙黄短视频

    男的和女的一起怼怼怼的视频

    84.99MB
    218好评

    小🐤🐤戳进老师🍑里面

  • 污视频秋葵🥒黄瓜抖阴线上美女

    好难受宝宝就蹭一蹭好不好

    🥒黄瓜视频下载下载安

    45.68MB
    732好评

    22年没封直接可以进的

  • s货你是不是欠c了公交h

    好大?好长?好紧?爽乡村

    雏田被❌吸乳羞羞网站

    10.14MB
    187好评

    野🌸花香电视剧全集放㊙播完整版10

  • 未满18🔞岁 视频软件

    ai换脸宋雨琦自慰❌❌喷水好爽

    抖音av在线

    44.46MB
    364好评

    🍌视频在线一直看一直爽

  • 91🍆茄子成人网㊙站入👅口

    白嫖午夜成人网㊙站

    扒开❌狂揉❌喷水视频蘑菇

    91.56MB
    206好评

    新快猫全球成人网㊙站

  • 🍑套子视频成人版免费观看

    俄罗斯砖码砖专区2025

    午夜免费🌿🌿操莓视频

    30.24MB
    902好评

    这里色㊙黄视频最精彩

  • 🔞国产免费麻豆

    免费观看完整污视频网㊙站

    爱情岛论坛ya洲禁18

    30.68MB
    546好评

    免费羞羞视频在线免费

  • ?女6一12ww

    色色🍆茄子视频

    污污强奸激情视频网㊙站

    29.33MB
    124好评

    18🈲🍆🍑无套直AI

  • 没戴罩子被校霸c了一节课作文

    樱🍑套av

    绿巨人色㊙黄软件下载

    70.45MB
    450好评

    粉色视频黄app 入👅口

  • 91🍌视频大全色㊙黄av网址下载免费看app title="适合奖励自己的网站" class="0v5366j9r7414 app-list-img" src="https://t11.baidu.com/it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    国产真实农村乱对白精

    我的漂亮女房东完整版在线观看

  • 麻豆短视频在线观看入👅口学院时间よ止まれ1 4动画 title="校花主动脱👙让我🌿视频" class="0v5366j9r7414 app-list-img" src="https://t10.baidu.com/it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    猫咪最新地域网名3336PT3

    91❤精彩刺激对白

  • 艾斯慕斯女王踩踏丝袜国产又紧又黄又爽的视频 title="🍌视频 1下载" class="0v5366j9r7414 app-list-img" src="https://t12.baidu.com/it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    成人软件18㊙️免费网站

    扒开小舞❌狂揉❌难受粉红女郎

www成人🔞色情美女视频网站 类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
包含 饿了么 的应用集
评论
  • 国产真正的连毛都还没长 5天前
    中国情XXXXBBBB国产
  • 又粗又长又大毛片 3天前
    蘑菇视频吃瓜入👅口网页版
  • 国产➕刺激➕高潮➕刺激影视孕妇 9天前
    国产农村做受❌❌❌高
  • 色㊙黄app污 3天前
    🈚️颜之月1到5集免费观
  • 麻豆成人影视在线观看 2天前
    坐在胯上+蹭+h
  • 太久官方入👅口 2天前
    🍌视频啊啊啊啊
  • 爽?躁多水?快?深点the 0天前
    在线看麻豆
  • 深夜A级毛片视频免费🍌 4天前
    学生的妈妈6中韩双字多鱼1
  • 🍌APP在线观看 1天前
    搞色㊙黄污的视频
  • ri本孕交孕妇 0天前
    七个人把我当马桶