首页 > 事业单位招聘 > 事业单位招聘 > 微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把3.5淘汰了

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把3.5淘汰了

发布时间:2024-04-23 15:37:06来源: 15210273549

Llama 3发布刚几天,微软就出手截胡了?

 

刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。

 

其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B

为了方便开源社区使用,还特意设计成了与Llama系列兼容的结构。

 

微软这次打出“手机就能直接跑的小模型”的旗号,4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上跑到每秒12 token。

 

这意味着,现在手机上能本地运行的最佳开源模型,已经做到ChatGPT水平。

 

在技术报告中还玩了一把花活,让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。

 

除了mini杯之外,小杯中杯也一并发布:

Phi-3-small,7B参数,为支持多语言换用了tiktoken分词器,并额外增加10%多语种数据。

Phi-3-medium,14B参数,在更多数据上训练,多数测试中已超越GPT-3.5和Mixtral 8x7b MoE。

(大杯他们目前不打算做)

作者阵容一看也不简单,一眼扫过去MSRA和MSR雷蒙德团队都投入了不少人。

 

那么,Phi-3系列到底有什么独特之处呢?

根据技术报告中披露,其核心秘诀就在于数据

去年团队就发现,单纯堆砌参数量并不是提升模型性能的唯一路径。

反而是精心设计训练数据,尤其是利用大语言模型本身去生成合成数据,配合严格过滤的高质量数据,反而能让中小模型的能力大幅跃升。

也就是训练阶段只接触教科书级别的高质量数据,Textbooks are all you need

 

Phi-3也延续了这一思路,这次他们更是下了血本:

  • 投喂了多达3.3万亿token的训练数据(medium中杯是4.8万亿)
  • 大幅强化了数据的”教育水平”过滤
  • 更多样化的合成数据,涵盖逻辑推理、知识问答等多种技能
  • 独特的指令微调和RLHF训练,大幅提升对话和安全性

举个例子,比如某一天足球比赛的结果可能对于大模型是良好的训练数据,但微软团队删除了这些加强知识的数据,留下更多能提高模型推理能力的数据

这样一来,对比Llama-2系列,就可以用更小的参数获得更高的MMLU测试分数了。

事业单位招聘更多>>

解锁爆款密码,问界新M7、问界M9以智慧重塑豪华 2024轩辕年度盛典在京举办:以轩辕之名,推动新汽车向前进 日系车放大招,本田日产将合并,成全球第三大汽车制造集团 小米挖走特斯拉上海工厂负责人?小米高管回应 鸿蒙智行引领汽车新风尚,余承东央视揭秘“四界”背后的科技力量 2024年10月汽车智能网联洞察报告 汽车黑匣子EDR板块领涨,12月20日资金净流入超亿元! 回顾他发明“烧水汽车”,83升水跑3千公里后离奇死亡,真相是啥 消息称富士康已与日产接洽,寻求取得后者控股权 特斯拉上海工厂“元老”宋钢本周或将离职 汽车直播进入AI时代,经销商获客新利器揭秘 理想汽车概念股板块12月18日涨0.86%,中科创达领涨,主力资金净流入9883.68万元 智己汽车“换帅”贾健旭接任董事长 前11月销量增逾106%连续两月破万 年产3500亿,中国汽车芯片加速去美国化,比尔盖茨的预言即将成真 进口汽车销量连月下滑,购车观念转移至智慧座舱、辅助驾驶智能网联技术上 “新豪华”汽车是怎样炼成的?央视新闻《中国经济引力场》对话赛力斯张兴海 网友不听劝,非要买阿维塔07,华为宁德加持的SUV到底能不能买? 有懂车的吗?手握16万,深蓝L07和海豹07 DM该怎么选? 售9.28万起!配1.5T动力+181马力!吉利博越综合表现怎么样? 比亚迪海狮05 EV申报图曝光!轴距2720mm!属于纯电紧凑型SUV! 长安启源C798亮相!配1.5L插混/1.5T插混!轴距2905mm! 摆脱套娃!理想L7外观套件改装案例 特斯拉,理想,小米“变相优惠”,消费者挤爆展厅,排队买车! 加热/通风/按摩,2.0T四代混动!埃尔法同款配置,27万的MPV上市 12月冲销量,最高优惠5.7万,4家合资品牌购车优惠大盘点 15万左右的A级SUV怎么选?比亚迪元PLUS领衔,盘点4款A级SUV 9块9能买个车?这小方盒子实惠+实用,解析捷途自由者 “神车厂”再放大招,实用性暴增100%,五菱宏光MINIEV四门版发布 14万出头,颜值高,好开好玩,试驾领克Z20 年底最后一波热门车型全在这里!小米YU7领衔,17款新车大盘点