首页> 原创文化 > 原创文化 > 苹果发布DiffuCode-7B-cpGRPO编程AI模型:基于Qwen2.5-7B,可不按顺序生成代码

苹果发布DiffuCode-7B-cpGRPO编程AI模型:基于Qwen2.5-7B,可不按顺序生成代码

发布时间:2025-07-06 08:58:22作者来源: 15518196690

7 月 5 日消息,苹果公司悄然在 Hugging Face 上发布了一款名为 DiffuCode-7B-cpGRPO 的开源 AI 模型,该模型在生成代码方面具有创新特性,能够不按顺序生成代码,且性能媲美顶级开源编码模型。

传统大语言模型(LLM)生成代码的方式,如同大多数人类阅读文本的方式,采用从左到右、从上到下顺序。

这主要是因为这些 LLM 采用自回归(Autoregression)方式工作,意味着当用户向它们提问后,它们会处理整个问题,预测答案的第一个 token,然后带着这个 token 重新处理整个问题,预测第二个 token,以此类推。

LLM 还有一个名为“温度”(Temperature)的设置,用于控制输出的随机性。在预测下一个 token 后,模型会为所有可能的选项分配概率。较低的温度意味着更有可能选择最可能的 token,而较高的温度则给予模型更多的自由,选择不太可能的 token。

而另一种选择就是扩散(Diffusion)模型,这种模型通常用于图像模型。简而言之,模型从一个模糊、噪声的图像开始,迭代去除噪声,同时考虑到用户的需求,逐渐将其引导至更接近用户请求的图像。

苹果公司发布的模型名为 DiffuCode-7B-cpGRPO,它基于上月发表、名为《DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation》的论文。

论文描述了一个采用扩散优先策略的代码生成模型,但有一个特别之处:当采样温度从默认的 0.2 增加到 1.2 后,DiffuCoder 在生成 token 的顺序上变得更加灵活,从而摆脱了严格的从左到右的约束。

更为有趣的是,苹果的这款模型建立在阿里的开源 Qwen2.5-7B 模型上,将这个模型按照 DiffuCoder 论文中的描述,改造成了一个基于扩散的 decoder,然后调整它以更好地遵循指示。完成这些后,他们又用超过 20000 个精心挑选的编码示例训练了它的另一个版本。

在主流编程跑分中,DiffuCode-7B-cpGRPO 保持了在生成代码时不严格依赖从左到右的生成方式情况下,相比较主流基于扩散的编程模型,测试得分提高了 4.4%。

原创文化更多>>

盼了这么久!2026款铃木UY125终于带ABS来了 15980元起!无极SR250GT II代上市,油箱加大1升,发动机动力提升 小鹏MONA L03前瞻,后置后驱稳了吗,加3万换五连杆后悬架? 售 29.88 万 - 39.38 万元 2027 款丰田赛那正式上市 享界G9申报:比仰望U8还长的方盒子 本田终于开窍了!全面优化升级,补齐短板焕新而来,真的听劝了? 跑了一趟三百公里高速,星耀6的表现让我踏实了不少 造型魔改+轴距加长111mm,全新奥迪Q3L曝光,依旧双动力可选 纯电还是增程?2026款零跑C10全系配置解析与选买建议 手机里装风扇是噱头还是真有用?iQOO 15 Ultra散热深度拆解 vivo续航拉胯?改1个关键设置,实测多撑10小时 腾讯内测AI视频创作工具“TDream” 别天天按电源键锁屏!教你一秒息屏妙招,简单好上手还护机 周末带娃高速行,宝马X5后排腿能伸直,奔驰GLE空间差在哪? 传祺MPV双车焕新,发布“祺享计划” 国产豪华硬派越野车红旗G919申报:配2.0T增程动力 新款捷达GLI优缺点鲜明!到底适合什么样的购车人群选择? 东风奕派EP7申报图曝光:双电机+电动尾翼,中大型纯电轿车新选择 新能源车和传统燃油产品的博弈,降价多的是谁?七款新车均上市 外观小幅度调整,哈弗H6L Hi4申报图曝光,纯电续航115/160公里 荣威家越07工信部申报落地:上汽×字节联手,重新定义AI增程SUV 全球第一!比亚迪要定了,5年后1000万辆,王传福给丰田判了死缓 轴距加长111mm,全新奥迪曝光,9月上市 新款乐道L60上市,电池租用方式售13.58万起 全新奥迪Q3 L申报图曝光:轴距加长111mm/提供1.5T与2.0T动力 奔驰VLE 未来国产 搭载800伏架构 舒适又豪华 燃油车最后的荣光?速腾1月狂卖3.1万辆,十一万落地ACC太香了 华为系新车官宣,6月11日全网首拆 13.58 万起!新乐道L60把蔚来旗舰科技拉到实在价 WWDC26:Apple 推出新一代 Apple 智能、Siri AI