首页> 原创文化 > 原创文化 > Character.AI突破性技术:实时AI角色视频互动

Character.AI突破性技术:实时AI角色视频互动

发布时间:2025-07-06 09:04:59作者来源: 15518196690

 7 月 5 日消息,AI 聊天机器人平台 Character.AI 发布研究论文和视频演示,展示了名为 TalkingMachines 的自回归扩散模型,让 AI 角色互动更加逼真。

该模型尚未部署在 Character.AI 平台上,根据研究论文和视频演示,用户只需要输入一张图片和声音信号,该模型就能实现类似 FaceTime 的通话视觉互动。

该模型基于 Diffusion Transformer(DiT)技术,本质上是一种能够从随机噪声中创建详细图像的“艺术家”,并不断优化图像直至完美。Character.AI 所做的就是让这一过程变得极其迅速,达到实时效果。

TalkingMachines 模型采用了流匹配扩散(Flow-Matched Diffusion)、音频驱动的交叉注意力(Audio-Driven Cross Attention)、稀疏因果注意力(Sparse Causal Attention)和不对称蒸馏(Asymmetric Distillation)等多种关键技术。

其中流匹配扩散技术通过训练大量动作,包括细微的面部表情和更夸张的手势,确保 AI 角色动作更加自然。音频驱动的交叉注意力技术则让 AI 不仅能听到单词,还能理解音频中的节奏、停顿和语调,并将其转化为精确的口型、点头和眨眼。

稀疏因果注意力技术让 Character.AI 能够以更高效的方式处理视频帧,而不对称蒸馏技术则让视频能够实时生成,营造出类似 FaceTime 通话的效果。

Character.AI 强调,这一研究突破不仅仅是关于面部动画的,它是朝向实时互动的音频视觉 AI 角色迈出的一步。该模型支真实感人类、动漫和 3D 虚拟形象等多种风格。

原创文化更多>>

盼了这么久!2026款铃木UY125终于带ABS来了 15980元起!无极SR250GT II代上市,油箱加大1升,发动机动力提升 小鹏MONA L03前瞻,后置后驱稳了吗,加3万换五连杆后悬架? 售 29.88 万 - 39.38 万元 2027 款丰田赛那正式上市 享界G9申报:比仰望U8还长的方盒子 本田终于开窍了!全面优化升级,补齐短板焕新而来,真的听劝了? 跑了一趟三百公里高速,星耀6的表现让我踏实了不少 造型魔改+轴距加长111mm,全新奥迪Q3L曝光,依旧双动力可选 纯电还是增程?2026款零跑C10全系配置解析与选买建议 手机里装风扇是噱头还是真有用?iQOO 15 Ultra散热深度拆解 vivo续航拉胯?改1个关键设置,实测多撑10小时 腾讯内测AI视频创作工具“TDream” 别天天按电源键锁屏!教你一秒息屏妙招,简单好上手还护机 周末带娃高速行,宝马X5后排腿能伸直,奔驰GLE空间差在哪? 传祺MPV双车焕新,发布“祺享计划” 国产豪华硬派越野车红旗G919申报:配2.0T增程动力 新款捷达GLI优缺点鲜明!到底适合什么样的购车人群选择? 东风奕派EP7申报图曝光:双电机+电动尾翼,中大型纯电轿车新选择 新能源车和传统燃油产品的博弈,降价多的是谁?七款新车均上市 外观小幅度调整,哈弗H6L Hi4申报图曝光,纯电续航115/160公里 荣威家越07工信部申报落地:上汽×字节联手,重新定义AI增程SUV 全球第一!比亚迪要定了,5年后1000万辆,王传福给丰田判了死缓 轴距加长111mm,全新奥迪曝光,9月上市 新款乐道L60上市,电池租用方式售13.58万起 全新奥迪Q3 L申报图曝光:轴距加长111mm/提供1.5T与2.0T动力 奔驰VLE 未来国产 搭载800伏架构 舒适又豪华 燃油车最后的荣光?速腾1月狂卖3.1万辆,十一万落地ACC太香了 华为系新车官宣,6月11日全网首拆 13.58 万起!新乐道L60把蔚来旗舰科技拉到实在价 WWDC26:Apple 推出新一代 Apple 智能、Siri AI