首页 实时讯息 常识

把数字人成本从数万元打到几十块,京东斩获这项唯一特等奖

0次浏览     发布时间:2025-03-20 07:57:00    

据公号“京东黑板报”3月19日消息,近日,中国人工智能学会发布2024年度“吴文俊人工智能科学技术奖”公告,京东科技人工智能团队凭借“多模态交互式数字人关键技术及产业应用”项目荣获中国智能科学技术最高奖——吴文俊人工智能科学技术奖的特等奖,也是本年度唯一的特等奖。

资料显示,在本次获奖项目中,京东科技人工智能团队在以下三方面实现了技术突破:

提出了低成本、高保真人体建模技术,解决了人体建模成本高、观感差难题

提出了语义一致多模态应答技术,解决了多模态语义难对齐、应答弱难题

提出了多模态自然化行为生成技术,解决了多样化行为难协调、交互假难题

近期,京东言犀数字人技术再度进化。京东科技人工智能团队打造的数字人通用的基座大模型,通过语音合成大模型LiveTTS及通用数字人大模型LiveHuman,仅需输入自然语言或1秒视频/照片,即可生成4K超高清、100%口型匹配的数字人,彻底告别数字人制作对线下拍摄、建模与耗时训练的依赖。

LiveTTS语音合成基座模型,可以基于20万小时数据训练的扩散模型,实现“零样本”声音合成与多语种情感化输出,音色相似度较其它头部厂商高出1.3倍、字符错误率(CER)降低最高5.12%;LiveHuman数字人基座模型有创新性的人体过渡帧生成技术,解决多片段衔接卡顿难题,在遮挡、大角度、动态背景、多人直播等极端条件下仍有流畅表现。

这一系列突破将单个数字人生产成本从数万元拉低至两位数,较真人拍摄模式成本降幅超90%,标志着数字人从“专业工具”正式成为“普惠生产力”。这将为广告素材批量生成、新媒体投放、个人IP打造等场景应用拆掉技术藩篱,走向工业级应用。

数字人直播引发关注 央广网报道截图

谈到AI数字人的产业应用,在2024世界人工智能大会上,京东云言犀负责人曾对我们表示,用户已经跨过了AI数字人直播的“恐怖谷效应”。一旦人们接受了这样的内容,那么AI数字人直播带来的好处就很多了:不只是解放人们的时间,可以实现一天24小时直播,它还可以实现多个数字人之间的互动,给用户带来更加丰富的呈现内容,其中很多形态还是真人不一定能做到,甚至做不到的。

数字人正在涌入电商等各类产业场景 2024年WAIC现场图

本文系观察者网独家稿件,未经授权,不得转载。

相关文章