近日,中國人工智能學會發布2024年度“吳文俊人工智能科學技術獎”公告,京東科技人工智能團隊憑借“多模態交互式數字人關鍵技術及產業應用”項目榮獲中國智能科學技術最高獎——吳文俊人工智能科學技術獎的特等獎,也是本年度唯一的特等獎。
這是京東集團繼2021年“商品智能匹配關鍵技術及在營銷中的應用”和2022年“任務型智能對話交互關鍵技術及大規模產業應用”之后的又一次獲獎,再次展現了京東在AI技術研發與產業應用領域的持續領先性。
多模態交互式數字人技術集語音、語義、形象等多模態技術于一體,存在諸多的技術挑戰,一直是國內外研究的前沿技術領域。在本次獲獎項目中,京東科技人工智能團隊在以下三方面實現了技術突破:
提出了低成本、高保真人體建模技術,解決了人體建模成本高、觀感差難題
提出了語義一致多模態應答技術,解決了多模態語義難對齊、應答弱難題
提出了多模態自然化行為生成技術,解決了多樣化行為難協調、交互假難題
京東多模態交互式數字人能力持續位居國際領先水平,并在2024年率先開啟行業最大規模的商業化應用,截至目前,已服務9000+商家,累計為商家帶來銷售增量超140億。2024年4月,采銷東哥AI數字人實現了高逼真、高可靠、極低幻覺率的新水平。2024年京東618期間,包括格力總裁董明珠、潔麗雅總經理“毛巾少爺”石展承、名創優品CEO葉國富等21位總裁數字人空降京東直播間,與數千家品牌商,共同創造了史上一日并行規模最大的數字人直播事件。在京東11.11、年貨節等場景,數字人與個護美妝、家電家居、母嬰寵物等品牌產生化學反應,持續帶來千人千面的直播交互體驗。
近期,京東言犀數字人技術再度進化。京東科技人工智能團隊打造的數字人通用的基座大模型,通過語音合成大模型LiveTTS及通用數字人大模型LiveHuman,僅需輸入自然語言或1秒視頻/照片,即可生成4K超高清、100%口型匹配的數字人,徹底告別數字人制作對線下拍攝、建模與耗時訓練的依賴。
LiveTTS語音合成基座模型:基于20萬小時數據訓練的擴散模型,實現“零樣本”聲音合成與多語種情感化輸出,音色相似度較其它頭部廠商高出1.3倍、字符錯誤率(CER)降低最高5.12%;
LiveHuman數字人基座模型:創新性的人體過渡幀生成技術,解決多片段銜接卡頓難題,在遮擋、大角度、動態背景、多人直播等極端條件下仍有流暢表現。
這一系列突破將單個數字人生產成本從數萬元拉低至兩位數,較真人拍攝模式成本降幅超90%,標志著數字人從“專業工具”正式成為“普惠生產力”。這將為廣告素材批量生成、新媒體投放、個人IP打造等場景應用拆掉技術藩籬,走向工業級應用。
作為一家兼具實體企業基因和屬性、先進數字技術和能力的新型實體企業,京東20多年來持續深耕供應鏈,用人工智能等數智化技術全面連接和優化社會生產、流通、消費、服務等各個環節。從零售效率提升到產業生態構建,京東始終踐行“以實助實”的路徑。截至2024年底,京東體系在基礎科學和技術研發上已累計投入近1400億元,先后推動大語言模型、語音識別及合成、數字人等一系列人工智能共性關鍵技術建設,并廣泛應用于零售、物流、工業、健康、政務等產業場景,助力千行百業實數融合,實現高質量發展。
面向未來,數字人只是京東浩瀚技術創新版圖中的一小部分。京東正加速推動AI構建新質生產力,讓每個企業乃至個人都能更高效率、更低門檻擁抱AI。
原標題:京東斬獲中國AI最高獎項的唯一特等獎
版權與免責聲明:
凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。
本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。
鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:[email protected]。