7月22日消息,火山引擎正在封測新一代數(shù)字人平臺,名為“奇美拉”。一位互聯(lián)網(wǎng)公司研發(fā)人士表示,目前奇美拉數(shù)字人平臺的使用采用定向邀請模式,邀測階段暫不收費,月底或開始公測。據(jù)了解,奇美拉數(shù)字人平臺由字節(jié)跳動旗下智能創(chuàng)作數(shù)字人團隊打造,依托火山引擎的AI大模型等技術,可以提供數(shù)字人、圖片換裝、視頻翻譯等服務。服務正式上線后將會有具體的計費方式和收費標準,一般以使用次數(shù)或視頻生成時長計費。
圖源:火山引擎官網(wǎng)
作為字節(jié)跳動旗下的云與AI服務平臺,火山引擎近年來在數(shù)字人領域積極布局。公開資料顯示,2022年6月,火山引擎虛擬人數(shù)字平臺已獲得信通院首批數(shù)字人系統(tǒng)基礎能力認證。2023年4月,在春季火山引擎FORCE原動力大會上,火山引擎正式發(fā)布“善聽”、“會說”、“能想”的虛擬數(shù)字人產(chǎn)品,并推出了交互型數(shù)字人、播報型數(shù)字人和直播型數(shù)字人三大產(chǎn)品方案。2024年至今,火山引擎陸續(xù)推出AI數(shù)字人綜合解決方案,覆蓋金融、直播、營銷等場景。
今年2月,字節(jié)跳動研究團隊發(fā)布全新端到端多模態(tài)AI數(shù)字人模型OmniHuman,其能夠?qū)我徽掌D(zhuǎn)換為逼真的動態(tài)視頻,展示人物講話、歌唱及自然動作。
該模型采用基于DiT架構的多模態(tài)運動條件混合訓練策略,解決高質(zhì)量數(shù)據(jù)稀缺問題。這項技術的核心在于,它結合了文本、音頻和人體動作等多種輸入,通過一種稱為“全條件”訓練的創(chuàng)新方法,使得AI能夠從更大、更豐富的數(shù)據(jù)集中學習。通過與多個已存在的模型定量對比,OmniHuman算法在多項評估指標上展現(xiàn)出顯著優(yōu)勢。
圖源:火山引擎官網(wǎng)
本文鏈接:http://www.enbeike.cn/news-12-34643-0.html字節(jié)火山引擎將推出新一代數(shù)字人平臺“奇美拉”
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕