无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成 人色 网 站 欧美大片在线观看

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【技術(shù)分享】AI數(shù)字人實(shí)時(shí)互動(dòng)直播技術(shù):數(shù)字人口型驅(qū)動(dòng)(算法篇)

2023-05-18 19:46 作者:Siyuejiang  | 我要投稿

數(shù)字人口型驅(qū)動(dòng)

FACS根據(jù)面部肌肉群對(duì)面部動(dòng)作編碼

51個(gè)通道


音頻特征:MFCC、基于深度學(xué)習(xí)的表征方法etc,選擇deepspeech,音頻-文本工具/音頻抽取特征,音頻轉(zhuǎn)成音頻圖


面部口型驅(qū)動(dòng):音頻特征提取——切分音頻特征(階梯過(guò)濾器)——縮放后到vit——加一層MLP——加一層position embedding

用到19個(gè)通道

階梯過(guò)濾器;attention機(jī)制(關(guān)注靠后音頻);loss function





【技術(shù)分享】AI數(shù)字人實(shí)時(shí)互動(dòng)直播技術(shù):數(shù)字人口型驅(qū)動(dòng)(算法篇)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
海晏县| 乳山市| 闵行区| 宁夏| 五寨县| 安宁市| 航空| 托克逊县| 浦县| 蓬溪县| 卓资县| 宿州市| 昂仁县| 大城县| 青阳县| 萍乡市| 依安县| 秭归县| 郓城县| 通化市| 垣曲县| 饶阳县| 吉首市| 广东省| 岳西县| 穆棱市| 合川市| 上饶市| 闽清县| 潞城市| 丁青县| 罗田县| 汶上县| 宜黄县| 保靖县| 临高县| 遂川县| 临猗县| 土默特左旗| 恩施市| 郯城县|