LOADING
单张肖像照片 + 语音音频 = 实时生成的超现实说话脸部视频,具有精确的唇音同步、逼真的面部行为和自然的头部运动。VASA-1是微软亚洲研究院开发的一种前沿人工智能技术,它能够将单一静态图像和一段语音音频转换成逼真的对话面部动画。这项技术通过精确的音频与唇部动作同步以及捕捉大量面部细微表情和自然头部动作,实现了生成具有丰富表情和动态面部表...