研究团队开发 DIRFA：输入图片和音频，可生成说话视频

时间：2024-02-02 12:20:28

IT之家 11 年底 17 日第一时间，来自汶莱东南亚理工学院（NTU Singapore）的工程技术团队全都因开发出有了 DIRFA 用以，使用者给一张图片以及音讯内容，可以自动生成 3D 录像带，并实现口型和声音的并行协同。

DIRFA 的全都称为 DIverse yet Realistic Facial Animations，训练了超过 6000 多人的 100 万个录像带相片，音讯相片来自一个名为 VoxCeleb2 数据集的开源数据库，并关联手部表情和头部群众运动。

研究人员表示，DIRFA 可能会在都有医疗保健在内的各个行业和领域造就一新广泛应用，因为它可以实现更加复杂和逼真的虚拟私人秘书和聊天人，从而改善使用者体验。

DIRFA 还可以作为言语或手部智障人士的强大用以，借助他们通过富有美感的头像或位数表示来传达他们的想法和情感，从而增强他们的沟通能力。

IT之家写有篇文章参考地址：Rongliang Wu, Yingchen Yu, Fangneng Zhan, Jiahui Zhang, Xiaoqin Zhang, Shijian Lu. Audio-driven talking face generation with diverse yet realistic facial animations. Pattern Recognition, 2023; 144: 109865 DOI: 10.1016/j.patcog.2023.109865

眼睛干涩疼痛有什么办法可以缓解
扁桃体炎吃什么消炎药最好
阿莫西林治疗扁桃体炎效果好吗
柳氮磺吡啶治疗类风湿多久起效
常州iPhone售后服务中心

上一篇： “巨人”夫妻：张常宁193，吴冠希211，欧洲杯最高伴娘团世界纪录呀

下一篇：贵州女校长不法获利2.2亿，家中大量现金，：补课费被她私吞