用AI低成本制作自己的虚拟数字人?也行

虽然虚拟数字人的概念被广泛讨论,没有统一完整的定义,但大家公认的基本知识是数字虚拟人是由人工智能等技术驱动的。比如我们可以驱动一个图像中的一个人物或者图像,或者把它做成一个新的视频。那么,基于这样的基本认知,我们能做一个简单低成本的虚拟数字人吗?当然,那很好。

低成本的概念是防止虚拟引擎等专业引擎再造独立完整的个人形象,只使用基本的人工智能技术驱动一个形象中的人物说话。这样看来,就简单多了。而这种技术,别说现在,就连前阵子,都已经出来了,只是集成而已。

简单来说,就是和自己(角色)拍一张照片或者做一个形象,然后用AI驱动它,让角色说话。这个AI往往不是技术。图中的数字人要说话,就要先开口。你可以用wav2lip这样的AI程序来做这个。接下来就是,既然你说了,那这个“发言”呢,也就是语音内容怎么解,你自己录就可以了——哈哈,当然,机智嘉宾是开玩笑的。如果你自己拍,那就不是虚拟的数字人,而是真人。当然,这种语言的内容是需要综合的。而这需要另一个AI程序,语音合成。

这项技术是百度飞桨开源的。PaddlePaddle自己的语音项目,是开源的,可谓重拳出击。非常重,它允许我们的个人开发者调用他们训练的模型来做他们自己的语音合成和一些其他项目。机智的我在之前的文章里已经说过了,就不多说了。说到这个语音合成应用,这里暂时只有一个女声。用了就不能切换其他声部了。

其实关于低成本的虚拟数字人,可能关注人工智能的朋友也知道,百度推出了一个开源项目,就是利用这样的技术实现一个虚拟数字人的简单制作。其实这个实现过程和上面机智嘉宾描述的差不多。我之前做过一个人工智能版的刘德华相亲视频,类似于这样一个低成本的虚拟数字人。另一方面,PaddlePaddle上这个开源项目的要点在于,开源作者整合了百度PaddlePaddle的各种独立项目应用,做出了这样一个虚拟的数字人。

今年(农历新年)看到各个团队或者大厂推出自己的虚拟人怎么样?我觉得有点痒。你想成为一个属于自己的虚拟人吗?如果预算有限,成本有限,可以利用这种思路和相应的AI技术,制作自己的虚拟人。