三星的AI技术让蒙娜丽莎有其它的表情

位于莫斯科的三星AI中心最近发布了一篇研究报告,指称已创建一个AI系统,只利用少许甚至是单一照片就能让这些人具备其它的表情或说话,可创造玛丽莲梦露、爱因斯坦,甚至是蒙娜丽莎正在说话的视频。

近来的机器学习研究已可借由训练卷积神经网络来获得非常逼真的头部图像,为了创建可说话的个性化头部模型,必须利用该名人士的大量图片集进行训练,但在许多实际的场景中,人们只能取得一些,甚至是只有一张图像。

于是这群研究人员打造了一个AI系统,可替这些只有少数图像的人们创建可说话的头部模型。他们的作法是先在大量与其他人相关的视频上首席执行官期的元学习(meta-learning),再借由强大的生成器与鉴别器来替只有少数图像的人创建说话头部模型。

简单地说,他们关注并分析了大量视频中的人脸特征,再将这些特征套用到相近的新人脸上,让这些缺乏大量数据的人像也能开口说话或具备其它表情。

图片来源/三星

该报告作者之一的Egor Zakharov说明,元学习阶段的成果让生成器与鉴别器具备数千万种参数,使得只有数张图像的新人也能据此进行微调;也可自动挖掘数据集中与画像或人像照片特征相符的人们,再将相关的模型套用到原本静止的画像或照片中的人物上。

于是,现在大家可以看到照片中的玛丽莲梦露或爱因斯坦开口说话了,甚至是在画作中的蒙娜丽莎也有不同的表情了,而且研究人员在蒙娜丽莎身上套用了来自3个不同人的模型,创造出3位个性迥异的蒙娜丽莎。Zakharov表示,不管是在特征的调适上或让系统可更紧密地集成特征关注,都有待进一步的研究。