233乐园:Nvidia引入AI以从2D图像生成视频会议讲话头

Nvidia AI研究人员已经引入AI,可以从单个2D图像生成视频会议的讲话头。该团队表示,他们能够实现多种操作,从旋转和移动人的头部到运动传递和视频重建。 AI将视频中的第一帧用作2D照片,然后使...

Nvidia AI研究人员已经引入AI,可以从单个2D图像生成视频会议的讲话头。该团队表示,他们能够实现多种操作,从旋转和移动人的头部到运动传递和视频重建。

AI将视频中的第一帧用作2D照片,然后使用无监督学习方法来收集视频中的3D关键点。除了在使用基准数据集的测试中胜过其他方法外,AI还使用以前所需带宽的十分之一来实现H.264质量视频。

Nvidia研究科学家Ting-Chun Wang,Arun Mallya和Ming-Yu Liu周一发表了有关该模型的论文。结果显示,最新的AI模型优于vid2vid,后者是去年在NeurIPS上发表的一篇论文中详细介绍的GAN镜头,其中Wang是第一作者,Liu是其合著者。

Nvidia引入AI以从2D图像生成视频会议讲话头-第1张图片-创载好文

“仅通过修改关键点转换,我们就能生成自由观看的视频。通过仅传输关键点转换,我们可以获得比现有方法更好的压缩率。”“通过大幅减少带宽并确保更身临其境的体验,我们相信这是迈向视频会议未来的重要一步。”

该模型的发布是在Nvidia视频会议服务Maxine于10月首次亮相之后。除了提供Zoom一样的虚拟背景外,Maxine还提供了微妙的AI技术,例如面部对准和降噪功能,以及不太明显的功能,例如对话式AI头像或实时翻译。

针对Microsoft Teams和Zoom的视频通话还使用AI形式执行诸如模糊背景以及增强现实动画和特效等功能。在Salesforce以270亿美元收购Slack的前一天,发表了有关Nvidia AI版本的论文,这一消息可能会撼动企业通信领域,并加剧Microsoft Teams与Slack之间的争执。微软今天还对团队的通话体验进行了更新。

英伟达(Nvidia)是从事诸如ModelGan之类的生成对抗(GAN)模型的最著名公司之一,该模型能够模糊现实与假货之间的界线。这样的AI模型在娱乐和游戏中具有潜在的应用,但是在虚假信息和伪造帐户的创建中也具有潜在的应用。虽然是值得庆幸的是约deepfakes加快误传导致了在11月份美国总统大选的可能性广泛关注没有兑现,甘斯没有进入图片。今年秋天,俄罗斯国家演员使用了由GAN生成的伪造的头像作为通过创建由真正的俄罗斯作家担任职员的假新闻媒体来推动宣传的一部分。在2019年的一次事件中,使用AI生成的图像为凯蒂·琼斯(Katie Jones)制作了个人资料,凯蒂·琼斯是一个伪造的人,曾与华盛顿特区的政治人物和智囊团研究人员联系。

  • 发表于 2022-06-23 12:08:21
  • 阅读 ( 1 )
  • 分类:网络安全

0 条评论

请先 登录 后评论

相关文章

相关问题