蓝冠代理招商

 


Deepfake 负面应用愈演愈烈。10 月,「一键脱衣」AI(DeepNude)盗用社群网路自拍照生成裸体刷爆社群网路,短短几天,致使 68 万女性受害。近日,再次有外媒爆出在 Reddit 社群中,一个名为 r / GeneratedPorn Subreddit 正在散播大量色情作品,而製作这些色情作品的正是造假软体──Deepfake。
 
这些虚假的色情作品已在 Twitter、Facebook、Reddit 多个社群网路,以及 XVideos、Pornhub 等色情网站上被疯狂传播。
 
不同于 DeepNude 利用社群网路中的私人照片,这次 Deepfake 造假软体利用的是现有的成人色情作品。创建者认为在原有色情作品上,利用 Deepfake 生成不存在的人脸进行二次创作可以避免法律上的惩罚和道德上的谴责。
 
但事实可能并非如此,目前 Reddit、XHamster 等多个网站已经将该软体封杀,并强调,
 
Reddit 网站政策禁止非自愿色情内容的分享和传播,包括 Deepfake 作品。
 
利用「成人影片」的 Deepfake
Deepfake 的深度造假能力到底有多强?它除了支援换头、换脸、对嘴型以及脱衣外,甚至还可以生成一张完全不存在的人脸,像下图这样,连头髮丝都显得逼真自然。
 
然而,正是这项原本被广泛用于影视业的逼真造假技术,被一名博士生用来创建了大量淫秽影片。
 
这款 Deepfake 造假软体被命名为 GeneratedPorn,简称 GP。GP 所利用的色情数据集全部来自于捷克的一家色情片製作公司──Czech Casting。
 
多年来,该公司拍摄了成千上万的女性影片,并託管在共享网站支援免费下载。影片中每个女性都被编号,并站在白色背景下进行 360° 无死角拍摄,甚至包括局部生殖器官的镜头特写。
 
这些高清、无死角的影片内容非常符合机器学习演算法的训练要求,GP 的创建者从中提取了 7,500 张图像,他说:
 
之所以选择该数据源是因为,生成对抗网路(GAN)需要学习生成对像类的图像结构,如果图像在结构上相似,则模型可以了解有关对象类的更精确细节,比如精确到脸上的酒窝或雀斑,这样可以获得更高品质的结果。
 
GAN 的全称为 Generative Adversarial Networks ,是一种深度学习模型,是近年来複杂分布上非监督学习最具前景的方法之一。该网路模型分为生成网路和判别网路模型,两个神经网路在相互博弈中,可以获得逼真的图像输出结果。
 
继 2016 年 GAN 首次被提出之后,NVIDIA 在此基础上研发出了 StleGAN,并在 2019 年升级为 StyleGAN2。如之前所说,StyleGAN2 在生成人脸,尤其是生存逼真且不存在的人脸方面已经达到最高性能,更重要的是,该模型已经在 GitHub 开源。
 
GP 创建者表示,它利用的就是开源的 StyleGAN2 模型,并用色情数据集加载到其中进行训练。这个过程与其他换脸 Deepfake 相似,但不同的是,GP 使用的不是一张人脸多种表情组成的数据集,而是多个数据集中提取的数据。
 
同时,他也强调虽然 GP 生成的色情内容非常逼真,肉眼甚至看不出任何破绽,但它生成的是不存在的人脸。蓝冠代理招商
 
遭多个平台封杀,创建者:我只是想炫耀一下
今年 9 月,这位博士生在 Reddit 上开设论坛,开始炫耀其用 GP 软体生成的色情作品。按照他的说法,在创建 GP 之初,已经曾考虑过道德层面的问题了。最后之所以选择现有色情作品做为训练数据集,部分原因也是出于道德层面的考虑。
 
这位博士生是一位电脑科学相关的学生,同时也是一位 AI 技术狂热爱好者。他说,
 
这一切的开始都是出于对技术的好奇和热爱,尤其是转向生成色情作品以后,这是一项非常酷的技术。
 
一开始,他计划製作一个 OnlyFans,提供定制化的 AI 裸体影片,但是这个想法遭到好友反对,因此,他将目标转向了色情公司的作品集。在他看来,利用成人色情作品,并切换成不存在的人脸图像,创建的色情图像可以避免道德上的谴责。
 
但事实可能并非如此,儘管是成人作品,但涉及到的女性并未给予授权,因此依然属于非法盗用。此外,其数据集所属公司 Czech Casting 正在面临刑事诉讼。
 
警方指控该公司透过贩卖人口和性侵来非法获取女性色情图像和影片,并勒令其向 22 名影片中的女性支付近 1,300 万美元的精神赔偿。同时,其创始人也正被联邦调查局(FBI)通缉。
 
而他对此并非不了解,因此,他解释了两点:
 
一是要透过演算法生成完整的裸露身体,需要更多真实且裸露的图像和影片,而 Czech Casting 的影片无疑是最佳资源。
二是有些女性是专门从事这项工作的,我无法透过图片判断其背后的故事,因此只能假设这些资源是可以利用的。
此外,虽然一再强调已经尽力在规避道德问题,但他还是在 XVideos、Pornhub、XHamster、Twitter、Facebook 多个网站上开通了个人帐号并分享其色情作品。
 
目前,多个社交平台已经将其帐号封禁。其中,XHamster 删除 GP 用户资料的同时也表示,
 
这些类型的内容确实属于灰色地带,我们需要与自己的机器学习团队以及 TOS 团队一起审查,以确定该如何评估和预防。
 
Deepfake 的正确使用方式为何
除了 GP,DeepNude 创建者也是出于对技术研究的热忱。
 
但无论是出于什麽原因,他们的做法确实滥用 AI 技术产生恶劣的影响。而且如果从技术的角度来讲,他们应该处理好数据隐私问题,包括数据集授权以及社群网路分享。
 
这一点可以借鑑 Facebook 的做法。
 
2019 年,Facebook 为应对社群网路中充斥的色情影片造假问题,发起了 Deepfake 挑战赛(Deepfakes Detection Challenge)。蓝冠代理招商
 
 
该挑战赛的所用数据集就包含了 10 万张色情演员的表演影片,供研究人员使用。但重点是,该数据集已付费并获得授权,同时技术测试内容也禁止任何社交平台分享。正如数据科学家乔杜里(Chowdhury)所说:「在未经授权的情况下使用资料库图像的 AI 是不道德的。」
 
但事实上,除了专业机构外,大部分利用 AI 生成的虚假影片均未获得授权,而且其中色情影片占比最高,达到了 96%。据了解,Facebook 託管在 Kaggle 的色情数据集也曾多次被盗取(Kaggle 是为开发商、数据科学家提供举办机器学习竞赛、託管资料库、编写和分享代码的专业平台)。
 
正因如此,Deepfake 逐渐沦为一个臭名昭著的造假软体。为遏制虚假内容的生成,Facebook 的努力已经初见成效(辨识准确率可达 82.56%),但想要完全关上潘朵拉的盒子,还需要更多企业、学界以及开发者的共同努力。