“Deepfake”,AI 技术及其在各行业的应用

“Deepfake” เทคโนโลยี AI กับการนําไปใช้งานในหลากหลายวงการ

“Deepfake”,AI 技术及其在各行业的应用

在世界进入信息丰富的互联网时代后,人工智能 (AI) 聊天机器人突飞猛进地发展起来。AI 的另一个观看潜力是视频和音频的发展,它已经发展到可以创建 AI 现在可以创建模仿反对现实的人的行为或“深度伪造”(也称为数字人类、AI 化身和 AI 克隆)的视频。

这种技术的定义很简单,当 AI 模拟一个人的视频根据用户想要的提示采取行动或说某事时,而实际上该人实际上不必做这样的动作。

例如 “Bee the Ska” 晒出一段自己混成“Pimry Pie”面孔,通过 Wilson 的 Deepfake 技术直播卖东西的视频。该软件对 AI 的发展产生了数量惊人的积极反馈。

或者在商业领域。 SCBX 大众有限公司 使用生成式 AI 准备内容和视频,由公司向股东展示。它使用大型语言模型 (LLM) 来训练历史会议序列,然后指示 AI 为最后一次会议编写脚本。

此外,系统使用生成视频来教 AI 理解上届股东会的视频演示格式,然后系统创建最新经营成果声明的视频。

创建 Deepfake 的步骤

然而创建 deepfake 的方法有很多种,但最常见的是使用使用换脸技术的深度神经网络,或者简单地说,用户必须有一个“目标视频”作为 deepfake 的基础,然后编译出你想要插入到目标视频中的人的视频剪辑。

虽然目标视频可以是好莱坞电影中的剪辑或您想要将脸插入电影中的人的视频,也可以是从任何视频平台下载的随机剪辑。

稍后,每个程序中的 AI 将从许多可用的角度和条件预测一个人的外表。然后,系统将通过查找相同的特征并创建用户想要的 deepfake 视频,将该人与目标视频中的另一个人进行匹配。

此外,开发人员还尝试添加另一种类型的机器学习*,即生成对抗网络 (GAN)*,它可以仔细检测和改进深度伪造视频中出现的缺陷,使视频欺骗检测器更难破译。

虽然整个创建过程听起来很复杂,但目前的软件相当易于使用,目前的许多应用程序只需点击几下就可以创建 deepfakes,例如来自 China、Zao、DeepFace Lab、FakeApp、Face Swap、Heygen、D-ID、StableDiffusion 等的应用程序。 Deepfake-as-a-Service ของ 腾讯 更多的 deepfake 软件可以在开源开发者社区 GitHub 上找到。

Deepfake 技术的好处

1. 配音和翻译

Deepfake 技术还可用于使许多其他行业受益,例如,用户使用 Deepfake 技术制作大卫·贝克汉姆 (David Beckham) 的视频。为终结疟疾的运动大声疾呼 โครงการ “疟疾必须死 在视频中,贝克汉姆用 9 种语言说出广告活动剧本,其口型与所说的每种语言完美协调。

Beckham 的视频展示了使用 Deepfake 技术进行电影配音的潜力。演员的面部动作作可能会使他们看起来像是在说一句他们在现实生活中没有说过的句子。

更重要的是,这个概念可以通过使用 AI 来控制演员的多种语言的声音而不是通常的画外音来扩展,这将使它更有趣,因为人的声音是原创的。

重要的是,现在有管理语音的技术,例如,使用 AI 克隆人类语音的 Lyrebird AI。与 Deepfake 的技术相结合,结果是一个具有巨大潜力的“画外音工具”,具体取决于用户的首选语言。

2. 电影行业

传统的视频制作通常涉及创建真实场景的繁忙工作,这需要花费大量的材料。但是通过使用 Deepfake 技术进行视觉效果,电影制作人可以轻松创建虚拟场景和背景。该技术将帮助电影制作人改变背景并适应不同的剧本,而不会遇到交通挑战。人工或其他成本

此外,Deepfake 技术允许电影制作人与无法再重返电影的演员一起想象新的情况。例如,令人惊讶的外观。 卢克·天行者 在《曼达洛人》第二季的大结局中,导致粉丝群接连涌入。

重要的是,人工智能技术现在可以创造 好莱坞著名演员的克隆。 甚至通过一个人的原始存储,通过四个步骤:录音、录音和数字克隆,整齐地勾勒出一个人的数字克隆。使用像“Dorothy”这样的数字扫描工具,可以将原件与目标视频相结合,并创建成各种角色。

更重要的是,这款 360 度摄像头几乎可以捕捉到人们每一种姿势的面部图像,无论是微笑、张嘴、伸舌头还是来回翻白眼,以使 deepfake 视频尽可能虚拟,克隆人说的每一个字都会随着正确的口型而移动。

3. 思想领袖 (KOL)

Deepfake 技术的思想领袖非常有用,尤其是在根据开发人员设计的脚本进行直接沟通以及降低人员成本方面,他们可以全天 24 小时工作。

一个有趣的例子是 Deepfake 的技术。 小冰  这些深度伪造的 KOL 都通过降低公司的成本和通过没有机会像真人一样换工作或被收购的思想领袖建立品牌知名度,为提高商业部门的效率做出了贡献。

4. 教育

1963 年,约翰·肯尼迪总统正在前往美国达拉斯发表演讲的途中。毕竟,肯尼迪没有发表他准备的演讲。 然而,随着现代技术和人工智能的发展,我们今天可以听到肯尼迪的声明。 CereProc 团队分析了他的 831 份演讲录音,以“创造肯尼迪的声音”。

声音被分成 116,177 个声音单位,这非常具有挑战性,因为录制的声音是在不同时间在不同类型的设备上创建的。但最终,CereProc 能够使用 AI 完全创建 Kennedy 的逼真声音。

例如,开发人员可以创建历史人物的新视频来讲述他们自己的故事,例如,去年,伊利诺伊州立博物馆和大屠杀研究中心展示了 15 名大屠杀幸存者的旋转全息图。参观者有机会对幸存者的全息图提问。来自球形摄像机的原始视频,该摄像机记录了对幸存者的采访,每个采访都需要 5 天时间拍摄。

5. 商业

商业部门是 Deepfake 技术的最大受益者之一,一个显着的例子是在 SCBX 最近的股东大会上引入了生成式 AI。

但是,在商业领域使用 Deepfake 技术的例子仍然很多。 Heygen,一个 AI 头像创建平台 例如,使用 AI 虚拟形象报告业务成果,使用虚拟形象技术培训新员工,或制作视频向客户推销工作等。这种技术的优势在于,只需单击几下,即可一次为客户创建数百或数千个视频。

Candy.ai
Candy.ai

当今商业领域使用 AI 的一个例子是在一个日益孤立的社会中。因此,近年来,约会应用程序越来越受欢迎。当约会应用程序的概念与 Deepfake 技术相结合时,它诞生了。 Candy.ai  一个模拟头像的平台,用户可以像朋友或恋人一样与 AI 交谈。如果未来技术进一步发展,用户可能能够使用语音或通过视频通话与用户想要且更加虚拟的 AI 头像进行通话。

此外,通过教学或培训赚钱的企业可以拍摄 deepfake 视频并输入命令并创建教学视频,而无需在工作室自己录制视频。 “Chance the Rapper” 说唱歌手 谁来向观众传授深度人工智能的工作。

Deepfakes 的阴暗面

然而,尽管这项技术为许多行业和企业带来了好处,但另一方面,deepfake 技术也被用来制造很多麻烦。例如,欺诈者使用此类技术创建泰国股票专家的视频或音频克隆。其中之一是“Dr.

Niwet Mewachirawarakorn“,然后欺骗公众进行投资。

此外,近年来,许多欺诈者将深度伪造技术用于非法目的,包括未经他们同意制作色情内容,直到美国联邦调查局不得不在 2023 年 6 月发布公告,警告公众生成式人工智能的危险以及他们使用这些工具创建裸体内容。网络性勒索和骚扰

2017 年,一位名叫“Deepfakes”的 Reddit 用户创建了一个帐户,以传播使用名人面孔的色情内容。 根据 Deeptrace 的数据,2019 年在网上发现的 deepfake 视频中,色情内容占 96%。

此外,深度伪造还被用于非性犯罪活动,例如在 2023 年,涉及使用 deepfake 技术来: 模仿女士的孩子的声音来恐吓和勒索她。

该技术还用于政治。例如,在 2018 年,比利时的一个政党发布了美国前总统唐纳德·特朗普的视频。 在呼吁比利时退出巴黎气候协定的演讲中。 然而,特朗普从未发表过那次演讲,而且都是假的。

类似的事件发生在 用户创建国家领导人的视频。 就像巴拉克·奥巴马、唐纳德·特朗普、乔·拜登或弗拉基米尔·普京一样。以上几点让许多分析师相信,深度伪造技术将改变全球政治的格局,因为人们将不得不越来越多地质疑如何有所作为。他们看到或听到的图像和视频是真实的吗?

如何检测 Deepfakes

1. 视频细节看起来模糊不清?检测深度伪造的技术之一是寻找可能看起来比视频中的环境更模糊的皮肤、头发或面部,或者考虑看起来不自然柔软的皮肤。

2. 光线看起来不自然,对吧?从一开始,就解释说 deepfake 视频由两个或多个视频组成,因此每个视频中的灯光不会相同。因此,这种检查视频的方法就是寻找光线方向的异常。

3. 单词或声音与图片是否相符?音频可能与视频中人物的口型不匹配,尤其是在视频是欺骗性视频的情况下,并且发音通常不匹配。

4. 来源看起来可信吗?记者和研究人员经常使用的一种技术来确定图像的真实来源这可以通过在 Google Lenses 等网络上向后搜索图像以及检查谁发布了该图像来立即完成。在哪里发布,发布视频有意义吗?

然而,检测深度伪造视频的问题仍然是科技行业人士争论的问题,因为人工智能的发展不断发展到以下程度 华尔街日报记者 创建您自己的头像,并使用银行的语音生物识别系统进行测试,说出您的名字和姓氏,然后说出带有您的头像的记者电子邮件。毕竟,由 Deepfake 技术生成的语音也可以通过语音认证系统。

这个问题让很多分析师担心,如果未来人工智能系统能够创造出人的克隆体,并能通过人脸识别和语音识别来验证他们的身份,那么未来可能会成为诈骗者用来进行非法活动的工具。例如,通过视频或音频克隆欺骗或冒充名人,然后从无辜的人那里骗钱。

Deepfake 监管措施

为了防止人工智能技术进步可能造成的损害,中国政府去年颁布了规范深度伪造使用的法律,包括:必须获得模特的同意,不得利用视频传播假新闻,制作模拟视频前必须经过系统严格验证,制作方必须将视频明确水印为模拟视频,禁止制作违反国家安全法的视频内容。

泰国的案例 法律学者认为,可以使用《计算机犯罪法》。第 14 条和第 16 条规定,使用他人的照片,无论该图像是否创建、编辑或添加,也无论以任何方式创建、编辑或添加。如果转载并引起尴尬,将被处以 3 年以下的监禁和不超过 200,000 泰铢的罚款。

与此同时,欧盟 (EU) 是第一个颁布立法来规范 AI 使用的国家,这已经控制了对使用 deepfake 技术验证身份和代表真人进行交易的担忧。

欧盟的 AI ACT 法禁止六项主要禁令:生物识别分类系统、无目的地抓取面部图像、情绪识别、社交评分、旨在指导人类行为和限制自由的人工智能,以及用于利用一个人的缺陷和脆弱性的人工智能。

术语

  1. 深度神经网络 = 通过数据识别模仿人类学习的人工智能的学习特性。系统重复经过训练的数据集的模式来预测未来趋势。
  2. 机器学习 = 制造机器,即计算机或电子设备,能够通过使用大数据进行训练来自行学习信息。
  3. 生成对抗网络 (GAN) 是通过原始图像和深度学习相结合的机器学习大脑,然后创造出人工智能的学习和媒体创作一组新的照片、视频或歌曲。
伟大!接下来,完成结帐以获得对 The Insiderly AI 的完全访问权限。
欢迎回来!您已成功登录。
您已成功订阅 The Insiderly AI。
成功!您的帐户已完全激活,您现在可以访问所有内容。
成功!您的账单信息已更新。
您的账单未更新。