Deepfake: безобидная игрушка или угроза безопасности?

Deepfake: безобидная игрушка или угроза безопасности?

Deepfake: безобидная игрушка или угроза безопасности?

Сегодня люди склонны доверять содержанию видео и аудио записей. Ведь это самое весомое доказательство чего бы то ни было, так ведь? Увы, уже не так. Оказывается лицо и голос любого человека можно воссоздать с высокой точностью! Называется сие светопреставление – deepfake – олицетворение текущей реальности. И нас с вами. В буквальном смысле.

Один из примеров мы оставим вот здесь.

Технология Deepfake существует всего несколько лет, но она уже превратилась в нечто захватывающее и тревожное. Термин «deepfake» или «глубокий обман» (что звучит как-то не по-русски) был придуман Reddit в 2017 году. Используется этот термин для описания воссоздания внешнего вида или голоса человека с помощью искусственного интеллекта (AI). Удивительно, но почти каждый может создать deepfake, используя самый убогий ПК, определенное ПО и несколько часов свободного времени.

 640x295xkirk-650x300.png.pagespeed.gp+jp+jw+pj+ws+js+rj+rp+rw+ri+cp+md.ic.TityG7ISD6.png

Угадали где настоящий? А вот и нет! Изображение слева - это deepfake...


Только помните: deepfake - это не CGI (изображения, сгенерированные компьютером). Deepfake создается AI для того, чтобы выдавать себя за человека. Парадоксально, для этого даже не требуется куча денег. Да почти никаких денег не надо. AI cделает работу невероятно простой, дешевой и убедительной.

Но давайте поконкретнее: как все-таки сделать Deepfake?

Сначала AI должен «научиться» выполнять поставленные перед ним задачи. Происходит это методом проб и ошибок или с применением грубой силы, в народе именуемым - машинным обучением. Например, искусственный интеллект, предназначенный для прохождения первого уровня Super Mario Bros., будет играть в игру снова и снова, пока не найдет лучший способ выиграть. Человек, проектирующий AI, должен предоставить вводные данные для начала работы, а также несколько «правил», на случай отклонения от сценария. Все остальное за AI.

Конечно же, воссоздание лица - не то же самое, что победа в видеоигре. Если нам нужно создать deepfake Дональда Трампа, который ведет шоу Ивана Урганта, то вот что нам потребуется:

·         Статичное видео

На данный момент deepfake лучше всего работает с четкими и «чистыми» видео. Вот почему самые убедительные подделки – политики. Есть множество записей, где разные политики неподвижно стоят или сидят и находятся под хорошим освещением. Итак, нам просто нужно видео, где Трамп сидит и разговаривает.

·         Несколько наборов данных

Чтобы движения рта и головы выглядели точными, нам нужен набор данных лица Дональда Трампа и Ивана Урганта. Если Трамп смотрит направо, нам нужна фотография Урганта, смотрящего направо. Если Трамп открывает рот, то нам нужна фотография Урганта, открывающего рот. В общем, логика очевидна.

После этого мы позволяем AI делать свою работу. Он снова и снова пытается создать deepfake, учась на собственных же ошибках. Офигенно, правда? Но таким видео никого не обманешь, поэтому давайте перейдем на следующий уровень.

Еще более убедительными (и потенциально опасными) подделками являются абсолютные подражания. Популярный deepfake Барака Обамы является хорошим примером (да, если кто не знает, это видео создано AI). Но можно и лучше. К примеру создать deepfake Марка Цукерберга, публично выступающего за разглашение конфиденциальной информации, собранной Facebook. Звучит же убедительно. Вот что нам нужно:

·         Статичное видео

Это может быть видео самого Цукерберга или актера, который похож на Цукерберга. Если наше видео предназначено для актера, мы просто приклеим лицо Цукерберга к актеру.

·         Фото

Нам нужны фотографии, на которых Цукерберг говорит, моргает и двигает головой. Если мы накладываем его лицо на актера, нам также понадобится набор фото с движениями лица актера.

·         Голос

Наш deepfake должен звучать как Цукерберг. Нет, не так. Он должен стать Цукербергом! Сделать это можно, записав подражателя или воссоздав голос Цукерберга с помощью AI. Чтобы воссоздать его голос, мы просто запускаем аудиосэмплы Марка через искусственный интеллект, к примеру Lyrebird. Затем пишем то, что мы хотим, чтобы он сказал.

·         AI с синхронизацией по губам

Поскольку мы добавляем в наше видео голос фальшивого Цукерберга, искуственный интеллект по синхронизации с губами должен убедиться, что движения лица нашего deepfake’а соответствуют тому, что говорится в аудио.

Вот, в принципе, и все. Мы вовсе не пытаемся преуменьшить работу и опыт, которые вкладываются в deepfake. Просто по сравнению с работой CGI за миллион долларов, которая вернула Одри Хепберн из мертвых, deepfake – это рисовать мелками на асфальте. Но даже самые грубые, самые очевидные подделки смогли нанести реальный вред.

Сегодня большинство deepfake только повторяют мем Николаса Кейджа, подделывают объявления государственных служб и имитируют порно с разными знаменитостями. Все это относительно безвредно и легко идентифицируемо, но в некоторых случаях подделки успешно используются для распространения дезинформации и для нанесения вреда жизни других людей.

В Индии индуистские националисты используют deepfake для дискредитации и подстрекательства к насилию в отношении женщин-журналистов. В 2018 году журналистка Рана Айюб стала жертвой такой кампании дезинформации, которая включала deepfake видео ее лица, наложенного на порнографическое видео. Это привело к различным формам преследования в Интернете и угрозам физической расправы.

Поскольку deepfake становятся все убедительнее, технология, несомненно, будет использоваться для все более сомнительных целей. Но есть вероятность, что мы ошибаемся. Эпоху Photoshop’а мы как-то пережили, справимся и с этим. Наверное.

Volmax Group

22 августа 2019


Возврат к списку