Учимся распознавать дипфейки на фото, видео, в голосовых сообщениях и видеозвонках в реальном времени.
В наши дни технологии создания поддельных видео- и голосовых сообщений стали доступны каждому, и мошенники активно осваивают технологии дипфейков. От угроз не застрахован никто — современные нейросети могут клонировать голос человека всего по трем-пяти секундам аудиозаписи и создавать убедительно выглядящие видео на основе пары фотографий.
Теперь давайте разберем, как злоумышленники создают и используют дипфейки в реальном времени, как распознать подделку без сложной экспертизы и защитить себя и близких от «атаки клонов».
В большинстве случаев в подобных сообщениях речь идет о какой-то форс-мажорной ситуации, в которой якобы оказалась жертва дипфейка. Разумеется, ей срочно требуются деньги, но, как назло, под рукой нет кошелька/банкомата/банковской карты, а связь настолько плоха, что онлайн-платежи тоже недоступны. Это дает мошенникам убедительную причину, по которой деньги нужно перевести не непосредственно жертве, а на какой-то «левый» счет, номер телефона или криптокошелек.
Чаще всего в подобных разводках используют заранее сгенерированные видео, но в последнее время стали доступны и сервисы для дипфейк-стриминга в реальном времени. С их помощью можно, например, подменить собственное лицо в чат-рулетке или во время видеозвонка.
Размытые или «плавающие» границы лица. Обратите внимание на височную линию: в дипфейках часто наблюдаются размытие, мерцание или неестественные цветовые переходы по линии роста волос. Эти артефакты возникают из-за несовершенства алгоритмов наложения лица клона на оригинал.
Неестественное моргание и «мертвые» глаза. Человек моргает в среднем от 10 до 20 раз в минуту. Сгенерированные же дипфейки моргают то слишком редко, то слишком часто. При этом движения век могут быть слишком резкими, а порой моргание рассинхронизируется, и один глаз не совпадает с другим. Также для дипфейков характерны «остекленевшие» глаза и «мертвый» взгляд с неподвижными зрачками. А иногда зрачок — как правило, один — может на мгновение повернуться в неожиданном направлении из-за галлюцинации нейросети.
При анализе статичного изображения, например фотографии, имеет смысл увеличить область глаз и сравнить отражения на радужках — в настоящих фото они будут идентичны, а вот у дипфейков зачастую отличаются.

Обратите внимание на отражения и блики в глазах на реальной фотографии (слева) и на сгенерированном изображении (справа) — у дипфейка они хоть и похожи, но отличаются для правого и левого глаза
Трудности с липсинком. Даже самые качественные дипфейки спотыкаются на точной синхронизации речи с движением губ. Невооруженным глазом заметна задержка уже в 100 миллисекунд. Часто можно наблюдать и неправильную форму губ при произношении звуков «м», «ф» или «т». Все это — признаки ИИ-моделированной внешности.
Статичный или размытый фон. В сгенерированных видео фон часто выглядит нереалистично: он может быть чрезмерно размытым, его элементы не взаимодействуют с персонажем, а порой картинка за спиной собеседника остается неподвижной даже при движении камеры.
Странная мимика. Дипфейки плохо имитируют сложные эмоции: выражение лица может не меняться при смене темы разговора, улыбка выглядит «застывшей», а мелкие морщинки и складки, появляющиеся у живых людей при проявлении эмоций, у подделок отсутствуют — лицо выглядит «ботоксным».
Монотонность и электронный тембр. Если собеседник звучит необычно ровно, без естественных колебаний интонации, или вы слышите слабый электронный призвук — высока вероятность, что вы общаетесь с дипфейком. Настоящая речь содержит множество вариаций тона и естественные несовершенства.
Отсутствие звуков дыхания. Люди делают микропаузы, вдыхают между фразами, особенно в длинных предложениях, а еще сопят, хрипят и откашливаются. Синтетические голоса часто упускают эти нюансы или расставляют их неестественно.
Роботизированная речь или внезапные обрывы. Голос может резко обрываться, слова звучат «склеенными», а ударения и интонирование нетипичны для речи вашего знакомого.
Шибболеты в речи. Обращайте внимание на отсутствие характерных особенностей речи — говора, употребления «местечковых» слов и выражений, присущих вашему собеседнику в реальной жизни, но плохо имитируемых дипфейком.
Чтобы скрыть визуальные и звуковые артефакты, мошенники часто имитируют плохую связь, присылая сильно зашумленное видео или звуковое сообщение. Низкое качество видеотрансляции или полученного медиафайла — первый «звоночек» о том, что собеседника на другом конце необходимо дополнительно проверить.
Невозможность повернуть голову. Во время видеозвонка попросите собеседника повернуть голову так, чтобы он смотрел полностью вбок. Большинство дипфейков создается на основе портретных фото и видео, поэтому при повороте в профиль изображение «поплывет», исказится или вообще развалится. Эксперты из стартапа Metaphysic.ai, создавшие широко завирусившиеся дипфейки Тома Круза, подтверждают: поворот головы — самый надежный тест на дипфейк сегодня.
Неестественные жесты. Попросите собеседника совершить какое-то спонтанное действие: помахать рукой перед лицом, почесать нос, отпить из чашки, закрыть глаза руками или показать что-то в комнате. Дипфейки плохо справляются с неожиданными быстрыми жестами: руки могут «проваливаться» сквозь предметы или лицо, пальцы — искажаться или двигаться неестественно.

Если попросить дипфейк-собеседника провести рукой перед лицом, то рука может «раствориться» в лице
Демонстрация экрана. Если разговор происходит в рабочем контексте, попросите включить демонстрацию экрана и показать что-то, связанное с вашими общими задачами. Без доступа к реальному устройству это будет практически невозможно сымитировать.
Неспособность ответить на каверзные вопросы. Спросите собеседника о том, что может знать только «оригинал» — например: «Какая у нас завтра встреча на работе?», «Откуда у меня этот шрам?», «Где мы были в отпуске два года назад?». Мошенник не сможет ответить на вопросы, если этой информации не было во взломанных чатах или открытых источниках.
Незнание кодового слова. Договоритесь с близкими о секретном слове или фразе, которые нужно назвать в экстренной ситуации, чтобы подтвердить личность. Если родственник в панике просит срочно перевести деньги, спокойно спросите у него семейный пароль. Настоящий родич легко назовет его, а мошенник с дипфейком — нет.
Источник
В наши дни технологии создания поддельных видео- и голосовых сообщений стали доступны каждому, и мошенники активно осваивают технологии дипфейков. От угроз не застрахован никто — современные нейросети могут клонировать голос человека всего по трем-пяти секундам аудиозаписи и создавать убедительно выглядящие видео на основе пары фотографий.
Теперь давайте разберем, как злоумышленники создают и используют дипфейки в реальном времени, как распознать подделку без сложной экспертизы и защитить себя и близких от «атаки клонов».
Как делают дипфейки
Исходный материал для дипфейков мошенники собирают из открытых источников — вебинаров, публичных видео в соцсетях и каналах, онлайн-выступлений. Иногда просто звонят по телефону и пытаются разговорить потенциальную жертву кражи идентичности, удерживая ее на связи как можно дольше, чтобы собрать данные для максимально качественной имитации голоса. А уж взломать мессенджер любителя голосовых и видеосообщений — это просто джекпот для мошенников. Получив доступ к видеозаписям и голосовым сообщениям, они генерируют убедительные подделки, которые 95% людей не могут отличить от настоящих сообщений своих близких и начальников.Инструментарий для создания дипфейков разнообразен — от простых ботов в Telegram до профессиональных генераторов вроде HeyGen и ElevenLabs. Мошенники используют дипфейки в связке с методами социальной инженерии — например, сначала имитируют звонки в мессенджере с постоянными «обрывами связи», а после присылают заранее сгенерированное видеосообщение с достаточно низким качеством видео, объясняя это плохой связью.
В большинстве случаев в подобных сообщениях речь идет о какой-то форс-мажорной ситуации, в которой якобы оказалась жертва дипфейка. Разумеется, ей срочно требуются деньги, но, как назло, под рукой нет кошелька/банкомата/банковской карты, а связь настолько плоха, что онлайн-платежи тоже недоступны. Это дает мошенникам убедительную причину, по которой деньги нужно перевести не непосредственно жертве, а на какой-то «левый» счет, номер телефона или криптокошелек.
Чаще всего в подобных разводках используют заранее сгенерированные видео, но в последнее время стали доступны и сервисы для дипфейк-стриминга в реальном времени. С их помощью можно, например, подменить собственное лицо в чат-рулетке или во время видеозвонка.
Как распознать дипфейк
Если на экране вы видите знакомое лицо, слышите родной голос, но обращаются к вам с нехарактерными просьбами, велика вероятность, что это дипфейк-мошенничество. К счастью, есть конкретные признаки — визуальные, звуковые и поведенческие — по которым можно распознать подделку, не будучи техническим специалистом.Визуальные признаки дипфейка
Проблемы с освещением и тенями. Дипфейки часто некорректно работают с физикой света: направление теней на лице может не совпадать с их направлением на фоне, блики на коже выглядят неестественно или отсутствуют вовсе. Или же собеседник на видео сидит вполоборота к окну, а на его лице — студийное освещение. Кстати, этот пример многим знаком по видеоконференциям — обычно замена фона в них выглядит максимально неестественно.Размытые или «плавающие» границы лица. Обратите внимание на височную линию: в дипфейках часто наблюдаются размытие, мерцание или неестественные цветовые переходы по линии роста волос. Эти артефакты возникают из-за несовершенства алгоритмов наложения лица клона на оригинал.
Неестественное моргание и «мертвые» глаза. Человек моргает в среднем от 10 до 20 раз в минуту. Сгенерированные же дипфейки моргают то слишком редко, то слишком часто. При этом движения век могут быть слишком резкими, а порой моргание рассинхронизируется, и один глаз не совпадает с другим. Также для дипфейков характерны «остекленевшие» глаза и «мертвый» взгляд с неподвижными зрачками. А иногда зрачок — как правило, один — может на мгновение повернуться в неожиданном направлении из-за галлюцинации нейросети.
При анализе статичного изображения, например фотографии, имеет смысл увеличить область глаз и сравнить отражения на радужках — в настоящих фото они будут идентичны, а вот у дипфейков зачастую отличаются.

Обратите внимание на отражения и блики в глазах на реальной фотографии (слева) и на сгенерированном изображении (справа) — у дипфейка они хоть и похожи, но отличаются для правого и левого глаза
Трудности с липсинком. Даже самые качественные дипфейки спотыкаются на точной синхронизации речи с движением губ. Невооруженным глазом заметна задержка уже в 100 миллисекунд. Часто можно наблюдать и неправильную форму губ при произношении звуков «м», «ф» или «т». Все это — признаки ИИ-моделированной внешности.
Статичный или размытый фон. В сгенерированных видео фон часто выглядит нереалистично: он может быть чрезмерно размытым, его элементы не взаимодействуют с персонажем, а порой картинка за спиной собеседника остается неподвижной даже при движении камеры.
Странная мимика. Дипфейки плохо имитируют сложные эмоции: выражение лица может не меняться при смене темы разговора, улыбка выглядит «застывшей», а мелкие морщинки и складки, появляющиеся у живых людей при проявлении эмоций, у подделок отсутствуют — лицо выглядит «ботоксным».
Звуковые признаки дипфейка
В ранних версиях ИИ-генераторов речь моделировалась из небольших однотонных фонем и при смене интонации можно было услышать «лесенку» в голосе — определить синтезированный голос не составляло труда. Сегодня же технология шагнула настолько далеко, что на «лесенку» больше ориентироваться нельзя, но есть и другие признаки, которые — пока что — еще свойственны сгенерированным голосам.Монотонность и электронный тембр. Если собеседник звучит необычно ровно, без естественных колебаний интонации, или вы слышите слабый электронный призвук — высока вероятность, что вы общаетесь с дипфейком. Настоящая речь содержит множество вариаций тона и естественные несовершенства.
Отсутствие звуков дыхания. Люди делают микропаузы, вдыхают между фразами, особенно в длинных предложениях, а еще сопят, хрипят и откашливаются. Синтетические голоса часто упускают эти нюансы или расставляют их неестественно.
Роботизированная речь или внезапные обрывы. Голос может резко обрываться, слова звучат «склеенными», а ударения и интонирование нетипичны для речи вашего знакомого.
Шибболеты в речи. Обращайте внимание на отсутствие характерных особенностей речи — говора, употребления «местечковых» слов и выражений, присущих вашему собеседнику в реальной жизни, но плохо имитируемых дипфейком.
Чтобы скрыть визуальные и звуковые артефакты, мошенники часто имитируют плохую связь, присылая сильно зашумленное видео или звуковое сообщение. Низкое качество видеотрансляции или полученного медиафайла — первый «звоночек» о том, что собеседника на другом конце необходимо дополнительно проверить.
Поведенческие признаки дипфейка
Анализ движений и нюансов поведения вашего собеседника остается, пожалуй, наиболее надежным способом распознать дипфейк в режиме реального времени.Невозможность повернуть голову. Во время видеозвонка попросите собеседника повернуть голову так, чтобы он смотрел полностью вбок. Большинство дипфейков создается на основе портретных фото и видео, поэтому при повороте в профиль изображение «поплывет», исказится или вообще развалится. Эксперты из стартапа Metaphysic.ai, создавшие широко завирусившиеся дипфейки Тома Круза, подтверждают: поворот головы — самый надежный тест на дипфейк сегодня.
Неестественные жесты. Попросите собеседника совершить какое-то спонтанное действие: помахать рукой перед лицом, почесать нос, отпить из чашки, закрыть глаза руками или показать что-то в комнате. Дипфейки плохо справляются с неожиданными быстрыми жестами: руки могут «проваливаться» сквозь предметы или лицо, пальцы — искажаться или двигаться неестественно.

Если попросить дипфейк-собеседника провести рукой перед лицом, то рука может «раствориться» в лице
Демонстрация экрана. Если разговор происходит в рабочем контексте, попросите включить демонстрацию экрана и показать что-то, связанное с вашими общими задачами. Без доступа к реальному устройству это будет практически невозможно сымитировать.
Неспособность ответить на каверзные вопросы. Спросите собеседника о том, что может знать только «оригинал» — например: «Какая у нас завтра встреча на работе?», «Откуда у меня этот шрам?», «Где мы были в отпуске два года назад?». Мошенник не сможет ответить на вопросы, если этой информации не было во взломанных чатах или открытых источниках.
Незнание кодового слова. Договоритесь с близкими о секретном слове или фразе, которые нужно назвать в экстренной ситуации, чтобы подтвердить личность. Если родственник в панике просит срочно перевести деньги, спокойно спросите у него семейный пароль. Настоящий родич легко назовет его, а мошенник с дипфейком — нет.
Что делать, если перед вами дипфейк
Если у вас есть хоть малейшие подозрения, что ваш собеседник не реальная личность, а дипфейк, воспользуйтесь нашими советами.- Прервите разговор и перезвоните. Самый надежный способ проверки — завершить видеозвонок и связаться с человеком по другому каналу: позвонить на его обычный номер телефона, написать в другом мессенджере или отправить SMS. Если собеседник слишком давит на вас, сымитируйте обрыв связи.
- Не торопитесь переводить деньги. Любимая манипуляция мошенников — создать ложное чувство срочности. «Мама, нужны деньги прямо сейчас, я попал в аварию»; «Нет времени объяснять»; «Если не переведешь в течение десяти минут — будет поздно, мне конец!». Реальный человек практически всегда может подождать несколько минут, пока вы перепроверите информацию.
- Предупредите о взломе. Если звонок или сообщение от якобы знакомого вам человека поступили с нового номера или незнакомого аккаунта, то в этом нет ничего необычного — злоумышленники часто создают поддельные профили или используют временные номера, и это еще один тревожный звоночек. Но если вы получили дипфейк-вызов от вашего контакта в мессенджере или адресной книге — срочно сообщите ему о взломе аккаунта через любой другой канал связи. Это поможет жертве принять меры, чтобы восстановить доступ к учетной записи (вот подробные инструкции для Telegram и WhatsApp) и минимизировать возможный урон знакомым — например, опубликовав сообщение о взломе.
Как уберечься от дипфейка с вашим лицом
- Ограничьте публичный доступ к вашим фото и видео. Закройте профили в соцсетях от посторонних, ограничьте список друзей реальными знакомыми, удалите видео с вашим голосом и лицом из открытого доступа.
- Не давайте доступ к камере и микрофону своего смартфона подозрительным программам. Мошенники могут собирать биометрические данные через фальшивые приложения, замаскированные под игры или утилиты. А чтобы такого софта у вас вообще не оказалось, используйте на своих устройствах проверенные решения комплексной защиты.
- Используйте ключи доступа, уникальные пароли и двухфакторную аутентификацию везде, где это возможно. Даже если мошенники создадут дипфейк с вашим лицом, при наличии второго фактора защиты им будет сложнее получить доступ к вашим аккаунтам и рассылать дипфейки от вашего имени. Здесь на помощь придет кросс-платформенный парольный менеджер с поддержкой ключей доступа (пасскеев) и 2FA-кодов.
- Обучите родственников распознавать дипфейки. Пожилые люди, дети и те, кто мало знаком с технологиями — самые уязвимые мишени. Расскажите им о схемах обмана, покажите примеры дипфейков и проведите тренировку с семейным кодовым словом.
- Используйте анализаторы контента. Хотя абсолютной защиты от дипфейков не существует, есть сервисы, способные распознать контент, сделанный с помощью ИИ, с высокой точностью. Для графики это Undetectable AI и Illuminarty, для видео — Deepware, для всех типов дипфейков — Sensity AI и Hive Moderation. В России бесплатный дипфейк-детектор для статических изображений запустила компания
- Сохраняйте трезвость мышления. Мошенники используют психологическое давление, страх и спешку, чтобы манипулировать вами. Запомните главное правило: если звонок, видео или голосовое сообщение от близкого человека вызывает у вас хоть малейшее сомнение — остановитесь или прервите разговор и свяжитесь по другому каналу связи.
Источник







