Ссылки для упрощенного доступа

Переводчик из Академии Генштаба запатентовал "генератор дипфейков"


Руслан Мавлеев, автор изобретения
Руслан Мавлеев, автор изобретения

Старший научный сотрудник Академии Генштаба, кандидат филологических наук Руслан Мавлеев зарегистрировал патент на компьютерную программу для "автоматической генерации фейков и дипфейков", обратила внимание "Система".

Судя по краткому резюме патента от 14 ноября 2024 года, программа может автоматически генерировать фальшивые видео по "интерактивно задаваемым сценариям" – пользователь якобы может задать программе сценарий дипфейка и определить аудио-, видео- и текстовый материал, на основе которого дипфейк должен быть сгенерирован. По замыслу автора, такой софт может применяться в составе "автоматизированных и информационных систем", используемых для "ведения информационного противоборства".

Дипфейками называют реалистичные подделки фото, видео или аудио. Для их генерации используются обученные модели нейросетей, которые весят сотни мегабайт или гигабайты. При этом программа Мавлеева написана на устаревшем языке Object Pascal и весит всего 1,5 мегабайта. Такой вес может соответствовать интерфейсу программы, но для полноценной генерации дипфейков его недостаточно. То есть программа либо не работает, либо неверно описана в патенте, подтвердили "Системе" два специалиста по нейросетям, пожелавшие остаться анонимными.

Кто такой Руслан Мавлеев

Старший лейтенант российской армии Мавлеев зарегистрировал в Роспатенте еще как минимум семь программ. Среди них – софт для "автоматизированного формирования и пополнения китайско-корейско-русско-татарского словаря" и "анализа естественно-языковых текстов на славянских и сино-тибетских языках". Все программы Мавлеева написаны на языке Object Pascal. Перед регистрацией каждую программу проверяют специалисты Роспатента, процесс обычно занимает несколько месяцев.

В 2019 году Мавлеев защитил кандидатскую диссертацию как сотрудник Военного университета Минобороны РФ по теме "Военно-политический дискурс: социально-коммуникативные, лингвокогнитивные и переводческие аспекты (на материале китайского и русского языков)".

Судя по фото в открытых источниках, он как минимум дважды ездил в командировки в составе российских военных делегаций. В 2014 году он участвовал в совместных военно-морских учениях России и Китая, которые прошли в Шанхае. В конце 2023-го его сфотографировали на мероприятии с иранской делегацией в "Русском доме в Сирии" (находится в Дамаске, принадлежит Россотрудничеству).

Мавлеев в Сирии
Мавлеев в Сирии

В одном из источников Мавлеев упомянут как старший научный сотрудник Научно-исследовательского института информационной безопасности Военной академии Генштаба (ВАГШ) ВС РФ. Этот НИИ создан в 2019 году, его сотрудники выполняют исследовательские работы и вырабатывают предложения по "совершенствованию системы информационной безопасности".

Мавлеев отказался отвечать на вопросы "Системы", сославшись на то, что он "непубличная личность".

Фейки и дипфейки в российской повестке

Российские официальные лица регулярно рассказывают об опасностях дипфейков. Владимир Путин еще в 2021 году отмечал, что "разработки по противодействию дипфейкам можно использовать на пользу людям". В сентябре 2024-го замглавы МИД Сергей Рябков заявлял о необходимости "торпедировать фейки, в том числе дипфейки".

Сама технология уже используется в "информационном противоборстве". В 2023 году "Система" рассказала, как в недрах Роскомнадзора обучали нейросети для распознавания "фейков о президенте" в соцсетях. В качестве обучающего материала использовались изображения Путина в виде краба, моли и вампира.

В мае 2024 года в сети появилось дипфейк-видео с участием представителя Госдепартамента США Мэттью Миллера. В ролике он якобы утверждает, что Белгород – "законная цель" для украинских ударов, поскольку в нем "не осталось мирных жителей". Видео распространилось по российским телеграм-каналам и государственным СМИ.

Разоблачить подделку оказалось несложно: губы "Миллера" двигаются с заметной рассинхронизацией, его галстук и рубашка меняют цвет прямо в кадре, а речь звучит рвано и неестественно.

XS
SM
MD
LG