Для распознавания дипфейков применяется анализ аудиодорожки при помощи детектора от MWS AI и анализ изображений и видео при помощи детектора от VisionLabs. В части звука используется специализированная модель: сначала она обучается на сырых записях человеческой речи, чтобы «понимать» естественные звуковые паттерны, а затем дообучается на синтетических записях, выявляя характерные признаки сгенерированного голоса.

Высокая точность распознавания видео, созданных современными ИИ-моделями, позволяет автоматически определять поддельные ролики до публикации, фильтровать ИИ-контент в медиа, социальных сетях и мессенджерах, предотвращать распространение видео с поддельными изображениями политиков и общественных деятелей, а также противодействовать попыткам массовых манипуляций, например, при создании фейковых видео катастроф и чрезвычайных происшествий, способных вызвать панику.

Точность распознавания по аудиодорожке составила 84% для видео, созданных моделью Veo 3, и 93% — для Sora 2. При анализе изображения точность детектора от VisionLabs достигла 93,9% для Veo 3 и 93,6% для Sora 2. В настоящий момент продолжается обучение алгоритмов для достижения целевой точности выше 98%, а также объединение технологий распознавания аудио, изображений и видео в единый детектор с общим интерфейсом.

Рано или поздно появляются новые типы синтеза, которые обходят существующие детекторы. С этой точки зрения наша основная задача — регулярно обновлять нейросети и делать это максимально быстро, поэтому мы сосредоточились на скорости дообучения алгоритмов. С моделями Veo 3 и Sora 2 мы смогли провести адаптацию всего за две недели — и именно это сейчас наше главное преимущество
Павел Воронин
Павел Воронин
Генеральный директор МТС Web Services

Одной из ключевых сложностей при работе с новейшими генеративными моделями является рост показателя False Rejection Rate (FRR) — числа ложных отклонений, когда система принимает реальный голос за синтезированный. Это может происходить при использовании инструментов для улучшения звука, таких как шумоподавление, компрессия или голосовые фильтры. По предварительным оценкам, FRR при анализе подобных записей может достигать от 4,5% до 7,2%, что требует дополнительной настройки алгоритмов.

В настоящее время MWS проводит тестирование нового детектора дипфейков с платформой для видеоконференций и онлайн-обучения МТС Линк, в сервисе МТС «Защитник», который предупреждает пользователей о разговоре с возможным мошенником, с одним из государственных сервисов в России, а также тремя банками в России и СНГ. 

О Vision-Language Models 

Veo 3 и Sora 2 относятся к классу VLM (Vision-Language Models) — мультимодальных моделей, объединяющих обработку видео и текста. Они умеют создавать полностью синтетические видеоролики с реалистичным изображением и звуком: модели одновременно генерируют картинку, речь, шумы и музыку так, чтобы все было синхронизировано. Эти системы обучены на огромных массивах реальных видеозаписей с аудио, благодаря чему «понимают», как должны совпадать движения губ и звук. При генерации также используются алгоритмы повышения качества кадров и точной передачи движений, что делает ролики почти неотличимыми от снятых на камеру. Новая технология синтеза речи позволяет одновременно генерировать два голоса, создавая реалистичные диалоги с естественными перебиваниями и наложениями реплик. Раньше подобного эффекта можно было добиться только с помощью отдельного монтажа, а теперь алгоритмы делают это «из коробки», приближая дипфейки к настоящему человеческому общению.

Поделиться

Похожие новости

  • МТС Web Services дополнила платформу MWS DevRails таск‑трекером со встроенными ИИ‑агентами
    Сервисы
    23 декабря 2025 г.
    МТС Web Services дополнила платформу MWS DevRails таск‑трекером со встроенными ИИ‑агентами
  • MWS Cloud запустил сервис по установке готовых серверов с GPU для работы с ИИ в периметре предприятий
    Сервисы
    5 декабря 2025 г.
    MWS Cloud запустил сервис по установке готовых серверов с GPU для работы с ИИ в периметре предприятий
  • МТС Web Services открыла бесплатный доступ к сервису для обмена асинхронными видео
    Сервисы
    4 декабря 2025 г.
    МТС Web Services открыла бесплатный доступ к сервису для обмена асинхронными видео
  • МТС Web Services открывает доступ к сверхбольшим китайским языковым моделям в сервисе MWS GPT
    Сервисы
    26 ноября 2025 г.
    МТС Web Services открывает доступ к сверхбольшим китайским языковым моделям в сервисе MWS GPT
  • В сервисе для командной работы MWS Tables появилась возможность оплаты через МТС PAY
    Сервисы
    31 октября 2025 г.
    В сервисе для командной работы MWS Tables появилась возможность оплаты через МТС PAY
  • МТС Web Services запускает решение для управления ПО и лицензиями MWS Softora
    Сервисы
    17 октября 2025 г.
    МТС Web Services запускает решение для управления ПО и лицензиями MWS Softora
  • Китайские открытые модели стали самыми популярными LLM у российских компаний
    Сервисы
    14 октября 2025 г.
    Китайские открытые модели стали самыми популярными LLM у российских компаний
  • MWS Cloud в 1,5 раза увеличила мощности GPU-облака для ИИ
    Сервисы
    1 сентября 2025 г.
    MWS Cloud в 1,5 раза увеличила мощности GPU-облака для ИИ
  • МТС Web Services запускает платформу полного цикла производства ПО с ИИ‑агентами
    Сервисы
    14 августа 2025 г.
    МТС Web Services запускает платформу полного цикла производства ПО с ИИ‑агентами
  • MWS Cloud запустила платформу для работы с LLM и моделями компьютерного зрения
    Сервисы
    12 августа 2025 г.
    MWS Cloud запустила платформу для работы с LLM и моделями компьютерного зрения

Напишите нам

Обсудим все детали и разработаем план действий по внедрению цифровых продуктов для вашего бизнеса

Ваше имя
name@yourcompany.com
+7 (999) 999-99-99
Компания
Москва