«Фальшивки» для ИИ: в России создали датасет для борьбы с мошенничеством

Фото сгенерировано Kandinsky 3.1
Набор MIDV-DM включает 8 тысяч поддельных удостоверений личности из России и других стран.

Российская ИИ-компания Smart Engines выпустила публичный датасет MIDV-DM с изображениями поддельных документов для разработчиков. Набор включает 8 тысяч образцов, сфальсифицированных самыми распространёнными способами, сообщили CNews. Цель — помочь создавать более точные системы обнаружения мошенничества.

Датасет MIDV-DM стал первым в мире публичным набором данных, который систематизировал все основные методы подделки. За основу взяли 1 тысячу изображений реальных документов из ранее опубликованной выборки MIDV-2020: российские паспорта, а также удостоверения Азербайджана, Латвии, Эстонии, Финляндии и других стран. Специалисты воспроизвели манипуляции, популярные у мошенников: вставку текста или фото из другого документа, маскировку полей, склеивание разных фрагментов и добавление посторонних эмблем или голограмм.

«При создании MIDV-DM мы сознательно вышли за рамки сценариев с текстовыми манипуляциями, детекция которых уже не является проблемой для современных систем. В датасет вошли подделки с изменением подписи, фотографии держателя и отдельных полей документа — то есть полный спектр типичных атак, с которыми на практике сталкиваются банки, МФО и госструктуры. Это позволит ИИ-системам учиться с повышенной точностью видеть не только заменённые ФИО, но и сложные структурные несоответствия в документе», — отметил Владимир Арлазаров, генеральный директор Smart Engines, доктор технических наук.

Разработка особенно актуальна на фоне роста числа преступлений с фальшивыми документами. По данным совместного исследования Smart Engines и юридической фирмы Intellect, в 2024 году в России количество уголовных дел по статье о подделке документов (ст. 327 УК РФ) выросло на 34%, достигнув 3,9 тысячи. В дальнейшем с помощью нового датасета Smart Engines планирует развивать собственную антифрод-систему «Шерлок 2о». Эта мультимодальная ИИ-модель проверяет документы по 600 параметрам, анализируя изображения из оптического, ультрафиолетового и инфракрасного спектров, текстовые поля, данные NFC-чипа и другую информацию.

Рост мошенничества с поддельными документами заставляет технологические компании искать новые способы защиты. Как ранее сообщал «Жуковский.Life», корпорация Microsoft будет массово внедрять в Windows 11 автономных ИИ-агентов, способных выполнять задачи за пользователя. Это решение принято, несмотря на внутренние предупреждения о рисках «галлюцинаций» алгоритмов и создании новых векторов для кибератак. По замыслу Microsoft, пользователи смогут заменять клики мыши и нажатия клавиш командами на естественном языке с помощью помощника Copilot.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Рейтинг
( Пока оценок нет )
Ксения Семашко/ автор статьи
Загрузка ...
Жуковский Life

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: