Искусственный интеллект создаёт более половины всего нового интернет-контента. К такому выводу пришли аналитики технологической компании Graphite, изучив десятки тысяч статей. Рост доли машинных текстов резко ускорился после появления ChatGPT. Об этом сообщает Naked Science.
«Специалисты технологической компании Graphite проанализировали случайную выборку из 65 000 англоязычных статей, опубликованных с января 2020 по май 2025 года. Используя детектор ИИ Surfer, любая статья, где 50% или более текста было сгенерировано большой языковой моделью, считалась ИИ-контентом», — отмечается в сообщении.
После бума роста, когда доля ИИ-статей взлетела с 10% в конце 2022 года до более 40% в 2024-м, динамика вышла на плато. По данным на май 2025 года, 52% новых статей в интернете создаются искусственным интеллектом, что сменило кратковременное преимущество человеческих текстов в предыдущем месяце.
Эксперты отмечают, что реальная доля контента, написанного людьми, может быть выше. Исследование построено на данных Common Crawl, который многие сайты с платным доступом начали блокировать. Эти платные статьи, почти наверняка созданные авторами-людьми, не попали в анализ. Кроме того, ИИ-детекторы, включая использованный Surfer, иногда ошибаются, ложно помечая около 4% человеческих текстов как машинные.
Причины стабилизации доли ИИ-контента пока неясны. Одна из версий — издатели столкнулись с тем, что низкокачественный машинный текст плохо индексируется поисковиками. Например, в Google Search 86% статей созданы людьми. С другой стороны, всё больше авторов используют ИИ как инструмент помощи, что размывает границы и усложняет работу детекторов.
Ранее британские учёные выяснили, что люди в большинстве случаев больше не способны достоверно отличить синтезированный ИИ-голос от настоящего. Как сообщало «Жуковский.Life», убедительность голосовых подделок достигла такого уровня, что нет статистически значимой разницы в способности испытуемых распознавать реальные голоса и их дипфейковые клоны.
