Популярная модель искусственного интеллекта от французского стартапа Mistral и другие ИИ-модели с открытым исходным кодом в наибольшей степени подвержены влиянию российской дезинформации, выяснили исследователи Института эстонского языка. Эти модели, чей программный код и архитектура находятся в публичном доступе, хуже всего справляются с выявлением ложных утверждений, распространяемых Россией с целью манипулировать международным общественным мнением, пишет Financial Times, ознакомившаяся с результатами исследования.
Даже самая передовая система Mistral занимает лишь 47-е место из 60 исследованных моделей генеративного ИИ, а все четыре ее версии набрали менее 40% по эффективности выявления источников, идентифицированных как «вредоносная» российская пропаганда. Закрытые, или коммерческие системы, такие как ChatGPT, Claude от Anthropic, Grok от xAI Илона Маска и даже некоторые версии китайских систем делают это лучше.
Хотя открытые модели считаются более конфиденциальными, так как их можно скачивать и запускать локально на собственном устройстве, по сравнению с коммерческими они оказались более опасными с точки зрения подверженности пропаганде, заявил директор института Арви Таваст. В этом смысле коммерческие модели, «похоже, безопаснее и устойчивее, чем открытые», сказал он: «Мы ожидали, что Mistral покажет лучшие результаты, но этого не произошло. Он уступил китайским моделям».
Открытая генеративная модель (open-source) – это нейросеть, обученная на больших массивах данных, чьи весовые коэффициенты и архитектура находятся в открытом доступе. Любой желающий может ее модифицировать, но также скачать и запустить на собственных серверах или компьютерах, обеспечив тем самым полный контроль и конфиденциальность. Модель можно отключить от интернета, доработать по собственному желанию, за нее не нужно платить.
Закрытые модели представляют собой «черный ящик»: разработчики не раскрывают их данные, доступ предоставляется только через веб-интерфейс или API (программный интерфейс). Общий доступ к самой модели и невозможность пользоваться ею автономно порождают сомнения в конфиденциальности. За более продвинутые модели нужно платить (коммерческая составляющая).
В ходе исследования специалисты Института эстонского языка задавали ИИ-моделям 75 вопросов на английском, русском и эстонском языках, чтобы выяснить, насколько они способны выявлять предвзятость. Также задавались «вредоносные» вопросы с целью манипулировать моделью и заставить ее генерировать результаты, поддерживающие пропаганду или основанные на дезинформации.
Основанная в 2023 году Mistral считается одним из самых многообещающих европейских игроков на рынке ИИ, где доминируют американские и китайские компании. Ее возглавляют три бывших специалиста из Meta и Google, в сентябре 2025 года компания привлекла 1,3 млрд евро от нидерландского производителя оборудования для микросхем ASML.
Mistral заявила, что «очень серьезно относится к борьбе с дезинформацией и постоянно инвестирует в передовые средства ее обнаружения и предотвращения». В эстонском исследовании были проанализированы ее «исходные модели, не настроенные и контролируемые клиентами», которые могут использовать функцию Vibe Work, добавила компания: она включает «надежные уровни фильтрации, предназначенные для выявления и блокировки сомнительных источников».