Первое из серии эссе об устройстве нейросетей и грамотном общении с ними.
Эти двое — не люди. Это гравитационные колодцы, как говорят промпт-инженеры. То есть AI-клише, самые шаблонные результаты генерации. Если вы скажете GPT «нарисуй рядом со мной красивую девушку или красивого парня», нейросеть наверняка изобразит под ручку с вами кого-то из этих двоих.
Такое у машины представление об идеале красоты 2026 года. Вот я и свел их наконец вместе. Пускай призраки любят друг друга, а мы с вами поговорим, как сделать, чтобы нас от них не тошнило.
Позвольте представиться. Я Михаил Шифрин, писатель и промпт-инженер. Когда вышла моя книга «100 рассказов из истории медицины», я был одним из основателей и первым по счету главным редактором сервиса «Яндекс. Практикум». Моя задача состояла в том, чтобы курсы по программированию были написаны технически грамотно и понятно для всех. Без повышения самооценки автора за счёт людей, покупающих и читающих эти курсы. Вдобавок хорошим русским языком
В апреле 2023-го, уже в эмиграции, я заметил, как LLM (большая языковая модель) GPT-3.5 шикарно пишет код, и понял, что с редактурой пора заканчивать. Дальше занимался только генеративным ИИ. Автоматизацией и промышленной генерацией. Мои агенты изображают людей в тренажёрах, собирают информацию о товарах и услугах, и, конечно же, генерируют тексты.
А со сгенерированными текстами сейчас беда.
Они совсем не писатели
Нас захлёстывает настоящая фобия. Всем так и мерещится, что автор текст писал не сам. Завидев двоеточие, длинное тире (em dash) и букву «ё», автора тут же расчеловечивают, будто за него всё сделал ИИ, и отказываются его читать.
Пресловутые «ё» и длинные тире всего лишь спутники текстовых паттернов, по которым узнают низкокачественную генерацию. Так почему же такие умные текстовые модели настолько плохи как писатели?
Мой ответ: они не писатели. Они музыканты-импровизаторы. Писатель думает словами, а модели — токенами (группами в 1–5 символов), которые не имеют смысла ни для нас, ни тем более для модели. Так отдельно взятые ноты и аккорды в музыке не значат ничего. Только их последовательность с определённой гармонией и ритмом вызывает эмоции и порой даже мысли.
Вот перед вами новейшая модель. Это пианист-виртуоз с громадными ручищами, накрывающими на клавиатуре по две октавы. Он учился 40 лет, знает о музыке всё. В общем, Рахманинов. Если вы Паганини, даёте ему партитуру своих каприсов, и получается «Рапсодия на тему Паганини». А если вы нот не знаете, немножко выпили, вам хочется пустить слезу и кого-то при этом потискать, вы подходите к Рахманинову и говорите: «Маэстро, сыграйте что-нибудь попроще, чтобы вышло по-нашему и проняло». Тогда у Рахманинова получается попса или шансон.
Именно так большинство пользователей ведёт себя с ChatGPT и Gemini. Задача ставится коротко, общо и чтоб скорей отделаться. Так, будто вам совсем не нравится переписка с искусственным интеллектом.
Текст получается совсем «ИИ-шный», потому что вы поставили неопределённую задачу. Импровизатор выслушал её, подумал, что вам нужно то же, что и всем. И стал играть шансон, а дальше увяз в клишированных блатных гармониях.
Все эти «не секрет, что», «это уже не только то-то, но и то-то», «и вот здесь начинается настоящая магия» сами по себе неплохи. Они бесят нас, когда скрепляют риторическую конструкцию, которую модель считает оптимальной.
Нейросеть обучена управлять не смыслом, а вашим вниманием. Ей бы задать общую картину, потом одно противопоставить другому, дать три пункта для запоминания (два мало, а четыре вы не запомните — проверено), а в конце мораль или призвать к действию.
Так построил свою речь ещё Демосфен 2376 лет назад, пытаясь побудить афинян к конкретным действиям против македонского царя Филиппа. Вы только поглядите, актуальность пугающая:
Знал бы оратор, к чему это приведёт!
— Афиняне решили сражаться, и Демосфен пошёл на войну рядовым (ладно, за свои слова нужно отвечать);
— Македоняне победили, Демосфен спасался с поля боя бегством (что ж, на войне бывает);
— Когда враги нашли убежище Демосфена в храме Посейдона, он принял яд, чтобы не достаться им живым. По преданию, яд был спрятан внутри тростниковой палочки, которой Демосфен писал тексты речей.
Но это ещё не все плохие новости. Перо старика Демосфен отравило большие языковые модели, потому что в конце концов схема его филиппики стала для нейросетей образцом. Посмотрите, как пышно расцвели на нём штампы генерации:
В русском языке такие клише — всего лишь краткие связки в тексте, развивающем какую-то идею. Они систематизированы. Объявлены редфлагами. Есть словари «Не употребляй такие-то обороты (и дальше список)».
Начинаю выдавать секреты
И вот вам первый секретик промпт-инженеров: языковые модели запоминают всего три запрета, начинающиеся со слова «не», на весь промпт. А остальные запреты игнорируют. Более того, если в промпте одно-единственное «не», его часто пропускают мимо ушей. Потом извиняются: «Прости, друг, не заметил! Моя вина, ты же написал, что не…»
Потому вместо редфлагов («Этих не люби») лучше ставить указатели (»… а люби вот этих»). Такие указатели называются «контрастные якоря». Вот как они делаются:
```text
Клиент жалуется на задержку доставки. Ответь как оператор поддержки.
<contrast>
Избегай шаблонных фраз: «приносим извинения за неудобства», «ваш вопрос очень важен для нас», «мы ценим ваше терпение».
Вместо этого: назови конкретную причину задержки, дай точный срок и предложи одно конкретное действие.
</contrast>
```
Смотрите: я вместо «Не употребляй шаблонные фразы» написал «Избегай шаблонных фраз». Если модель проспит первое слово, у неё может случиться инсайт на следующих двух. Рассуждающая модель (опция «thinking» в чате) может задаться вопросом, с чего это следующие слова в винительном падеже, может, с ними что-то не то?
Только не обольщайтесь. Думающие модели подвержены попаданию в семантические гравитационные колодцы похлеще лёгких моделей. Да, в ИИ тоже проблемы с интеллектуалами. Они так же падки на стереотипы и с умом обходят ваши правила. Контрастные якоря убирают только половину клише.
На наше счастье, модель умеет думать по-разному. Для каждого языка у неё своё пространство — со своими обучающими текстами и с толпой тренеров-фрилансеров из числа носителей языка.
Таким тренером бывал в непростые времена и я. Учил одну супермодель решать химические задачи на русском языке. Обучающие тексты показывают моделям, как надо писать, чтобы было гармонично, а люди отмечают наиболее полезные и безопасные варианты. Где модель не справилась, пишут ей, как нужно на самом деле и в чём она ошиблась.
Получается, что «гармоничные» тексты выкапывают семантические колодцы, а «полезные и безопасные» тренеры своими руками углубляют их. И пока модели будут обучаться таким образом, будут и колодцы.
Но какое счастье, что языков много! Тот случай, когда от мультикультурализма есть какой-то прок. В каждом языковом пространстве мышления модель стартует в свойственной именно этому языку области, отчего скатывается в гравитационные колодцы, характерные только для данного языка. А смысл этих колодцев в разных языках не совпадает!
Для иллюстрации я поставил рядом 10 самых частотных (по моим данным) русских и английских колодцев. Цветом выделены близкие по смыслу:
Как видите, полностью идентичен смысл только трёх с половиной из 10 чемпионов английского и русского языков. Отсюда техника промптинга: предлагай модели думать на одном языке, а отвечать на другом:
```text
Think in English. Then answer in Russian.
Придумай слоган для кофейни «Утро» — тёплый, человечный, без корпоративного стиля.
```
Для русскоязычного читателя английский колодец — и не колодец вовсе, а просто слова, и не всегда штампованные. «Это здесь я Баба Яга, а за морем я Василиса Прекрасная!»
И ещё секретик. Лучше давать контекст на английском, а выдачу требовать потом перевести на целевой:
```text
[Product: Coffee shop «Morning» / Target: Local residents seeking cozy, slow mornings]
Generate a slogan for this coffee shop—warm, human, non-corporate style.
Respond entirely in Russian.
```
Так лучше из-за одного фундаментального свойства языковых моделей. Поговорим о нём в другой раз.
***
— Ну, а зачем, — спросят меня, — рассказывать жуликам, как замаскировать генерацию? Студенты и так учиться перестали, а издательства завалены терабайтами сгенерированных рукописей. Скоро авторов заставят писать от руки гусиным пером в доказательство, что это не ИИ.
— Так и пусть заставляют, — отвечу я. — Литература это искусство, способ самовыражения. Я свои тексты пишу сам, потому что для меня это удовольствие. Готов и пером, и топором.
Но сколько есть авторов, которым тексты служат не для самовыражения! Редактор новостей; составитель технической документации; доктор, который делает на YouTube ролики, как правильно беречь спину. Их продукция ценна сама по себе. Надо, чтобы она была понятна, убедительна и не вызывала отвращения.
Вот когда нужен грамотный промпт.