Как ИИ генерирует ответы: ментальная модель, после которой промптинг становится понятным
ИИ не думает как человек. Он генерирует вероятные продолжения из контекста. Простая ментальная модель делает почти все советы по промптингу гораздо понятнее.
Outcome: Использовать ментальную модель следующего токена, чтобы писать лучшие промпты без предположения, что модели думают как люди.
Большинство объяснений того, как работает ИИ, застревают между двумя крайностями: "это как человек" (что ошибочно и может привести к плохим решениям) и "он предсказывает следующее слово" (что технически верно, но слишком расплывчато для практики). Эта статья — середина: рабочая ментальная модель, которую можно понять за десять минут и которая сразу меняет то, как вы пишете промпты.
Математика не нужна. Не нужно знать, что такое transformer. Нужна одна идея и четыре следствия.
Одна идея
Когда вы отправляете сообщение в ChatGPT, Claude или любой современный ИИ-ассистент, он делает примерно следующее:
С учётом обучающих паттернов и разговора, который вы только что отправили, какое продолжение наиболее правдоподобно?
Затем модель генерирует ответ маленькими кусочками — несколькими символами или словом — и подаёт каждый кусочек обратно в себя, чтобы предсказать следующий. Так продолжается, пока не сработает условие остановки.
Это базовый цикл. Там нет внутреннего поиска "ответа", нет обращения к базе данных, если не подключён инструмент, и нет модуля рассуждения в человеческом смысле. Есть очень большой статистический сопоставитель паттернов, который создаёт продолжение, похожее на текст, который в такой ситуации написал бы знающий человек.
Это ощущается интеллектуальным, потому что паттерны, выученные во время обучения, пришли из человеческого текста: грамматика, факты, шутки, код, договоры, рецепты, аргументы, извинения, разница между вежливым ответом и саркастичным. Поэтому наиболее правдоподобное продолжение часто оказывается правильным ответом. Часто. Не всегда.
Из этого следуют четыре последствия. Каждое делает целую категорию "советов по промптингу" очевиднее.
Следствие 1: модель не проверяет, что истинно
Модель не оптимизирована на проверку истины. Она оптимизирована на создание правдоподобного текста. Чаще всего эти вещи совпадают, потому что в обучающих данных была корректная информация о распространённых темах. Но когда вы спрашиваете о вопросе, где модель не видела надёжной информации — узкое юридическое дело, конкретное недавнее событие, малоизвестная цитата, — она не останавливается. Она всё равно создаёт правдоподобный ответ.
Так возникают галлюцинации. Не потому, что модель сломана, а потому, что она делает ровно то, для чего была построена: создаёт правдоподобное продолжение. Правдоподобие и истина связаны, но не идентичны.
Вывод: любое конкретное фактическое утверждение от ИИ — имя, дата, число, ссылка — требует привычки проверки. Модель может выразить неопределённость, но не стоит полагаться на это как на систему безопасности. Встройте проверку в свой workflow.
Следствие 2: контекст решает всё
Если модель предсказывает наиболее правдоподобное следующее предложение с учётом вашего промпта, то промпт и есть вход, который определяет результат. Добавьте больше релевантного контекста — кто вы, что уже пробовали, чего хотите, — и у модели будет более богатый паттерн для сопоставления.
Поэтому "дать больше контекста" — самый надёжный способ улучшить ответ.
"Напиши мне email" даёт типовой email, который написал бы человек без информации.
>
"Напиши email давнему клиенту, по сроку которого мы задержались; тон прямой, но тёплый; до 100 слов; в конце ясный следующий шаг" даёт результат гораздо ближе к тому, что вам нужно.
Модель не стала умнее между двумя промптами. Она получила более богатый промпт, который сузил пространство "правдоподобных продолжений" до гораздо более полезной зоны.
Когда опытные пользователи говорят, что промптинг — это "просто быть конкретнее", они имеют в виду именно это. Это не трюк. Это модель, которая выполняет свою единственную работу точнее, потому что вы дали ей больше материала.
Следствие 3: разговор является частью контекста
Каждый современный ИИ-ассистент держит весь разговор в рабочей памяти, которую называют контекстным окном. Когда вы отвечаете "сделай второй абзац короче", модель не начинает с нуля. Она создаёт наиболее правдоподобный следующий ответ с учётом всего разговора: исходный email, свой черновик, вашу критику и новую просьбу сократить второй абзац.
Поэтому второй черновик почти всегда лучше первого. У модели больше материала: исходный промпт, её собственная попытка и ваша реакция.
Отсюда следуют практические правила:
- Длинные полезные разговоры — это возможность, а не проблема. Оставайтесь в одной ветке, вместо того чтобы каждый раз начинать заново.
- Вставить критику обратно лучше, чем переписывать промпт с нуля. Модели нужно меньше нового контекста, если он уже перед ней.
- Когда разговор становится очень длинным, модель начинает терять ранние части. Топовые продукты 2026 года могут иметь очень большие контекстные окна, иногда миллион токенов и больше, но ваш конкретный тариф часто меньше, а качество падает по мере заполнения окна. Для длинных проектов периодически делайте summary и начинайте свежую ветку.
Следствие 4: рамка вопроса формирует ответ
Поскольку модель создаёт правдоподобное продолжение, тип продолжения сильно зависит от тона и формы промпта.
Спросите небрежно и расплывчато — получите небрежный и расплывчатый ответ. Спросите тот же вопрос структурно и конкретно — получите более строгий ответ.
Попросите модель разложить проблему перед финальным ответом, и она сгенерирует промежуточный анализ, который часто улучшает результат. Это не магия. Вы направляете большую часть ответа в сторону декомпозиции, проверок и сравнения до вывода, что может сделать ответ надёжнее на сложных задачах.
Скажите модели роль — "ты старший налоговый консультант в Эстонии" — и она будет опираться на паттерны того, как такой человек писал бы. Модель не становится налоговым консультантом. Она подбирает стиль и плотность содержания экспертного текста.
Попросите модель спорить с вашей идеей, и она создаст наиболее правдоподобный контраргумент. Попросите сыграть скептичного клиента — получите скептическую обратную связь. Попросите быть краткой — она сожмёт.
Каждый паттерн промптинга, который вы видели, является вариантом этого следствия. Role prompting, worked examples, critique prompts, "argue against", "be concise", "match this tone" — всё это работает, потому что направляет предсказание модели к другому типу правдоподобного продолжения.
Для рабочих задач самый безопасный промпт редко бывает самым хитроумным. Обычно это ясный пакет: контекст, ограничения, исходный материал, формат вывода и явное правило работы с неопределённостью.
Как это собрать вместе
Держите четыре следствия в голове, когда в следующий раз отправляете промпт:
- Модель не проверяет истину; она создаёт правдоподобное.
- Больше контекста сужает пространство правдоподобных ответов к тому, что вам нужно.
- Весь разговор является контекстом, поэтому используйте итерацию.
- Форма и тон промпта формируют форму и тон ответа.
Все четыре сводятся к одному наблюдению: промпт — это мост между обучающими паттернами модели и нужным вам результатом. Чем короче этот мост без потери информации, тем лучше.
В этом вся игра.
Практический пакет промпта
Для реальной работы хороший промпт обычно содержит шесть частей:
| Часть | Что это даёт модели | | --- | --- | | Роль или перспектива | Тип паттерна ответа | | Контекст | Ситуация, аудитория и ограничения | | Исходный материал | Текст, данные или примеры для работы | | Задача | Конкретная работа, которую нужно выполнить | | Формат вывода | Форма ответа | | Правило неопределённости | Что помечать, проверять или отказываться делать |
Поэтому расплывчатые промпты дают расплывчатые ответы. Они оставляют открытым слишком много правдоподобных продолжений. Упражнение, связанное с этой статьёй, помогает превратить слабый промпт в такой пакет из шести частей.
Маленький тест
Возьмите недавний промпт, который дал посредственный ответ. Посмотрите на него. Затем спросите себя:
- Дал ли я модели достаточно контекста о том, кто я и чего хочу?
- Были ли ограничения — длина, тон, формат?
- Показал ли я пример хорошего результата?
- Попросил ли я разложить задачу, возразить или отметить неопределённость?
Почти всегда найдётся хотя бы один недостающий элемент. Добавьте его и отправьте промпт снова. Ответ обычно станет лучше, потому что вы сузили пространство правдоподобных продолжений к той работе, которая вам действительно нужна.