Выпуск LLM-продукта: цены, маржа и ловушка «антирва»

У LLM-продуктов экономика жёстче, чем у традиционного SaaS. Переменные издержки растут вместе с использованием, маржу съедает инференс, риск коммодитизации, конкуренты с теми же базовыми моделями. Как построить продукт, который действительно защищён, и какие паттерны ведут к LLM-стартапам, исчезающи

Что вы сможете сделать

Использовать статью как контекст для решений о внедрении, риске, управлении или инвестициях.

15 мая 2026 г.

В этой статье

Что особенного в LLM-продуктах
Структура издержек
Модели ценообразования
Вопрос юнит-экономики
Защита маржи
1. Разбейте модели по тарифам
2. Оптимизация издержек (тема отдельной статьи)
3. Прозрачность по использованию
4. Умное кэширование
5. Гибрид hosted / self-hosted
6. По результату — для высокоценного
Вопрос рва
Настоящие рвы
Псевдорвы
Стратегические паттерны
Паттерн 1: Воркфлоу + ИИ, а не «ИИ-инструмент»
Паттерн 2: Маховик клиентских данных
Паттерн 3: Глубокая вертикальная специализация
Паттерн 4: Встроиться в существующий воркфлоу
Паттерн 5: ИИ-нативные операции
Паттерн 6: Многомерные рвы
Кейсы ценообразования
Кейс 1: «Гонка ко дну» обёрток
Кейс 2: Вертикальный специалист
Кейс 3: Встроенная платформа
Кейс 4: Маховик данных
Что идёт не так
Конкретные ценовые паттерны, которые работают
Фреймворк решения по цене
Заметка об ИИ-стартапах в 2026 году
Что оптимизировать
Ключевая мысль

В 2023 и 2024 годах запустилась волна LLM-стартапов. Они оборачивали GPT-4 или Claude в UI, обслуживали конкретный юзкейс, продавали подписки. Многие набрали тягу. Многие умерли.

Смерти случались не потому, что продукты были плохие. А потому, что у продуктов не было рва. Любой мог построить то же самое на той же модели. Клиенты уходили туда, где дешевле. Основатели смотрели, как маржа схлопывается по мере того, как поставщики базовых моделей снижали свои цены или запускали конкурирующие фичи.

К 2026 году уроки яснее. Сборка LLM-продукта — это не то же самое, что сборка традиционного SaaS-продукта. Экономика другая. Конкурентная динамика другая. Рвы другие. Команды, которые этой разницы не понимают, превращаются в кейсы из подборки «ИИ-стартапы, которые исчезли».

В этой статье — как в 2026 году реально выглядит выпуск LLM-продукта: цены, маржа, стратегические паттерны и рвы, которые держатся, против тех, что не держатся.

Что особенного в LLM-продуктах

Несколько характеристик, отличающих LLM-продукты от традиционного SaaS:

Переменные издержки растут с использованием. У каждого пользовательского взаимодействия есть стоимость вызова (инференс). В отличие от ПО, где обслуживание 10 000-го пользователя по сути бесплатно, 10 000-й LLM-вызов стоит столько же, сколько первый.

Маржа тоньше. Издержки на инференс часто составляют 10–40% выручки. После хостинга, compute и прочей инфраструктуры валовая маржа ИИ-продуктов обычно 50–75%, а не 80–90%, как у чистого SaaS.

Базовые модели — это commodity. GPT, Claude, Gemini доступны всем. Ваш конкурент использует те же модели. То, что приходит от модели, не дифференциатор.

Базовые модели меняются. Новые версии, депрекации, изменения цен — поквартально. Ваш продукт зависит от инфраструктуры, которую вы не контролируете.

Качество трудно защищать. Удачный промпт легко реверс-инжинирится. Уникальный файнтюн воспроизводится. Инновация в воркфлоу копируется.

Ожидания клиентов смещаются быстро. То, что впечатляет сегодня, через полгода — обязательный минимум. Планка движется быстро.

Ценовое давление. Сами поставщики базовых моделей запускают продукты, конкурирующие со своими же клиентами. Salesforce + OpenAI; Microsoft + OpenAI; конкуренты с массовой дистрибуцией.

Это не теория. Это ежедневная реальность работы в 2026 году.

Структура издержек

Типичная структура издержек LLM-продукта:

Переменные издержки (на пользователя / на использование):

Инференс (API LLM или хостинг).
Эмбеддинги (для RAG).
Векторная БД или хранилище.
Прочая инфраструктура, которая растёт с использованием.

Постоянные издержки:

Зарплаты команды.
Офис/операционка.
Лицензии на софт (CRM, инструменты).
Базовый хостинг.
Маркетинг/продажи.

Переменная часть и есть отличие. Если ваш переменный расход — €0,05 на активного пользователя в день, а вы берёте €20/мес, у вас €19,50 - дни_активности × €0,05 вклада в покрытие. Тяжёлые пользователи могут размывать это значительно.

Реальный пример. Компания, предлагающая ИИ-инструмент для письма за €20/пользователь в месяц:

Средний пользователь: 5 сессий/день × 20 дней/мес = 100 сессий/мес.
Средняя сессия: 5 LLM-вызовов × 2K токенов в среднем.
Всего токенов: 1M токенов/мес/пользователь (вход + выход).
Издержки по ценам Claude Sonnet (€3/M вход, €15/M выход): ~€7–12/пользователь/мес.
Валовая маржа: ~50–65%.

Для их тяжёлых пользователей (в 10–20 раз больше сессий):

10–20M токенов/мес.
Издержки на инференс: €70–200/мес.
Убыток на каждом тяжёлом пользователе.

Без ограничений по использованию тяжёлые пользователи могут быть убыточными. У традиционного SaaS такой проблемы в той же мере нет.

Модели ценообразования

Вопрос цены сложнее, чем для традиционного SaaS. Варианты:

Фиксированная цена за пользователя. Просто. По умолчанию. Но тяжёлые пользователи могут быть убыточны; лёгкие их субсидируют.

За место с лимитами по использованию. Каждое место включает N действий/вызовов/токенов в месяц. Тяжёлые пользователи платят overage или упираются в лимит.

Чисто по использованию. Платите за вызов, за токен, за действие. Расходы и выручка совпадают. Предсказуемая маржа. Но неопределённость счёта может вредить адопшену.

Тарифные планы. Free, Pro (с лимитами), Enterprise (по договору). Стандартный SaaS-паттерн, адаптированный под лимиты использования.

Гибрид. Базовая ставка за место плюс usage-based для тяжёлых фич. Захватывает и предсказуемость, и согласованность.

По результату. Платите за результат (закрытая сделка, закрытый тикет, единица сгенерированного контента). Высокая ценность, тяжело операционализировать. Становится частым по мере того, как ИИ выполняет всё более измеримую работу.

У каждой модели есть компромиссы. «Правильная» зависит от:

Потребности в предсказуемости (вашей и клиента).
Разброса использования.
Структуры маржи.
Конкурентного ландшафта.

Большинство успешных LLM-продуктов используют тарифные планы или гибрид. Тяжёлые пользователи упираются в лимиты или платят за перебор; лёгкие получают разумную ценность.

Вопрос юнит-экономики

Полезная рамка: какая у вас единица продажи и сколько она стоит?

Для чат-ассистента:

Единица: «разговор».
Издержки: €0,10–1,00 за разговор в зависимости от длины.
Выручка: ?

Если вы берёте €20/пользователь/мес, а пользователи проводят 100 разговоров в месяц, средняя выручка с разговора — €0,20. Маржа на грани или в минус.

Если вы берёте €30/пользователь/мес с лимитом 200 разговоров, а большинство проводит 50, — комфортная маржа.

Упражнение: оцените издержки на единицу, задайте выручку с единицы, убедитесь, что маржа имеет смысл во всём распределении пользователей.

Тяжёлые пользователи обычно и есть убыточные. Решите явно: субсидировать их? Сдвигать в enterprise? Лимитировать использование?

Защита маржи

Несколько тактик защиты маржи:

1. Разбейте модели по тарифам

Дешёвые в эксплуатации фичи — в базовом тарифе. Дорогие (reasoning-модели, длинный контекст, большие выводы) — в премиуме.

Пользователь бесплатного тарифа на эквиваленте Claude Haiku обходится примерно в €0,10/мес инференса. Премиум-пользователь на эквиваленте Claude Opus может обходиться в €5–20/мес. Тарифицируйте соответственно.

2. Оптимизация издержек (тема отдельной статьи)

Кэширование, маршрутизация, контроль вывода. Продакшен-оптимизация издержек обычно даёт экономию 60–90%. Для многих продуктов это разница между прибыльностью и убытками.

3. Прозрачность по использованию

Покажите пользователю его расход. Это неявное приглашение оптимизировать своё поведение.

Это не наказание, это взаимная информированность. Пользователям нравится видеть свой расход. Тяжёлые сами себя пристёгивают или апгрейдятся.

4. Умное кэширование

Кэширование на уровне пользователя или организации сильно сокращает издержки для тяжёлых пользователей. Они продолжают активно пользоваться, не упираясь в лимиты-наказания.

5. Гибрид hosted / self-hosted

Для крупных enterprise-клиентов предложение self-hosted или BYO-cloud варианта переносит издержки на инференс на них. Они получают приватность/контроль; вы — облегчение по издержкам.

6. По результату — для высокоценного

Некоторые воркфлоу дают измеримый результат (закрытые сделки, решённые тикеты). Тарификация по результату захватывает ценность иначе, чем за токены. Маржа может быть существенно лучше.

Вопрос рва

Более сложный вопрос. Что делает ваш продукт защищённым?

Список «рвов», которые реально работают, против псевдорвов:

Настоящие рвы

Собственные данные. У вас есть данные, которые конкуренты не получат легко. Канонический пример — данные конкретного клиента. Чем больше продукт учится на данных каждого клиента, тем сложнее ему переключаться.

Дистрибуция. Вы встроены в воркфлоу или платформы, в которых конкурентов нет. У Microsoft Copilot колоссальный дистрибуционный ров через Office.

Доверие. Клиенты в регулируемых индустриях, чувствительных вертикалях доверяют вам. Переключение стоит дорого (security review, compliance review, обучение).

Интеграция. Вы интегрированы со множеством инструментов клиента, заменяя или дополняя их. Каждая интеграция — это switching cost.

Специализация воркфлоу. Вы построились специально под воркфлоу, требующий глубокого знания предметной области. Универсальные ИИ-инструменты не воспроизведут это без аналогичных вложений.

Сетевые эффекты. Пользователи выигрывают от других пользователей (комьюнити, общий контент, сравнительные бенчмарки). Редко в индивидуальной продуктивности, но реально для некоторых категорий.

Бренд и switching costs. В enterprise-продажах карьера покупателя завязана на выбор. Переключение для него рискованно; у вас защищённая позиция, когда вас уже выбрали.

Вертикальная интеграция. Вам принадлежит значимая инфраструктура (свои модели, свой инференс, свои пайплайны данных). Сложно воспроизвести.

Псевдорвы

Конкретный промпт или воркфлоу. Легко реверс-инжинирится. Клиент может построить сам.

Конкретный выбор модели. Доступен конкурентам.

Удачный UI. Копируется за квартал.

Скорость итерации. Реальна в окне; конкуренты догоняют. В одиночку не устойчиво.

Маркетинг или брендинг. В эпоху ИИ — одноразовое; репутации делаются и рушатся быстро.

Псевдорвы — это то, на что опирается большинство ИИ-обёрток. Этим объясняется их высокая смертность.

Стратегические паттерны

Несколько паттернов, дающих защищённые LLM-продукты:

Паттерн 1: Воркфлоу + ИИ, а не «ИИ-инструмент»

Вместо «ИИ, который делает X» — стройте воркфлоу, в котором ИИ — часть более крупной системы.

Пример: не «ИИ-саммаризатор юридических контрактов», а «платформа управления контрактами со встроенным ИИ».

Платформенная ценность (хранение, организация, совместная работа, история, комплаенс) — это ров; ИИ — это фича.

Чистые ИИ-инструменты коммодитизируются. Платформы с ИИ-фичами держатся.

Паттерн 2: Маховик клиентских данных

Использование каждого клиента порождает данные, улучшающие его опыт (и, возможно, других). Переключение означает потерю накопленной персонализации.

Пример: ИИ-помощник продаж, который изучает голос каждого пользователя, его аккаунты и паттерны. Через 6 месяцев переключение к конкуренту означает старт с нуля.

Стройте этот маховик с первого дня. Делайте продукт лучше чем дольше им пользуются.

Паттерн 3: Глубокая вертикальная специализация

Выберите вертикаль. Стройте под неё глубоко. Здравоохранение, юриспруденция, финансы, недвижимость.

Знание вертикали — ваш ров. Универсальные ИИ-инструменты не могут конкурировать на доменной специфике. Специализированные конкуренты могут — но каждая вертикаль это собственный рынок, где есть место нескольким специалистам.

Паттерн 4: Встроиться в существующий воркфлоу

Не зовите пользователя в свой продукт. Встройтесь туда, где он уже работает: Slack, Microsoft 365, Google Workspace, его CRM.

Дистрибуция через встраивание — реальный ров. Когда вы у него в ежедневных инструментах, выдрать вас оттуда дорого.

Паттерн 5: ИИ-нативные операции

Некоторые бизнесы ИИ-нативны от и до — они не продают ИИ людям, а используют ИИ для оказания услуги. ИИ-репетиторство, ИИ-поддержка как результат, ИИ-контент как commodity.

«Продукт» — это результат; ИИ — операционная вещь. Конкуренты с похожим ИИ, но худшей операционкой, проигрывают.

Паттерн 6: Многомерные рвы

Продукт защищён по нескольким осям: вертикаль + данные + интеграция + воркфлоу. Ни одна ось в одиночку не ров, но в комбинации их сложно воспроизвести.

Так выглядит большинство успешных ИИ-продуктов. Не один большой ров; несколько, взаимно усиливающих друг друга.

Кейсы ценообразования

Несколько реальных (анонимизированных) кейсов:

Кейс 1: «Гонка ко дну» обёрток

Стартап запустился в 2023 году с чат-интерфейсом для написания контента. Free-тариф; €20/мес Pro.

Год 1: выручка росла. Год 2: запустилось 5 конкурентов с похожим продуктом. Ценовое давление: €10/мес, потом €5/мес. Маржа сжалась; рост замер.

Год 3: ChatGPT включил похожие фичи в своей потребительской подписке. Конкурентная позиция нежизнеспособна. Закрытие.

Урок: Обёртка без других рвов не имеет защиты.

Кейс 2: Вертикальный специалист

Компания, построенная специально под ИИ в фарм-исследованиях. Глубокая интеграция с исследовательскими базами. Специализированные промпты под медицинскую терминологию. Комплаенс под воркфлоу FDA.

Цена: €1500/пользователь/мес. Маржа здоровая. Отток низкий. Прямые конкуренты не могут сравниться по глубине.

Урок: Вертикальная глубина + комплаенс + интеграция — реальный ров.

Кейс 3: Встроенная платформа

ИИ-фича, добавленная в существующую платформу управления проектами. Пользователи и так были там ради управления проектами; ИИ сделал её ценнее.

Цена: включена в существующие тарифы. Отдельной цены на ИИ нет. Чистый эффект: удержание выросло, ARPU вырос.

Урок: Существующая дистрибуция + ИИ как дополнительная фича — устойчиво.

Кейс 4: Маховик данных

Инструмент продаж, который со временем изучает аккаунты, голос и паттерны каждого клиента. После 12 месяцев модель хорошо знает их конкретный бизнес.

Цена: за место с кастомным enterprise. Высокое удержание; переключение — реальная цена (потерять 12 месяцев персонализации).

Урок: Клиентоспецифические данные — реальный ров.

Что идёт не так

Типичные провалы:

Провал 1: Сжатие маржи. Начали со здоровой маржей; конкуренты и ценовое давление её сжали. Теперь выручка растёт, а прибыль нет.

Провал 2: Запуск базовой модели. OpenAI / Anthropic выкатили фичу, конкурирующую с вашим продуктом. Ваш дифференциатор испарился.

Провал 3: Экономика тяжёлых пользователей. Несколько пользователей несоразмерно гонят издержки. Они убыточны. Либо вы берёте с них правильно, либо съедаете убыток.

Провал 4: Регрессия качества. Обновление базовой модели изменило поведение. Ваши настроенные промпты сломались. Доверие клиентов упало. Восстановление медленное.

Провал 5: Отток к бесплатным альтернативам. ChatGPT или Claude могут сделать большую часть того, что делает ваш продукт, дешевле. Пользователи ушли.

Провал 6: Ожидания цикла enterprise-продаж. Enterprise ожидает долгосрочной ценности. Ваш продукт может быть заменён Microsoft Copilot за 18 месяцев. Доверие тяжело строится.

Провал 7: Масштабирование без дисциплины по марже. Рост финансировал рост; маржа игнорировалась. Деньги в итоге кончаются, а пути к прибыльности нет.

Провал 8: Риск зависимости от фундамента. Рост цены API, депрекация или сбой у вашего провайдера. Ваш бизнес сломан тем, что вы не контролируете.

Конкретные ценовые паттерны, которые работают

Несколько паттернов из продуктов, у которых экономика сошлась:

За действие с лимитами. Тарифицируйте «выполненную задачу» или «успешный результат». Лимитируйте использование по тарифу. Тяжёлые платят overage. Чёткое совпадение с ценностью.

Bring your own API key. Продвинутые пользователи могут подключить свой ключ OpenAI / Anthropic и платить за инференс напрямую. Вы берёте за продукт вокруг. Снимает издержки на инференс с ваших книг.

Кастомные цены для enterprise. Крупные клиенты договариваются. Можно зашить издержки в цену; меньшие клиенты идут по стандартным тарифам.

Free-тариф с сильной upgrade-дорожкой. Щедрый free для адопшена; чёткая ценность платных тарифов. Free-пользователи сами себя обслуживают и становятся платящими.

Годовые контракты со скидкой. Фиксируют выручку; сглаживают прогноз использования; снижают отток. Стандартный SaaS-паттерн, всё ещё работает.

Фреймворк решения по цене

Шаги:

Смоделируйте свою структуру издержек. Сколько реально стоит обслуживание типичного, тяжёлого, лёгкого пользователя?

Выберите единицу. За что вы берёте — места, действия, результаты, токены?

Найдите правильную цену. Где сходятся ценность для клиента, ваши издержки и конкурентное давление?

Тарифицируйте умно. Free / Pro / Enterprise с чёткой ценностной прогрессией.

Поставьте лимиты. С какого момента тяжёлые пользователи начинают съедать маржу? Применяйте кепы или берите за перебор.

Планируйте перемены. Цены на базовые модели будут падать. Возможно, ваша цена должна следовать за ними. Или вы можете удержать цены и нарастить маржу. Решайте.

Меряйте постоянно. LTV клиента, маржинальный вклад, отток, expansion. Корректируйте по мере того, как узнаёте больше.

Заметка об ИИ-стартапах в 2026 году

Честный ландшафт:

Бизнесы-обёртки обычно мучаются. Простая обёртка вокруг базовой модели редко выживает сама по себе. Исключения — те, у кого есть конкретные рвы по дистрибуции, бренду или интеграции; обёртка — наименьшая часть того, что они на самом деле продают.

Вертикальные специалисты процветают. Специализированные по предметной области ИИ-продукты с глубоким клиентским знанием идут хорошо.

Платформенные игры доминируют. Microsoft, Google, Salesforce, крупные вендоры с дистрибуцией владеют большой частью enterprise-ИИ-рынка через бандлы.

ИИ-нативная операционка работает. Компании, использующие ИИ для оказания услуг (а не продающие ИИ), часто имеют лучшую экономику, чем компании «ИИ-как-софт».

Open-source-фронтир переформатирует игру. Способные открытые модели меняют конкурентную динамику в некоторых сегментах. Привязка к базовой модели слабеет.

Поставщики базовых моделей — это платформы. OpenAI, Anthropic, Google строят продуктовые слои на своих моделях. Перед клиентами встаёт вопрос: строить на OpenAI или быть заменённым OpenAI?

Успешные новые компании 2026 года навигируют по этой динамике осознанно. Те, что нет, в основном исчезают.

Что оптимизировать

Для основателей — иерархия:

Сделайте что-то, что выполняет реальную работу. Не «ИИ для X», а измеримый результат, ценный для клиентов.

Намеренно стройте рвы. Маховик клиентских данных, вертикальная глубина, интеграция, встраивание в воркфлоу. Выберите один или несколько; стройте с самого начала.

Сводите юнит-экономику. Маржа, работающая на масштабе. Цены, отражающие ценность и защищающие издержки.

Не зависьте от движущегося фундамента. Диверсифицируйте поставщиков моделей. Стройте с возможностью замены. Будьте готовы к изменениям у провайдеров.

Масштабируйте операционное мастерство. Наблюдаемость, эвалы, безопасность, качество. Скучные вещи, отличающие тех, кто остаётся, от тех, кто исчезает.

Защищайте отношения. Доверие, интеграции, switching costs. Клиенты, которые не могут уйти легко, и есть ров.

Это не отличается от успешных традиционных бизнесов — но срочность выше, потому что нижележащая технология движется быстрее.

Ключевая мысль

Выпуск LLM-продукта в 2026 году тяжелее, чем в 2023-м. Эпоха обёрток в основном позади; поставщики базовых моделей и платформы конкурируют напрямую. Маржа уже, чем у традиционного SaaS; конкуренция шире.

Продукты, у которых получается, имеют рвы, которые не сводятся к «у нас есть ИИ». Это собственные данные, вертикальная глубина, дистрибуция, интеграция, доверие, специализация воркфлоу. Построенные намеренно, наслоенные друг на друга, защищаемые активно.

Экономика требует строгости. Переменные издержки, растущие с использованием. Защита маржи через кэширование, маршрутизацию, тарификацию, умные цены. Тяжёлые пользователи — либо тарифицируются адекватно, либо лимитируются.

Команды, делающие это правильно, строят реальные бизнесы на ИИ. Те, что не делают, становятся кейсами в подборках — интересные демо, краткая тяга, затем забвение.

Это игра тяжелее, чем подсказывал ранний хайп. Возможность реальна, но конкретна. Стройте с учётом рва с первого дня. Управляйте маржой как тем, что имеет значение. Относитесь к базовым моделям как к commodity-инфраструктуре, а не как к дифференциатору.

Так выпускают LLM-продукт, который через три года ещё здесь.

Читать дальше

Продолжайте тот же учебный путь со следующими практическими статьями.

Голосовые агенты для клиентских процессов: где они работают и где ломаются

Решить, подходит ли клиентский голосовой агент, и спроектировать первый запуск с раскрытием, эскалацией, тестированием и мониторингом.

Паттерны приватного ИИ: локально, VPC, self-hosted и гибрид

Выбрать паттерн приватного развёртывания ИИ по чувствительности данных, требованиям к качеству, цене, задержке и операционной способности команды.

ИИ-нативные IDE и рабочие процессы, которые понимают репозиторий

Спроектировать ИИ-процесс разработки с пониманием репозитория, который ускоряет поставку, не ослабляя проверку, безопасность, тесты или владение кодом.

Углубиться

Тщательно подобранные внешние курсы, которые глубже раскрывают эту тему.

Coursera · DeepLearning.AI

AI for Everyone

Эндрю Ын

Шесть лет спустя — самая чистая точка входа для тех, кому нужно разобраться в ИИ без программирования. Без математики, без жаргона, без хайпа — после прохождения вы сможете вести осознанные разговоры о проектах с ИИ.

Новичок в ИИ~6 часовПроверено 25 дней назад

Coursera · The Wharton School

AI Strategy and Governance

Kartik Hosanagar · Kevin Werbach · Prasanna Tambe · Lynn Wu

Сильная рамка Wharton для руководителей, принимающих решения «строить или покупать». Курс не продаёт инструменты, а фокусируется на экономике внедрения ИИ, алгоритмической предвзятости, доверии к данным и практиках управления, которые выдерживают аудит.

Эксперт~10 часовПроверено 25 дней назад

Все курсы в категории «ИИ для бизнеса»