channel: > Внедрение ИИ в бизнес

Доводим ИИ‑пилот до промышленного использования.

90% ИИ‑пилотов в РФ в 2025 не дошли до прода — слабая интеграция и нехватка людей. AVAT берёт ту часть, где обычно ломается: данные, интеграции, ревью, ответственность за бизнес‑метрику. От 300 000 ₽ за 3–4 недели, SLA в договоре.

80%+
accuracy
на golden‑set
// production AI pipeline LIVE
📥 Источники CRM · база · API
🔎 RAG векторный поиск
🧠 Claude API ответ + действие
📋 Golden set эталон ответов
📊 Eval accuracy / cost
🚦 Решение ship / refine
📈 Langfuse логи и метрики
👤 Human review критичные шаги
💰 SLA фикс в договоре
3–4 нед
до прода
300к ₽
от суммы
80%+
accuracy
SLA
в договоре
3–4 нед
от пилота до прода
6 SaaS
с встроенным ИИ в проде
80%+
accuracy на golden‑set
SLA
на метрику в договоре
// СТЕК ВНЕДРЕНИЯ ИИ
Claude (Sonnet · Opus · Haiku)· OpenAI GPT-4o · o1· GigaChat· YandexGPT· Ollama (Llama 3 · Qwen)· LangChain· LlamaIndex· Qdrant· pgvector· Langfuse· Helicone· n8n· Supabase· PostgreSQL· FastAPI· Next.js· AmoCRM· Битрикс24· Telegram API· WhatsApp·

Четыре сценария,
в которых ИИ доходит до промышленного.

Каждый сценарий = одна бизнес‑метрика в договоре. Без метрики проект не берём — иначе через 3 месяца это окажется ещё одним «красивым пилотом».

ИИ‑ассистент в продажах и поддержке

Claude или GPT в Telegram, WhatsApp, на сайте, в Битрикс24/AmoCRM. Снимает 60–80% типовых обращений, передаёт сложные оператору с контекстом разговора. Целевая метрика — минус N часов саппорта в неделю.

от 300 000 ₽ · 3 недели

RAG‑поиск по корпоративной базе

ИИ ищет в 300+ страницах регламентов, договоров, инструкций, истории переписки. Отвечает с цитатами и ссылками на источник. Векторная база Qdrant/pgvector, ре‑ранжирование, контроль галлюцинаций.

от 400 000 ₽ · 3–4 недели

ИИ‑агенты для процессов

Классификация обращений, маршрутизация в CRM, автоответ с действием (создать сделку, выставить счёт, поставить задачу). Мультиагентные сценарии через function calling. Контроль через human‑in‑the‑loop на критичных шагах.

от 500 000 ₽ · 4–6 недель

Доведение существующего пилота

У вас уже есть демо или MVP, который завис между «выглядит круто» и «реально работает». Делаем аудит, фиксируем что ломает выход в прод (данные, метрика, стоимость, точность) и дорабатываем именно это. Без переписывания с нуля.

от 300 000 ₽ · оценка после аудита

Почему AVAT,
а не «бот за 50к» и не системный интегратор.

«Бот за 50к» делает интерфейс — и падает на первой интеграции. Системный интегратор просит 5 млн и полгода. Внутренний R&D застрял на пилоте уже шесть месяцев. AVAT — четвёртый путь: production‑ready ИИ под бизнес‑метрику за 3–6 недель.

Берём только то, у чего есть метрика

Без целевой бизнес‑метрики проект не стартует. Не «внедрим ИИ», а «снимем 40% обращений саппорта» или «повысим конверсию автоответа лида на 25%». Метрика — в договоре, не достигли — продолжаем за свой счёт.

Продакшен, а не демо

Логирование каждого вызова (Langfuse), мониторинг точности на golden‑set, фолбэки, лимиты на стоимость токенов, ревью человеком на критичных шагах. То, чего обычно нет в пилоте — причина, почему 90% из них умирают.

Стоимость токенов считается заранее

Главный неожиданный счёт ИИ‑внедрений — расход на LLM‑токены. Считаем на этапе архитектуры и фиксируем месячный потолок. Кэширование, дешёвые модели на дешёвых шагах, дорогие — только где нужно.

Скорость вайбкодинга

Cursor, Claude Code, GitHub Copilot. То, что у классического интегратора занимает 2–3 месяца, делаем за 3–6 недель. У AVAT 6 собственных SaaS в продакшне с встроенным ИИ — знаем что ломается раньше клиента.

152‑ФЗ и on‑premise

Для проектов с ПДн — YandexGPT/GigaChat (российские, сертифицированные) или локальные модели через Ollama на вашем сервере. Anonymization‑слой перед отправкой в LLM. NDA и договор обработки персональных данных по 152‑ФЗ.

SLA на качество и стоимость

Accuracy на golden‑set не ниже 80%. Latency ответа не выше Х секунд. Стоимость токенов в пределах Y ₽/мес. Всё в договоре. Месяц поддержки включён, далее retainer от 80 000 ₽/мес.

Пять шагов
от пилота до промышленного использования.

Стандартный цикл — 3–4 недели на один сценарий. Для корпоративных мультиагентных систем — 6–10 недель. Никаких «продолжим в следующем спринте» — выходим в прод на последней неделе.

01

Аудит пилота и данных

Смотрим что есть: что показал пилот, какие данные доступны, где интеграции, кто отвечает за метрику. Фиксируем целевую бизнес‑метрику (минус N часов саппорта, плюс N% конверсии). Без неё — не берём.

Неделя 1
02

Архитектура и данные

Выбираем LLM (Claude/GPT/GigaChat/YandexGPT), способ векторизации, формат логов, фолбэки, ревью‑контур. Готовим golden‑set из 50–200 эталонных примеров. Считаем стоимость токенов на месяц.

Неделя 2
03

Интеграции и сборка

Подключаемся к CRM, ERP, базам знаний, файлам, email, мессенджерам. Делаем API, очереди, RAG, function calling, мультиагентные сценарии. Логирование каждого шага через Langfuse/Helicone.

Недели 2–3
04

Тесты и ревью

Прогон golden‑set, accuracy/precision/recall. Edge‑cases. Подключаем выборочный ручной ревью оператора. Замеряем latency и стоимость одного вызова на реальной нагрузке.

Неделя 3
05

Запуск и SLA

Включаем на ограниченной аудитории, мониторим метрику 5–7 дней. Масштабирование. Фиксируем SLA на точность, latency, бюджет токенов. Месяц поддержки в стоимости, далее retainer.

Неделя 4

Production‑стек ИИ.
То, что не отвалится через месяц.

Стек собирается под бизнес‑метрику и ограничения по 152‑ФЗ. У вас остаётся полный код и документация: любая ИИ‑команда продолжит после нас без «vendor lock».

LLM‑модели
AI Core
  • Claude (Sonnet/Opus/Haiku) — через прокси, главный выбор для tool use и RAG
  • GPT‑4o, o1 — мультимодальные сценарии
  • GigaChat, YandexGPT — для 152‑ФЗ
  • Llama 3 / Qwen через Ollama — on‑premise, полная приватность
RAG и векторы
Retrieval
  • Qdrant — основной векторный store
  • pgvector — встроенный в PostgreSQL
  • LlamaIndex и LangChain — оркестрация
  • Hybrid search + ре‑ранжирование, контроль галлюцинаций
Логи и мониторинг
Observability
  • Langfuse — открытый, self‑hosted, в РФ
  • Helicone — стоимость и latency
  • Golden‑set + автоматический eval
  • Алерты на падение accuracy и всплеск стоимости
Бэкенд и данные
Data Layer
  • FastAPI, Python — основной бэкенд
  • Supabase, PostgreSQL — оперативные данные
  • Redis — кэширование LLM‑ответов
  • Очереди (Celery, BullMQ) для тяжёлых пайплайнов
Интеграции
Channels
  • AmoCRM, Битрикс24 — через webhooks и REST
  • Telegram, WhatsApp Business — мессенджеры
  • Email, веб‑чат, мобильные SDK
  • n8n — оркестрация неосновных шагов
Инфраструктура
Infra
  • Selectel, Yandex Cloud — РФ‑облака, 152‑ФЗ
  • On‑premise — для банков, страховых, госсектора
  • Docker + Kubernetes для production
  • Anonymization‑прокси перед внешними LLM

Шесть продуктов AVAT,
в каждом ИИ работает в проде.

У AVAT есть собственные SaaS, где ИИ — часть продукта, а не «красивый пилот». На этих кейсах видно, что именно мы умеем доводить. Внешние клиентские кейсы под NDA — показываем на брифе.

L7 / Контент

Контент‑завод — ИИ‑генерация постов

ИИ собирает контекст, генерирует пост в стиле бренда, складывает в админку черновиком, после утверждения автопубликует в Telegram. Двухэтапный prompt + ревью человеком на критичных шагах.

Замена контент‑менеджера на 80% задач · −60 000 ₽/мес ФОТ
80%
задач авто
−60к
ФОТ/мес
Claude
+ human review
Внешний / NDA · ИИ‑бот

ИИ‑бот в WhatsApp для beauty‑сети

Сеть салонов красоты, 8 точек, 120 клиентов в день. ИИ‑ассистент в WhatsApp принимает запись 24/7, проверяет слоты в YClients, ведёт follow‑up по возвратам. RAG по услугам и ценам.

−70% нагрузки администраторов · +28% повторных визитов
−70%
нагрузка адм.
+28%
повторных
24/7
приём заявок
L7 / Маркетплейсы

МП Приборка — ИИ в аналитике WB/Ozon

ИИ классифицирует возвраты по причинам, объясняет падение маржи по SKU, готовит summary за неделю по каждому клиенту. 40 аккаунтов, мультитенант.

40 клиентов · заменяет 2–3 аналитиков в одной компании
40
клиентов
2–3
аналитика замена
WB+Ozon
обе платформы
L7 / Управл. учёт

Пульсар7 — ИИ‑комментарии к KPI

Дашборд KPI для собственника + ИИ автоматически пишет недельный комментарий «что произошло, на что смотреть». Сборка данных из CRM, банка, рекламных кабинетов.

60 платящих компаний · экономия 4–6 часов в неделю на собственника
60
компаний
−6ч
рутины/нед
ИИ
недельный summary

Три формата работы.
Фиксированная цена и SLA в договоре.

Без процентов от выручки. Стоимость токенов считается и фиксируется заранее. Бизнес‑метрика — в договоре: не достигли — продолжаем за свой счёт до достижения.

Старт
300 000
3 недели · один ИИ‑сценарий

Один ИИ‑сценарий до прода целиком: ассистент в поддержке/продажах или RAG‑поиск по корпоративной базе. Для первого реального внедрения, когда нужно увидеть результат на метрике за один цикл.

  • 1 сценарий, 1–2 канала (чат / WhatsApp / CRM)
  • Аудит данных и интеграции к источникам
  • Golden‑set 50–100 примеров + eval
  • Langfuse‑логи, мониторинг качества и стоимости
  • SLA на accuracy и latency в договоре
  • Месяц поддержки в стоимости
Обсудить
Корпоративный кастом
1.5–3 млн ₽
1.5–2.5 месяца

Мультиагентные системы, RAG на 10k+ документов, on‑premise‑модели через Ollama, fine‑tune под отраслевой язык. Для банков, страховых, госсектора и промышленности — с соблюдением 152‑ФЗ.

  • Мультиагентная архитектура
  • On‑premise LLM (Llama 3 / Qwen / GigaChat)
  • Fine‑tune или instruct‑tune под домен
  • Anonymization‑слой, NDA, 152‑ФЗ
  • Аудит безопасности и нагрузочное тестирование
  • SLA с неустойкой + retainer 6+ месяцев
Обсудить

Стоимость токенов LLM считается и фиксируется до старта. Дальнейшая поддержка — retainer от 80 000 ₽/мес. NDA подписываем бесплатно.

AVAT против трёх альтернатив.
Когда мы — и когда не мы.

«Бот за 50к», внутренний R&D и системный интегратор закрывают свои задачи. Сравнение не «мы лучше» — а «где нас имеет смысл звать».

/ ПАРАМЕТР
«Бот за 50к»
AVAT
Системный интегратор
Бюджет
30–80 тыс ₽
300 тыс – 3 млн ₽
5–30 млн ₽
Срок до прода
2 недели
3–6 недель
6–18 месяцев
Бизнес‑метрика в договоре
Нет
Да, SLA
Иногда, формально
Интеграции с CRM/ERP
1–2 через Zapier
Сколько нужно, нативно
Все, долго и дорого
Логи и мониторинг качества
Нет
Langfuse + golden‑set
Корпоративный APM
152‑ФЗ / on‑premise
Нет
Да, GigaChat/YandexGPT/Ollama
Да, через комитет
Кому подходит
Хобби, тест идеи
Бизнес 20–500 чел., средний
Enterprise 500+ чел.

«Бот за 50к» — если нужно «попробовать» без бизнес‑метрики. Системный интегратор — если у вас 500+ человек и два года терпения. AVAT — если ИИ должен принести деньги или сэкономить часы в этом квартале и при этом не развалиться через три месяца.

Москва, Санкт‑Петербург.
Удалённо по всей России и СНГ.

Большая часть проектов идёт онлайн: бриф в Zoom, согласование в Telegram, передача кода через GitHub. На ключевые встречи и корпоративные внедрения выезжаем.

Москва

Основная база команды. Внедрение ИИ для московских компаний: e‑commerce, beauty‑сети, фитнес, b2b‑услуги, IT‑продукты, медицина, образование. ИИ‑ассистенты в WhatsApp/Telegram, RAG по корпоративной базе, доведение существующих пилотов до прода. Выезд на встречу по Москве и МО — бесплатно.

Санкт‑Петербург

AVAT работает в СПб с 2017 года (как часть L7 Agency). Знаем специфику питерских ниш: туризм, ивенты, премиальный сервис, инжиниринг, креативные индустрии. Агентство по внедрению ИИ в СПб для среднего бизнеса. Выезд по СПб и ЛО — бесплатно.

Россия и СНГ — удалённо

Работаем по всей РФ и СНГ: Казахстан, Беларусь, Узбекистан, Армения. Для 152‑ФЗ‑критичных проектов разворачиваем on‑premise (YandexGPT/GigaChat/Ollama) на вашем сервере или в Yandex Cloud / Selectel. Сложные корпоративные внедрения обсуждаем индивидуально.

Частые вопросы
про внедрение ИИ в бизнес.

Не нашли ответ — спросите в Telegram @hlestov_m, отвечаем за 2 часа.

Почему 90% ИИ‑пилотов не доходят до прода?

По данным «Ведомостей» (март 2026), 90% пилотных ИИ‑проектов российских компаний в 2025 не достигли промышленного внедрения. Главные причины: слабая интеграция с реальными процессами, нехватка людей с опытом продакшен‑LLM, отсутствие ответственности за метрику. Пилот делается «чтобы попробовать», без целевой бизнес‑метрики и интеграционного контура — и упирается в первый же блокер: данные, доступы, стоимость токенов, точность на реальной выборке.

Чем доведение пилота до прода отличается от «обычной разработки бота»?

«Бот под ключ» — это интерфейс и сценарий. Доведение пилота до прода — это работа над тем, на чём пилот сломался: производственные интеграции, очистка данных, RAG‑поиск с релевантностью, prompt‑инженерия с golden‑set, логи и мониторинг, фолбэки, контроль стоимости токенов, SLA на качество. AVAT не делает «ещё один пилот» — берёмся только за то, что должно работать на бизнес‑метрике.

Какие задачи берёте?

Четыре направления. 1) ИИ‑ассистенты в продажах и поддержке (Claude/GPT в Telegram, WhatsApp, на сайте, в Битрикс24/AmoCRM) — от 300 000 ₽. 2) RAG‑поиск по корпоративной базе знаний и документам — от 400 000 ₽. 3) ИИ‑агенты для процессов (классификация, автоответы, действия в CRM/ERP) — от 500 000 ₽. 4) Доведение существующего пилота до прода — оценка после аудита, обычно 300 000 – 1 200 000 ₽.

Какие модели и стек используете?

LLM: Claude (Anthropic) через прокси для РФ — основной выбор для качественной генерации и tool use. OpenAI GPT‑4o/o1 — там, где нужны мультимодальные сценарии. YandexGPT и GigaChat — для on‑premise или 152‑ФЗ‑критичных проектов. Локальные модели через Ollama (Llama 3, Qwen) — для полной приватности. Стек: Python/FastAPI, LangChain/LlamaIndex, Qdrant/pgvector, Langfuse/Helicone, n8n, Supabase/PostgreSQL.

Сколько стоит и какой срок?

Старт от 300 000 ₽ за 3–4 недели — один ИИ‑сценарий целиком до прода, с интеграцией и SLA. Полная имплементация от 600 000 ₽ за 4–6 недель — несколько сценариев в одном контуре с дашбордом качества. Корпоративный кастом 1.5–3 млн ₽ за 1.5–2.5 месяца — мультиагентные системы, RAG на 10k+ документов, кастомные fine‑tune. Месяц поддержки включён, далее retainer от 80 000 ₽/мес.

Гарантируете метрику?

Гарантируем три вещи. Целевая бизнес‑метрика фиксируется в договоре (например, сократить нагрузку на саппорт на 40% или повысить конверсию автоответа лида на 25%). Если на проде метрика не достигнута — продолжаем работу за свой счёт до достижения. Качество ИИ‑ответов измеряется на golden‑set минимум 80% accuracy. Стоимость LLM‑токенов считается заранее и фиксируется.

Что нужно от нас как от заказчика?

Три вещи. 1) Доступ к данным (CRM, базе документов, истории обращений) — без них ИИ не сделать релевантным. 2) Один ответственный с вашей стороны, который может принимать решения по сценарию и проверять качество ответов. 3) Согласие на 2–3 раунда правок prompt‑инженерии после запуска — ИИ не «настраивается один раз», он улучшается на реальных данных.

ИИ заменит сотрудников?

Нет, и это правильно. Сценарий «уволить саппорт, поставить бота» работает только в 10% случаев. Правильный сценарий: ИИ снимает 60–80% типовых запросов, операторы работают только со сложными — и качество растёт. Менеджер вместо 6 часов копипасты — 2 часа продажи горячему лиду. ФОТ остаётся, выручка растёт без расширения штата.

Работаете с конфиденциальными данными и 152‑ФЗ?

Да. Для проектов с персональными данными по 152‑ФЗ предлагаем on‑premise‑варианты: YandexGPT и GigaChat (российские, в облаках с СПД‑сертификацией) или локальные модели через Ollama на ваших серверах. Anonymization‑слой перед отправкой в LLM. NDA, договор обработки персональных данных, журналы доступа. Полная картина согласовывается до старта.

Что делать, если у нас уже есть свой пилот?

Это частый кейс. Не переписываем с нуля, если ваш пилот разумен по архитектуре. Делаем аудит за 1 неделю: фиксируем, на каком блокере он стоит — данные, метрика, стоимость токенов, качество ответов. Дальше делаем именно эту часть. Аудит — от 100 000 ₽, засчитывается в стоимость проекта если идём дальше.

Разберём ваш пилот или задачу
и покажем, что мешает выйти в прод.

Бриф 30–40 минут в Zoom. Если есть пилот — смотрим, что его держит. Если нет — проектируем сценарий с бизнес‑метрикой, оцениваем срок, стоимость, бюджет токенов. Без обязательств.