Где территориально работаете?

AVAT базируется в Москве и Санкт-Петербурге, работаем с клиентами по всей России и СНГ. Большая часть проектов идёт полностью удалённо. Для крупных корпоративных внедрений выезжаем на встречи в Москву и СПб бесплатно, в другие города - с компенсацией командировочных.

channel: > Внедрение ИИ в бизнес

Доводим ИИ‑пилот до промышленного использования

Q: Почему 90% ИИ-пилотов не доходят до прода?

По данным «Ведомостей» (март 2026), 90% пилотных ИИ-проектов российских компаний в 2025 не достигли промышленного внедрения. Главные причины: слабая интеграция с реальными процессами, нехватка людей с опытом продакшен-LLM, отсутствие ответственности за метрику. Пилот делается «чтобы попробовать», без целевой бизнес-метрики и интеграционного контура - и упирается в первый же блокер: данные, доступы, стоимость токенов, точность на реальной выборке.

Q: Какие задачи берёте?

Четыре направления. 1) ИИ-ассистенты в продажах и поддержке (Claude/GPT в Telegram, WhatsApp, на сайте, в Битрикс24/AmoCRM) - от 300 000 ₽. 2) RAG-поиск по корпоративной базе знаний и документам (300+ страниц регламентов, договоров, инструкций - ИИ ищет и цитирует) - от 400 000 ₽. 3) ИИ-агенты для процессов (классификация обращений, автоответы, действия в CRM/ERP, маршрутизация) - от 500 000 ₽. 4) Доведение существующего пилота до прода - оценка после аудита, обычно 300 000 - 1 200 000 ₽.

Q: Сколько стоит и какой срок?

Старт от 300 000 ₽ за 3-4 недели - один ИИ-сценарий целиком до прода, с интеграцией и SLA. Полная имплементация от 600 000 ₽ за 4-6 недель - несколько сценариев в одном контуре с дашбордом качества. Корпоративный кастом 1.5-3 млн ₽ за 1.5-2.5 месяца - мультиагентные системы, RAG на 10k+ документов, кастомные fine-tune. Месяц поддержки включён в стоимость, далее retainer от 80 000 ₽/мес.

Q: Гарантируете метрику?

Гарантируем три вещи: целевая бизнес-метрика фиксируется в договоре (например, сократить нагрузку на саппорт на 40% или повысить конверсию автоответа лида на 25%). Если на проде метрика не достигнута - продолжаем работу за свой счёт до достижения. Качество ИИ-ответов измеряется на golden-set минимум 80% accuracy. Стоимость LLM-токенов считается заранее и фиксируется.

Q: Работаете с конфиденциальными данными и 152-ФЗ?

Да. Для проектов с персональными данными по 152-ФЗ предлагаем on-premise-варианты: YandexGPT и GigaChat (российские, в облаках с СПД-сертификацией) или локальные модели через Ollama на ваших серверах. Anonymization-слой перед отправкой в LLM. NDA, договор обработки персональных данных, журналы доступа. Полная картина согласовывается до старта.

90% ИИ‑пилотов в РФ в 2025 не дошли до прода - слабая интеграция и нехватка людей. AVAT берёт ту часть, где обычно ломается: данные, интеграции, ревью, ответственность за бизнес‑метрику. От 300 000 ₽ за 3-4 недели, SLA в договоре.

Обсудить внедрение ИИ Тарифы и сроки

80%+

accuracy
на golden‑set

📥 Источники CRM · база · API

→

🔎 RAG векторный поиск

→

🧠 Claude API ответ + действие

📋 Golden set эталон ответов

→

📊 Eval accuracy / cost

→

🚦 Решение ship / refine

📈 Langfuse логи и метрики

→

👤 Human review критичные шаги

→

💰 SLA фикс в договоре

3-4 нед

до прода

300к ₽

от суммы

80%+

accuracy

SLA

в договоре

3-4 нед

от пилота до прода

6 SaaS

с встроенным ИИ в проде

80%+

accuracy на golden‑set

SLA

на метрику в договоре

// НАШИ КЛИЕНТЫ

// НА ЭТОЙ СТРАНИЦЕ

/ 01, НАПРАВЛЕНИЯ

Четыре сценария,
в которых ИИ доходит до промышленного

Каждый сценарий = одна бизнес‑метрика в договоре. Без метрики проект не берём - иначе через 3 месяца это окажется ещё одним «красивым пилотом».

ИИ‑ассистент в продажах и поддержке

Claude или GPT в Telegram, WhatsApp, на сайте, в Битрикс24/AmoCRM. Снимает 60-80% типовых обращений, передаёт сложные оператору с контекстом разговора. Целевая метрика - минус N часов саппорта в неделю.

от 300 000 ₽ · 3 недели

RAG‑поиск по корпоративной базе

ИИ ищет в 300+ страницах регламентов, договоров, инструкций, истории переписки. Отвечает с цитатами и ссылками на источник. Векторная база Qdrant/pgvector, ре‑ранжирование, контроль галлюцинаций.

от 400 000 ₽ · 3-4 недели

ИИ‑агенты для процессов

Классификация обращений, маршрутизация в CRM, автоответ с действием (создать сделку, выставить счёт, поставить задачу). Мультиагентные сценарии через function calling. Контроль через human‑in‑the‑loop на критичных шагах.

от 500 000 ₽ · 4-6 недель

Доведение существующего пилота

У вас уже есть демо или MVP, который завис между «выглядит круто» и «реально работает». Делаем аудит, фиксируем что ломает выход в прод (данные, метрика, стоимость, точность) и дорабатываем именно это. Без переписывания с нуля.

от 300 000 ₽ · оценка после аудита

/ 02, ПОЗИЦИОНИРОВАНИЕ

Почему AVAT,
а не «бот за 50к» и не системный интегратор

«Бот за 50к» делает интерфейс - и падает на первой интеграции. Системный интегратор просит 5 млн и полгода. Внутренний R&D застрял на пилоте уже шесть месяцев. AVAT - четвёртый путь: production‑ready ИИ под бизнес‑метрику за 3-6 недель.

Берём только то, у чего есть метрика

Без целевой бизнес‑метрики проект не стартует. Не «внедрим ИИ», а «снимем 40% обращений саппорта» или «повысим конверсию автоответа лида на 25%». Метрика - в договоре, не достигли - продолжаем за свой счёт.

Продакшен, а не демо

Логирование каждого вызова (Langfuse), мониторинг точности на golden‑set, фолбэки, лимиты на стоимость токенов, ревью человеком на критичных шагах. То, чего обычно нет в пилоте - причина, почему 90% из них умирают.

Стоимость токенов считается заранее

Главный неожиданный счёт ИИ‑внедрений - расход на LLM‑токены. Считаем на этапе архитектуры и фиксируем месячный потолок. Кэширование, дешёвые модели на дешёвых шагах, дорогие - только где нужно.

Скорость вайбкодинга

Cursor, Claude Code, GitHub Copilot. То, что у классического интегратора занимает 2-3 месяца, делаем за 3-6 недель. У AVAT 6 собственных SaaS в продакшне с встроенным ИИ - знаем что ломается раньше клиента.

152‑ФЗ и on‑premise

Для проектов с ПДн - YandexGPT/GigaChat (российские, сертифицированные) или локальные модели через Ollama на вашем сервере. Anonymization‑слой перед отправкой в LLM. NDA и договор обработки персональных данных по 152‑ФЗ.

SLA на качество и стоимость

Accuracy на golden‑set не ниже 80%. Latency ответа не выше Х секунд. Стоимость токенов в пределах Y ₽/мес. Всё в договоре. Месяц поддержки включён, далее retainer от 80 000 ₽/мес.

/ 03, КАК РАБОТАЕМ

Пять шагов
от пилота до промышленного использования

Аудит пилота и данных

Смотрим что есть: что показал пилот, какие данные доступны, где интеграции, кто отвечает за метрику. Фиксируем целевую бизнес‑метрику (минус N часов саппорта, плюс N% конверсии). Без неё - не берём.

Неделя 1

Архитектура и данные

Выбираем LLM (Claude/GPT/GigaChat/YandexGPT), способ векторизации, формат логов, фолбэки, ревью‑контур. Готовим golden‑set из 50-200 эталонных примеров. Считаем стоимость токенов на месяц.

Неделя 2

Интеграции и сборка

Подключаемся к CRM, ERP, базам знаний, файлам, email, мессенджерам. Делаем API, очереди, RAG, function calling, мультиагентные сценарии. Логирование каждого шага через Langfuse/Helicone.

Недели 2-3

Тесты и ревью

Прогон golden‑set, accuracy/precision/recall. Edge‑cases. Подключаем выборочный ручной ревью оператора. Замеряем latency и стоимость одного вызова на реальной нагрузке.

Неделя 3

Запуск и SLA

Включаем на ограниченной аудитории, мониторим метрику 5-7 дней. Масштабирование. Фиксируем SLA на точность, latency, бюджет токенов. Месяц поддержки в стоимости, далее retainer.

Неделя 4

/ 04, СТЕК

Production‑стек ИИ
То, что не отвалится через месяц

Стек собирается под бизнес‑метрику и ограничения по 152‑ФЗ. У вас остаётся полный код и документация: любая ИИ‑команда продолжит после нас без «vendor lock».

LLM‑модели

AI Core

Claude (Sonnet/Opus/Haiku) - через прокси, главный выбор для tool use и RAG
GPT - мультимодальные сценарии
GigaChat, YandexGPT - для 152‑ФЗ
Llama 3 / Qwen через Ollama - on‑premise, полная приватность

RAG и векторы

Retrieval

Qdrant - основной векторный store
pgvector - встроенный в PostgreSQL
LlamaIndex и LangChain - оркестрация
Hybrid search + ре‑ранжирование, контроль галлюцинаций

Логи и мониторинг

Observability

Langfuse - открытый, self‑hosted, в РФ
Helicone - стоимость и latency
Golden‑set + автоматический eval
Алерты на падение accuracy и всплеск стоимости

Бэкенд и данные

Data Layer

FastAPI, Python - основной бэкенд
Supabase, PostgreSQL - оперативные данные
Redis - кэширование LLM‑ответов
Очереди (Celery, BullMQ) для тяжёлых пайплайнов

Интеграции

Channels

AmoCRM, Битрикс24 - через webhooks и REST
Telegram, WhatsApp Business - мессенджеры
Email, веб‑чат, мобильные SDK
n8n - оркестрация неосновных шагов

Инфраструктура

Infra

Selectel, Yandex Cloud - РФ‑облака, 152‑ФЗ
On‑premise - для банков, страховых, госсектора
Docker + Kubernetes для production
Anonymization‑прокси перед внешними LLM

/ 05, КЕЙСЫ

Шесть продуктов AVAT,
в каждом ИИ работает в проде

У AVAT есть собственные SaaS, где ИИ - часть продукта, а не «красивый пилот». На этих кейсах видно, что именно мы умеем доводить. Внешние клиентские кейсы под NDA - показываем на брифе.

КЗ

L7 / Контент

Контент‑завод - ИИ‑генерация постов

ИИ собирает контекст, генерирует пост в стиле бренда, складывает в админку черновиком, после утверждения автопубликует в Telegram. Двухэтапный prompt + ревью человеком на критичных шагах.

Замена контент‑менеджера на 80% задач · −60 000 ₽/мес ФОТ

80%

задач авто

−60к

ФОТ/мес

Claude

+ human review

Внешний / NDA · ИИ‑бот

ИИ‑бот в WhatsApp для beauty‑сети

Сеть салонов красоты, 8 точек, 120 клиентов в день. ИИ‑ассистент в WhatsApp принимает запись 24/7, проверяет слоты в YClients, ведёт follow‑up по возвратам. RAG по услугам и ценам.

−70% нагрузки администраторов · +28% повторных визитов

−70%

нагрузка адм.

+28%

повторных

24/7

приём заявок

МП

L7 / Маркетплейсы

МП Приборка - ИИ в аналитике WB/Ozon

ИИ классифицирует возвраты по причинам, объясняет падение маржи по SKU, готовит summary за неделю по каждому клиенту. 40 аккаунтов, мультитенант.

40 клиентов · заменяет 2-3 аналитиков в одной компании

клиентов

2-3

аналитика замена

WB+Ozon

обе платформы

L7 / Управл. учёт

Пульсар7 - ИИ‑комментарии к KPI

Дашборд KPI для собственника + ИИ автоматически пишет недельный комментарий «что произошло, на что смотреть». Сборка данных из CRM, банка, рекламных кабинетов.

60 платящих компаний · экономия 4-6 часов в неделю на собственника

компаний

−6ч

рутины/нед

ИИ

недельный summary

Обсудим ваш проект?

Расскажите задачу - подберём формат, цену и срок. Ответим в рабочее время.

Обсудить проект

/ 06, ТАРИФЫ

Три формата работы
Фиксированная цена и SLA в договоре

Без процентов от выручки. Стоимость токенов считается и фиксируется заранее. Бизнес‑метрика - в договоре: не достигли - продолжаем за свой счёт до достижения.

Старт

300 000 ₽

3 недели · один ИИ‑сценарий

Один ИИ‑сценарий до прода целиком: ассистент в поддержке/продажах или RAG‑поиск по корпоративной базе. Для первого реального внедрения, когда нужно увидеть результат на метрике за один цикл.

1 сценарий, 1-2 канала (чат / WhatsApp / CRM)
Аудит данных и интеграции к источникам
Golden‑set 50-100 примеров + eval
Langfuse‑логи, мониторинг качества и стоимости
SLA на accuracy и latency в договоре
Месяц поддержки в стоимости

Обсудить

ПОПУЛЯРНЫЙ Полная имплементация

600 000 ₽

4-6 недель · несколько сценариев

Несколько связанных сценариев в одном контуре: ассистент + RAG + ИИ‑агенты с действиями в CRM. Дашборд качества и стоимости в Langfuse. Подходит, если есть несколько процессов под ИИ и хочется одного подрядчика.

2-4 связанных ИИ‑сценария
RAG по базе документов + ре‑ранжирование
ИИ‑агенты с function calling и human‑in‑the‑loop
Интеграции с AmoCRM/Битрикс24/ERP
Golden‑set 100-200 примеров
SLA + квартал поддержки в стоимости

Обсудить

Корпоративный кастом

1.5-3 млн ₽

1.5-2.5 месяца

Мультиагентные системы, RAG на 10k+ документов, on‑premise‑модели через Ollama, fine‑tune под отраслевой язык. Для банков, страховых, госсектора и промышленности - с соблюдением 152‑ФЗ.

Мультиагентная архитектура
On‑premise LLM (Llama 3 / Qwen / GigaChat)
Fine‑tune или instruct‑tune под домен
Anonymization‑слой, NDA, 152‑ФЗ
Аудит безопасности и нагрузочное тестирование
SLA с неустойкой + retainer 6+ месяцев

Обсудить

Стоимость токенов LLM считается и фиксируется до старта. Дальнейшая поддержка - retainer от 80 000 ₽/мес. NDA подписываем бесплатно.

/ 07, СРАВНЕНИЕ

AVAT против трёх альтернатив
Когда мы - и когда не мы

«Бот за 50к», внутренний R&D и системный интегратор закрывают свои задачи. Сравнение не «мы лучше» - а «где нас имеет смысл звать».

/ ПАРАМЕТР

«Бот за 50к»

AVAT

Системный интегратор

Бюджет

30-80 тыс ₽

300 тыс - 3 млн ₽

5-30 млн ₽

Срок до прода

2 недели

3-6 недель

6-18 месяцев

Бизнес‑метрика в договоре

Нет

Да, SLA

Иногда, формально

Интеграции с CRM/ERP

1-2 через Zapier

Сколько нужно, нативно

Все, долго и дорого

Логи и мониторинг качества

Нет

Langfuse + golden‑set

Корпоративный APM

152‑ФЗ / on‑premise

Нет

Да, GigaChat/YandexGPT/Ollama

Да, через комитет

Кому подходит

Хобби, тест идеи

Бизнес 20-500 чел., средний

Enterprise 500+ чел.

«Бот за 50к» - если нужно «попробовать» без бизнес‑метрики. Системный интегратор - если у вас 500+ человек и два года терпения. AVAT - если ИИ должен принести деньги или сэкономить часы в этом квартале и при этом не развалиться через три месяца.

/ 08, РЕГИОНЫ

Москва, Санкт‑Петербург
Удалённо по всей России и СНГ

Большая часть проектов идёт онлайн: бриф в Zoom, согласование в Telegram, передача кода через GitHub. На ключевые встречи и корпоративные внедрения выезжаем.

Москва

Основная база команды. Внедрение ИИ для московских компаний: e‑commerce, beauty‑сети, фитнес, b2b‑услуги, IT‑продукты, медицина, образование. ИИ‑ассистенты в WhatsApp/Telegram, RAG по корпоративной базе, доведение существующих пилотов до прода. Выезд на встречу по Москве и МО - бесплатно.

Санкт‑Петербург

AVAT работает в СПб с 2017 года (как часть L7 Agency). Знаем специфику питерских ниш: туризм, ивенты, премиальный сервис, инжиниринг, креативные индустрии. Агентство по внедрению ИИ в СПб для среднего бизнеса. Выезд по СПб и ЛО - бесплатно.

Россия и СНГ - удалённо

Работаем по всей РФ и СНГ: Казахстан, Беларусь, Узбекистан, Армения. Для 152‑ФЗ‑критичных проектов разворачиваем on‑premise (YandexGPT/GigaChat/Ollama) на вашем сервере или в Yandex Cloud / Selectel. Сложные корпоративные внедрения обсуждаем индивидуально.

/ 09, FAQ

Частые вопросы
про внедрение ИИ в бизнес

Не нашли ответ - спросите в Telegram @hlestov_m, отвечаем за 2 часа.

Почему 90% ИИ‑пилотов не доходят до прода?

По данным «Ведомостей» (март 2026), 90% пилотных ИИ‑проектов российских компаний в 2025 не достигли промышленного внедрения. Главные причины: слабая интеграция с реальными процессами, нехватка людей с опытом продакшен‑LLM, отсутствие ответственности за метрику. Пилот делается «чтобы попробовать», без целевой бизнес‑метрики и интеграционного контура - и упирается в первый же блокер: данные, доступы, стоимость токенов, точность на реальной выборке.

Чем доведение пилота до прода отличается от «обычной разработки бота»?

«Бот под ключ» - это интерфейс и сценарий. Доведение пилота до прода - это работа над тем, на чём пилот сломался: производственные интеграции, очистка данных, RAG‑поиск с релевантностью, prompt‑инженерия с golden‑set, логи и мониторинг, фолбэки, контроль стоимости токенов, SLA на качество. AVAT не делает «ещё один пилот» - берёмся только за то, что должно работать на бизнес‑метрике.

Какие задачи берёте?

Четыре направления. 1) ИИ‑ассистенты в продажах и поддержке (Claude/GPT в Telegram, WhatsApp, на сайте, в Битрикс24/AmoCRM) - от 300 000 ₽. 2) RAG‑поиск по корпоративной базе знаний и документам - от 400 000 ₽. 3) ИИ‑агенты для процессов (классификация, автоответы, действия в CRM/ERP) - от 500 000 ₽. 4) Доведение существующего пилота до прода - оценка после аудита, обычно 300 000 - 1 200 000 ₽.

Какие модели и стек используете?

LLM: Claude (Anthropic) через прокси для РФ - основной выбор для качественной генерации и tool use. OpenAI GPT - там, где нужны мультимодальные сценарии. YandexGPT и GigaChat - для on‑premise или 152‑ФЗ‑критичных проектов. Локальные модели через Ollama (Llama 3, Qwen) - для полной приватности. Стек: Python/FastAPI, LangChain/LlamaIndex, Qdrant/pgvector, Langfuse/Helicone, n8n, Supabase/PostgreSQL.

Сколько стоит и какой срок?

Старт от 300 000 ₽ за 3-4 недели - один ИИ‑сценарий целиком до прода, с интеграцией и SLA. Полная имплементация от 600 000 ₽ за 4-6 недель - несколько сценариев в одном контуре с дашбордом качества. Корпоративный кастом 1.5-3 млн ₽ за 1.5-2.5 месяца - мультиагентные системы, RAG на 10k+ документов, кастомные fine‑tune. Месяц поддержки включён, далее retainer от 80 000 ₽/мес.

Гарантируете метрику?

Гарантируем три вещи. Целевая бизнес‑метрика фиксируется в договоре (например, сократить нагрузку на саппорт на 40% или повысить конверсию автоответа лида на 25%). Если на проде метрика не достигнута - продолжаем работу за свой счёт до достижения. Качество ИИ‑ответов измеряется на golden‑set минимум 80% accuracy. Стоимость LLM‑токенов считается заранее и фиксируется.

Что нужно от нас как от заказчика?

Три вещи. 1) Доступ к данным (CRM, базе документов, истории обращений) - без них ИИ не сделать релевантным. 2) Один ответственный с вашей стороны, который может принимать решения по сценарию и проверять качество ответов. 3) Согласие на 2-3 раунда правок prompt‑инженерии после запуска - ИИ не «настраивается один раз», он улучшается на реальных данных.

ИИ заменит сотрудников?

Нет, и это правильно. Сценарий «уволить саппорт, поставить бота» работает только в 10% случаев. Правильный сценарий: ИИ снимает 60-80% типовых запросов, операторы работают только со сложными - и качество растёт. Менеджер вместо 6 часов копипасты - 2 часа продажи горячему лиду. ФОТ остаётся, выручка растёт без расширения штата.

Работаете с конфиденциальными данными и 152‑ФЗ?

Да. Для проектов с персональными данными по 152‑ФЗ предлагаем on‑premise‑варианты: YandexGPT и GigaChat (российские, в облаках с СПД‑сертификацией) или локальные модели через Ollama на ваших серверах. Anonymization‑слой перед отправкой в LLM. NDA, договор обработки персональных данных, журналы доступа. Полная картина согласовывается до старта.

Что делать, если у нас уже есть свой пилот?

Это частый кейс. Не переписываем с нуля, если ваш пилот разумен по архитектуре. Делаем аудит за 1 неделю: фиксируем, на каком блокере он стоит - данные, метрика, стоимость токенов, качество ответов. Дальше делаем именно эту часть. Аудит - от 100 000 ₽, засчитывается в стоимость проекта если идём дальше.

/ 10, СТАРТ

Разберём ваш пилот или задачу
и покажем, что мешает выйти в прод.

Бриф 30-40 минут в Zoom. Если есть пилот - смотрим, что его держит. Если нет - проектируем сценарий с бизнес‑метрикой, оцениваем срок, стоимость, бюджет токенов. Без обязательств.

Обсудить внедрение ИИ Написать в Telegram

Доводим ИИ‑пилот до промышленного использования

Четыре сценария, в которых ИИ доходит до промышленного

ИИ‑ассистент в продажах и поддержке

RAG‑поиск по корпоративной базе

ИИ‑агенты для процессов

Доведение существующего пилота

Почему AVAT, а не «бот за 50к» и не системный интегратор

Пять шагов от пилота до промышленного использования

Аудит пилота и данных

Архитектура и данные

Интеграции и сборка

Тесты и ревью

Запуск и SLA

Production‑стек ИИ То, что не отвалится через месяц

Шесть продуктов AVAT, в каждом ИИ работает в проде

Контент‑завод - ИИ‑генерация постов

ИИ‑бот в WhatsApp для beauty‑сети

МП Приборка - ИИ в аналитике WB/Ozon

Пульсар7 - ИИ‑комментарии к KPI

Обсудим ваш проект?

Три формата работы Фиксированная цена и SLA в договоре

AVAT против трёх альтернатив Когда мы - и когда не мы

Москва, Санкт‑Петербург Удалённо по всей России и СНГ

Москва

Санкт‑Петербург

Россия и СНГ - удалённо

Частые вопросы про внедрение ИИ в бизнес

Разберём ваш пилот или задачу и покажем, что мешает выйти в прод.

Четыре сценария,
в которых ИИ доходит до промышленного

Почему AVAT,
а не «бот за 50к» и не системный интегратор

Пять шагов
от пилота до промышленного использования

Production‑стек ИИ
То, что не отвалится через месяц

Шесть продуктов AVAT,
в каждом ИИ работает в проде

Три формата работы
Фиксированная цена и SLA в договоре

AVAT против трёх альтернатив
Когда мы - и когда не мы

Москва, Санкт‑Петербург
Удалённо по всей России и СНГ

Частые вопросы
про внедрение ИИ в бизнес

Разберём ваш пилот или задачу
и покажем, что мешает выйти в прод.