Не сценарный Salebot. Кастом на Claude и GPT с tools и RAG
agent: > claude.sonnet-4.5

ИИ-ассистенты и боты, которые делают, а не только болтают.

На Claude, GPT, GigaChat или YandexGPT.
С памятью, RAG по вашей базе знаний и tools для действий. Telegram, web, WhatsApp Business, VK. От 60 000 ₽ за 3-7 дней.

AVAT: 24 ИИ-бота в продакшене, 380к диалогов/мес, 92% без эскалации
bot.your-co.ru · claude-sonnet-4.5
LIVE
/ ДИАЛОГ С КЛИЕНТОМ
USER 12:04 Привет, нужен гидрокостюм L, бюджет 25к
AI/ 12:04 Под бюджет 3 варианта в наличии:
• Aqua Pro 3mm, 22 900 ₽
• Beuchat Mundial 5mm, 24 800 ₽
• Cressi Lido 2mm, 19 500 ₽
Передал заявку менеджеру, скоро напишет
/ ПОД КАПОТОМ
12:04:01
intent: product_search
12:04:02
tool_call: 🔧 search_catalog(size=Lbudget=25000) → 3 SKU
12:04:03
rag: 📄 returns_policy.pdf p.12 → 14 дней
12:04:04
action: ⚡ create_lead in AmoCRM ✓
12:04:05
handoff: → менеджер @maria
Telegram WhatsApp Web AmoCRM База знаний
Один ассистент
видит всё · действует во всём
24 бота
в продакшене
380к+
диалогов в месяц
от 60к ₽
за 3-7 дней
92%
без эскалации
// СТЕК ИИ-АГЕНТОВ
Claude Sonnet 4.5· GPT-5· Anthropic SDK· OpenAI SDK· GigaChat MAX· YandexGPT 5· RAG · pgvector· function calling· MCP· n8n· LangGraph· Telegram Bot API· WhatsApp Business· Yandex SpeechKit· Claude Sonnet 4.5· GPT-5· RAG · pgvector· MCP·

Что такое AI-ассистент
в 2026 году.

Слово «бот» давно потеряло смысл. У всех своё. Разберём что мы делаем под ключ.

ЭТО AI-АГЕНТ

Понимает → ищет → действует

Reasoning по запросу, RAG по базе знаний, tools для действий, память контекста на 30+ реплик. Передаёт оператору если не уверен.

НЕ AI-АГЕНТ

FAQ-бот по сценариям

Aimylogic, BotHelp, Salebot. Дерево из 40 кнопок «выберите 1, 2 или 3». Декларативные сценарии, нет reasoning.

НЕ AI-АГЕНТ

Голосовое меню IVR

«Нажмите 1 для записи, 2 для отмены». Боль клиента нарастает с каждым нажатием. Прошлый век.

НЕ AI-АГЕНТ

One-prompt ChatGPT

Подключённый ChatGPT, который красиво болтает, но не знает каталог, не пишет в CRM, не помнит контекст. Демо для инвесторов, не продукт.

Три причины, почему
прошлые боты не работали.

Слышим в каждом втором discovery-звонке. Каждую закрываем в Рабочем пакете.

/ 01

Бот тупит на простом вопросе

«У вас есть размер L?» — «Извините, я вас не понял, выберите из меню». Клиент уходит к конкуренту, который ответил живой человек за 30 сек.

LLM понимает запрос в свободной форме, переспрашивает по смыслу, помнит контекст диалога. Никаких «выберите 1 или 2».
/ 02

Менеджер отвечает 50 раз/день одно и то же

«Где мой заказ?», «Сколько доставка в Казань?», «Какой ваш ИНН?». 70% типовых вопросов съедают рабочий день поддержки.

RAG по вашей базе знаний + tool для проверки статуса заказа. 92% типовых вопросов закрываются без оператора.
/ 03

AI красиво говорит, но не делает

ChatGPT-бот пишет «приходите в 14:00», но в YClients запись не создал. Цифровой швейцар, без рук.

Function calling: бот сам вызывает tools, создаёт запись, оплату, лида в CRM. Действия, не только слова.

Кастом на Claude
vs no-code конструкторы.

Aimylogic, Salebot, BotHelp работают на сценариях. Мы работаем на LLM. Разница принципиальная.

Параметр
Кастом на Claude/GPT
No-code (Aimylogic/Salebot)
Логика
LLM-агент с reasoning и tools
Декларативные if-else-сценарии
Память контекста
До 30+ реплик, длинный диалог
Ограничена тарифом, короткая
RAG по базе знаний
Да, pgvector + embeddings
Базовый поиск по FAQ
Сложные сценарии
Любые multi-step, ветвление
Жёстко ограничены конструктором
Стек LLM
Claude · GPT · GigaChat · YandexGPT
Свой движок + плагин LLM
Сроки разработки
3–7 дней
1–3 дня самостоятельно
Стоимость
От 60 000 ₽ единоразово
От 1 000 ₽/мес навсегда
Owner кода
Вы, в GitHub
Платформа, vendor lock

Пять слоёв
современного AI-агента.

Каждый слой решает свою задачу. Без любого из них бот не работает.

Triggers
TG · WhatsApp · Web
Каналы общения. Telegram Bot API, WhatsApp Business, веб-виджет, VK, Avito.
LLM core
Claude · GPT · YandexGPT
Мозг бота. System-prompt, понимание интента, генерация ответа, гардрейлы.
RAG
pgvector · embeddings
База знаний. Документы → чанки → эмбеддинги → поиск релевантного → ответ с цитатой.
Tools
function calling
Руки бота. get_availability, create_lead, book_yclients, send_invoice, create_deal_amocrm.
Memory & Handoff
Supabase · sentiment
Контекст диалога. История в Postgres, sentiment-trigger на оператора при негативе.

Как бот цитирует
вашу базу знаний.

Кликните на вопрос, посмотрите как ИИ находит фрагмент в документе и отвечает с цитатой.

Когда возврат? Размер L есть? Доставка в Казань? Гарантия на товар?

Claude, GPT, GigaChat
или YandexGPT?

Выбираем на discovery: задача × бюджет × требования ИБ × язык.

Параметр
Claude 4.5
GPT-5
GigaChat MAX
YandexGPT 5
Цена 1М входных
$3
$5
~150 ₽
~120 ₽
Русский язык
Отлично
Отлично
Нативный
Нативный
Function calling
Лучший в классе
Стандарт
Базовый
Базовый
Контекст
200к / 1М tokens
400к tokens
32к tokens
32к tokens
Сервер
Anthropic (US/EU)
OpenAI (US)
РФ, реестр
РФ, реестр
152-ФЗ ready
Через прокси/маскировку
Через прокси/маскировку
Да
Да

Три пути
под вашу нишу.

Outside-стек, Claude-стек или Российский — выбираем по требованиям ИБ и комплаенсу.

Claude-стек
Anthropic SDK · MCP
  • Лучший function calling в классе
  • Контекст до 1М токенов
  • Prompt caching, экономия 90%
  • MCP для интеграций
Когда брать Сложные multi-step агенты, многоканальные диалоги, RAG по большой базе знаний.
OpenAI-стек
GPT-5 · Realtime
  • GPT-5 для сложного reasoning
  • GPT-4o-mini, дёшево и быстро
  • Realtime API для voice
  • Vision для изображений
Когда брать Voice-агенты, мультимодальные боты (распознавание фото товаров), массовые простые диалоги.
Российский стек
GigaChat · YandexGPT
  • Серверы в РФ, в реестре Минцифры
  • 152-ФЗ из коробки
  • Цена в рублях, без VPN
  • Подходит для гос/банков/мед
Когда брать 152-ФЗ, банки, страховые, клиники, гос-смежники, ИБ-требование «всё в РФ».

Пять этапов
от персоны до запуска.

Не дни недели. Смысловые этапы с артефактом на выходе. От 3 рабочих дней.

/ ЭТАП 1, 4 ЧАСА

Персона

Discovery: бизнес, цель бота, тон голоса, 30 типовых запросов. Собираем persona.md с примерами.

→ persona.md + 5 идеальных ответов
/ ЭТАП 2, 1 ДЕНЬ

Диалоги

Системный промпт под персону. Прогон 30 запросов через 2 модели, выбираем стиль. Память, гардрейлы.

→ prompts/v1 в git
/ ЭТАП 3, 1-2 ДНЯ

Tools

Список функций (запись/лид/оплата/поиск). Пишем на Node/Python через SDK. Function calling, тесты.

→ tools/ с покрытием тестами
/ ЭТАП 4, 1 ДЕНЬ

RAG

Notion/Confluence/PDF → чанки → embeddings text-embedding-3-large → pgvector. Контрольная выборка.

→ rag-index + accuracy-отчёт
/ ЭТАП 5, 1 ДЕНЬ

Запуск

Деплой на ваш сервер. BotFather, WhatsApp Business API, web-виджет. Sentry, логи, дашборд. Onboarding 2 ч.

✓ LIVE: бот в проде у клиентов

Четыре пакета
+ Partnership.

Цена и срок фиксируются в договоре. Опаздываем мы, доделываем бесплатно.

СТАРТ
60к
3 дня · 1 канал + 1 tool

Простой бот для сервисного бизнеса или малого e-com. GPT-4o-mini или Claude Haiku.

  • → 1 канал (Telegram или web)
  • → 1 tool: запись YClients / лид / каталог-поиск до 100 SKU
  • → Память 20 реплик
  • → Передача оператору по команде
  • → 7 дней поддержки
Получить смету
РАБОЧИЙ
120к
5 дней · RAG + CRM

Для сервисного бизнеса с CRM, среднего e-com, b2b-агентств. Claude Sonnet или GPT-4o.

  • → До 2 каналов
  • → RAG до 200 страниц
  • → 1 CRM (AmoCRM/Битрикс24/RetailCRM)
  • → До 3 кастомных tools
  • → Аналитика диалогов
  • → 14 дней поддержки
Получить смету
ENTERPRISE
450к₽+
2-3 нед · on-premise + 152-ФЗ

Для банков, страховых, клиник, гос-смежников. Llama 3.1 70B или GigaChat корпоративный.

  • → On-premise (Llama 70B / Qwen) или GigaChat
  • → SSO (LDAP/AD/Keycloak)
  • → Полный аудит-лог
  • → PII-маскировка (паспорта, СНИЛС)
  • → 152-ФЗ комплаенс, договор-поручение
  • → Pentest перед запуском
  • → SLA 99.5% в договоре
  • → 60 дней поддержки
Получить смету

Опции: voice-агент +50к ₽ · сложная интеграция (1С УПП, SAP) от 40к ₽ · миграция с BotHelp/Aimylogic от 80к ₽ · Telegram-WhatsApp-VK дополнительный канал +25к ₽

После релиза: Partnership 2 500 ₽/час (правки промптов, новые tools, разбор плохих диалогов) или Retainer 30 000 ₽/мес (12 ч + мониторинг + ответ за 2 ч)

Наши боты
в продакшене.

Реальные продукты с реальными диалогами. 24 бота в проде, 380к диалогов в месяц.

AI Content

Контент-завод

Генератор постов на Claude в стиле «Заметки системного руководителя». Автопубликация в Telegram-канал. 600+ постов в проде.

600+
постов
Claude
Sonnet
0
ручных правок 8 нед
SaaS Support

Бот-поддержка Пульсар7

RAG по 80 статьям документации. Отвечает на 87% входящих, эскалирует сложное. Развернут за 4 дня.

87%
без оператора
80
статей RAG
4 дн
релиз
HR-агент

HR-скрининг для клиента

Фильтрует 80 откликов в неделю. Задаёт 5-7 вопросов, оценивает релевантность, передаёт рекрутеру 20% качественных.

14 ч/нед
сэкономлено
80
откликов/нед
20%
passrate

ИИ-агенты AVAT не сценарные боты
четыре факта.

  • AVAT строит кастомных агентов на Anthropic SDK (Claude Sonnet 4.5) или OpenAI SDK, не на сценарных движках Salebot или Aimylogic
  • Function calling через tools, а не if-else: цены, скидки и операции с CRM приходят из вашей системы, не из модели
  • Multi-agent через LangGraph для длинных диалогов: lead-qualifier передаёт sales-coach с контекстом, тот закрывает сделку
  • AVAT держит 24 ИИ-бота в продакшене, 380 000 диалогов в месяц, 92% без эскалации на оператора

Что спрашивают
перед заказом AI-бота.

10 горячих вопросов и прямые ответы.

Какую модель используете, Claude или GPT?

По умолчанию Claude Sonnet 4.5 для основной логики и Haiku в роли роутера. На простых задачах GPT-4o-mini, она быстрее и дешевле. Для импортозамещения под 152-ФЗ или госконтракт GigaChat MAX или YandexGPT 5 Pro. Выбираем на discovery.

А если бот сочинит цену или скидку?

Цены не приходят из модели, они приходят из tool: get_price, get_promo, get_availability. Это function calling. Модель формулирует ответ, цифры берёт из вашей системы. Если tool вернул пусто, бот говорит «уточню у менеджера», а не выдумывает. Если боту нужна своя БД и multi-tenant архитектура — встраиваем в SaaS-продукт.

Кто платит за токены?

В пакетах Старт и Рабочий первый месяц токенов наш счёт (заложено в стоимость). Дальше вы заводите аккаунт в Anthropic Console или OpenAI и платите напрямую. В Премиум и Enterprise сразу на ваш аккаунт. Средний диалог 0.4-2 ₽.

RAG это то же что дообучение?

Нет. Дообучение это переобучение модели на ваших данных, 3 месяца и от 500к ₽. RAG это поиск в вашей базе перед каждым ответом. Быстрее, дешевле, легче обновлять. Добавил статью в Notion, через 5 минут бот её знает.

Voice-бот реально?

Да, в Премиум-пакете. Pipeline: входящий звонок → Yandex SpeechKit STT → Claude → SpeechKit TTS → ответ. Задержка 1.2-1.8 сек, для b2b-скриптов норм. Делали для исходящего обзвона лидов и приёма входящих звонков.

Multi-agent зачем?

Один промпт работает до 5-7 шагов диалога, дальше путается. Multi-agent: lead-qualifier держит 8 вопросов, передаёт sales-coach с контекстом, тот закрывает. Каждый агент 200-400 токенов промпта, не 4000.

У нас банк, on-premise можно?

Да. Llama 3.1 70B или Qwen2.5 72B на вашем сервере (нужно 2x A100 80Gb). Или GigaChat/YandexGPT по корпоративному контракту, серверы в РФ, в реестре Минцифры. Enterprise-пакет от 450к ₽.

Аналитика диалогов?

В Рабочем выгрузка в Google Sheet с фильтрами. В Премиуме наш дашборд в реальном времени: диалогов, средняя длина, conversion, горячие лиды, негативные диалоги, top-10 вопросов в неделю.

Поддержка после релиза?

60 дней гарантии на код, наши баги правим бесплатно. Дальше: ваша команда (onboarding 2 ч), Partnership 2 500 ₽/час, Retainer 30 000 ₽/мес (12 ч + мониторинг Sentry + ответ за 2 часа).

Кому принадлежит бот?

Вам. GitHub-репозиторий под вашей организацией, сервер под вашим аккаунтом, домен ваш, токен Anthropic/OpenAI ваш. Если AVAT закроется завтра, бот работает, любая команда подхватит.

AI-агент,
который делает,
а не только болтает.

Бриф 30 минут, без обязательств. Покажите сценарий, скажем что автоматизируем и за сколько.

→ Ответим в Telegram в течение часа в рабочее время.

Получить смету за 30 минут