Понимает → ищет → действует
Reasoning по запросу, RAG по базе знаний, tools для действий, память контекста на 30+ реплик. Передаёт оператору если не уверен.
На Claude, GPT, GigaChat или YandexGPT.
С памятью, RAG по вашей базе знаний и tools для действий. Telegram, web, WhatsApp Business, VK. От 60 000 ₽ за 3-7 дней.
Слово «бот» давно потеряло смысл. У всех своё. Разберём что мы делаем под ключ.
Reasoning по запросу, RAG по базе знаний, tools для действий, память контекста на 30+ реплик. Передаёт оператору если не уверен.
Aimylogic, BotHelp, Salebot. Дерево из 40 кнопок «выберите 1, 2 или 3». Декларативные сценарии, нет reasoning.
«Нажмите 1 для записи, 2 для отмены». Боль клиента нарастает с каждым нажатием. Прошлый век.
Подключённый ChatGPT, который красиво болтает, но не знает каталог, не пишет в CRM, не помнит контекст. Демо для инвесторов, не продукт.
Слышим в каждом втором discovery-звонке. Каждую закрываем в Рабочем пакете.
«У вас есть размер L?» — «Извините, я вас не понял, выберите из меню». Клиент уходит к конкуренту, который ответил живой человек за 30 сек.
«Где мой заказ?», «Сколько доставка в Казань?», «Какой ваш ИНН?». 70% типовых вопросов съедают рабочий день поддержки.
ChatGPT-бот пишет «приходите в 14:00», но в YClients запись не создал. Цифровой швейцар, без рук.
Кликните на тип, чтобы увидеть пример диалога и какие tools использует бот.
Aimylogic, Salebot, BotHelp работают на сценариях. Мы работаем на LLM. Разница принципиальная.
Каждый слой решает свою задачу. Без любого из них бот не работает.
Кликните на вопрос, посмотрите как ИИ находит фрагмент в документе и отвечает с цитатой.
Выбираем на discovery: задача × бюджет × требования ИБ × язык.
Outside-стек, Claude-стек или Российский — выбираем по требованиям ИБ и комплаенсу.
Не дни недели. Смысловые этапы с артефактом на выходе. От 3 рабочих дней.
Discovery: бизнес, цель бота, тон голоса, 30 типовых запросов. Собираем persona.md с примерами.
Системный промпт под персону. Прогон 30 запросов через 2 модели, выбираем стиль. Память, гардрейлы.
Список функций (запись/лид/оплата/поиск). Пишем на Node/Python через SDK. Function calling, тесты.
Notion/Confluence/PDF → чанки → embeddings text-embedding-3-large → pgvector. Контрольная выборка.
Деплой на ваш сервер. BotFather, WhatsApp Business API, web-виджет. Sentry, логи, дашборд. Onboarding 2 ч.
Цена и срок фиксируются в договоре. Опаздываем мы, доделываем бесплатно.
Простой бот для сервисного бизнеса или малого e-com. GPT-4o-mini или Claude Haiku.
Для сервисного бизнеса с CRM, среднего e-com, b2b-агентств. Claude Sonnet или GPT-4o.
Для среднего бизнеса, HR, SaaS-поддержки. Claude Sonnet 4.5 + Haiku-роутер.
Для банков, страховых, клиник, гос-смежников. Llama 3.1 70B или GigaChat корпоративный.
Опции: voice-агент +50к ₽ · сложная интеграция (1С УПП, SAP) от 40к ₽ · миграция с BotHelp/Aimylogic от 80к ₽ · Telegram-WhatsApp-VK дополнительный канал +25к ₽
После релиза: Partnership 2 500 ₽/час (правки промптов, новые tools, разбор плохих диалогов) или Retainer 30 000 ₽/мес (12 ч + мониторинг + ответ за 2 ч)
Реальные продукты с реальными диалогами. 24 бота в проде, 380к диалогов в месяц.
Генератор постов на Claude в стиле «Заметки системного руководителя». Автопубликация в Telegram-канал. 600+ постов в проде.
RAG по 80 статьям документации. Отвечает на 87% входящих, эскалирует сложное. Развернут за 4 дня.
Фильтрует 80 откликов в неделю. Задаёт 5-7 вопросов, оценивает релевантность, передаёт рекрутеру 20% качественных.
10 горячих вопросов и прямые ответы.
По умолчанию Claude Sonnet 4.5 для основной логики и Haiku в роли роутера. На простых задачах GPT-4o-mini, она быстрее и дешевле. Для импортозамещения под 152-ФЗ или госконтракт GigaChat MAX или YandexGPT 5 Pro. Выбираем на discovery.
Цены не приходят из модели, они приходят из tool: get_price, get_promo, get_availability. Это function calling. Модель формулирует ответ, цифры берёт из вашей системы. Если tool вернул пусто, бот говорит «уточню у менеджера», а не выдумывает. Если боту нужна своя БД и multi-tenant архитектура — встраиваем в SaaS-продукт.
В пакетах Старт и Рабочий первый месяц токенов наш счёт (заложено в стоимость). Дальше вы заводите аккаунт в Anthropic Console или OpenAI и платите напрямую. В Премиум и Enterprise сразу на ваш аккаунт. Средний диалог 0.4-2 ₽.
Нет. Дообучение это переобучение модели на ваших данных, 3 месяца и от 500к ₽. RAG это поиск в вашей базе перед каждым ответом. Быстрее, дешевле, легче обновлять. Добавил статью в Notion, через 5 минут бот её знает.
Да, в Премиум-пакете. Pipeline: входящий звонок → Yandex SpeechKit STT → Claude → SpeechKit TTS → ответ. Задержка 1.2-1.8 сек, для b2b-скриптов норм. Делали для исходящего обзвона лидов и приёма входящих звонков.
Один промпт работает до 5-7 шагов диалога, дальше путается. Multi-agent: lead-qualifier держит 8 вопросов, передаёт sales-coach с контекстом, тот закрывает. Каждый агент 200-400 токенов промпта, не 4000.
Да. Llama 3.1 70B или Qwen2.5 72B на вашем сервере (нужно 2x A100 80Gb). Или GigaChat/YandexGPT по корпоративному контракту, серверы в РФ, в реестре Минцифры. Enterprise-пакет от 450к ₽.
В Рабочем выгрузка в Google Sheet с фильтрами. В Премиуме наш дашборд в реальном времени: диалогов, средняя длина, conversion, горячие лиды, негативные диалоги, top-10 вопросов в неделю.
60 дней гарантии на код, наши баги правим бесплатно. Дальше: ваша команда (onboarding 2 ч), Partnership 2 500 ₽/час, Retainer 30 000 ₽/мес (12 ч + мониторинг Sentry + ответ за 2 часа).
Вам. GitHub-репозиторий под вашей организацией, сервер под вашим аккаунтом, домен ваш, токен Anthropic/OpenAI ваш. Если AVAT закроется завтра, бот работает, любая команда подхватит.
Бриф 30 минут, без обязательств. Покажите сценарий, скажем что автоматизируем и за сколько.