Дикие боты про Ai, ИИ и Ай-яй-яи

Авторский блог про нейросети

10 сентября, 2025

Сегодня делюсь подробным апдейтом о том, как продвигается разработка ботов Wildbots: какие этапы мы прошли, над чем работаем прямо сейчас и какие результаты уже видим. Расскажу о технологическом стеке, метриках качества, инфраструктуре, тестировании и планах на ближайшие спринты. Этот пост — честный срез прогресса, трудностей и находок команды. Поехали! 🚀


Что мы строим и зачем 🤖

Wildbots — это платформа умных ботов для поддержки клиентов, продаж и внутренних процессов. Наша цель — сократить время ответа, повысить конверсию и разгрузить команды, сохраняя дружелюбный тон и точность ответов. Мы совмещаем классические диалоги по сценариям с пониманием естественного языка (NLU) и подключаем внешние источники знаний, чтобы бот знал именно то, что нужно вашим пользователям.

Этапы, которые мы прошли 🗺️

Discovery и исследование

  • Собрали пул реальных кейсов из поддержки, продаж и HR.
  • Сформировали карту интентов и типовые диалоги по индустриям.
  • Определили ключевые метрики: точность распознавания интентов, время ответа, доля автозакрытия обращений, удовлетворенность (CSAT/NPS), стоимость сессии.

MVP и первые пилоты

  • Поддержали каналы: Telegram, WhatsApp Business, VK и веб-виджет.
  • Сделали конструктор сценариев с визуальными ветвлениями и условиями.
  • Подключили поиск по базе знаний (RAG) с приоритизацией свежего контента.
  • Реализовали «дежурного человека»: безопасная передача диалога оператору.

Альфа → Бета

  • Добавили интеграции с CRM (amoCRM, Bitrix24, HubSpot) и тикет-системами (Zendesk, Jira Service Management).
  • Запустили платежные сценарии (YooKassa/Stripe) с чек-аутом внутри диалога.
  • Расширили мультиязычность: ru/en + автодетект языка.
  • Сделали редактор тональности голосом бренда и библиотеку готовых шаблонов.

Что работает прямо сейчас ✅

  • Точность распознавания интентов (micro-F1): 93–94% на текущем датасете.
  • Извлечение сущностей (NER, micro-F1): ~0.88; активно улучшаем на доменных данных.
  • Средняя задержка ответа p95: 450–600 мс в зависимости от канала.
  • Uptime за последние 30 дней: 99.95% (много зон доступности).
  • Доля автозакрытия обращений в поддержке: +18 п.п. к базовой линии.
  • Стоимость одной сессии: −23% после оптимизаций кэшей и маршрутизации.

Технологический стек под капотом 🧩

  • Сервисы: Python (FastAPI) и Node.js, асинхронщина там, где это критично.
  • Хранилища: PostgreSQL (транзакции), Redis (кэш/сессии), ClickHouse (события/аналитика).
  • ML/NLU: классификация интентов, NER, перефразирование, RAG-поиск по Confluence/Notion/Docs.
  • Инфраструктура: Kubernetes, autoscaling, GitHub Actions + ArgoCD, feature flags, canary/blue-green релизы.
  • Наблюдаемость: OpenTelemetry, Prometheus + Grafana, алерты по SLO, трейсинг энд-ту-энд.
  • Безопасность: TLS повсюду, шифрование данных «на диске», секреты в vault, RBAC и аудиторские логи.

Качество: как мы тестируем и не ломаем прод 🧪

  • Unit/интеграционные тесты на критических путях сценариев.
  • Регрессионные наборы с синтетическими и реальными (анонимизированными) примерами.
  • Нагрузочное тестирование и лимиты на rate control в каналах мессенджеров.
  • «Тёмные запуски» и feature flags — выкатываем мелкими порциями.
  • Active Learning: пересмотр неуверенных предсказаний и постоянное дообучение.

Интеграции и экосистема 🔌

Поддерживаем готовые коннекторы к amoCRM, Bitrix24, HubSpot, Notion, Confluence, Google Docs/Sheets. Есть вебхуки, REST API и события для аналитики. Для разработчиков готовим SDK и примеры — хотим, чтобы расширения и «умения» ботов можно было писать быстро и безопасно.

С чем столкнулись и как решаем ⚙️

  • Лимиты и антиспам платформ. Делаем очереди, ретраи и адаптивный бэк-офф, чтобы не терять сообщения.
  • Галлюцинации моделей. Ограничили креатив: строгие инструкции, верификация фактов через RAG, фильтры безопасности.
  • Мультиязычность. Нормализуем даты/валюты, проверяем смысловое равенство ответов, локализуем шаблоны.
  • Контент-модерация. Встроили проверку токсичности и запрещённых тем, журналируем пограничные случаи.

Реальные результаты и кейсы 📈

  • Поддержка e-commerce: +18% к доле автозакрытия тикетов и −27% к среднему времени ответа.
  • Лиды в b2b: квалификация по сценарию + NLU, рост конверсии в звонок на 14%.
  • HR-бот: ответы на частые вопросы сотрудников 24/7, снижение нагрузки на People Ops на 35%.

Планы на ближайшие 2–3 спринта 🗓️

  • Голосовой интерфейс: распознавание/синтез речи, телефонные линии и WhatsApp Voice.
  • Аналитика v2: когорты, воронки, retention и сравнение версий ботов.
  • Маркетплейс шаблонов: готовые сценарии по отраслям, импорт/экспорт.
  • Самообслуживание: онбординг за 15 минут, валидация знаний и тестовый прогон.
  • SDK для расширений и валидаторы «умений» (permissions, SLA, observability).

Как можно помочь 🤝

Нам важна обратная связь. Если у вас есть сценарии, данные для дообучения или идеи интеграций — напишите. Особенно ценим сложные кейсы: многоязычные магазины, поддержку с сезонными всплесками, тонкие юридические темы. Вместе мы ускорим развитие и сделаем ботов ещё полезнее.


Выводы 🧭

Мы стабильно движемся вперёд: улучшили качество NLU, ускорили ответы, расширили интеграции и укрепили инфраструктуру. Перед нами — голос, аналитика v2 и маркетплейс шаблонов. Будем держать вас в курсе и показывать живые демо по мере готовности. Спасибо за внимание и идеи — они помогают нам расти каждый спринт! 🙌

Cart (0 items)

Create your account