Сегодня делюсь подробным апдейтом о том, как продвигается разработка ботов Wildbots: какие этапы мы прошли, над чем работаем прямо сейчас и какие результаты уже видим. Расскажу о технологическом стеке, метриках качества, инфраструктуре, тестировании и планах на ближайшие спринты. Этот пост — честный срез прогресса, трудностей и находок команды. Поехали! 🚀
Что мы строим и зачем 🤖
Wildbots — это платформа умных ботов для поддержки клиентов, продаж и внутренних процессов. Наша цель — сократить время ответа, повысить конверсию и разгрузить команды, сохраняя дружелюбный тон и точность ответов. Мы совмещаем классические диалоги по сценариям с пониманием естественного языка (NLU) и подключаем внешние источники знаний, чтобы бот знал именно то, что нужно вашим пользователям.
Этапы, которые мы прошли 🗺️
Discovery и исследование
- Собрали пул реальных кейсов из поддержки, продаж и HR.
- Сформировали карту интентов и типовые диалоги по индустриям.
- Определили ключевые метрики: точность распознавания интентов, время ответа, доля автозакрытия обращений, удовлетворенность (CSAT/NPS), стоимость сессии.
MVP и первые пилоты
- Поддержали каналы: Telegram, WhatsApp Business, VK и веб-виджет.
- Сделали конструктор сценариев с визуальными ветвлениями и условиями.
- Подключили поиск по базе знаний (RAG) с приоритизацией свежего контента.
- Реализовали «дежурного человека»: безопасная передача диалога оператору.
Альфа → Бета
- Добавили интеграции с CRM (amoCRM, Bitrix24, HubSpot) и тикет-системами (Zendesk, Jira Service Management).
- Запустили платежные сценарии (YooKassa/Stripe) с чек-аутом внутри диалога.
- Расширили мультиязычность: ru/en + автодетект языка.
- Сделали редактор тональности голосом бренда и библиотеку готовых шаблонов.
Что работает прямо сейчас ✅
- Точность распознавания интентов (micro-F1): 93–94% на текущем датасете.
- Извлечение сущностей (NER, micro-F1): ~0.88; активно улучшаем на доменных данных.
- Средняя задержка ответа p95: 450–600 мс в зависимости от канала.
- Uptime за последние 30 дней: 99.95% (много зон доступности).
- Доля автозакрытия обращений в поддержке: +18 п.п. к базовой линии.
- Стоимость одной сессии: −23% после оптимизаций кэшей и маршрутизации.
Технологический стек под капотом 🧩
- Сервисы: Python (FastAPI) и Node.js, асинхронщина там, где это критично.
- Хранилища: PostgreSQL (транзакции), Redis (кэш/сессии), ClickHouse (события/аналитика).
- ML/NLU: классификация интентов, NER, перефразирование, RAG-поиск по Confluence/Notion/Docs.
- Инфраструктура: Kubernetes, autoscaling, GitHub Actions + ArgoCD, feature flags, canary/blue-green релизы.
- Наблюдаемость: OpenTelemetry, Prometheus + Grafana, алерты по SLO, трейсинг энд-ту-энд.
- Безопасность: TLS повсюду, шифрование данных «на диске», секреты в vault, RBAC и аудиторские логи.
Качество: как мы тестируем и не ломаем прод 🧪
- Unit/интеграционные тесты на критических путях сценариев.
- Регрессионные наборы с синтетическими и реальными (анонимизированными) примерами.
- Нагрузочное тестирование и лимиты на rate control в каналах мессенджеров.
- «Тёмные запуски» и feature flags — выкатываем мелкими порциями.
- Active Learning: пересмотр неуверенных предсказаний и постоянное дообучение.
Интеграции и экосистема 🔌
Поддерживаем готовые коннекторы к amoCRM, Bitrix24, HubSpot, Notion, Confluence, Google Docs/Sheets. Есть вебхуки, REST API и события для аналитики. Для разработчиков готовим SDK и примеры — хотим, чтобы расширения и «умения» ботов можно было писать быстро и безопасно.
С чем столкнулись и как решаем ⚙️
- Лимиты и антиспам платформ. Делаем очереди, ретраи и адаптивный бэк-офф, чтобы не терять сообщения.
- Галлюцинации моделей. Ограничили креатив: строгие инструкции, верификация фактов через RAG, фильтры безопасности.
- Мультиязычность. Нормализуем даты/валюты, проверяем смысловое равенство ответов, локализуем шаблоны.
- Контент-модерация. Встроили проверку токсичности и запрещённых тем, журналируем пограничные случаи.
Реальные результаты и кейсы 📈
- Поддержка e-commerce: +18% к доле автозакрытия тикетов и −27% к среднему времени ответа.
- Лиды в b2b: квалификация по сценарию + NLU, рост конверсии в звонок на 14%.
- HR-бот: ответы на частые вопросы сотрудников 24/7, снижение нагрузки на People Ops на 35%.
Планы на ближайшие 2–3 спринта 🗓️
- Голосовой интерфейс: распознавание/синтез речи, телефонные линии и WhatsApp Voice.
- Аналитика v2: когорты, воронки, retention и сравнение версий ботов.
- Маркетплейс шаблонов: готовые сценарии по отраслям, импорт/экспорт.
- Самообслуживание: онбординг за 15 минут, валидация знаний и тестовый прогон.
- SDK для расширений и валидаторы «умений» (permissions, SLA, observability).
Как можно помочь 🤝
Нам важна обратная связь. Если у вас есть сценарии, данные для дообучения или идеи интеграций — напишите. Особенно ценим сложные кейсы: многоязычные магазины, поддержку с сезонными всплесками, тонкие юридические темы. Вместе мы ускорим развитие и сделаем ботов ещё полезнее.
Выводы 🧭
Мы стабильно движемся вперёд: улучшили качество NLU, ускорили ответы, расширили интеграции и укрепили инфраструктуру. Перед нами — голос, аналитика v2 и маркетплейс шаблонов. Будем держать вас в курсе и показывать живые демо по мере готовности. Спасибо за внимание и идеи — они помогают нам расти каждый спринт! 🙌