Проблема: онбординг съедает ресурсы команды
Средний онбординг нового сотрудника в IT-компании занимает 15–20 часов рабочего времени опытных коллег за первые 3 недели. При найме 20+ человек в год это становится операционным bottleneck. RAG-бот берёт на себя ответы на типовые вопросы и позволяет новичкам находить информацию самостоятельно 24/7.
Что такое RAG и почему это работает для онбординга
RAG (Retrieval-Augmented Generation) — AI-агент, который перед ответом ищет релевантные фрагменты в вашей базе знаний и отвечает на их основе. Не hallucinations из обучающих данных, а ваши реальные регламенты и инструкции.
Для онбординга это идеальный сценарий: вопросы новичков предсказуемы (70–80% повторяются), ответы есть в документах, но найти их в Confluence или Google Drive быстро — невозможно.
Архитектура решения
Стек: LlamaIndex или LangChain для оркестрации → embedding-модель (OpenAI text-embedding-3-small или Cohere multilingual для русского) → Qdrant как векторная БД → Claude API для генерации ответа → Telegram-бот или Slack-интеграция как интерфейс.
Источники данных: Confluence, Notion, Google Docs, PDF-регламенты, Jira-тикеты. Индексация занимает 2–4 часа для базы до 5 000 документов.
Реальный кейс: онбординг в 60 человек в год
Клиент — продуктовая IT-компания, 250 сотрудников, нанимает 60 человек в год. До внедрения: каждый новичок задавал в среднем 40 вопросов за первые 2 недели, из которых 30 — повторяющиеся. Тимлид тратил 4–5 часов в неделю только на ответы новичкам.
После внедрения RAG-бота: 78% вопросов новичков бот закрывает без привлечения коллег. Среднее время онбординга до первого самостоятельного задания сократилось с 14 до 4 рабочих дней. Удовлетворённость новичков процессом выросла с 3,2 до 4,6 из 5.
Как обновлять базу знаний
Инкрементальное обновление: новый документ добавляется в индекс автоматически через вебхук или cron-задачу. При обновлении существующего документа старые чанки удаляются, добавляются новые. Полная переиндексация при смене embedding-модели — раз в 6–12 месяцев.
Важно добавлять метаданные к каждому чанку: источник, дата, тема, автор — это позволяет фильтровать поиск («только документы 2025 года», «только HR-политики»).
Обсудите задачу с нами — оставьте заявку, разберём ваш кейс бесплатно.