Culture Bot — RAG-агент

Интеллектуальный помощник, который помогает сотрудникам техподдержки быстро находить ответы на вопросы клиентов и упрощает адаптацию новых специалистов

🛡️ Доступ по Telegram ID | 🏠 Развернуто на собственной инфраструктуре

Цели и применение проекта

Culture Bot — умный помощник сотрудников техподдержки проекта "Культурный регион", использующий корпоративную базу знаний и AI-технологии

🧭 Ключевые возможности

Интерпретация свободной речи

Понимание пользовательских запросов в естественной форме

Релевантный поиск информации

Векторный поиск по корпоративной документации

Структурированные ответы

Формирование точных и полезных ответов на основе найденных данных

Независимое масштабирование

Развертывание на собственной инфраструктуре без зависимости от внешних сервисов (кроме LLM)

"Люди не читают инструкции, но задают вопросы. Бот отвечает так, как будто их прочитал."
Основная философия Culture Bot
🛎️

Техподдержка

Быстрые ответы на повторяющиеся запросы клиентов с помощью AI-помощника

📘

Обучение стажеров

AI-помощник помогает новым сотрудникам быстрее изучить продукты и процессы

💼

Внутренние команды

Помощь в навигации по процессам и инструкциям

👨‍👩‍👧‍👦

Пользовательский кабинет

Интерфейс к FAQ, снижающий нагрузку на call-центр

🧠 Почему RAG, а не просто GPT?

RAG снижает затраты, упрощает обслуживание и повышает надёжность

Параметр GPT (без RAG) RAG
Контекст Ограничен 4–32K токенов Подгружается релевантно из базы
Расход токенов Высокий, пропорционален объёму В разы ниже — передаются только фрагменты
Актуализация знаний Только через переобучение Достаточно обновить базу документов
Масштаб Ограничен контекстным окном Горизонтально масштабируется
Стоимость Высокая на больших базах Минимальная (экономия ×10–100)

📐 1. Загрузка базы знаний

1

Документы загружаются с облачного хранилища (Yandex.Disk)

2

Текст разбивается на чанки (600 символов с overlap 50)

3

Каждый чанк преобразуется в вектор через OpenAI Embedding

4

Вектора сохраняются в Supabase documents (pgvector)

📌 Загрузка выполняется вручную при обновлении базы

📚 Источник данных

База знаний формируется на основе документа
"МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО РАБОТЕ
С ИНФОРМАЦИОННОЙ СИСТЕМОЙ «КУЛЬТУРНЫЙ РЕГИОН»"

🤖 2. Ответ на запрос пользователя

1

Telegram Trigger — сообщение поступает в n8n

2

Проверка ID — доступ только whitelisted-пользователям

3

Преобразование запроса в вектор

4

Векторный поиск по Supabase

5

Передача результатов в GPT-4 с промтом

6

Формирование ответа, отправка в Telegram

7

Сохранение лога в PostgreSQL

🔒 Доступ к боту

Бот доступен по ссылке: @evgrafovAI3006bot

Как получить доступ:

Напишите мне в Telegram @vadim_evgrafov, укажите для чего вам нужен бот и пришлите свой Telegram ID

🛡️ Авторизация

По Telegram ID для защиты от спама

⚡ Производительность

Мини-сервер (x86, 16GB RAM), возможны перезагрузки при обновлениях

⚠️ Текущие ограничения

MVP-версия не имеет защиты от некорректных промтов, просьба использовать систему бережно

Узнать свой Telegram ID: @getmyid_bot

⚙️ Архитектура решения

RAG-система (Retrieval-Augmented Generation), развёрнутая на собственном сервере. Все компоненты размещены в Docker-контейнерах с коммуникацией по виртуальным сетям.

Ключевые элементы архитектуры

n8n

Оркестратор бизнес-логики (workflow management)

Telegram Bot API

Интерфейс взаимодействия с пользователями

Supabase (pgvector)

Векторное хранилище базы знаний проекта "Культурный регион"

OpenAI GPT-4 API

Генератор финальных ответов

Дополнительные компоненты

Xray (VLESS + TLS)

Обход блокировок OpenAI через безопасное туннелирование

PostgreSQL

Хранилище логов и пользовательских сессий

Схема работы системы

Telegram Bot

Пользовательский интерфейс

n8n Workflow

Оркестратор логики

Supabase pgvector

Векторная база знаний

OpenAI GPT-4

Генерация ответов

🔗 Полная инфраструктура и документация

Детальная техническая документация доступна в GitLab Wiki

Технические особенности:

  • • Все компоненты в Docker-контейнерах
  • • Коммуникация по виртуальным сетям
  • • Чанки документов: 600 символов с overlap 50
  • • Мониторинг через Prometheus + Grafana

Планы развития:

  • • HuggingFace Inference API для эмбеддингов
  • • Self-hosted PostgreSQL + pgvector
  • • Замена OpenAI на локальные модели
  • • Собственный эмбеддинг-сервис

🧭 Этапы эволюции проекта

Стратегический план развития от быстрого MVP до масштабируемой SaaS-платформы

🎯 Цели на ближайшее развитие

Качество

  • • Оптимизация структуры базы знаний через семантический чанкинг и обогащение чанков контекстом
  • • Улучшение промтов и "prompt compression"
  • • Нормализация пользовательского ввода до эмбеддинга

Инфраструктура

  • • Переход с Supabase на self-hosted PostgreSQL + pgvector
  • • Развёртывание собственного эмбеддинг-сервиса
  • • Замена OpenAI на локальные модели (Sber, YandexGPT)

Надёжность

  • • Логирование, мониторинг (Prometheus + Grafana)
  • • Переработка логики на FastAPI (code-first)
  • • Улучшение отказоустойчивости системы

MVP — Проверка идеи

✅ Завершено

Цель

Проверка идеи и демонстрация ценности

Стек

n8n + Supabase + OpenAI

Статус

✅ Реализовано и работает

Результат

Функциональный RAG-бот в Telegram

2

Улучшение качества ответов — Оптимизация базы знаний и промтов

🔄 В процессе

Цель

Повышение точности и релевантности ответов

Задачи

Семантический чанкинг базы знаний, нормализация запросов, улучшение промтов

Статус

🔄 Активная разработка

Фокус

Структура документов, prompt engineering, нормализация входящих данных

3

Отделение логики — Независимый AI-сервис

🔜 Планируется

Цель

Масштабируемость и переиспользование

Стек

FastAPI + LangChain

Статус

🔜 В планах

Преимущества

API для других приложений

4

Перенос в код — Уход от no-code, полная кастомизация

🔜 Планируется

Цель

Максимальный контроль и производительность

Стек

Python + LangChain + pgvector

Статус

🔜 В планах

Результат

Высокопроизводительный AI-сервис

5

MCP-сервер — API, мульти-инструменты, рефлексия

🔜 Перспектива

Цель

Превращение в многофункциональную платформу

Стек

LangServe + MCP

Статус

🔜 Будущее

Возможности

Многоагентность, внешние инструменты

6

SaaS-версия — Web-интерфейс, подписки, отчёты

⏳ Долгосрочно

Цель

Коммерциализация и массовый рынок

Стек

Next.js + Docker + Stripe

Статус

⏳ Концепция

Потенциал

Полноценный B2B продукт

Стратегическое обоснование подхода

no-code → code-first эволюция позволяет:

🚀 Быстрый старт

MVP на n8n позволяет проверить идею за недели, а не месяцы

🔧 Постепенное усложнение

Каждый этап добавляет функциональность без переписывания с нуля

📈 Масштабируемость

Переход к коду даёт полный контроль над производительностью

💰 Монетизация

Архитектура готова к превращению в коммерческий продукт