RAG-агент Culture Bot | Помощник сотрудников техподдержки

Цели и применение проекта

Culture Bot — умный помощник сотрудников техподдержки проекта "Культурный регион", использующий корпоративную базу знаний и AI-технологии

🧭 Ключевые возможности

Интерпретация свободной речи

Понимание пользовательских запросов в естественной форме

Релевантный поиск информации

Векторный поиск по корпоративной документации

Структурированные ответы

Формирование точных и полезных ответов на основе найденных данных

Независимое масштабирование

Развертывание на собственной инфраструктуре без зависимости от внешних сервисов (кроме LLM)

"Люди не читают инструкции, но задают вопросы. Бот отвечает так, как будто их прочитал."

Основная философия Culture Bot

🛎️

Техподдержка

Быстрые ответы на повторяющиеся запросы клиентов с помощью AI-помощника

📘

Обучение стажеров

AI-помощник помогает новым сотрудникам быстрее изучить продукты и процессы

💼

Внутренние команды

Помощь в навигации по процессам и инструкциям

👨‍👩‍👧‍👦

Пользовательский кабинет

Интерфейс к FAQ, снижающий нагрузку на call-центр

🧠 Почему RAG, а не просто GPT?

RAG снижает затраты, упрощает обслуживание и повышает надёжность

Параметр	GPT (без RAG)	RAG
Контекст	Ограничен 4–32K токенов	Подгружается релевантно из базы
Расход токенов	Высокий, пропорционален объёму	В разы ниже — передаются только фрагменты
Актуализация знаний	Только через переобучение	Достаточно обновить базу документов
Масштаб	Ограничен контекстным окном	Горизонтально масштабируется
Стоимость	Высокая на больших базах	Минимальная (экономия ×10–100)

📐 1. Загрузка базы знаний

Документы загружаются с облачного хранилища (Yandex.Disk)

Текст разбивается на чанки (600 символов с overlap 50)

Каждый чанк преобразуется в вектор через OpenAI Embedding

Вектора сохраняются в Supabase documents (pgvector)

📌 Загрузка выполняется вручную при обновлении базы

📚 Источник данных

База знаний формируется на основе документа
"МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО РАБОТЕ
С ИНФОРМАЦИОННОЙ СИСТЕМОЙ «КУЛЬТУРНЫЙ РЕГИОН»"

🤖 2. Ответ на запрос пользователя

Telegram Trigger — сообщение поступает в n8n

Проверка ID — доступ только whitelisted-пользователям

Преобразование запроса в вектор

Векторный поиск по Supabase

Передача результатов в GPT-4 с промтом

Формирование ответа, отправка в Telegram

Сохранение лога в PostgreSQL

🔒 Доступ к боту

Бот доступен по ссылке: @evgrafovAI3006bot

Как получить доступ:

Напишите мне в Telegram @vadim_evgrafov, укажите для чего вам нужен бот и пришлите свой Telegram ID

Попробовать бота

🛡️ Авторизация

По Telegram ID для защиты от спама

⚡ Производительность

Мини-сервер (x86, 16GB RAM), возможны перезагрузки при обновлениях

⚠️ Текущие ограничения

MVP-версия не имеет защиты от некорректных промтов, просьба использовать систему бережно

Узнать свой Telegram ID: @getmyid_bot

⚙️ Архитектура решения

RAG-система (Retrieval-Augmented Generation), развёрнутая на собственном сервере. Все компоненты размещены в Docker-контейнерах с коммуникацией по виртуальным сетям.

Ключевые элементы архитектуры

n8n

Оркестратор бизнес-логики (workflow management)

Telegram Bot API

Интерфейс взаимодействия с пользователями

Supabase (pgvector)

Векторное хранилище базы знаний проекта "Культурный регион"

OpenAI GPT-4 API

Генератор финальных ответов

Дополнительные компоненты

Xray (VLESS + TLS)

Обход блокировок OpenAI через безопасное туннелирование

PostgreSQL

Хранилище логов и пользовательских сессий

Схема работы системы

Telegram Bot

Пользовательский интерфейс

n8n Workflow

Оркестратор логики

Supabase pgvector

Векторная база знаний

OpenAI GPT-4

Генерация ответов

🔗 Полная инфраструктура и документация

Детальная техническая документация доступна в GitLab Wiki

Технические особенности:

• Все компоненты в Docker-контейнерах
• Коммуникация по виртуальным сетям
• Чанки документов: 600 символов с overlap 50
• Мониторинг через Prometheus + Grafana

Планы развития:

• HuggingFace Inference API для эмбеддингов
• Self-hosted PostgreSQL + pgvector
• Замена OpenAI на локальные модели
• Собственный эмбеддинг-сервис

🧭 Этапы эволюции проекта

Стратегический план развития от быстрого MVP до масштабируемой SaaS-платформы

🎯 Цели на ближайшее развитие

Качество

• Оптимизация структуры базы знаний через семантический чанкинг и обогащение чанков контекстом
• Улучшение промтов и "prompt compression"
• Нормализация пользовательского ввода до эмбеддинга

Инфраструктура

• Переход с Supabase на self-hosted PostgreSQL + pgvector
• Развёртывание собственного эмбеддинг-сервиса
• Замена OpenAI на локальные модели (Sber, YandexGPT)

Надёжность

• Логирование, мониторинг (Prometheus + Grafana)
• Переработка логики на FastAPI (code-first)
• Улучшение отказоустойчивости системы

Цели и применение проекта

🧭 Ключевые возможности

Интерпретация свободной речи

Релевантный поиск информации

Структурированные ответы

Независимое масштабирование

Техподдержка

Обучение стажеров

Внутренние команды

Пользовательский кабинет

🧠 Почему RAG, а не просто GPT?

📐 1. Загрузка базы знаний

📚 Источник данных

🤖 2. Ответ на запрос пользователя

🔒 Доступ к боту

Как получить доступ:

🛡️ Авторизация

⚡ Производительность

⚠️ Текущие ограничения

⚙️ Архитектура решения

Ключевые элементы архитектуры

n8n

Telegram Bot API

Supabase (pgvector)

OpenAI GPT-4 API

Дополнительные компоненты

Xray (VLESS + TLS)

PostgreSQL

Схема работы системы

🔗 Полная инфраструктура и документация

Технические особенности:

Планы развития:

🧭 Этапы эволюции проекта

🎯 Цели на ближайшее развитие

Качество

Инфраструктура

Надёжность

MVP — Проверка идеи

Цель

Стек

Статус

Результат

Улучшение качества ответов — Оптимизация базы знаний и промтов

Цель

Задачи

Статус

Фокус

Отделение логики — Независимый AI-сервис

Цель

Стек

Статус

Преимущества

Перенос в код — Уход от no-code, полная кастомизация

Цель

Стек

Статус

Результат

MCP-сервер — API, мульти-инструменты, рефлексия

Цель

Стек

Статус

Возможности

SaaS-версия — Web-интерфейс, подписки, отчёты

Цель

Стек

Статус

Потенциал

Стратегическое обоснование подхода

🚀 Быстрый старт

🔧 Постепенное усложнение

📈 Масштабируемость

💰 Монетизация