Ключ к раскрытию потенциала LLM в корпоративной среде: что такое метод RAG?

11 марта 2025

Редактор: Виталий Виноградов

Что такое метод RAG и как он помогает LLM генерировать точные, актуальные и контекстно-зависимые ответы

Эту статью написал участник сообщества

Виталий Виноградов

Руководитель AI-продукта в Just AI

Just AI

Разработчик и вендор технологий генеративного ИИ

Редакция Бизнес-секретов бережно сохранила авторский стиль, орфографию и пунктуацию

Написать статью

В современной бизнес-среде, где данные являются ключевым активом, а способность эффективно извлекать, обрабатывать и использовать информацию имеет решающее значение для успеха, большие языковые модели (LLM) становятся незаменимым инструментом в работе. Но традиционные LLM обучаются на обширных наборах данных, и не всегда эти данные применимы к конкретным бизнес-задачам. Например, если ваша компания работает в нишевой отрасли, ваши внутренние документы и базы знаний гораздо более ценны, чем обобщенная информация. Поэтому для полной реализации потенциала нейросетей необходимо использовать метод RAG.

Что такое RAG, и когда он нужен?

RAG — это подход, который объединяет LLM с методами поиска информации. По сути, RAG позволяет LLM получать доступ к внешним знаниям, хранящимся в базах данных, документах и других хранилищах информации, повышая способность нейросети генерировать точные и контекстно-релевантные ответы.

До недавнего времени популярной альтернативой RAG была тонкая настройка моделей или, как это называют в инженерной среде, fine-tuning. Конечная цель RAG и тонкой настройки одна и та же: извлечь большую бизнес-ценность из ИИ-моделей. Но вместо того, чтобы дополнять существующую LLM доступом к собственной базе данных, fine-tuning идет глубже, адаптируя саму модель для конкретной области. Тонкая настройка включает в себя обучение LLM на меньшем, специализированном, маркированном наборе данных и корректировку параметров модели на основе новых данных.

Но fine-tuning «запекает» знания в модели, требуя повторного обучения при изменении данных. RAG же, напротив, обращается к актуальной информации в режиме реального времени, что идеально подходит для работы с динамическими базами знаний, новостями, рыночными данными и т.д. Представьте чат-бота службы поддержки, которому нужно знать о последних обновлениях продукта — с RAG он всегда будет в курсе, в то время как fine-tuning потребует постоянного переобучения.

Рассылка: как вести бизнес в России

Каждую неделю присылаем самые важные новости бизнеса, разборы законов и инструкции, которые помогут вести свое дело

Примеры использования RAG

В качестве примера использования RAG приведем кейсы известной компании, занимающейся продажей строительных материалов. Представим несколько сценариев.

Чат-бот для обслуживания клиентов. Клиент спрашивает: «Какой цемент лучше всего подходит для заливки фундамента в условиях повышенной влажности?». LLM с RAG может получить доступ к базе знаний компании (технические характеристики материалов, рекомендации производителей, отзывы клиентов) и предоставить клиенту персонализированную рекомендацию, учитывающую специфические условия. Без RAG LLM может дать только общий ответ, который не будет полезен клиенту.

Техническая поддержка. Строитель столкнулся с проблемой при использовании нового материала. LLM с RAG может проанализировать описание проблемы, найти похожие случаи в базе знаний компании и предложить решение, сэкономив время и ресурсы на выезд специалиста.

Автоматизация рутинных задач по поиску данных внутри компании. С RAG компании могут интегрировать данные из внутренних платформ, таких как CRM-системы, каталоги продуктов и базы данных HR, с внешними источниками, такими как социальные сети, отраслевые отчеты и сторонние API. Например, маркетинговая команда может использовать RAG LLM для автоматического извлечения последних отзывов клиентов, данных об эффективности продаж и аналитики веб-сайта для создания подробных отчетов. Аналогичным образом, отделы кадров могут автоматизировать извлечение данных сотрудников, учебных материалов и оценок эффективности.

Если бы компания использовала LLM в «чистом» виде, то для поддержки актуальности данных: цен, перечня товаров, отчетов и т.п. требовалось бы постоянное дообучение модели, что может позволить себе не каждая компания в виду ограниченности ресурсов. Также LLM, столкнувшись с запросами, выходящими за рамки их обучающих данных, может начать галлюцинировать и выдавать неверную или сфабрикованную информацию.

Как подготовить данные компании для внедрения RAG?

Для создания качественной базы знаний на основе документов компании, важно, чтобы материалы были подготовлены в соответствиями с некоторыми требованиями. Они могут разниться, в зависимости от вендора, но я перечислю основные.

Все документы должны соответствовать поддерживаемым форматам. PDF, DOCX, TXT, XML, JSON, HTML и т.д.

Документы должны быть структурированы. То есть:

везде есть четкие заголовки, подзаголовки и разделы;
вся информация актуальна;
информация в документах не противоречит сама себе;
в файлах формата JSON/XML/YAML данные логически организованы и валидны;
в файлах формата Markdown (MD, MDX) и HTML корректна разметка.

Подготовка данных к внедрению RAG — хорошая возможность провести аудит базы знаний компании и обновить неактуальную информацию.

Для измерения качества ответов LLM по в базе знаний мы используем тест-сет, который состоит из вопросов и ожидаемых ответов. Каждый вопрос отправляется в базу знаний, а полученный ответ вместе с вопросом и ожидаемым ответом передается в LLM. LLM оценивает качество фактического ответа по шкале от 1 до 10. Результат измерения — среднее значение по всем вопросам тест-сета. Обычно, чем больше вопросов в тест-сете, тем достовернее результат измерения.

RAG как неотъемлемая часть AI-стратегии

В заключение хочется еще раз подчеркнуть, что LLM, подкрепленные доступом к базе знаний компании через RAG, обеспечивают существенный прирост эффективности по сравнению с LLM, используемыми изолированно. По статистике ежедневно сотрудники тратят около 2-х часов в день на поиск нужной информации — представьте, что это время может сократиться до 15 минут. Использование конкретных метрик, таких как время решения задач, точность и объем обработанной информации, позволит объективно оценить влияние RAG на производительность и подтвердить возврат инвестиций в эту технологию.