«Базовый RAG: свой поисковик на LLM за один вечер»
Воркшоп в рамках наборной кампании курса «LLM-инженер» подойдёт как тем, кто только начинает работать с LLM, так и тем, кто хочет построить надежную производственную систему на основе RAG. Потрогаем все части пайплайна, поднимем у себя и заставим работать как одно.
онлайн
бесплатно
16 июля
18:30 мск
О воркшопе
Эксперт
Дарья Андреева, ML engineer (NLP) X5 Tech
Воркшоп посвящён архитектуре Retrieval-Augmented Generation (RAG) — подходу, который сочетает мощь больших языковых моделей с возможностью извлекать и использовать внешние знания в реальном времени. Участники познакомятся с тем, как устроена типовая RAG-система, из каких компонентов она состоит, и в каких задачах этот подход особенно эффективен — от интеллектуальных чат-ботов до корпоративных поисковых ассистентов.
Особое внимание уделим подготовке данных.
Подробно разберём, как правильно обрабатывать текстовые источники:
Как разбивать документы на фрагменты (chunking).
Какие стратегии выбрать в зависимости от типа данных и задач.
Как создавать и использовать эмбеддинги при помощи современных моделей, таких как BGE, E5 и других.
Разберемся как строить векторные индексы с использованием инструментов вроде FAISS и Qdrant, и как поддерживать их в актуальном состоянии.
Воркшоп также охватывает аспекты построения инфраструктуры и пайплайнов для RAG-систем.
Разберем ключевые механизмы, которые делают RAG-интеграции по-настоящему умными:
Переформулировка пользовательских запросов
Reranking результатов поиска
Сохранение контекста в диалоге и логика принятия решений внутри системы — когда запускать retriever, а когда использовать внутренние знания модели.