Онлайн-курс «LLM-инженер»

Курс для разработчиков, которые хотят строить LLM-системы, а не просто вызывать API
6 месяцев
70% практики
2 онлайн-занятия в неделю
старт курса 04.06.2026
Пересобрали и обновили 30 апреля 2026
Регистрация на мастер-класс
Менеджер перезвонит и ответит на ваши вопросы

Что вы сможете написать в резюме

Qwen 3.5
Unsloth
LangGraph
PEFT
RAG with Qdrant
LoRA / QLoRA
MLflow
Langfuse
Gradio / Streamlit
DeepEval
Docker
llama.cpp
Arize / Fiddler
OpenAI Agents API
Слой 1

Опыт дообучения LLM/энкодер под домен

  • Стек: Qwen 3.5 / Llama, QLoRA, Unsloth, PEFT, TRL SFTTrainer
  • Артефакты: адаптеры на HF Hub, метрики на доменном бенчмарке и через LM Evaluation Harness
Слой 2

RAG над вашей корпоративной базой

  • Стек: Qdrant, BM25 + dense гибрид, cross-encoder реранкер, LangChain/LangGraph, DeepEval
  • Артефакты: production-ready система поиска и ранжирования с оценкой качества и замерами latency
Слой 3

Мультиагентная надстройка

  • Стек: LangGraph, function calling, structured outputs, Schema-Guided Reasoning
  • Артефакты: агент с tool use и многошаговым планированием, golden-датасет для оценки, дашборд трассировки в Langfuse
Слой 4

Production-сервис в Docker

  • Стек: vLLM, FastAPI / Gradio, Telegram-бот, Docker
  • Артефакты: развернутый чат-бот с RAG и агентами, результаты нагрузочного тестирования, конфигурации под разные требования к latency и стоимости, демо-ссылка
Слой 5

Observability и отчет по безопасности

  • Стек: Langfuse, версионирование промптов, A/B-тесты, OWASP Top 10 for LLM, HiveTrace Red
  • Артефакты: онлайн-метрики, алерты, отчет по red-teaming с найденными уязвимостями и мерами защиты

Что окажется в вашем GitHub после курса?

( Ваш сквозной проект )

Как LLM меняет мир?

Решения строятся как end-to-end системы с продуманной архитектурой, интеграцией с корпоративными системами и обработкой больших объёмов данных. Используются подходы system design, автоматизация процессов и аналитика для поддержки решений. Это позволяет ускорить принятие решений, снизить ручной труд и масштабировать цифровые решения на уровне enterprise-систем.
Газпром ЦПС внедряет цифровые платформы с элементами AI для управления строительством и операционными процессами
1/3
Система обрабатывает большое количество запросов, классифицирует их и отвечает с использованием базы знаний. В результате время ответа сократилось с 10+ минут до 8−15 секунд, а часть задач была полностью автоматизирована.
SL Soft внедрила LLM + RAG для автоматизации клиентской поддержки и обработки обращений
2/3
Агент анализирует новые инциденты, находит похожие кейсы в базе знаний и предлагает решения с интеграцией в Service Desk. Это ускорило обработку инцидентов и снизило нагрузку на инженеров.
OTUS разработал RAG-агента для автоматизации инцидент-менеджмента в IT-системах
3/3

На защите вы покажете

end-to-end LLM-систему:

от дообученной модели до сервиса с мониторингом и проверкой на безопасность. С метриками, дашбордами и кодом, который можно поднять одной командой.

10 практических работ из семинаров:

профилирование через PyTorch Profiler, DPO на Qwen 3.5, гибридный поиск на SciFact, простой агент с tool use и другие.

Какой формат курса?

Продолжительность курса 25 недель
Занятия по вторникам и четвергам с 19:00 до 21:00 Мск
Регулярные запланированные каникулы для отдыха после больших модулей
Доступ к записям всех теоретических и практических занятий курса
Старт курса
04
июня

Этот курс для:

Python-разработчиков

которые хотят перейти в LLM-инженерию

ML-инженеров из классического ML/CV

которые хотят освоить современный LLM-стек

Разработчиков

которые уже используют OpenAI API и хотят строить production-системы, а не прототипы

Инженеров

со своим рабочим проектом, где они хотят внедрить LLM-решение

Курс точно не подойдет, если:

Вы только начинаете программировать
Вам нужен общий обзор GenAI без технической глубины
Вы ищете курс по prompt engineering

Хотите понять, подходит ли вам данный курс?

Программа курса

Раздел 1

Фундамент: от классического NLP до архитектуры трансформера

1/
NLP — от базы до DL
Лекция: Основные задачи NLP, уровни абстракции текстовых данных (буквы, слова, n-граммы, предложения, документы), основные этапы предобработки (сегментация предложений, нормализация, токенизация, удаление стоп-слов, морфологический анализ: стемминг и лемматизация), методы векторизации текста (мешок слов, TF-IDF), нейросетевые подходы к эмбеддингам (Word2Vec: CBOW и Skip-Gram, GloVe, FastText), меры близости векторных представлений и способы оценки качества эмбеддингов (intrinsic и extrinsic).
2/
Препроцессинг и эмбеддинги на практике
Семинар:

  • Предобработка текстовых данных с использованием gensim, corus, razdel, pymorphy3, fasttext, navec, nltk, spacy, pandas, numpy, scikit-learn, BeautifulSoup;

  • Загрузка и парсинг данных, очистка HTML-текста, токенизация и лемматизация; построение мешка слов и TF-IDF признаков (CountVectorizer, TfidfTransformer);

  • Классификационная модель через sklearn Pipeline, оптимизация гиперпараметров с HalvingGridSearchCV;

  • Работа с эмбеддингами Word2Vec, FastText, Navec для русскоязычных текстов.
3/
Attention и архитектура трансформера
Лекция:

  • Основы ИНС: матричное представление, функции активации, обратное распространение ошибки; основные архитектуры (полносвязные сети, CNN, RNN, LSTM, GRU);

  • Архитектура трансформера (Encoder–Decoder, Self-Attention, Multi-Head Attention, positional encoding, residual-соединения и нормализация);

  • Концепция transfer learning.
4/
Разбор блоков трансформера и Hugging Face
Семинар:

  • Recap архитектуры трансформеров: позиционное кодирование, multi-head self-attention, normalization, residual блоки, FFN, masked self-attention, linear + softmax-слой;

  • Практическое применение Hugging Face Transformers через готовые pipelines (TextClassificationPipeline для анализа тональности и autoregressive generation); LSTM на чистом PyTorch для примера кастомного train-loop и контраста.
5/
Дообучение PLM на классических задачах
Семинар:

  • Использование PLM из библиотеки Transformers: дообучение модели для классификации текста (на IMDb) и распознавания именованных сущностей (WNUT), MLM на ELI5.
6/
Эволюция трансформеров до наших дней
Лекция:

  • Эволюция NLP до современных трансформеров: сравнение энкодерных (BERT, RoBERTa, DistilBERT, ALBERT), декодерных (GPT-½/3) и энкодер-декодерных (T5, BART) моделей;

  • Постановка задач Masked Language Modeling и Next Sentence Prediction; архитектурные новшества;

  • Методы дообучения BERT для классификации, NER, QA;

  • Алгоритмы токенизации (BPE, WordPiece, SentencePiece) и их влияние на качество.
7/
Токенизация и семплирование на практике
Семинар:

  • Методы токенизации (преимущественно BPE) и связанные инструменты — Tiktoken, YouTokenToMe;

  • Препроцессинг перед токенизацией и практическая демонстрация работы токенизаторов;

  • Распространённые проблемы — непоследовательные разбиения, обработка эмодзи и неизвестных токенов, языковая предвзятость, опечатки;

  • Алгоритмы семплирования для генерации текста (greedy, top-k, top-p, температурное), Beam Search, Min-p семплирование, ключевые тонкости настройки.
8/
Ключевые техники современных трансформеров
Лекция:

  • Методы позиционного кодирования (sin/cos, относительное RPE, RoPE и интерполяция позиций);

  • Техники разреженного и линейного внимания (BigBird, Performer, Reformer, Linformer, cosFormer);

  • Архитектурные варианты внимания (multi-head, grouped-query, multi-query) и высокопроизводительная реализация FlashAttention;

  • Эволюция функций активации (ReLU, GELU, SiLU, SwiGLU) и стратегии нормализации (Pre-LayerNorm, RMSNorm); Mixture of Experts с роутерами.
Раздел 2

Современные LLM: дообучение, ускорение, выравнивание

9/
Ландшафт LLM 2026: открытые vs закрытые модели
Лекция:

  • Gartner Hype Cycle для генеративного ИИ;

  • Сравнение закрытых и открытых моделей (GPT-5, Claude 4.5, Llama 4, Qwen3, DeepSeek-V3, Mistral) по производительности, размерам, архитектурам и механизмам внимания (RoPE, GQA, SWA, MoE, FlashAttention);

  • Русскоязычные модели; разбор современных энкодеров (ModernBERT, NeoBERT, FRIDA);

  • Основные бенчмарки (MMLU, MTEB, HumanEval, ruMTEB, MERA), статические vs динамические бенчмарки; общая схема выбора LLM под задачу, лицензирование, прайсинг.
10/
Жизненный цикл LLM и стратегии адаптации
Лекция:

  • Этапы обучения LLM (Pretraining, SFT, Instruction-tuning, RLHF) — общая схема;

  • Preprocessing данных (фильтрация, дедупликация, токенизация);

  • Domain adaptation, task adaptation и transfer learning;

  • Методы domain adaptation (context optimization, RAG, prompt engineering, гибридное дообучение);

  • Базовые техники prompt engineering (Instruction-Following, chain-of-thought, имперсонализация, chaining);

  • Процесс SFT, формат и сбор данных для SFT;

  • Сбор данных для CPT;

  • Циклы дообучения CPT vs SFT и их комбинации с PEFT и расширением токенизатора;

  • Адаптация энкодеров — MLM, contrastive learning (InfoNCE, triplet loss).
11/
Эффективное обучение LLM
Лекция:

  • GPT-2 memory footprint;

  • Mixed Precision, gradient checkpointing, gradient accumulation;

  • linear probing, LP-FT, адаптеры, LoRA и QLoRA, LN-Tuning, Prompt-Tuning и Prefix-Tuning;

  • Архитектуры параллелизма (Data Parallel, Tensor Parallel, Naive Model Parallel, GPipe, PipeDream, ZeRO), стратегии выбора параллелизма.
12/
Тюнинг LLM и энкодеров на практике
Семинар:

  • QLoRA/LoRA через Unsloth, PEFT и TRL SFTTrainer для instruction-тюнинга Qwen2.5;

  • Снижение потребления VRAM (bitsandbytes, 8-bit Adam, gradient checkpointing/accumulation);

  • Экспорт/слияние адаптеров; быстрая оценка через LM Evaluation Harness;

  • Добавление новых токенов в GPT-подобную модель с тюнингом эмбеддингов;

  • QLoRA-дообучение энкодера с Multiple Negatives Ranking Loss на SberQuAD и метрикой Hit@5;

  • Элементы training-LLMOps на практике — трекинг экспериментов через W&B, версионирование чекпоинтов и адаптеров, воспроизводимость пайплайна.
13/
Ускорение LLM в инференсе
Лекция:

  • Метрики производительности (Time-to-First-Token, Tokens-Per-Second, P50/P95/P99 латентность);

  • Профилирование на GPU (SM-occupancy, пропускная способность памяти, HtoD/DtoH); memory-bound vs compute-bound задачи;

  • Prefill-decode фазы, roofline model;

  • KV-кеширование и его влияние на память;

  • Стратегии батчинга (динамический, непрерывный);

  • Спекулятивный декодинг (EAGLE, Medusa);

  • Методы квантизации (GPTQ, AWQ, FP8, INT4);

  • Дистилляция (hard-label, soft-label, on-policy).
14/
Профилирование, квантизация и распределённое обучение
Семинар:

  • Профилирование и ускорение вывода LLM: различие compute-bound и memory-bound режимов с синтетическими экспериментами;

  • PyTorch Profiler для сбора трейсов, их интерпретация и визуализация; сравнение этапов prefill и decode, типичные узкие места;

  • Анализ влияния KV-cache на задержки и память;

  • Обзор квантизации и применения BitsAndBytes;

  • Сравнение «битности» и потерь качества;

  • Практика распределённого обучения через accelerate — запуск DDP и ZeRO, сравнение пропускной способности, отладка типичных проблем.
15/
RLHF и Alignment
Лекция:

  • Почему SFT недостаточно;

  • Пайплайн Pretraining → SFT → Preference Tuning; цели alignment (Helpful-Harmless-Honest); Instrumental Convergence и стратегии любого агента;

  • «Налог» на alignment;

  • Классический RLHF и PPO;

  • Проблемы reward-моделей (RM drift и reward hacking);

  • Альтернативы — RLAIF и Constitutional AI;

  • Контрастные методы без reward-модели (DPO, KTO, GRPO/GRPO-Zero) с их допущениями и компромиссами;

  • Когда и что использовать.
16/
DPO, LLM-as-Judge, гардрейлы
Семинар:

  • LLM-as-Judge и best-of-N с реранжированием по reward-модели;

  • Детекторы токсичности и PII;

  • Constitutional AI и безопасная перегенерация ответов;

  • Пайплайн fallback-решений; DPO на Qwen2.5-0.5B с LoRA.
17/
LLM system design
Лекция:

  • KPI и tradeoffs (quality vs latency, cost vs performance);

  • Сравнение классического ML и LLM-подходов;

  • Поэтапное наращивание сложности от zero/few-shot до SFT/LoRA/QLoRA и RAG с реранкингом;

  • Построение golden-датасета через weak supervision, active learning и human-in-the-loop;

  • Онлайн/оффлайн оценка с LLM-as-Judge, A/B-тестами и метриками;

  • Проектирование пайплайнов для NER, суммаризации, классификации;

  • Fallback-стратегии;

  • Выбор стратегии обучения — CPT/TAPT/DAPT, SFT и alignment (DPO/RLHF/Constitutional AI) с учётом ограничений.
18/
Экономика LLM-решений и Guest Talk
Лекция:

  • Расчёт unit-экономики LLM-фичи;

  • Выбор API vs self-hosted под конкретные SLA;

  • Прогнозирование cost-per-request под нагрузкой;

  • Разбор реального production-кейса от приглашённого практика (X5 / Газпромбанк) — архитектура, цифры по latency, точности и стоимости, что не сработало;

  • Короткий воркшоп — расчёт экономики собственного проекта (стоимость на пользователя, break-even, TCO под разные сценарии нагрузки) с обсуждением.
Раздел 3

Advanced LLM: мультимодальность, reasoning, новые архитектуры

19/
Мультимодальные LLM
Лекция:

  • Мультимодальность: основные концепции, типовые задачи;

  • Vision-модальность — исторические архитектуры (ViT, CLIP, SigLIP), VLM (LLaVA, Flamingo, BLIP-2, Qwen-VL), fusion-паттерны (early-, model-level, late-), стадии pretraining VLM;

  • Аудио и видео — speech-encoders, мультимодальные энкодеры для видео, актуальные модели;

  • Омни-модальные модели (GPT-4o, Gemini 2. x, Qwen-Omni, R1-Omni и др.) — архитектурные подходы и компромиссы;

  • Бенчмарки (MMBench, MMT-Bench, MMMU, MMStar, аудио- и видео-бенчмарки), практические кейсы применения.
20/
Reasoning-модели
Лекция:

  • Определение reasoning, варианты архитектурной реализации;

  • Преимущества и ограничения, где имеет смысл применять;

  • Эволюция reasoning — in-context learning,

  • CoT-революция (Chain-of-Thought, Self-Consistency, Least-to-Most), модель + инструменты (ReAct, Tree-of-Thoughts);

  • Современные reasoning-модели (o1/o3, DeepSeek-R1, Qwen-QwQ);

  • Методы улучшения reasoning — test-time scaling, RL, RL+SFT, GRPO для reasoning;

  • Управление бюджетом токенов — hybrid thinking, паттерн роутинга reasoning vs non-reasoning, ранний выход;

  • Дистилляция reasoning — перенос reasoning-навыков в маленькие модели и где это работает;

  • Специфика оценки — верификаторы (process- vs outcome-supervision), бенчмарки (AIME, GPQA, ARC-AGI), типичные ошибки оценки.
21/
Занятие по запросу группы
Занятие:

  • Разбор крупных релизов между запуском курса и текущим занятием, углублённая работа с LLM-as-Judge, нестандартные кейсы из практики студентов.
22/
Эволюция архитектур: за пределами трансформера
Лекция:

  • Краткое напоминание истории NLP до трансформеров (RNN, LSTM, Seq2Seq с attention);

  • Проблемы трансформеров и мотивация для альтернатив;

  • State Space Models (SSM), актуальные линейки Mamba и RWKV;

  • Test-Time Training;

  • Современные гибридные архитектуры (DeepSeek, Falcon Mamba и др.) — что в них от трансформера, что нет; что из этого реально едет в продакшн в 2026 и где находятся точки риска для трансформера как доминирующей архитектуры.
Раздел 4

RAG-системы

23/
Основы RAG-систем
Лекция:

  • Анатомия RAG-системы как единого целого: компоненты, типичные пайплайны, точки качества и точки отказа; query expansion и rewriting;

  • Высокоуровневый обзор метрик качества — за что отвечает каждая, на каком этапе замеряется (углублённый разбор — в отдельной лекции по evaluation в финале блока);

  • Сложности построения RAG-систем на реальных корпоративных данных; популярные фреймворки (LangChain, LangGraph, LlamaIndex) — что выбирать.
24/
Запуск базового RAG и обзор инструментов оценки
Семинар:

  • Запуск простой RAG-системы;

  • Тест эмбеддеров на практике;

  • Обзор и сравнение коробочных инструментов оценки RAG — ragas (как RAG-специфичный) и DeepEval, в каких случаях что удобнее;

  • Демонстрация нерепрезентативности базовых метрик и типичных проблем.
25/
Работа с документами: чанкирование и нормализация
Семинар:

  • Семантический и иерархический chunking через Chonkie;

  • Обработка PDF/HTML/таблиц; перевод в MD-разметку;

  • Работа с реальными «грязными» документами.
26/
Векторы и информационный поиск
Лекция:

  • Эмбеддинг-модели: обзор и квантизация векторов;

  • Sparse-подходы (лексический поиск) — от TF-IDF к BM25, улучшения (BM25+, DFR), практические техники;

  • Dense-поиск — bi-encoder vs cross-encoder, симметричный vs асимметричный поиск, меры близости;

  • Гибридный поиск — классический, Filter-then-hybrid, Pre-filters vs Post-filters; стратегии fusion — взвешивание, RRF;

  • Многостадийный поиск; метрики поиска (Precision@k, Recall@k, MAP, MRR, NDCG).
27/
Гибридный поиск с Qdrant
Семинар:

  • Построение и оценка гибридного поиска на SciFact: загрузка BEIR, чанкование текстов, dense-бейзлайн на эмбеддингах, развёртывание Qdrant (in-memory), базовый поиск с метриками NDCG@10, MAP@10, Recall@10, Precision@10;

  • Измерение latency per-query, влияние hnsw_ef на latency;

  • Гибрид BM25+dense с реранкингом кросс-энкодером и сравнением пайплайнов; настройка порога «no-answer» и политики выбора контекста;

  • Multi-query expansion, динамический ef_search;

  • Групповой поиск group_by=doc_id и системные пороги в Qdrant;

  • Фьюжн RRF.
28/
Реранкинг и продвинутый retrieval
Лекция:

  • Cross-encoders, late interaction (ColBERT), ListWise reranking;

  • Как обучать собственный реранкер;

  • Реранкинг на доменных данных.
29/
Усложнение RAG: графовые и мультимодальные
Лекция:

  • Графовые RAG (GraphRAG, LightRAG) и обзор библиотек;

  • Мультимодальные RAG (поиск по изображениям и таблицам);

  • Системный дизайн RAG — масштабирование, кеширование, обработка no-answer кейсов, борьба с галлюцинациями;

  • Аgentic-паттерны вынесены в блок 5.
30/
Evaluation RAG-систем: датасеты, метрики, мониторинг
Лекция:

  • Сбор валидационных датасетов: synthetic generation через LLM, weak supervision, разметка через human-in-the-loop, бутстрап на проде, hard negatives mining;

  • Контроль качества разметки; типичные ошибки (data leakage, дисбаланс по доменам); метрики ретривала углублённо (Precision/Recall/MAP/MRR/NDCG, когда какая работает, оценка по этапам пайплайна);

  • Метрики генерации (faithfulness, answer relevancy, context utilisation, безопасность ответа); LLM-as-Judge для генерации и его подводные камни;

  • Мониторинг качества в проде — что собирать, паттерны и антипаттерны (молчаливая деградация, drift золотого датасета, переобучение реранкера на синтетике);

  • Подключение оценки к CI/CD-пайплайну.
31/
RAG System Design Workshop
Семинар:

  • Групповая работа: студенты разбирают свои проекты, проектируют end-to-end RAG-архитектуру под свой домен, защищают перед группой;

  • Эксперты дают обратную связь.
Раздел 5

AI-агенты и мультиагентные системы

32/
Введение в AI-агентов
Лекция:

  • Что такое агент и когда он реально нужен (а когда хватит LLM с tool use);

  • Паттерны работы — ReAct, Chain-of-Thought, Reflection, Plan-and-Execute;

  • Agentic RAG как один из ключевых паттернов — tool use внутри RAG-пайплайна, итеративный поиск с уточнением запроса, мультиэтапные RAG-агенты;

  • Обзор фреймворков (LangGraph, smolagents, LlamaIndex, OpenAI Agents SDK) — что выбирать под задачу;

  • Практические вопросы — hallucination, безопасность, бюджетирование токенов.
33/
Простой агент с tool use
Семинар:

  • Построение собственного агента с tool use (function calling), structured outputs, constrained decoding;

  • Обработка ошибок инструментов;

  • Structured logging и трассировка действий агента.
34/
Мультиагентные системы
Лекция:

  • Single-Agent vs Multi-Agent Systems;

  • Паттерны (orchestrator-worker, hierarchical, swarm);

  • Schema-Guided Reasoning (SGR), constrained decoding;

  • Data parsing; реальные примеры архитектур, обмен сообщениями, общая память, точки отказа.
35/
Мультиагентная система на LangGraph
Семинар:

  • Реализация мультиагентной системы с поддержкой многошагового планирования;

  • Использование LLM для генерации и корректировки пошаговых инструкций;

  • Добавление валидации и ограничений на действия;

  • Тесты для проверки корректности работы агента.
36/
Память агента и MCP-протокол
Лекция:

  • Память агента — short-term (контекст) и long-term (внешнее хранилище), эпизодическая и семантическая память;

  • Реализация через векторные БД, summary-память, retrieval-augmented memory;

  • Стратегии управления контекстным окном;

  • Практические рецепты — что класть в память и что забывать;

  • MCP (Model Context Protocol) как стандарт коммуникации агента с инструментами и данными — устройство протокола, экосистема серверов, написание собственного MCP-сервера под корпоративный API;

  • Сравнение с классическим tool use и function calling.
37/
Продуктивизация агентов
Лекция:

  • Что отличает агента «на демо» от агента в продакшне;

  • Оценка качества (трассы, judge-модели, оффлайн и онлайн метрики);

  • Human-in-the-loop как паттерн, а не костыль;

  • Fallback-стратегии и graceful degradation;

  • Бюджетирование токенов и стоимость на пользователя;

  • Когда стоит откатиться к простому RAG или классическому ML.
38/
Оценка и трассировка агентов
Семинар:

  • Реализация системы оценки агента: golden-датасет, LLM-as-Judge для агентских трасс, метрики успешности задачи, метрики безопасности действий, дашборд через Langfuse.
39/
RAG & Agent System Design — командный воркшоп
Семинар:

  • Командная защита проектов: RAG + агентский слой;

  • Эксперты курса дают развёрнутую обратную связь по архитектуре и готовности к продакшену.
Раздел 6

Инфраструктура и продуктовый деплой

40/
Production-инференс
Лекция:

  • vLLM, SGLang, TGI — устройство и сравнение;

  • Стратегии батчинга в проде (continuous batching, PagedAttention); маршрутизация запросов; multi-tenant сервинг;

  • KV-cache в проде;

  • Структурированная генерация в production-окружении;

  • Cost-управление под нагрузкой.
41/
Деплой модели через vLLM
Семинар:

  • Поднятие модели через vLLM, работа с API;

  • Нагрузочное тестирование;

  • Конфигурация под разные SLA;

  • Мониторинг latency и throughput.
42/
Разработка чат-бота: архитектура и инструменты
Лекция:

  • Архитектура чат-бот-приложений;

  • Обзор UI-инструментов (Gradio, Streamlit);

  • Хорошие практики разработки;

  • Интеграция в Web/Telegram;

  • Docker-сборка для деплоя.
43/
Сборка production-чат-бота
Семинар:

  • Разработка чат-бота с RAG-частью и агентским слоем — собираем артефакты предыдущих блоков в единый сервис;

  • Деплой через Docker.
44/
Production observability и онлайн-метрики
Семинар:

  • Системная картина observability в проде в отличие от трассировки агентов из блока 5;

  • Версионирование промптов;

  • Онлайн-метрики качества (бизнесовые и технические);

  • Drift-детекторы, алерты;

  • A/B на уровне моделей и промптов;

  • Разбор реальных production-дашбордов;

  • Связка с evaluation-пайплайном из блока 4 — метрики из «золотого датасета» как онлайн-сигнал.
Раздел 7

Безопасность и red-teaming GenAI-систем

45/
Основы безопасности GenAI-систем
Лекция:

  • Ключевые риски и реальные инциденты, связанные с использованием генеративного ИИ;

  • Чем GenAI-системы отличаются с точки зрения безопасности от классических приложений;

  • Фреймворки и методологии учёта угроз (OWASP Top 10 for LLM Applications, OWASP Top 10 for Agentic AI Applications), типовые уязвимости и подходы к их анализу.
46/
Уязвимости и защита агентных систем
Лекция:

  • Ключевые уязвимости агентных систем: риски tool use, утечки через память, манипуляции через внешние источники данных, автономное выполнение действий;

  • Гардрейл-модели — устройство, основные типы и характеристики защиты, практические методы повышения безопасности ИИ-систем.
47/
Red-teaming GenAI-продуктов
Лекция:

  • Red-teaming GenAI-продуктов;

  • Основные виды атак на ИИ-системы и подходы к их систематизации (jailbreaks, prompt injection и другие промпт-атаки);

  • Автоматизация атакующего тестирования;

  • Демонстрация работы HiveTrace Red на реальном кейсе.
48/
Практикум: анализ угроз и мер защиты
Семинар:

  • Групповая работа: командам предложены типовые ИИ-приложения, нужно определить актуальные угрозы и возможные сценарии атак, предложить обоснованные меры защиты, понять, как снижать риски на этапе проектирования и эксплуатации.
Раздел 8

Защита проектов. Завершение курса

49/
Защита итоговых проектов и завершение курса
Защита:

  • Команды представляют собранные за курс системы (дообученная LLM/энкодер → RAG-система → агентский слой → production-сервис с мониторингом → проверка безопасности);

  • Эксперты курса дают развёрнутую обратную связь;

  • Завершение курса — открытая дискуссия о рынке LLM-инженеров в 2026, грейдах, технических собесах, упаковке проекта для портфолио, нетворкинг с экспертами.

Преимущества курса

Освоение передовых технологий
Изучите инструменты для работы с LLM, такие как PyTorch, Hugging Face, vLLM.
Диплом о профессиональной переподготовке
Получите диплом ДПО, который повысит вашу конкурентоспособность на рынке труда.
Нетворкинг с экспертами
Обучение проводится экспертами уровня lead и head ведущих IT-компаний страны, которые в ежедневном формате работают с LLM и RAG, именно они будут давать обратную связь по вашим проектам.
Практика разработки и внедрения LLM
Создадите собственный LLM-проект и внедрите его в продакшн.

Эксперты курса

  • Потехин Александр
    NLP Lead, X5 Tech
  • Соломатин Роман
    NLP Researcher, Сбер
  • Андреева Дарья
    ML Engineer (NLP), X5 Tech
  • Желтова Кристина
    Газпромбанк, директор по разработке моделей
  • Кокуйкин Евгений
    Генеральный директор HiveTrace

Корпоративное обучение

Учитесь командой
Присоединяйтесь к основному потоку курса всей командой (от 3 человек)​
Скидки для команды
10% при регистрации
Совместная практика
RAG-системы, агенты, fine-tuning — применяйте к вашим задачам вместе с менторством
Обучение для бизнеса
Обучите команду LLM-инженерии под ключ: от RAG-систем до агентов с кастомизацией под ваш бизнес.​
Повышение цены через
00:00:00
226 000 ₽
195 000 ₽
195 000 ₽
Стоимость курса при 100% оплате
37 667 ₽/мес
34 767 ₽/мес
при рассрочке на 6 месяцев
Записаться на консультацию
Менеджер перезвонит и ответит на ваши вопросы

Стоимость курса

Learn more

Вопросы и ответы

Остались вопросы?
Запишитесь на консультацию
Корпоративное обучение
Менеджер перезвонит и ответит на ваши вопросы
Бесплатная консультация
Менеджер перезвонит и ответит на ваши вопросы