Онлайн-курс «LLM-инженер»

Курс для разработчиков, которые хотят строить LLM-системы, а не просто вызывать API

6 месяцев

70% практики

2 онлайн-занятия в неделю

старт курса 04.06.2026

Пересобрали и обновили 30 апреля 2026

Регистрация на мастер-класс

Менеджер перезвонит и ответит на ваши вопросы

Что вы сможете написать в резюме

Qwen 3.5

Unsloth

LangGraph

PEFT

RAG with Qdrant

LoRA / QLoRA

MLflow

Langfuse

Gradio / Streamlit

DeepEval

Docker

llama.cpp

Arize / Fiddler

OpenAI Agents API

Слой 1

Опыт дообучения LLM/энкодер под домен

Стек: Qwen 3.5 / Llama, QLoRA, Unsloth, PEFT, TRL SFTTrainer
Артефакты: адаптеры на HF Hub, метрики на доменном бенчмарке и через LM Evaluation Harness

Слой 2

RAG над вашей корпоративной базой

Стек: Qdrant, BM25 + dense гибрид, cross-encoder реранкер, LangChain/LangGraph, DeepEval
Артефакты: production-ready система поиска и ранжирования с оценкой качества и замерами latency

Слой 3

Мультиагентная надстройка

Стек: LangGraph, function calling, structured outputs, Schema-Guided Reasoning
Артефакты: агент с tool use и многошаговым планированием, golden-датасет для оценки, дашборд трассировки в Langfuse

Слой 4

Production-сервис в Docker

Стек: vLLM, FastAPI / Gradio, Telegram-бот, Docker
Артефакты: развернутый чат-бот с RAG и агентами, результаты нагрузочного тестирования, конфигурации под разные требования к latency и стоимости, демо-ссылка

Слой 5

Observability и отчет по безопасности

Стек: Langfuse, версионирование промптов, A/B-тесты, OWASP Top 10 for LLM, HiveTrace Red
Артефакты: онлайн-метрики, алерты, отчет по red-teaming с найденными уязвимостями и мерами защиты

Что окажется в вашем GitHub после курса?

( Ваш сквозной проект )

Как LLM меняет мир?

Решения строятся как end-to-end системы с продуманной архитектурой, интеграцией с корпоративными системами и обработкой больших объёмов данных. Используются подходы system design, автоматизация процессов и аналитика для поддержки решений. Это позволяет ускорить принятие решений, снизить ручной труд и масштабировать цифровые решения на уровне enterprise-систем.

Газпром ЦПС внедряет цифровые платформы с элементами AI для управления строительством и операционными процессами

1/3

Система обрабатывает большое количество запросов, классифицирует их и отвечает с использованием базы знаний. В результате время ответа сократилось с 10+ минут до 8−15 секунд, а часть задач была полностью автоматизирована.

SL Soft внедрила LLM + RAG для автоматизации клиентской поддержки и обработки обращений

2/3

Агент анализирует новые инциденты, находит похожие кейсы в базе знаний и предлагает решения с интеграцией в Service Desk. Это ускорило обработку инцидентов и снизило нагрузку на инженеров.

OTUS разработал RAG-агента для автоматизации инцидент-менеджмента в IT-системах

3/3

На защите вы покажете

end-to-end LLM-систему:

от дообученной модели до сервиса с мониторингом и проверкой на безопасность. С метриками, дашбордами и кодом, который можно поднять одной командой.

10 практических работ из семинаров:

профилирование через PyTorch Profiler, DPO на Qwen 3.5, гибридный поиск на SciFact, простой агент с tool use и другие.

Какой формат курса?

Продолжительность курса 25 недель

Занятия по вторникам и четвергам с 19:00 до 21:00 Мск

Регулярные запланированные каникулы для отдыха после больших модулей

Доступ к записям всех теоретических и практических занятий курса

Старт курса

04

июня

Этот курс для:

Python-разработчиков

которые хотят перейти в LLM-инженерию

ML-инженеров из классического ML/CV

которые хотят освоить современный LLM-стек

Разработчиков

которые уже используют OpenAI API и хотят строить production-системы, а не прототипы

Инженеров

со своим рабочим проектом, где они хотят внедрить LLM-решение

Курс точно не подойдет, если:

Вы только начинаете программировать

Вам нужен общий обзор GenAI без технической глубины

Вы ищете курс по prompt engineering

Хотите понять, подходит ли вам данный курс?

Получить консультацию

Программа курса

Программа в PDF

Раздел 1

Фундамент: от классического NLP до архитектуры трансформера

1/

NLP — от базы до DL

Лекция: Основные задачи NLP, уровни абстракции текстовых данных (буквы, слова, n-граммы, предложения, документы), основные этапы предобработки (сегментация предложений, нормализация, токенизация, удаление стоп-слов, морфологический анализ: стемминг и лемматизация), методы векторизации текста (мешок слов, TF-IDF), нейросетевые подходы к эмбеддингам (Word2Vec: CBOW и Skip-Gram, GloVe, FastText), меры близости векторных представлений и способы оценки качества эмбеддингов (intrinsic и extrinsic).

2/

Препроцессинг и эмбеддинги на практике

Семинар:

Предобработка текстовых данных с использованием gensim, corus, razdel, pymorphy3, fasttext, navec, nltk, spacy, pandas, numpy, scikit-learn, BeautifulSoup;

Загрузка и парсинг данных, очистка HTML-текста, токенизация и лемматизация; построение мешка слов и TF-IDF признаков (CountVectorizer, TfidfTransformer);

Классификационная модель через sklearn Pipeline, оптимизация гиперпараметров с HalvingGridSearchCV;

Работа с эмбеддингами Word2Vec, FastText, Navec для русскоязычных текстов.

3/

Attention и архитектура трансформера

Лекция:

Основы ИНС: матричное представление, функции активации, обратное распространение ошибки; основные архитектуры (полносвязные сети, CNN, RNN, LSTM, GRU);

Архитектура трансформера (Encoder–Decoder, Self-Attention, Multi-Head Attention, positional encoding, residual-соединения и нормализация);

Концепция transfer learning.

4/

Разбор блоков трансформера и Hugging Face

Семинар:

Recap архитектуры трансформеров: позиционное кодирование, multi-head self-attention, normalization, residual блоки, FFN, masked self-attention, linear + softmax-слой;

Практическое применение Hugging Face Transformers через готовые pipelines (TextClassificationPipeline для анализа тональности и autoregressive generation); LSTM на чистом PyTorch для примера кастомного train-loop и контраста.

5/

Дообучение PLM на классических задачах

Семинар:

Использование PLM из библиотеки Transformers: дообучение модели для классификации текста (на IMDb) и распознавания именованных сущностей (WNUT), MLM на ELI5.

6/

Эволюция трансформеров до наших дней

Лекция:

Эволюция NLP до современных трансформеров: сравнение энкодерных (BERT, RoBERTa, DistilBERT, ALBERT), декодерных (GPT-½/3) и энкодер-декодерных (T5, BART) моделей;

Постановка задач Masked Language Modeling и Next Sentence Prediction; архитектурные новшества;

Методы дообучения BERT для классификации, NER, QA;

Алгоритмы токенизации (BPE, WordPiece, SentencePiece) и их влияние на качество.

7/

Токенизация и семплирование на практике

Семинар:

Методы токенизации (преимущественно BPE) и связанные инструменты — Tiktoken, YouTokenToMe;

Препроцессинг перед токенизацией и практическая демонстрация работы токенизаторов;

Распространённые проблемы — непоследовательные разбиения, обработка эмодзи и неизвестных токенов, языковая предвзятость, опечатки;

Алгоритмы семплирования для генерации текста (greedy, top-k, top-p, температурное), Beam Search, Min-p семплирование, ключевые тонкости настройки.

8/

Ключевые техники современных трансформеров

Лекция:

Методы позиционного кодирования (sin/cos, относительное RPE, RoPE и интерполяция позиций);

Техники разреженного и линейного внимания (BigBird, Performer, Reformer, Linformer, cosFormer);

Архитектурные варианты внимания (multi-head, grouped-query, multi-query) и высокопроизводительная реализация FlashAttention;

Эволюция функций активации (ReLU, GELU, SiLU, SwiGLU) и стратегии нормализации (Pre-LayerNorm, RMSNorm); Mixture of Experts с роутерами.

Раздел 2

Современные LLM: дообучение, ускорение, выравнивание

9/

Ландшафт LLM 2026: открытые vs закрытые модели

Лекция:

Gartner Hype Cycle для генеративного ИИ;

Сравнение закрытых и открытых моделей (GPT-5, Claude 4.5, Llama 4, Qwen3, DeepSeek-V3, Mistral) по производительности, размерам, архитектурам и механизмам внимания (RoPE, GQA, SWA, MoE, FlashAttention);

Русскоязычные модели; разбор современных энкодеров (ModernBERT, NeoBERT, FRIDA);

Основные бенчмарки (MMLU, MTEB, HumanEval, ruMTEB, MERA), статические vs динамические бенчмарки; общая схема выбора LLM под задачу, лицензирование, прайсинг.

10/

Жизненный цикл LLM и стратегии адаптации

Лекция:

Этапы обучения LLM (Pretraining, SFT, Instruction-tuning, RLHF) — общая схема;

Preprocessing данных (фильтрация, дедупликация, токенизация);

Domain adaptation, task adaptation и transfer learning;

Методы domain adaptation (context optimization, RAG, prompt engineering, гибридное дообучение);

Базовые техники prompt engineering (Instruction-Following, chain-of-thought, имперсонализация, chaining);

Процесс SFT, формат и сбор данных для SFT;

Сбор данных для CPT;

Циклы дообучения CPT vs SFT и их комбинации с PEFT и расширением токенизатора;

Адаптация энкодеров — MLM, contrastive learning (InfoNCE, triplet loss).

11/

Эффективное обучение LLM

Лекция:

GPT-2 memory footprint;

Mixed Precision, gradient checkpointing, gradient accumulation;

linear probing, LP-FT, адаптеры, LoRA и QLoRA, LN-Tuning, Prompt-Tuning и Prefix-Tuning;

Архитектуры параллелизма (Data Parallel, Tensor Parallel, Naive Model Parallel, GPipe, PipeDream, ZeRO), стратегии выбора параллелизма.

12/

Тюнинг LLM и энкодеров на практике

Семинар:

QLoRA/LoRA через Unsloth, PEFT и TRL SFTTrainer для instruction-тюнинга Qwen2.5;

Снижение потребления VRAM (bitsandbytes, 8-bit Adam, gradient checkpointing/accumulation);

Экспорт/слияние адаптеров; быстрая оценка через LM Evaluation Harness;

Добавление новых токенов в GPT-подобную модель с тюнингом эмбеддингов;

QLoRA-дообучение энкодера с Multiple Negatives Ranking Loss на SberQuAD и метрикой Hit@5;

Элементы training-LLMOps на практике — трекинг экспериментов через W&B, версионирование чекпоинтов и адаптеров, воспроизводимость пайплайна.

13/

Ускорение LLM в инференсе

Лекция:

Метрики производительности (Time-to-First-Token, Tokens-Per-Second, P50/P95/P99 латентность);

Профилирование на GPU (SM-occupancy, пропускная способность памяти, HtoD/DtoH); memory-bound vs compute-bound задачи;

Prefill-decode фазы, roofline model;

KV-кеширование и его влияние на память;

Стратегии батчинга (динамический, непрерывный);

Спекулятивный декодинг (EAGLE, Medusa);

Методы квантизации (GPTQ, AWQ, FP8, INT4);

Дистилляция (hard-label, soft-label, on-policy).

14/

Профилирование, квантизация и распределённое обучение

Семинар:

Профилирование и ускорение вывода LLM: различие compute-bound и memory-bound режимов с синтетическими экспериментами;

PyTorch Profiler для сбора трейсов, их интерпретация и визуализация; сравнение этапов prefill и decode, типичные узкие места;

Анализ влияния KV-cache на задержки и память;

Обзор квантизации и применения BitsAndBytes;

Сравнение «битности» и потерь качества;

Практика распределённого обучения через accelerate — запуск DDP и ZeRO, сравнение пропускной способности, отладка типичных проблем.

15/

RLHF и Alignment

Лекция:

Почему SFT недостаточно;

Пайплайн Pretraining → SFT → Preference Tuning; цели alignment (Helpful-Harmless-Honest); Instrumental Convergence и стратегии любого агента;

«Налог» на alignment;

Классический RLHF и PPO;

Проблемы reward-моделей (RM drift и reward hacking);

Альтернативы — RLAIF и Constitutional AI;

Контрастные методы без reward-модели (DPO, KTO, GRPO/GRPO-Zero) с их допущениями и компромиссами;

Когда и что использовать.

16/

DPO, LLM-as-Judge, гардрейлы

Семинар:

LLM-as-Judge и best-of-N с реранжированием по reward-модели;

Детекторы токсичности и PII;

Constitutional AI и безопасная перегенерация ответов;

Пайплайн fallback-решений; DPO на Qwen2.5-0.5B с LoRA.

17/

LLM system design

Лекция:

KPI и tradeoffs (quality vs latency, cost vs performance);

Сравнение классического ML и LLM-подходов;

Поэтапное наращивание сложности от zero/few-shot до SFT/LoRA/QLoRA и RAG с реранкингом;

Построение golden-датасета через weak supervision, active learning и human-in-the-loop;

Онлайн/оффлайн оценка с LLM-as-Judge, A/B-тестами и метриками;

Проектирование пайплайнов для NER, суммаризации, классификации;

Fallback-стратегии;

Выбор стратегии обучения — CPT/TAPT/DAPT, SFT и alignment (DPO/RLHF/Constitutional AI) с учётом ограничений.

18/

Экономика LLM-решений и Guest Talk

Лекция:

Расчёт unit-экономики LLM-фичи;

Выбор API vs self-hosted под конкретные SLA;

Прогнозирование cost-per-request под нагрузкой;

Разбор реального production-кейса от приглашённого практика (X5 / Газпромбанк) — архитектура, цифры по latency, точности и стоимости, что не сработало;

Короткий воркшоп — расчёт экономики собственного проекта (стоимость на пользователя, break-even, TCO под разные сценарии нагрузки) с обсуждением.

Раздел 3

Advanced LLM: мультимодальность, reasoning, новые архитектуры

19/

Мультимодальные LLM

Лекция:

Мультимодальность: основные концепции, типовые задачи;

Vision-модальность — исторические архитектуры (ViT, CLIP, SigLIP), VLM (LLaVA, Flamingo, BLIP-2, Qwen-VL), fusion-паттерны (early-, model-level, late-), стадии pretraining VLM;

Аудио и видео — speech-encoders, мультимодальные энкодеры для видео, актуальные модели;

Омни-модальные модели (GPT-4o, Gemini 2. x, Qwen-Omni, R1-Omni и др.) — архитектурные подходы и компромиссы;

Бенчмарки (MMBench, MMT-Bench, MMMU, MMStar, аудио- и видео-бенчмарки), практические кейсы применения.

20/

Reasoning-модели

Лекция:

Определение reasoning, варианты архитектурной реализации;

Преимущества и ограничения, где имеет смысл применять;

Эволюция reasoning — in-context learning,

CoT-революция (Chain-of-Thought, Self-Consistency, Least-to-Most), модель + инструменты (ReAct, Tree-of-Thoughts);

Современные reasoning-модели (o1/o3, DeepSeek-R1, Qwen-QwQ);

Методы улучшения reasoning — test-time scaling, RL, RL+SFT, GRPO для reasoning;

Управление бюджетом токенов — hybrid thinking, паттерн роутинга reasoning vs non-reasoning, ранний выход;

Дистилляция reasoning — перенос reasoning-навыков в маленькие модели и где это работает;

Специфика оценки — верификаторы (process- vs outcome-supervision), бенчмарки (AIME, GPQA, ARC-AGI), типичные ошибки оценки.

21/

Занятие по запросу группы

Занятие:

Разбор крупных релизов между запуском курса и текущим занятием, углублённая работа с LLM-as-Judge, нестандартные кейсы из практики студентов.

22/

Эволюция архитектур: за пределами трансформера

Лекция:

Краткое напоминание истории NLP до трансформеров (RNN, LSTM, Seq2Seq с attention);

Проблемы трансформеров и мотивация для альтернатив;

State Space Models (SSM), актуальные линейки Mamba и RWKV;

Test-Time Training;

Современные гибридные архитектуры (DeepSeek, Falcon Mamba и др.) — что в них от трансформера, что нет; что из этого реально едет в продакшн в 2026 и где находятся точки риска для трансформера как доминирующей архитектуры.

Раздел 4

RAG-системы

23/

Основы RAG-систем

Лекция:

Анатомия RAG-системы как единого целого: компоненты, типичные пайплайны, точки качества и точки отказа; query expansion и rewriting;

Высокоуровневый обзор метрик качества — за что отвечает каждая, на каком этапе замеряется (углублённый разбор — в отдельной лекции по evaluation в финале блока);

Сложности построения RAG-систем на реальных корпоративных данных; популярные фреймворки (LangChain, LangGraph, LlamaIndex) — что выбирать.

24/

Запуск базового RAG и обзор инструментов оценки

Семинар:

Запуск простой RAG-системы;

Тест эмбеддеров на практике;

Обзор и сравнение коробочных инструментов оценки RAG — ragas (как RAG-специфичный) и DeepEval, в каких случаях что удобнее;

Демонстрация нерепрезентативности базовых метрик и типичных проблем.

25/

Работа с документами: чанкирование и нормализация

Семинар:

Семантический и иерархический chunking через Chonkie;

Обработка PDF/HTML/таблиц; перевод в MD-разметку;

Работа с реальными «грязными» документами.

26/

Векторы и информационный поиск

Лекция:

Эмбеддинг-модели: обзор и квантизация векторов;

Sparse-подходы (лексический поиск) — от TF-IDF к BM25, улучшения (BM25+, DFR), практические техники;

Dense-поиск — bi-encoder vs cross-encoder, симметричный vs асимметричный поиск, меры близости;

Гибридный поиск — классический, Filter-then-hybrid, Pre-filters vs Post-filters; стратегии fusion — взвешивание, RRF;

Многостадийный поиск; метрики поиска (Precision@k, Recall@k, MAP, MRR, NDCG).

27/

Гибридный поиск с Qdrant

Семинар:

Построение и оценка гибридного поиска на SciFact: загрузка BEIR, чанкование текстов, dense-бейзлайн на эмбеддингах, развёртывание Qdrant (in-memory), базовый поиск с метриками NDCG@10, MAP@10, Recall@10, Precision@10;

Измерение latency per-query, влияние hnsw_ef на latency;

Гибрид BM25+dense с реранкингом кросс-энкодером и сравнением пайплайнов; настройка порога «no-answer» и политики выбора контекста;

Multi-query expansion, динамический ef_search;

Групповой поиск group_by=doc_id и системные пороги в Qdrant;

Фьюжн RRF.

28/

Реранкинг и продвинутый retrieval

Лекция:

Cross-encoders, late interaction (ColBERT), ListWise reranking;

Как обучать собственный реранкер;

Реранкинг на доменных данных.

29/

Усложнение RAG: графовые и мультимодальные

Лекция:

Графовые RAG (GraphRAG, LightRAG) и обзор библиотек;

Мультимодальные RAG (поиск по изображениям и таблицам);

Системный дизайн RAG — масштабирование, кеширование, обработка no-answer кейсов, борьба с галлюцинациями;

Аgentic-паттерны вынесены в блок 5.

30/

Evaluation RAG-систем: датасеты, метрики, мониторинг

Лекция:

Сбор валидационных датасетов: synthetic generation через LLM, weak supervision, разметка через human-in-the-loop, бутстрап на проде, hard negatives mining;

Контроль качества разметки; типичные ошибки (data leakage, дисбаланс по доменам); метрики ретривала углублённо (Precision/Recall/MAP/MRR/NDCG, когда какая работает, оценка по этапам пайплайна);

Метрики генерации (faithfulness, answer relevancy, context utilisation, безопасность ответа); LLM-as-Judge для генерации и его подводные камни;

Мониторинг качества в проде — что собирать, паттерны и антипаттерны (молчаливая деградация, drift золотого датасета, переобучение реранкера на синтетике);

Подключение оценки к CI/CD-пайплайну.

31/

RAG System Design Workshop

Семинар:

Групповая работа: студенты разбирают свои проекты, проектируют end-to-end RAG-архитектуру под свой домен, защищают перед группой;

Эксперты дают обратную связь.

Раздел 5

AI-агенты и мультиагентные системы

32/

Введение в AI-агентов

Лекция:

Что такое агент и когда он реально нужен (а когда хватит LLM с tool use);

Паттерны работы — ReAct, Chain-of-Thought, Reflection, Plan-and-Execute;

Agentic RAG как один из ключевых паттернов — tool use внутри RAG-пайплайна, итеративный поиск с уточнением запроса, мультиэтапные RAG-агенты;

Обзор фреймворков (LangGraph, smolagents, LlamaIndex, OpenAI Agents SDK) — что выбирать под задачу;

Практические вопросы — hallucination, безопасность, бюджетирование токенов.

33/

Простой агент с tool use

Семинар:

Построение собственного агента с tool use (function calling), structured outputs, constrained decoding;

Обработка ошибок инструментов;

Structured logging и трассировка действий агента.

34/

Мультиагентные системы

Лекция:

Single-Agent vs Multi-Agent Systems;

Паттерны (orchestrator-worker, hierarchical, swarm);

Schema-Guided Reasoning (SGR), constrained decoding;

Data parsing; реальные примеры архитектур, обмен сообщениями, общая память, точки отказа.

35/

Мультиагентная система на LangGraph

Семинар:

Реализация мультиагентной системы с поддержкой многошагового планирования;

Использование LLM для генерации и корректировки пошаговых инструкций;

Добавление валидации и ограничений на действия;

Тесты для проверки корректности работы агента.

36/

Память агента и MCP-протокол

Лекция:

Память агента — short-term (контекст) и long-term (внешнее хранилище), эпизодическая и семантическая память;

Реализация через векторные БД, summary-память, retrieval-augmented memory;

Стратегии управления контекстным окном;

Практические рецепты — что класть в память и что забывать;

MCP (Model Context Protocol) как стандарт коммуникации агента с инструментами и данными — устройство протокола, экосистема серверов, написание собственного MCP-сервера под корпоративный API;

Сравнение с классическим tool use и function calling.

37/

Продуктивизация агентов

Лекция:

Что отличает агента «на демо» от агента в продакшне;

Оценка качества (трассы, judge-модели, оффлайн и онлайн метрики);

Human-in-the-loop как паттерн, а не костыль;

Fallback-стратегии и graceful degradation;

Бюджетирование токенов и стоимость на пользователя;

Когда стоит откатиться к простому RAG или классическому ML.

38/

Оценка и трассировка агентов

Семинар:

Реализация системы оценки агента: golden-датасет, LLM-as-Judge для агентских трасс, метрики успешности задачи, метрики безопасности действий, дашборд через Langfuse.

39/

RAG & Agent System Design — командный воркшоп

Семинар:

Командная защита проектов: RAG + агентский слой;

Эксперты курса дают развёрнутую обратную связь по архитектуре и готовности к продакшену.

Раздел 6

Инфраструктура и продуктовый деплой

40/

Production-инференс

Лекция:

vLLM, SGLang, TGI — устройство и сравнение;

Стратегии батчинга в проде (continuous batching, PagedAttention); маршрутизация запросов; multi-tenant сервинг;

KV-cache в проде;

Структурированная генерация в production-окружении;

Cost-управление под нагрузкой.

41/

Деплой модели через vLLM

Семинар:

Поднятие модели через vLLM, работа с API;

Нагрузочное тестирование;

Конфигурация под разные SLA;

Мониторинг latency и throughput.

42/

Разработка чат-бота: архитектура и инструменты

Лекция:

Архитектура чат-бот-приложений;

Обзор UI-инструментов (Gradio, Streamlit);

Хорошие практики разработки;

Интеграция в Web/Telegram;

Docker-сборка для деплоя.

43/

Сборка production-чат-бота

Семинар:

Разработка чат-бота с RAG-частью и агентским слоем — собираем артефакты предыдущих блоков в единый сервис;

Деплой через Docker.

44/

Production observability и онлайн-метрики

Семинар:

Системная картина observability в проде в отличие от трассировки агентов из блока 5;

Версионирование промптов;

Онлайн-метрики качества (бизнесовые и технические);

Drift-детекторы, алерты;

A/B на уровне моделей и промптов;

Разбор реальных production-дашбордов;

Связка с evaluation-пайплайном из блока 4 — метрики из «золотого датасета» как онлайн-сигнал.

Раздел 7

Безопасность и red-teaming GenAI-систем

45/

Основы безопасности GenAI-систем

Лекция:

Ключевые риски и реальные инциденты, связанные с использованием генеративного ИИ;

Чем GenAI-системы отличаются с точки зрения безопасности от классических приложений;

Фреймворки и методологии учёта угроз (OWASP Top 10 for LLM Applications, OWASP Top 10 for Agentic AI Applications), типовые уязвимости и подходы к их анализу.

46/

Уязвимости и защита агентных систем

Лекция:

Ключевые уязвимости агентных систем: риски tool use, утечки через память, манипуляции через внешние источники данных, автономное выполнение действий;

Гардрейл-модели — устройство, основные типы и характеристики защиты, практические методы повышения безопасности ИИ-систем.

47/

Red-teaming GenAI-продуктов

Лекция:

Red-teaming GenAI-продуктов;

Основные виды атак на ИИ-системы и подходы к их систематизации (jailbreaks, prompt injection и другие промпт-атаки);

Автоматизация атакующего тестирования;

Демонстрация работы HiveTrace Red на реальном кейсе.

48/

Практикум: анализ угроз и мер защиты

Семинар:

Групповая работа: командам предложены типовые ИИ-приложения, нужно определить актуальные угрозы и возможные сценарии атак, предложить обоснованные меры защиты, понять, как снижать риски на этапе проектирования и эксплуатации.

Раздел 8

Защита проектов. Завершение курса

49/

Защита итоговых проектов и завершение курса

Защита:

Команды представляют собранные за курс системы (дообученная LLM/энкодер → RAG-система → агентский слой → production-сервис с мониторингом → проверка безопасности);

Эксперты курса дают развёрнутую обратную связь;

Завершение курса — открытая дискуссия о рынке LLM-инженеров в 2026, грейдах, технических собесах, упаковке проекта для портфолио, нетворкинг с экспертами.

Преимущества курса

Освоение передовых технологий

Изучите инструменты для работы с LLM, такие как PyTorch, Hugging Face, vLLM.

Диплом о профессиональной переподготовке

Получите диплом ДПО, который повысит вашу конкурентоспособность на рынке труда.

Нетворкинг с экспертами

Обучение проводится экспертами уровня lead и head ведущих IT-компаний страны, которые в ежедневном формате работают с LLM и RAG, именно они будут давать обратную связь по вашим проектам.