Инжиниринг искусственного интеллекта, Дегтев С., 2026.
Представьте, что LLM - это чёрный ящик. Вы знаете, что внутри что-то есть, но каждый раз, открывая его, надеетесь на чудо. Эта книга закроет ящик навсегда. Не учебник. Не научпоп. Инженерный путеводитель. Две книги под одной обложкой. Первая - от токена до трансформера: как работает внимание, почему память убивает процессор, сколько стоит владение моделью и что такое НВМ. Вторая - от агента до лицензии на ИИ: как строить, тестировать, внедрять, считать ROI и не провалиться в цифровую ловушку самообмана. Здесь нет магии. Есть инженерия компромиссов: скорость против памяти, качество против денег, контроль против автономии. Автор не гуру. Автор - энтузиаст, который прошёл путь от «что такое токен» до внедрения агентов в продакшен. И честно рассказывает, где заканчивается наше понимание. Если вы готовы заменить веру в чудо на систему координат -откройте эту книгу.

Позиционное кодирование (Positional Encoding).
Эмбеддинги наделили каждое слово смыслом, расположив их в пространстве так, что «кот» и «кошка» оказались рядом. Но в языке важен не только смысл самих слов, но и их порядок. Фразы «кот укусил собаку» и «собака укусила кота» состоят из одних и тех же слов, но означают прямо противоположное. Если мы просто сложим эмбеддинги. модель не увидит разницы. Как же сообщить ей, что порядок имеет значение?
Вектор токена сам по себе не содержит информации о его позиции в последовательности. Чтобы модель могла различать порядок слов, к эмбеддингам добавляют специальную метку - позиционное кодирование. Но как именно его реализовать? Здесь инженеры придумали несколько способов, и выбор между ними влияет на то, как модель будет работать с длинными текстами.
ОГЛАВЛЕНИЕ.
СТАРТОВАЯ КАРТА.
ВАЖНОЕ ПРЕДУПРЕЖДЕНИЕ ДЛЯ ЧИТАТЕЛЯ.
КНИГА 1. Инженерия LLM: от токена до двойника.
ВВЕДЕНИЕ.
ГЛАВА 1. КАК РАБОТАЕТ ГЕНЕРАТИВНАЯ ЯЗЫКОВАЯ МОДЕЛЬ: ОТ ЗАПРОСА К ОТВЕТУ.
1.1 Токен.
1.2 Эмбеддинги.
1.3 Позиционное кодирование (Positional Encoding).
1.4 Механизм самовнимания (Self-Attention).
1.5 Трансформерные блоки (Transformer Blocks).
1.6 Выходной слой и генерация.
1.7 Галлюцинации: когда модель уверенно врёт.
1.8 RAG: как модель не выдумывает факты.
РЕЗЮМЕ ГЛАВЫ 1.
Вопросы для самопроверки.
ГЛАВА 2. ТИПЫ АРХИТЕКТУР НЕЙРОСЕТЕЙ.
2.1 CNN Convolutional Neural Network / Свёрточная нейросеть.
2.2 RNN (Recurrent Neural Network / Рекуррентная нейросеть).
2.3 LSTM (Long Short-Term Memory / Долгая краткосрочная память).
2.4 GRU (Gated Recurrent Unit / Рекуррентный блок с вентилями).
2.5 Трансформер (Transformer).
2.6 МоЕ (Mixture of Expens / Смесь экспертов).
2.7 Diffusion Models (Диффузионные модели).
2.8 За рамками текста: как трансформеры научились видеть.
РЕЗЮМЕ ГЛАВЫ 2.
Вопросы для самопроверки.
ГЛАВА 3. ОБУЧЕНИЕ МОДЕЛЕЙ.
3.1 Pre-training (Предварительное обучение).
3.2 SFT - Supervised Fine-Tuning (Дообучение с учителем).
3.3 RLHF - Reinforcement Learning from Human Feedback (Обучение с подкреплением на основе обратной связи от человека).
3.4 Этика и «красные линии»: чью мораль вшивают в модель?.
РЕЗЮМЕ ГЛАВЫ 3.
Вопросы для самопроверки.
ГЛАВА 4. КЛЮЧЕВЫЕ ОПТИМИЗАЦИИ СОВРЕМЕННЫХ МОДЕЛЕЙ.
4.1 KV-Cache (Кэш ключей и значений).
4.2 GQA - Grouped Query Attention (Групповое внимание по запросам).
4.3 ML А - Multi-head Latent Attention (Латентное многоголовое внимание).
4.4 МТР - Multi-Token Prediction (Предсказание нескольких токенов).
4.5 Sliding Window Attention (Внимание со скользящим окном).
4.6 Sparse Attention (Разреженное внимание).
4.7 Квантизация: как сжать модель без убийства качества.
4.8 FlashAttention: как ускорить внимание без потери качества.
РЕЗЮМЕ К ГЛАВЕ 4.
Вопросы для самопроверки.
ГЛАВА 5. КАК ВЫБИРАТЬ МОДЕЛИ И ПОДРУЖИТЬ ИХ С ВАШИМИ ДАННЫМИ.
5.1. СРАВНЕНИЕ СОВРЕМЕННЫХ (2024-2025) МОДЕЛЕЙ.
5.2 Выводы: как выбирать модель.
5.3 ТСО: сколько на самом деле стоит владение моделью?.
5.4 Вычислительная инфраструктура: почему LLM «едят» память, а не процессор.
5.5 MLOps: как превратить модель в работающий сервис.
5.6 Безопасность LLM: как не выпустить джинна из бутылки.
РЕЗЮМЕ К ГЛАВЕ 5.
Вопросы для самопроверки.
ГЛАВА 6. ПЕРСПЕКТИВНЫЕ АРХИТЕКТУРЫ: ОТ МОНОЛИТА К ОРКЕСТРУ.
6.1 Проблема одной модели.
6.2 Роутинг моделей (Model Routing).
6.3 Аналогия с микросервисной архитектурой.
6.4 Единая шина для обмена контекстом.
6.5 RLM - Recursive Language Models (Рекурсивные языковые модели).
6.6 Агентные системы.
6.7 Переключение по длине контекста.
6.8 DWH (Data Warehouse) и ИИ: как подружить бухгалтера и художника.
РЕЗЮМЕ К ГЛАВЕ 6.
Вопросы для самопроверки.
ГЛАВА 7. ЦИФРОВОЙ ДВОЙНИК ЧЕЛОВЕКА: ЕДИНОЕ ОКНО В ЦИФРОВОЙ МИР.
7.1 Проблема: человек как узкое горлышко.
7.2 Идея: цифровой двойник как единое окно.
7.3 Архитектура двойника (три уровня).
7.4 Сценарий: утро с двойником.
7.5 Техническая архитектура.
7.6 Проблемы и прогноз.
РЕЗЮМЕ К ГЛАВЕ 7.
Вопросы для самопроверки.
ЧТО ДЕЛАТЬ ДАЛЬШЕ?.
ПРИЛОЖЕНИЯ.
1. КАК ТРАНСФОРМЕР ПОНИМАЕТ.
2. КЛЮЧЕВЫЕ МЫСЛИ КНИГИ 1.
3. ИСТОРИЯ РАЗВИТИЯ НЕЙРОСЕТЕЙ: ОТ МЕЧТЫ К ПОВСЕДНЕВНОСТИ.
4. МНОГОЯЗЫЧНЫЕ МОДЕЛИ: КАК ОДИН ТРАНСФОРМЕР МОЖЕТ ГОВОРИТЬ НА ВСЕХ ЯЗЫКАХ.
5. ПРАКТИЧЕСКИЕ ПРИМЕРЫ: (псевдо-)КОД И ИНСТРУКЦИИ.
5.1 KV Cache на псевдокоде (как это работает внутри).
5.2 Расчет ТСО на Python.
5.3 Простой роутер на fastText.
5.4 Минимальный прототип цифрового двойника (FastAPI).
6. ГЛУБИННЫЕ ВОПРОСЫ: то, что осталось за кадром.
ГЛОССАРИЙ.
ЗАКЛЮЧЕНИЕ.
КНИГА 2. От инструмента к двойнику: экономика, тестирование и границы ИИ.
ВВЕДЕНИЕ.
ГЛАВА A. AI-АГЕНТЫ: ОТ ПРОТОТИПА К PRODUCTION.
А.1 Определение и эволюция: LLM vs AT Agent vs Workflow.
A.2 Архитектурные паттерны агентов.
А.3 Инструментарий разработчика.
А.4 Управление состоянием и памятью.
A.5 Надежность, безопасность и будущее агентов (сводная глава).
РЕЗЮМЕ К ГЛАВЕ А.
Вопросы для самопроверки.
ГЛАВА Б. ИНЖЕНЕРНЫЙ АРСЕНАЛ LLM: ОТ КВАНТИЗАЦИИ ДО ДАТАСЕТОВ.
Б.1 Квантизация и сжатие моделей.
Б.2 Распределённый тренинг.
Б.3 Системы RAG (Retrieval-Augmented Generation).
Б.4 Промпт-инжиниринг и структурированные выходы.
Б.5 Оценка и бенчмаркинг LLM.
Б.6 Fine - tuning на практике.
Б.7 Инференс и сервинг.
Б.8 Модальности: мультимодальные модели.
Б.9 Безопасность и выравнивание (Alignment).
Б.10 Инжиниринг данных для LLM.
Б.11 No - code / low - code платформы для оркестрации ИИ.
РЕЗЮМЕ К ГЛАВЕ Б.
Вопросы для самопроверки.
ГЛАВА В. КАРТА КОМПЕТЕНЦИЙ А1-ПРОДАКГА.
B.1 Природа ИИ (Ментальная модель).
В.2 Технический цикл жизни модели (MLLC): Почему код - это не главное.
В.3 Техническая грамотность (без углубления в код).
В.4 Безопасность, право и этика.
В.5 Бизнес и управление изменениями.
В.6 Управление ИИ-продуктом (AIPDLC): Как организовать команду и процесс.
РЕЗЮМЕ К ГЛАВЕ В (для продакта и тимлида).
Вопросы для самопроверки.
ГЛАВА Г. МУЛЬТИМОДАЛЬНЫЕ МОДЕЛИ: КОГДА LLM ВИДИТ И СЛЫШИТ.
Г.1 Проблема: текст - это только вершина айсберга.
Г.2 От текста к картинкам: Vision Transformer (ViT).
Г.3 CLIP: как научить модель понимать, что на картинке.
Г.4 Как устроены мультимодальные LLM (LLaVA, GPT-4V, Gemini).
Г.5 Глубже: как модели понимают видео и аудио.
Г.6 Практические возможности и ограничения.
Г.7 Риски и безопасность мультимодальных моделей.
Г.8 Архитектурные паттерны для мультимодальных приложений.
Г.9 Будущее мультимодальных моделей.
РЕЗЮМЕ К ГЛАВЕ Г (для инженера).
Вопросы для самопроверки.
ГЛАВА Д. ГОЛОСОВЫЕ АССИСТЕНТЫ: ASR, ITS И КОНВЕЙЕРЫ.
Д.1 Чем голосовой ассистент отличается от чат-бота.
Д.2 ASR: как компьютер слышит.
Д.3 От ASR к пониманию: NLU для голоса.
Д.4 TTS: как компьютер говорит.
Д.5 Единые мультимодальные модели: конвейер уходит в прошлое?.
Д.6 Латентность и интерактивность: почему 5 секунд - это много.
Д.7 Практические рекомендации для инженера.
Д.8 Будущее голосовых ассистентов.
РЕЗЮМЕ К ГЛАВЕ Д.
Вопросы для самопроверки.
ГЛАВА Е. КАК ТЕСТИРОВАТЬ ТО, ЧТО НЕЛЬЗЯ ЗААССЕРТИТЬ.
Е.1 Проблема: нейросеть не возвращает 2+2.
Е.2 Три слоя тестирования (Пирамида для LLM).
Е.3 LLM-as-a-Judge: когда модель проверяет модель.
Е.4 Метрики надежности: как измерить «качество агента».
Е.5 Регрессионное тестирование: библиотека nightmare.
РЕЗЮМЕ К ГЛАВЕ Е.
Вопросы для самопроверки.
ГЛАВА Ж. ЦИФРОВАЯ ЛОВУШКА: КАК ИИ УГЛУБЛЯЕТ САМООБМАН.
Ж.1 Проблема: зеркало, которое льстит.
Ж.2 Механизм самообмана: пошаговая анатомия.
Ж.3 Подмена реальности: как ИИ становится соучастником.
Ж.4 «А если я пошутил?» Почему модель не отличает комплимент от насмешки.
Ж.5 Почему это особенно опасно с ИИ.
Ж.6 Что делают ответственные модели, чтобы этого избежать?.
Ж.7 Практический кейс: как выглядит честный диалог.
Ж.8 Что это значит для инженера (строящего такие системы).
Ж.9 Что это значит для пользователя (читающего книгу).
Ж.10 Границы и ограничения: что эта глава НЕ утверждает.
РЕЗЮМЕ К ГЛАВЕ Ж.
Вопросы для самопроверки.
РЕЗЮМЕ КНИГИ 2. 20 ГЛАВНЫХ ИДЕЙ.
ПРИЛОЖЕНИЯ.
1. ЕСЛИ ЕСТЬ ТОЛЬКО 10-20 МИНУТ, ТО.
2. КАК ОТЛИЧИТЬ ТЕКСТ, СГЕНЕРИРОВАННЫЙ LLM. ОТ ЧЕЛОВЕЧЕСКОГО.
3. ГЛУБИННЫЕ ВОПРОСЫ ЮРИСТА: КТО ОТВЕЧАЕТ, КОГДА ИИ ОШИБАЕТСЯ.
4. КАК ВНЕДРИТЬ LLM В БИЗНЕСЕ: ЧЕК-ЛИСТ ДЛЯ ДИРЕКТОРА ПРОЕКТА.
4.1 Аудит бизнес-процессов: как найти зоны с максимальным ROI за 2 недели.
4.2 Выбор: готовая платформа vs кастомная разработка.
4.3 Как защитить проект перед собственником (шаблон презентации).
4.4 Управление изменениями: как работать с сопротивлением.
4.5 Безопасность: чек-лист для директора проекта.
4.6 ТСО-калькулятор: три варианта + платформа.
4.7 Итог: чек-лист готовности Директора проекта.
5. ENTERPRISE-ПЛАТФОРМЫ ДЛЯ ИИ: ГОТОВЫЙ «МОЗГ ПОД КЛЮЧ».
6. EDGE LLM: КОГДА ИИ ЖИВЁТ У ВАС В КАРМАНЕ ГЛОССАРИЙ.
ЗАКЛЮЧЕНИЕ.
ПОСЛЕСЛОВИЕ. ЛИЦЕНЗИЯ НА ИИ: ОТ УТОПИИ К НЕИЗБЕЖНОСТИ.
Купить .
Купить .
Теги: учебник по информатике :: информатика :: компьютеры :: Дегтев :: нейросеть :: паттерн :: кодирование








