Алгоритмы обучения с подкреплением на Python, Лонца А., 2020.
Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и метаалгоритмом ESBAS. Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне.
Глубокое обучение.
Теперь можно задаться вопросом: почему глубокое обучение в сочетании с ОП дает такие замечательные результаты? Главным образом потому, что глубокое обучение способно справляться с пространством состояний очень высокой размерности. До изобретения глубокого ОП пространства состояний приходилось разбивать на более простые представления, называемые признаками. Их было трудно проектировать, и иногда эта задача была подвластна только узким специалистам. Теперь же, пользуясь глубокими нейронными сетями, в частности сверточными нейронными сетями (СНС) или рекуррентными нейронными сетями (РНС), ОП-система может обучиться различным уров- ням абстракции непосредственно на исходных пикселях или последовательных данных (например, текстах на естественном языке). Такая конфигурация показана на рис. 1.3.
Содержание.
Об авторе.
Предисловие.
Часть I.АЛГОРИТМЫ И ОКРУЖАЮЩИЕ СРЕДЫ.
Часть II.БЕЗМОДЕЛЬНЫЕ АЛГОРИТМЫ ОП.
Часть III.ЗА ПРЕДЕЛАМИ БЕЗМОДЕЛЬНЫХ АЛГОРИТМОВ.
Купить .
Теги: Лонца :: книги по программированию :: программирование :: Python
Смотрите также учебники, книги и учебные материалы:
- Вы пока еще не знаете JS, Познакомьтесь, JavaScript, Симпсон К., 2022
- Веб-разработка с применением Node и Express, Полноценное использование стека JavaScript, Браун И., 2021
- Паттерны проектирования для C# и платформы .NET Core., Арораа Г., Чилберто Д., 2021
- Data Science в действии, Апельцин Л., 2023
- React, Быстрый старт, Стефанов С., 2023
- React, Современные шаблоны для разработки приложений, Бэнкс А., Порселло Е., 2022
- Kafka Streams и ksqlDB, Данные в реальном времени, Сеймур М., 2023
- JavaScript, Рецепты для разработчиков, Скотт А., Макдоналд М., Пауэрс Ш., 2023