Грокаем глубокое обучение с подкреплением, Моралес М., 2023.
Мы учимся, взаимодействуя с окружающей средой, и получаемые вознаграждения и наказания определяют наше поведение в будущем. Глубокое обучение с подкреплением привносит этот естественный процесс в искусственный интеллект и предполагает анализ результатов для выявления наиболее эффективных путей движения вперед. Агенты глубокого обучения с подкреплением могут способствовать успеху маркетинговых кампаний, прогнозировать рост акций и побеждать гроссмейстеров в Го и шахматах. Давайте научимся создавать системы глубокого обучения на примере увлекательных упражнений, сопровождаемых кодом на Python с подробными комментариями и понятными объяснениями. Вы увидите, как работают алгоритмы, и научитесь создавать собственных агентов глубокого обучения с подкреплением, используя оценочную обратную связь.

Оценка поведения агента.
Вы уже знаете, как сложно сбалансировать краткосрочные и долгосрочные цели. Все мы сталкиваемся с этой проблемой по нескольку раз на дню. Например, чем лучше заняться этим вечером: посмотреть фильм или продолжить чтение книги? Первый вариант сразу же приносит удовлетворение: на протяжении полутора-двух часов вы можете променять нищету на богатство, одиночество на любовь, избыточный вес на стройную фигуру — и все это не переставая жевать попкорн. А вот чтение книги не даст вам особых ощущений сегодня вечером, но в дальнейшем эти ощущения могут (без какой-либо гарантии) оказаться куда сильнее.
Краткое содержание.
Предисловие.
Вступление.
Благодарности.
О книге.
От издательства.
Об авторе.
Глава 1.Введение в глубокое обучение с подкреплением.
Глава 2.Математические основы обучения с подкреплением.
Глава 3.Баланс краткосрочных и долгосрочных целей.
Глава 4.Баланс между сбором и использованием информации.
Глава 5.Оценка поведения агента.
Глава 6.Улучшение поведения агентов.
Глава 7.Более действенные и эффективные способы достижения целей.
Глава 8.Введение в ценностно ориентированное глубокое обучение с подкреплением.
Глава 9.Более стабильные ценностно ориентированные методы.
Глава 10.Ценностно ориентированные методы с эффективным использованием выборок.
Глава 11.Методы градиента политик и «актер-критик».
Глава 12.Продвинутые методы «актер-критик».
Глава 13.Путь к сильному искусственному интеллекту.
Купить .
Теги: Моралес :: книги по программированию :: программирование :: искусственный интеллект :: Python