В программе лояльности

Глубокое обучение с подкреплением. Теория и практика на языке Python

Грессер Лаура, Кенг Ван Лун

Код товара: 4796308
(0 оценок)Оценить
ОтзывНаписать отзыв
ВопросЗадать вопрос
1 / 19
PDF
Нет в наличии
Доставим в
г. Москва
Курьером
Л-Пост
бесплатно от 10 000 ₽
В пункт выдачи
от 155 ₽
бесплатно от 10 000 ₽
Точная стоимость доставки рассчитывается при оформлении заказа
Издательство:
Оригинальное название:
Foundations of Deep Reinforcement Learning. Theory and Practice in Python
Год издания:
2022
Переводчик:

Описание

Характеристики

Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области - от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники.
Эта книга - введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
Руководство идеально подойдет как для студентов, изучающих компьютерные науки, так и для разработчиков программного обеспечения, которые знакомы с основными принципами машинного обучения и знают Python.
код в Майшоп
4796308
возрастная категория
16+
количество томов
1
количество страниц
416 стр.
размеры
234x166x23 мм
формат
70x100/16 (170x240) мм
ISBN
978-5-4461-1699-7
тип бумаги
офсетная (60-220 г/м2)
стандарт
вес
язык
русский
переплёт
Мягкая обложка

Содержание

Предисловие
Введение
Благодарности
Об авторах
От издательства
Глава 1. Введение в обучение с подкреплением
Часть I. Алгоритмы, основанные на стратегиях и
полезностях
Глава 2. REINFORCE
Глава 3. SARSA
Глава 4. Глубокие Q-сети
Глава 5. Улучшение DQN
Часть II. Комбинированные методы
Глава 6. Метод актора-критика с преимуществом
(А2С)
Глава 7. Оптимизация ближайшей стратегии
Глава 8. Методы параллелизации
Глава 9. Сравнительный анализ алгоритмов
Часть III. Практика
Глава 10. Начало работы с глубоким RL
Глава 11. SLM Lab
Глава 12. Архитектура сетей
Глава 13. Аппаратное обеспечение
Часть IV. Проектирование сред
Глава 14. Состояния
Глава 15. Действия
Глава 16. Вознаграждения
Глава 17. Функция переходов
Заключение
Приложения
Приложение А. История глубокого обучения с
подкреплением
Приложение Б. Примеры сред
Список используемых источников

Отзывы

Вопросы

Поделитесь своим мнением об этом товаре с другими покупателями — будьте первыми!

Дарим бонусы за отзывы!

За какие отзывы можно получить бонусы?
  • За уникальные, информативные отзывы, прошедшие модерацию
Как получить больше бонусов за отзыв?
  • Публикуйте фото или видео к отзыву
  • Пишите отзывы на товары с меткой "Бонусы за отзыв"
Правила начисления бонусов
Задайте вопрос, чтобы узнать больше о товаре
Если вы обнаружили ошибку в описании товара «Глубокое обучение с подкреплением. Теория и практика на языке Python» (авторы: Грессер Лаура, Кенг Ван Лун), то выделите её мышкой и нажмите Ctrl+Enter. Спасибо, что помогаете нам стать лучше!
Ваш населённый пункт:
г. Москва
Выбор населённого пункта