... /

Глубокое обучение с подкреплением. Теория и практика на языке Python

Грессер Лаура, Кенг Ван Лун

Код товара: 4796308

(0 оценок)Оценить

ОтзывНаписать отзыв

ВопросЗадать вопрос

1 / 19

PDF

1 / 19

Нет в наличии

Доставим в

г. Москва

Курьером

бесплатно от 10 000 ₽

В пункт выдачи

от 200 ₽

бесплатно от 10 000 ₽

Точная стоимость доставки рассчитывается при оформлении заказа

Издательство:

Питер

Оригинальное название:

Foundations of Deep Reinforcement Learning. Theory and Practice in Python

Год издания:

Cерия:

Библиотека программиста

Переводчик:

Синица К.

Описание

Характеристики

Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области - от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники.
Эта книга - введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
Руководство идеально подойдет как для студентов, изучающих компьютерные науки, так и для разработчиков программного обеспечения, которые знакомы с основными принципами машинного обучения и знают Python.

код в Майшоп

4796308

возрастная категория

16+

количество томов

количество страниц

416 стр.

размеры

234x166x23 мм

формат

70x100/16 (170x240) мм

ISBN

978-5-4461-1699-7

тип бумаги

офсетная (60-220 г/м2)

стандарт

вес

язык

русский

переплёт

Мягкая обложка

Содержание

Предисловие
Введение
Благодарности
Об авторах
От издательства
Глава 1. Введение в обучение с подкреплением
Часть I. Алгоритмы, основанные на стратегиях и
полезностях
Глава 2. REINFORCE
Глава 3. SARSA
Глава 4. Глубокие Q-сети
Глава 5. Улучшение DQN
Часть II. Комбинированные методы
Глава 6. Метод актора-критика с преимуществом
(А2С)
Глава 7. Оптимизация ближайшей стратегии
Глава 8. Методы параллелизации
Глава 9. Сравнительный анализ алгоритмов
Часть III. Практика
Глава 10. Начало работы с глубоким RL
Глава 11. SLM Lab
Глава 12. Архитектура сетей
Глава 13. Аппаратное обеспечение
Часть IV. Проектирование сред
Глава 14. Состояния
Глава 15. Действия
Глава 16. Вознаграждения
Глава 17. Функция переходов
Заключение
Приложения
Приложение А. История глубокого обучения с
подкреплением
Приложение Б. Примеры сред
Список используемых источников

Отзывы

Вопросы

Поделитесь своим мнением об этом товаре с другими покупателями — будьте первыми!

Дарим бонусы за отзывы!

За какие отзывы можно получить бонусы?

За уникальные, информативные отзывы, прошедшие модерацию

Как получить больше бонусов за отзыв?

Публикуйте фото или видео к отзыву
Пишите отзывы на товары с меткой "Бонусы за отзыв"

Правила начисления бонусов

Задайте вопрос, чтобы узнать больше о товаре

Товары издательства "Питер"

-50%

207413

Все дети - зас..нцы. И это не ваша вина

Ладитан Банми

-50%

146291

Правила дорожного движения 2017 с примерами и комментариями

-50%

1 1252 249

Framed Ink. Рисунок и композиция для визуального сторителлинга

Матеу-Местре Маркос

-50%

120240

Медосмотры водителей 2023. Электронный путевой лист

Кузнецов Петр Павлович

-50%

1 0202 039

Создание фантастических существ и животных с помощью акварели

Пуй-Мун Ло Стефани

-50%

458915

Бессмертная книга вампиров

Романова Марьяна

-50%

285569

Лицензия на счастье

Сюрр Елена

Если вы обнаружили ошибку в описании товара «Глубокое обучение с подкреплением. Теория и практика на языке Python» (авторы: Грессер Лаура, Кенг Ван Лун), то выделите её мышкой и нажмите Ctrl+Enter. Спасибо, что помогаете нам стать лучше!