В программе лояльности

Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи

Равичандиран Судхарсан

Код товара: 3739293
(0 оценок)Оценить
ОтзывНаписать отзыв
ВопросЗадать вопрос
1 / 10
PDF
Нет в наличии
Доставим в
г. Москва
Курьером
Л-Пост
бесплатно от 10 000 ₽
В пункт выдачи
от 155 ₽
бесплатно от 10 000 ₽
Точная стоимость доставки рассчитывается при оформлении заказа
Издательство:
Оригинальное название:
Hands-On Reinforcement Learning with Python
Год издания:
2020
Переводчик:
Редактор:

Описание

Характеристики

Глубокое обучение с подкреплением (Reinforcement Learning) — самое популярное и перспективное направление искусственного интеллекта. Практическое изучение RL на Python поможет освоить не только базовые, но и передовые алгоритмы глубокого обучения с подкреплением. Вы начнете с основных принципов обучения с подкреплением, OpenAI Gym и TensorFlow, познакомьтесь с марковскими цепями, методом Монте-Карло и динамическим программированием, так что «страшные» аббревиатуры DQN, DRQN, A3C, PPO и TRPO вскоре перестанут вас пугать. Вы узнаете об агентах, которые учатся на человеческих предпочтениях, DQfD, HER и многих других последних достижениях RL. Прочитав книгу, вы приобретете знания и опыт, необходимые для реализации обучения с подкреплением и глубокого обучения с подкреплением в реальных проектах, и войдете в мир искусственного интеллекта.
код в Майшоп
3739293
возрастная категория
16+
количество томов
1
количество страниц
320 стр.
размеры
232x165x15 мм
страна изготовления
Россия
формат
70x100/16 (170x240) мм
ISBN
978-5-4461-1251-7
тип бумаги
офсетная (60-220 г/м2)
тираж
1200
стандарт
вес
язык
русский
переплёт
Мягкая обложка

Содержание

Об авторе
Предисловие
Глава 1. Введение в обучение с подкреплением
Глава 2. Знакомство с OpenAI и TensorFlow
Глава 3. Марковский процесс принятия решений и
динамическое программирование
Глава 4. Методы Монте-Карло в играх
Глава 5. Обучение на основе временных различий
Глава 6. Задача о многоруком бандите
Глава 7. Основы глубокого обучения
Глава 8. Игры Atari с использованием Deep Q
Network
Глава 9. Игра Doom в глубокой рекуррентной
Q-сети
Глава 10. Асинхронная преимущественная сеть
"актор-критик"
Глава 11. Градиенты политик и оптимизация
Глава 12. "Автогонки" с использованием DQN
Глава 13. Последние достижения и следующие
шаги
Ответы

Отзывы

Вопросы

Поделитесь своим мнением об этом товаре с другими покупателями — будьте первыми!

Дарим бонусы за отзывы!

За какие отзывы можно получить бонусы?
  • За уникальные, информативные отзывы, прошедшие модерацию
Как получить больше бонусов за отзыв?
  • Публикуйте фото или видео к отзыву
  • Пишите отзывы на товары с меткой "Бонусы за отзыв"
Правила начисления бонусов
Задайте вопрос, чтобы узнать больше о товаре
Если вы обнаружили ошибку в описании товара «Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи» (авторы: Равичандиран Судхарсан), то выделите её мышкой и нажмите Ctrl+Enter. Спасибо, что помогаете нам стать лучше!
Ваш населённый пункт:
г. Москва
Выбор населённого пункта