... /

Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи

Равичандиран Судхарсан

Код товара: 3739293

(0 оценок)Оценить

ОтзывНаписать отзыв

ВопросЗадать вопрос

1 / 10

PDF

1 / 10

Нет в наличии

Доставим в

г. Москва

Курьером

бесплатно от 10 000 ₽

В пункт выдачи

от 155 ₽

бесплатно от 10 000 ₽

Точная стоимость доставки рассчитывается при оформлении заказа

Издательство:

Питер

Оригинальное название:

Hands-On Reinforcement Learning with Python

Год издания:

Cерия:

Библиотека программиста

Переводчик:

Матвеев Е.

Редактор:

Тульцева К.

Описание

Характеристики

Глубокое обучение с подкреплением (Reinforcement Learning) — самое популярное и перспективное направление искусственного интеллекта. Практическое изучение RL на Python поможет освоить не только базовые, но и передовые алгоритмы глубокого обучения с подкреплением. Вы начнете с основных принципов обучения с подкреплением, OpenAI Gym и TensorFlow, познакомьтесь с марковскими цепями, методом Монте-Карло и динамическим программированием, так что «страшные» аббревиатуры DQN, DRQN, A3C, PPO и TRPO вскоре перестанут вас пугать. Вы узнаете об агентах, которые учатся на человеческих предпочтениях, DQfD, HER и многих других последних достижениях RL. Прочитав книгу, вы приобретете знания и опыт, необходимые для реализации обучения с подкреплением и глубокого обучения с подкреплением в реальных проектах, и войдете в мир искусственного интеллекта.

код в Майшоп

3739293

возрастная категория

16+

количество томов

количество страниц

320 стр.

размеры

232x165x15 мм

страна изготовления

Россия

формат

70x100/16 (170x240) мм

ISBN

978-5-4461-1251-7

тип бумаги

офсетная (60-220 г/м2)

тираж

1200

стандарт

10 шт.

вес

420 г

язык

русский

переплёт

Мягкая обложка

Содержание

Об авторе
Предисловие
Глава 1. Введение в обучение с подкреплением
Глава 2. Знакомство с OpenAI и TensorFlow
Глава 3. Марковский процесс принятия решений и
динамическое программирование
Глава 4. Методы Монте-Карло в играх
Глава 5. Обучение на основе временных различий
Глава 6. Задача о многоруком бандите
Глава 7. Основы глубокого обучения
Глава 8. Игры Atari с использованием Deep Q
Network
Глава 9. Игра Doom в глубокой рекуррентной
Q-сети
Глава 10. Асинхронная преимущественная сеть
"актор-критик"
Глава 11. Градиенты политик и оптимизация
Глава 12. "Автогонки" с использованием DQN
Глава 13. Последние достижения и следующие
шаги
Ответы

Отзывы

Вопросы

Поделитесь своим мнением об этом товаре с другими покупателями — будьте первыми!

Дарим бонусы за отзывы!

За какие отзывы можно получить бонусы?

За уникальные, информативные отзывы, прошедшие модерацию

Как получить больше бонусов за отзыв?

Публикуйте фото или видео к отзыву
Пишите отзывы на товары с меткой "Бонусы за отзыв"

Правила начисления бонусов

Задайте вопрос, чтобы узнать больше о товаре

Товары издательства "Питер"

-15%

1 5281 797

Геймдизайн.Рецепты успеха лучших компьютерных игр от Super Mario и Doom до Assassin's Creed и дальше

Тайнан Сильвестр

-15%

408480

Почему мне так хреново, хотя вроде бы всё нормально

Павлова Елизавета

-15%

632743

Система Сосновского. 30 советов

Сосновский Александр

-15%

830976

Герои

Ревякина Анна Николаевна

-15%

352413

Все дети - зас..нцы. И это не ваша вина

Ладитан Банми

-15%

459539

Воскресшие на Третьей мировой. Антология военной поэзии 2014 - 2022 гг.

Алейников Владимир Дмитриевич

-15%

357420

Школа рисования. Форма, объем, пропорции

Чернов Денис

Если вы обнаружили ошибку в описании товара «Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи» (авторы: Равичандиран Судхарсан), то выделите её мышкой и нажмите Ctrl+Enter. Спасибо, что помогаете нам стать лучше!