Книги / Компьютерная литература / Разработка ПО / Языки и среды программирования, технологии и т.п. / Python

Алгоритмы обучения с подкреплением на Python

Лонца Андреа

Код товара: 4047558

(0 оценок)Оценить

ОтзывНаписать отзыв

ВопросЗадать вопрос

1 / 2

PDF

-33%

1 822

2 719

Доставим в

г. Москва

Планируемая дата

19 мая (Вс)

Курьером

бесплатно от 10 000 ₽

В пункт выдачи

от 155 ₽

бесплатно от 10 000 ₽

Точная стоимость доставки рассчитывается при оформлении заказа

Издательство:

ДМК-Пресс

Оригинальное название:

Reinforcement Learning Algorithms with Python

Год издания:

Редактор:

Мовчан Д. А.

Переводчик:

Слинкин А. А.

Описание

Характеристики

Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов.
В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и мета-алгоритмом ESBAS.
Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне.

количество томов

количество страниц

286 стр.

переплет

Твёрдый переплёт

размеры

245x172x20 мм

страна изготовления

Россия

цвет

Белый

тип бумаги

офсетная (60-220 г/м2)

формат

70x100/16 (170x240 мм)

ISBN

978-5-97060-855-5

стандарт

12 шт.

возрастная категория

18+ (нет данных)

вес

571 г

код в Майшоп

4047558

язык

русский

Содержание

Об авторе
Предисловие
Часть I. АЛГОРИТМЫ И ОКРУЖАЮЩИЕ СРЕДЫ
Глава 1. Ландшафт обучения с подкреплением
Глава 2. Реализация цикла ОП и OpenAI Gym
Глава 3. Решение задач методом динамического
программирования
Часть II. БЕЗМОДЕЛЬНЫЕ АЛГОРИТМЫ ОП
Глава 4. Применение Q-обучения и алгоритма
SARSA
Глава 5. Глубокая О-сеть
Глава 6. Стохастическая оптимизация и градиенты
стратегии
Глава 7. Реализация TRPO и РРО
Глава 8. Применения алгоритмов DDPG и TD3
Часть III. ЗА ПРЕДЕЛАМИ БЕЗМОДЕЛЬНЫХ
АЛГОРИТМОВ
Глава 9. ОП на основе модели
Глава 10. Подражательное обучение и алгоритм
DAgger
Глава 11. Оптимизация методом черного ящика
Глава 12. Разработка алгоритма ESBAS
Глава 13. Практические подходы к решению
проблем ОП
Ответы на вопросы
Предметный указатель

Отзывы

Вопросы

Поделитесь своим мнением об этом товаре с другими покупателями — будьте первыми!

Дарим бонусы за отзывы!

За какие отзывы можно получить бонусы?

За уникальные, информативные отзывы, прошедшие модерацию

Как получить больше бонусов за отзыв?

Публикуйте фото или видео к отзыву
Пишите отзывы на товары с меткой "Бонусы за отзыв"

Правила начисления бонусов

Задайте вопрос, чтобы узнать больше о товаре

Если вы обнаружили ошибку в описании товара «Алгоритмы обучения с подкреплением на Python» (авторы: Лонца Андреа), то выделите её мышкой и нажмите Ctrl+Enter. Спасибо, что помогаете нам стать лучше!