Алгоритмы обучения с подкреплением на Python

Лонца Андреа

Код товара: 4047558
(0 оценок)Оценить
ОтзывНаписать отзыв
ВопросЗадать вопрос
1 / 2
PDF
1 822
2 719
Доставим в
г. Москва
Планируемая дата
19 мая (Вс)
Курьером
Л-Пост
бесплатно от 10 000 ₽
В пункт выдачи
от 155 ₽
бесплатно от 10 000 ₽
Точная стоимость доставки рассчитывается при оформлении заказа
Издательство:
Оригинальное название:
Reinforcement Learning Algorithms with Python
Год издания:
2020 г.
Редактор:
Переводчик:

Описание

Характеристики

Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов.
В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и мета-алгоритмом ESBAS.
Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне.
количество томов
1
количество страниц
286 стр.
переплет
Твёрдый переплёт
размеры
245x172x20 мм
страна изготовления
Россия
цвет
Белый
тип бумаги
офсетная (60-220 г/м2)
формат
70x100/16 (170x240 мм)
ISBN
978-5-97060-855-5
стандарт
возрастная категория
18+ (нет данных)
вес
код в Майшоп
4047558
язык
русский

Содержание

Об авторе
Предисловие
Часть I. АЛГОРИТМЫ И ОКРУЖАЮЩИЕ СРЕДЫ
Глава 1. Ландшафт обучения с подкреплением
Глава 2. Реализация цикла ОП и OpenAI Gym
Глава 3. Решение задач методом динамического
программирования
Часть II. БЕЗМОДЕЛЬНЫЕ АЛГОРИТМЫ ОП
Глава 4. Применение Q-обучения и алгоритма
SARSA
Глава 5. Глубокая О-сеть
Глава 6. Стохастическая оптимизация и градиенты
стратегии
Глава 7. Реализация TRPO и РРО
Глава 8. Применения алгоритмов DDPG и TD3
Часть III. ЗА ПРЕДЕЛАМИ БЕЗМОДЕЛЬНЫХ
АЛГОРИТМОВ
Глава 9. ОП на основе модели
Глава 10. Подражательное обучение и алгоритм
DAgger
Глава 11. Оптимизация методом черного ящика
Глава 12. Разработка алгоритма ESBAS
Глава 13. Практические подходы к решению
проблем ОП
Ответы на вопросы
Предметный указатель

Отзывы

Вопросы

Поделитесь своим мнением об этом товаре с другими покупателями — будьте первыми!

Дарим бонусы за отзывы!

За какие отзывы можно получить бонусы?
  • За уникальные, информативные отзывы, прошедшие модерацию
Как получить больше бонусов за отзыв?
  • Публикуйте фото или видео к отзыву
  • Пишите отзывы на товары с меткой "Бонусы за отзыв"
Правила начисления бонусов
Задайте вопрос, чтобы узнать больше о товаре
Если вы обнаружили ошибку в описании товара «Алгоритмы обучения с подкреплением на Python» (авторы: Лонца Андреа), то выделите её мышкой и нажмите Ctrl+Enter. Спасибо, что помогаете нам стать лучше!
Ваш населённый пункт:
г. Москва
Выбор населённого пункта