Обучение с подкреплением на PyTorch. Сборник рецептов. Свыше 60 рецептов проектирования, разработки
Юси (Хэйден) Лю
Код товара: 4087879
(0 оценок)Оценить
ОтзывНаписать отзыв
ВопросЗадать вопрос
1 / 2
PDF
Нет в наличии
Доставим в
г. Химки, Московская обл.Курьером
бесплатно от 10 000 ₽
В пункт выдачи
от 155 ₽
бесплатно от 10 000 ₽
Точная стоимость доставки рассчитывается при оформлении заказа
Издательство:
Оригинальное название:
PyTorch 1.x Reinforcement Learning Cookbook. Over 60 recipes to design, develop, and deploy self-l.
Описание
Характеристики
Библиотека PyTorch выходит на передовые позиции в качестве средства обучения с подкреплением (ОП) благодаря эффективности и простоте ее использования. Эта книга организована как справочник по работе с PyTorch, охватывающий широкий круг тем – от самых азов (настройка рабочей среды) до практических задач (рассмотрение ОП на конкретных примерах).
Вы научитесь использовать алгоритм «многоруких бандитов» и аппроксимацию функций; узнаете, как победить в играх Atari с помощью глубоких Q-сетей и как эффективно реализовать метод градиента стратегии; увидите, как применить метод ОП к игре в блэкджек, к окружающим средам в сеточном мире, к оптимизации рекламы в интернете и к игре Flappy Bird.
Издание предназначено для специалистов по искусственному интеллекту, которым требуется помощь в решении задач ОП. Для изучения материала необходимо знакомство с концепциями машинного обучения; опыт работы с библиотекой PyTorch необязателен, но желателен.
Вы научитесь использовать алгоритм «многоруких бандитов» и аппроксимацию функций; узнаете, как победить в играх Atari с помощью глубоких Q-сетей и как эффективно реализовать метод градиента стратегии; увидите, как применить метод ОП к игре в блэкджек, к окружающим средам в сеточном мире, к оптимизации рекламы в интернете и к игре Flappy Bird.
Издание предназначено для специалистов по искусственному интеллекту, которым требуется помощь в решении задач ОП. Для изучения материала необходимо знакомство с концепциями машинного обучения; опыт работы с библиотекой PyTorch необязателен, но желателен.
Содержание
Об авторе
О рецензентах
Предисловие
Глава 1. Приступаем к обучению с подкреплением и PyTorch
Глава 2. Марковские процессы принятия решений и динамическое
программирование
Глава 3. Применение методов Монте-Карло для численного оценивания
Глава 4. TD-обучение и Q-обучение
Глава 5. Решение задачи о многоруком бандите
Глава 6. Масштабирование с помощью аппроксимации функций
Глава 7. Глубокие Q-сети в действии
Глава 8. Реализация методов градиента стратегии и оптимизация
стратегии
Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird
Предметный указатель
О рецензентах
Предисловие
Глава 1. Приступаем к обучению с подкреплением и PyTorch
Глава 2. Марковские процессы принятия решений и динамическое
программирование
Глава 3. Применение методов Монте-Карло для численного оценивания
Глава 4. TD-обучение и Q-обучение
Глава 5. Решение задачи о многоруком бандите
Глава 6. Масштабирование с помощью аппроксимации функций
Глава 7. Глубокие Q-сети в действии
Глава 8. Реализация методов градиента стратегии и оптимизация
стратегии
Глава 9. Кульминационный проект - применение DQN к игре Flappy Bird
Предметный указатель
Отзывы
Вопросы
Поделитесь своим мнением об этом товаре с другими покупателями — будьте первыми!
Дарим бонусы за отзывы!
За какие отзывы можно получить бонусы?
- За уникальные, информативные отзывы, прошедшие модерацию
Как получить больше бонусов за отзыв?
- Публикуйте фото или видео к отзыву
- Пишите отзывы на товары с меткой "Бонусы за отзыв"
Задайте вопрос, чтобы узнать больше о товаре
Если вы обнаружили ошибку в описании товара «Обучение с подкреплением на PyTorch. Сборник рецептов. Свыше 60 рецептов проектирования, разработки» (авторы: Юси (Хэйден) Лю), то выделите её мышкой и нажмите Ctrl+Enter. Спасибо, что помогаете нам стать лучше!