Głębokie uczenie przez wzmacnianie. Praca


Код: 13900202085
1713 грн
Цена указана с доставкой в Украину
Товар есть в наличии
КАК ЭКОНОМИТЬ НА ДОСТАВКЕ?
Заказывайте большое количество товаров у этого продавца
Информация
  • Время доставки: 7-10 дней
  • Состояние товара: новый
  • Доступное количество: 15

Заказывая «Głębokie uczenie przez wzmacnianie. Praca» данное изделие из «E-бизнес» вы можете быть уверены, что после оформления заказа, доставки в Украину, вы получите именно то, что заказывали, в оговоренные сроки и европейского качества.

Глубокое обучение с подкреплением. Работа с чат-ботами и робототехникой, дискретная оптимизация и автоматизация сетей на практике. 2-е издание

Автор: Максим Лапан

Издательство: Гелион

Год издания: 2022

Перевод: Яцек Януш

ISBN: 978-83-283-8052-3

Формат: 168x237

Обложка: мягкая

Страницы: 720

Книга новая

Цена обложки книги: 149,00 злотых > Акционную цену можно найти на нашем аукционе!

Глубокое обучение с подкреплением развивается очень динамично. Эта область характеризуется неисчерпаемым потенциалом для решения сложных задач. По крайней мере, несколько исследовательских групп работают над этим, сосредоточившись на внедрении глубокого обучения с подкреплением в различных отраслях. К сожалению, описания последних разработок сложны для понимания и слишком абстрактны, чтобы их можно было легко применить в практических реализациях, однако корректная работа приложения зависит от досконального понимания проблемы разработчиком.

Это обновленное и расширенное издание популярного руководства с использованием новейших инструментов и методов, связанных с обучением с подкреплением. Он знакомит с теорией обучения с подкреплением и объясняет практические способы написания самообучающихся агентов для решения практических задач. В это издание добавлены шесть новых глав, посвященных таким технологическим достижениям, как дискретная оптимизация, многоагентные методы, среда Microsoft TextWorld и передовые методы интеллектуального анализа данных. Также рассматриваются другие темы, в том числе сети с глубоким Q, политические градиенты, непрерывный контроль и высокомасштабируемые безградиентные методы. Отдельные проблемы проиллюстрированы кодом и описанием деталей реализации.

Книга, среди прочего, включает в себя:

  • связь между обучением с подкреплением и глубоким обучением.
  • различные методы обучения с подкреплением, включая кросс-энтропию, сеть DQN, а также алгоритмы: актор-критик, TRPO, PPO, DDPG, D4PG и другие.
  • практическое применение дискретной оптимизации для решения задачи Рубика. Задача куба.
  • обучение агентов с использованием программного обеспечения AlphaGo Zero.
  • чат-боты на основе искусственного интеллекта.
  • передовые методы исследования, включая методы сетевой дистилляции.

Привет, мир настоящего искусственного интеллекта!