Głębokie uczenie przez wzmacnianie. Praca
- Время доставки: 7-10 дней
- Состояние товара: новый
- Доступное количество: 15
Заказывая «Głębokie uczenie przez wzmacnianie. Praca» данное изделие из «E-бизнес» вы можете быть уверены, что после оформления заказа, доставки в Украину, вы получите именно то, что заказывали, в оговоренные сроки и европейского качества.
Глубокое обучение с подкреплением. Работа с чат-ботами и робототехникой, дискретная оптимизация и автоматизация сетей на практике. 2-е издание
Автор: Максим Лапан
Издательство: Гелион
Год издания: 2022
Перевод: Яцек Януш
ISBN: 978-83-283-8052-3
Формат: 168x237
Обложка: мягкая
Страницы: 720
Книга новая
Цена обложки книги: 149,00 злотых > Акционную цену можно найти на нашем аукционе!
Глубокое обучение с подкреплением развивается очень динамично. Эта область характеризуется неисчерпаемым потенциалом для решения сложных задач. По крайней мере, несколько исследовательских групп работают над этим, сосредоточившись на внедрении глубокого обучения с подкреплением в различных отраслях. К сожалению, описания последних разработок сложны для понимания и слишком абстрактны, чтобы их можно было легко применить в практических реализациях, однако корректная работа приложения зависит от досконального понимания проблемы разработчиком.
Это обновленное и расширенное издание популярного руководства с использованием новейших инструментов и методов, связанных с обучением с подкреплением. Он знакомит с теорией обучения с подкреплением и объясняет практические способы написания самообучающихся агентов для решения практических задач. В это издание добавлены шесть новых глав, посвященных таким технологическим достижениям, как дискретная оптимизация, многоагентные методы, среда Microsoft TextWorld и передовые методы интеллектуального анализа данных. Также рассматриваются другие темы, в том числе сети с глубоким Q, политические градиенты, непрерывный контроль и высокомасштабируемые безградиентные методы. Отдельные проблемы проиллюстрированы кодом и описанием деталей реализации.
Книга, среди прочего, включает в себя:
- связь между обучением с подкреплением и глубоким обучением.
- различные методы обучения с подкреплением, включая кросс-энтропию, сеть DQN, а также алгоритмы: актор-критик, TRPO, PPO, DDPG, D4PG и другие.
- практическое применение дискретной оптимизации для решения задачи Рубика. Задача куба.
- обучение агентов с использованием программного обеспечения AlphaGo Zero.
- чат-боты на основе искусственного интеллекта.
- передовые методы исследования, включая методы сетевой дистилляции.