GŁĘBOKIE UCZENIE PRZEZ WZMACNIANIE W.2


Код: 15454582705
1695 грн
Цена указана с доставкой в Украину
Товар есть в наличии
КАК ЭКОНОМИТЬ НА ДОСТАВКЕ?
Заказывайте большое количество товаров у этого продавца
Информация
  • Время доставки: 7-10 дней
  • Состояние товара: новый
  • Доступное количество: 4

Оплачивая «GŁĘBOKIE UCZENIE PRZEZ WZMACNIANIE W.2» данный товар из каталога «E-бизнес» вы можете быть уверены, что после оформления заказа, доставки в Украину, вы получите именно то, что заказывали, в оговоренные сроки и европейского качества.

ГЛУБОКОЕ ЗАКРЕПЛЕНИЕ ОБУЧЕНИЯ, V.2

МАКСИМ ЛАПАН

  • Издательство: ГЕЛИОН
  • Год издания: 2022
  • Переплет: БРОШЮРА
  • Количество страниц: 720
  • >EAN: 9788328380523

Глубокое обучение с подкреплением развивается очень динамично. Эта область характеризуется неисчерпаемым потенциалом для решения сложных задач. По крайней мере, несколько исследовательских групп работают над этим, сосредоточившись на внедрении глубокого обучения с подкреплением в различных отраслях. К сожалению, описания последних разработок сложны для понимания и слишком абстрактны, чтобы их можно было легко применить в практических реализациях, однако правильная работа приложения зависит от глубокого понимания проблемы разработчиком. Это обновленное и расширенное издание популярного руководства по новейшим инструментам и методам обучения с подкреплением. Он знакомит с теорией обучения с подкреплением и объясняет практические способы написания самообучающихся агентов для решения практических задач. В это издание добавлены шесть новых глав, посвященных таким технологическим достижениям, как дискретная оптимизация, многоагентные методы, среда Microsoft TextWorld и передовые методы интеллектуального анализа данных. Также рассматриваются другие темы, в том числе сети с глубоким Q, политические градиенты, непрерывный контроль и высокомасштабируемые безградиентные методы. Отдельные проблемы проиллюстрированы кодом и описанием деталей реализации. В книгу вошли: связи между обучением с подкреплением и глубоким обучением, различные методы обучения с подкреплением, включая кросс-энтропию, сеть DQN, а также алгоритмы: актор-критик, TRPO, PPO, DDPG, D4PG и другие практические применения дискретной оптимизации решений. к задаче кубика Рубика обучение агентов с использованием программного обеспечения AlphaGo Zero чат-боты на основе искусственного интеллекта передовые методы майнинга, включая методы сетевой дистилляции Привет, мир настоящего искусственного интеллекта!

[Код предложения,491400,9788328380523,2024-04-12 02:58:37]