GŁĘBOKIE UCZENIE PRZEZ WZMACNIANIE W.2


Код: 16505610386
1860 грн
Цена указана с доставкой в Украину
Товар есть в наличии
КАК ЭКОНОМИТЬ НА ДОСТАВКЕ?
Заказывайте большое количество товаров у этого продавца
Информация
  • Время доставки: 7-10 дней
  • Состояние товара: новый
  • Доступное количество: 4

Просматривая «GŁĘBOKIE UCZENIE PRZEZ WZMACNIANIE W.2» данный товар из каталога «E-бизнес», вы можете получить дополнительную скидку 4%, если произведете 100% предоплату. Размер скидки вы можете увидеть сразу при оформлении заказа на сайте. Внимание!!! Скидка распространяется только при заказе через сайт.

ГЛУБОКОЕ ЗАКРЕПЛЕНИЕ ОБУЧЕНИЯ, V.2

МАКСИМ ЛАПАН

  • Издательство: ГЕЛИОН
  • Год издания: 2022
  • Переплет: БРОШЮРА
  • Количество страниц: 720
  • >EAN: 9788328380523

Глубокое обучение с подкреплением развивается очень динамично. Эта область характеризуется неисчерпаемым потенциалом для решения сложных задач. По крайней мере, несколько исследовательских групп работают над этим, сосредоточившись на внедрении глубокого обучения с подкреплением в различных отраслях. К сожалению, описания последних разработок сложны для понимания и слишком абстрактны, чтобы их можно было легко применить в практических реализациях, однако правильная работа приложения зависит от глубокого понимания проблемы разработчиком. Это обновленное и расширенное издание популярного руководства по новейшим инструментам и методам обучения с подкреплением. Он знакомит с теорией обучения с подкреплением и объясняет практические способы написания самообучающихся агентов для решения практических задач. В это издание добавлены шесть новых глав, посвященных таким технологическим достижениям, как дискретная оптимизация, многоагентные методы, среда Microsoft TextWorld и передовые методы интеллектуального анализа данных. Также рассматриваются другие темы, в том числе сети с глубоким Q, политические градиенты, непрерывный контроль и высокомасштабируемые безградиентные методы. Отдельные проблемы проиллюстрированы кодом и описанием деталей реализации. В книгу вошли: связи между обучением с подкреплением и глубоким обучением, различные методы обучения с подкреплением, включая кросс-энтропию, сеть DQN, а также алгоритмы: актор-критик, TRPO, PPO, DDPG, D4PG и другие практические применения дискретной оптимизации решений. к обучению агентов задачам кубика Рубика с использованием программных чат-ботов AlphaGo Zero, основанных на передовых методах майнинга искусственного интеллекта, включая методы сетевой дистилляции. Привет, мир настоящего искусственного интеллекта!

[Код предложения,491400,9788328380523,2024-09-16 18:39:08]