GŁĘBOKIE UCZENIE PRZEZ WZMACNIANIE W.2
- Время доставки: 7-10 дней
- Состояние товара: новый
- Доступное количество: 4
Просматривая «GŁĘBOKIE UCZENIE PRZEZ WZMACNIANIE W.2» данный товар из каталога «E-бизнес», вы можете получить дополнительную скидку 4%, если произведете 100% предоплату. Размер скидки вы можете увидеть сразу при оформлении заказа на сайте. Внимание!!! Скидка распространяется только при заказе через сайт.
ГЛУБОКОЕ ЗАКРЕПЛЕНИЕ ОБУЧЕНИЯ, V.2
МАКСИМ ЛАПАН
Глубокое обучение с подкреплением развивается очень динамично. Эта область характеризуется неисчерпаемым потенциалом для решения сложных задач. По крайней мере, несколько исследовательских групп работают над этим, сосредоточившись на внедрении глубокого обучения с подкреплением в различных отраслях. К сожалению, описания последних разработок сложны для понимания и слишком абстрактны, чтобы их можно было легко применить в практических реализациях, однако правильная работа приложения зависит от глубокого понимания проблемы разработчиком. Это обновленное и расширенное издание популярного руководства по новейшим инструментам и методам обучения с подкреплением. Он знакомит с теорией обучения с подкреплением и объясняет практические способы написания самообучающихся агентов для решения практических задач. В это издание добавлены шесть новых глав, посвященных таким технологическим достижениям, как дискретная оптимизация, многоагентные методы, среда Microsoft TextWorld и передовые методы интеллектуального анализа данных. Также рассматриваются другие темы, в том числе сети с глубоким Q, политические градиенты, непрерывный контроль и высокомасштабируемые безградиентные методы. Отдельные проблемы проиллюстрированы кодом и описанием деталей реализации. В книгу вошли: связи между обучением с подкреплением и глубоким обучением, различные методы обучения с подкреплением, включая кросс-энтропию, сеть DQN, а также алгоритмы: актор-критик, TRPO, PPO, DDPG, D4PG и другие практические применения дискретной оптимизации решений. к обучению агентов задачам кубика Рубика с использованием программных чат-ботов AlphaGo Zero, основанных на передовых методах майнинга искусственного интеллекта, включая методы сетевой дистилляции. Привет, мир настоящего искусственного интеллекта!
[Код предложения,491400,9788328380523,2024-09-16 18:39:08]