ГЛУБОКОЕ ЗАКРЕПЛЕНИЕ ОБУЧЕНИЯ
- Время доставки: 7-10 дней
- Состояние товара: новый
- Доступное количество: 5
Просматривая «ГЛУБОКОЕ ЗАКРЕПЛЕНИЕ ОБУЧЕНИЯ», вы можете быть уверены, что данный товар из каталога «E-бизнес» будет доставлен из Польши и проверен на целостность. В цене товара, указанной на сайте, учтена доставка из Польши. Внимание!!! Товары для Евросоюза, согласно законодательству стран Евросоюза, могут отличаться упаковкой или наполнением.
Глубокое обучение с подкреплением
⭐⭐⭐⭐⭐
✅ Подзаголовок: Работа с чат-ботами и робототехникой, дискретная оптимизация и автоматизация сети на практике
✅ Автор : Лапан Максим
✅ Переводчик: Януш Яцек
✅ Язык: польский
✅ Издательство: Гелион
✅ Формат: 17,0х24,5 см
✅ Страниц: 720
✅ Обложка: Мягкая
✅ Вес: 1,045
✅ Год: 2022
✅ ISBN: 9788328380523
✅ EAN: 9788328380523
✅ Код: 22036A01427KS AZ5%
Глубокое обучение с подкреплением развивается очень динамично. Эта область характеризуется неисчерпаемым потенциалом для решения сложных задач. По крайней мере, несколько исследовательских групп работают над этим, сосредоточившись на внедрении глубокого обучения с подкреплением в различных отраслях. К сожалению, описания последних разработок сложны для понимания и слишком абстрактны, чтобы их можно было легко применить в практических реализациях, однако правильная работа приложения зависит от глубокого понимания проблемы разработчиком. Это обновленное и расширенное издание популярного руководства по новейшим инструментам и методам обучения с подкреплением. Он знакомит с теорией обучения с подкреплением и объясняет практические способы написания самообучающихся агентов для решения практических задач. В это издание добавлены шесть новых глав, посвященных таким технологическим достижениям, как дискретная оптимизация, многоагентные методы, среда Microsoft TextWorld и передовые методы интеллектуального анализа данных. Также рассматриваются другие темы, в том числе сети с глубоким Q, политические градиенты, непрерывный контроль и высокомасштабируемые безградиентные методы. Отдельные проблемы проиллюстрированы кодом и описанием деталей реализации. В книгу вошли: связи между обучением с подкреплением и глубоким обучением, различные методы обучения с подкреплением, включая кросс-энтропию, сеть DQN, а также алгоритмы: актор-критик, TRPO, PPO, DDPG, D4PG и другие практические применения дискретной оптимизации решений. к задаче кубика Рубика обучение агентов с использованием программного обеспечения AlphaGo Zero чат-боты на основе искусственного интеллекта передовые методы майнинга, включая методы сетевой дистилляции Привет, мир настоящего искусственного интеллекта! Максим Лапан — независимый исследователь с многолетним профессиональным опытом в области программирования и системной архитектуры. Он досконально изучил такие вопросы, как большие данные, машинное обучение и распределенные высокопроизводительные вычислительные системы. В настоящее время он работает над приложениями глубокого обучения, включая глубокую обработку естественного языка и глубокое обучение с подкреплением.