ГЛУБОКОЕ ЗАКРЕПЛЕНИЕ ОБУЧЕНИЯ V.2 МАКСИМ ЛАПАН
Код: 14745416254
2021 грн
Цена указана с доставкой в Украину
Товар есть в наличии
КАК ЭКОНОМИТЬ НА ДОСТАВКЕ?
Заказывайте большое количество товаров у этого продавца
Информация
- Время доставки: 7-10 дней
- Состояние товара: новый
- Доступное количество: 6
Приобретая «ГЛУБОКОЕ ЗАКРЕПЛЕНИЕ ОБУЧЕНИЯ V.2 МАКСИМ ЛАПАН» данный товар из каталога «E-бизнес» вы можете быть уверены, что после оформления заказа, доставки в Украину, вы получите именно то, что заказывали, в оговоренные сроки и европейского качества.
Глубокое обучение с подкреплением, версия 2
Максим Лапан
<ул>
<ли>
Издательство: Гелион
<ли>
Год выпуска: 2022.
<ли>
Переплет: буклет
<ли>
Формат: 237х168 мм.
<ли>
Количество страниц: 720
<р>
<б>
Глубокое обучение
б>
<б>
за счет подкрепления оно развивается очень динамично. Эта область характеризуется неисчерпаемым потенциалом для решения сложных задач. По крайней мере, несколько исследовательских групп работают над этим, сосредоточившись на внедрении глубокого обучения с подкреплением в различных отраслях. К сожалению, описания последних разработок сложны для понимания и слишком абстрактны, чтобы их можно было легко применить в практических реализациях, однако правильная работа приложения зависит от глубокого понимания проблемы разработчиком.
б>
<р>
Это обновленное и расширенное издание популярного руководства по новейшим инструментам и методам обучения с подкреплением. Он знакомит с теорией обучения с подкреплением и объясняет практические способы написания самообучающихся агентов для решения практических задач. В это издание добавлено шесть новых глав, посвященных таким технологическим достижениям, как дискретная оптимизация, многоагентные методы, среда Microsoft TextWorld и передовые методы интеллектуального анализа данных. Также рассматриваются другие темы, в том числе сети с глубоким Q, политические градиенты, непрерывный контроль и высокомасштабируемые безградиентные методы. Отдельные проблемы проиллюстрированы кодом и описанием деталей реализации.
<р>
В книгу входят, среди прочего:
<ул>
<ли>
связь между обучением с подкреплением и глубоким обучением
<ли>
различные методы обучения с подкреплением, включая кросс-энтропию, сеть DQN, а также алгоритмы: актер-критик, TRPO, PPO, DDPG, D4PG и другие.
<ли>
практическое применение дискретной оптимизации для решения задачи кубика Рубика
<ли>
обучение агентов с использованием программного обеспечения AlphaGo Zero
<ли>
чат-боты на основе искусственного интеллекта
<ли>
передовые методы разведки, включая методы сетевой дистилляции
<р>
Привет, мир настоящего искусственного интеллекта!
[Stamp,9788328380523,18.06.2024 12:10:45]