Głębokie uczenie przez wzmacnianie. Praca z chatbo
- Время доставки: 7-10 дней
- Состояние товара: новый
- Доступное количество: 1
Оплачивая «Głębokie uczenie przez wzmacnianie. Praca z chatbo» данное изделие из «E-бизнес» вы можете быть уверены, что после оформления заказа, доставки в Украину, вы получите именно то, что заказывали, в оговоренные сроки и европейского качества.
Глубокое обучение с подкреплением. Работа с чат-ботами и робототехникой, дискретная оптимизация и автоматизация сетей на практике.
Гелион Гливице
Еан: 9788328380523
- ISBN: 9788328380523
- Автор: Лапан Максим
- Привязка: br
- Год публикации: 2022
- Формат: b5
- Страницы:< / б>720
Глубокое обучение с подкреплением развивается очень динамично. Эта область характеризуется неисчерпаемым потенциалом для решения сложных задач. По крайней мере, несколько исследовательских групп работают над этим, сосредоточившись на внедрении глубокого обучения с подкреплением в различных отраслях. К сожалению, описания последних достижений сложны для понимания и слишком абстрактны, чтобы их можно было легко применить в практических реализациях, однако правильная работа приложения зависит от глубокого понимания проблемы разработчиком.
Это обновленное и расширенное издание популярного руководства по новейшим инструментам и методам обучения с подкреплением. Он знакомит с теорией обучения с подкреплением и объясняет практические способы написания самообучающихся агентов для решения практических задач. В это издание добавлены шесть новых глав, посвященных таким технологическим достижениям, как дискретная оптимизация, многоагентные методы, среда Microsoft TextWorld и передовые методы интеллектуального анализа данных. Также рассматриваются другие темы, в том числе сети с глубоким Q, политические градиенты, непрерывный контроль и высокомасштабируемые безградиентные методы. Отдельные проблемы проиллюстрированы кодом и описанием деталей реализации.
В книге, среди прочего:
- взаимосвязь между обучением с подкреплением и глубоким обучением
- различные методы обучения с подкреплением, включая кросс-энтропию, сеть DQN, а также алгоритмы: актер-критик, TRPO, PPO, DDPG, D4PG и другие.
- Практическое применение дискретной оптимизации для решения задачи кубика Рубика
- обучение агентов с использованием программного обеспечения AlphaGo Zero
- чат-боты на основе искусственного интеллекта.
- передовые методы исследования, включая методы сетевой дистилляции.
Здравствуй, мир настоящего искусственного интеллекта!