GŁĘBOKIE UCZENIE PRZEZ WZMACNIANIE W.2


Код: 12384936292
1852 грн
Ціна вказана з доставкою в Україну
Товар є в наявності
ЯК ЕКОНОМИТИ НА ДОСТАВКЕ?
Замовляйте велику кількість товарів у цього продавця
Інформація
  • Час доставки: 7-10 днів
  • Стан товару: новий
  • Доступна кількість: 8

Оплачивая «GŁĘBOKIE UCZENIE PRZEZ WZMACNIANIE W.2», вы можете быть уверены, что данный товар из каталога «E-бизнес» будет доставлен из Польши и проверен на целостность. В цене товара, указанной на сайте, учтена доставка из Польши. Внимание!!! Товары для Евросоюза, согласно законодательству стран Евросоюза, могут отличаться упаковкой или наполнением.

Глибоке навчання з підкріпленням, версія 2

Максим Лапан

  • Видавництво: Геліон
  • Рік випуску: 2022
  • Палітурка: буклет
  • Формат: 237х168 мм
  • Кількість сторінок: 720

Глибоке навчання через підкріплення розвивається дуже динамічно. Ця сфера характеризується невичерпним потенціалом для вирішення складних завдань. Принаймні кілька дослідницьких груп працюють над цим, зосереджуючись на впровадженні глибокого навчання з підкріпленням у різних галузях. На жаль, описи останніх розробок складні для розуміння та надто абстрактні, щоб їх було легко застосувати на практиці, і все ж правильна робота програми залежить від глибокого розуміння проблеми дизайнером.

Це оновлене та розширене видання бестселера з найновіших інструментів і методів навчання закріплення. Він представляє теорію навчання з підкріпленням і пояснює практичні способи кодування самонавчальних агентів для вирішення практичних завдань. Це видання додає шість нових розділів, присвячених таким технологічним досягненням, як дискретна оптимізація, багатоагентні методи, середовище Microsoft TextWorld і передові методи видобутку. Також розглядаються інші теми, зокрема глибокі мережі Q, градієнти політики, безперервний контроль і високомасштабовані безградієнтні методи. Окремі проблеми проілюстровано кодом разом із описом деталей впровадження.

Книга містить, серед іншого:

  • зв'язки між навчанням з підкріпленням і глибоким навчанням
  • різні методи навчання з підкріпленням, включаючи крос-ентропію, мережу DQN, а також алгоритми: актор-критик, TRPO, PPO, DDPG, D4PG та інші
  • практичне застосування дискретної оптимізації для розв’язування задачі кубика Рубіка
  • навчання агентів за допомогою програмного забезпечення AlphaGo Zero
  • чат-боти на основі штучного інтелекту
  • передові методи розвідки, включаючи методи мережевої дистиляції

Привіт, світ справжнього штучного інтелекту!

[Марка,9788328380523,6/18/2024 00:08:08]