GŁĘBOKIE UCZENIE PRZEZ WZMACNIANIE W.2

Код: 16505610386

Як замовити

1860 грн

Ціна вказана з доставкою в Україну

Товар є в наявності

ЯК ЕКОНОМИТИ НА ДОСТАВКЕ?

Замовляйте велику кількість товарів у цього продавця

ВСІ ТОВАРИ ПРОДАВЦЯ №61370575

Інформація

Час доставки: 7-10 днів
Стан товару: новий
Доступна кількість: 4

Опис

Просматривая «GŁĘBOKIE UCZENIE PRZEZ WZMACNIANIE W.2» данный товар из каталога «E-бизнес», вы можете получить дополнительную скидку 4%, если произведете 100% предоплату. Размер скидки вы можете увидеть сразу при оформлении заказа на сайте. Внимание!!! Скидка распространяется только при заказе через сайт.

НАВЧАННЯ ДЛЯ ГЛИБКОГО ПІДКРІПЛЕННЯ В.2

МАКСИМ ЛАПАН

Видавництво: ГЕЛІОН
Рік видання: 2022
Палітурка: БРОШУРА
Кількість сторінок: 720
EAN: 9788328380523

Глибоке навчання з підкріпленням розвивається дуже динамічно. Ця сфера характеризується невичерпним потенціалом для вирішення складних завдань. Принаймні кілька дослідницьких груп працюють над цим, зосереджуючись на впровадженні глибокого навчання з підкріпленням у різних галузях. На жаль, описи останніх розробок складні для розуміння та надто абстрактні, щоб їх було легко застосувати на практиці, і все ж правильна робота програми залежить від глибокого розуміння проблеми дизайнером. Це оновлене та розширене видання бестселера з найновіших інструментів і методів навчання закріплення. Він представляє теорію навчання з підкріпленням і пояснює практичні способи кодування самонавчальних агентів для вирішення практичних завдань. Це видання додає шість нових розділів, присвячених таким технологічним досягненням, як дискретна оптимізація, багатоагентні методи, середовище Microsoft TextWorld і передові методи видобутку. Також розглядаються інші теми, зокрема глибокі мережі Q, градієнти політики, безперервний контроль і високомасштабовані безградієнтні методи. Окремі проблеми проілюстровано кодом разом із описом деталей впровадження. Книга містить: зв'язки між навчанням з підкріпленням і глибинним навчанням, різні методи навчання з підкріпленням, включаючи крос-ентропію, мережу DQN, а також алгоритми: актор-критик, TRPO, PPO, DDPG, D4PG та інші практичні застосування дискретної оптимізації для рішень до кубика Рубіка навчання агентів за допомогою чат-ботів програмного забезпечення AlphaGo Zero на основі штучного інтелекту передових методів видобутку, включаючи методи мережевої дистиляції Привіт, світ справжнього штучного інтелекту!

[Код пропозиції,491400,9788328380523,2024-09-16 18:39:08]