Głębokie uczenie przez wzmacnianie. Praca z chatbo
- Час доставки: 7-10 днів
- Стан товару: новий
- Доступна кількість: 1
Оплачивая «Głębokie uczenie przez wzmacnianie. Praca z chatbo» данное изделие из «E-бизнес» вы можете быть уверены, что после оформления заказа, доставки в Украину, вы получите именно то, что заказывали, в оговоренные сроки и европейского качества.
Глибоке навчання з підкріпленням. Робота з чат-ботами та робототехнікою, дискретна оптимізація та мережева автоматизація на практиці.
Геліон Глівіце
Ean:9788328380523
- ISBN: 9788328380523
- Автор: Лапан Максим
- Перешивка: br
- Рік видання: 2022
- Формат: b5
- Сторінок: 720
Глибоке навчання з підкріпленнямрозвивається дуже динамічно. Ця сфера характеризується невичерпним потенціалом для вирішення складних завдань. Принаймні кілька дослідницьких груп працюють над цим, зосереджуючись на впровадженні глибокого навчання з підкріпленням у різних галузях. На жаль, описи останніх досягнень важко зрозуміти та надто абстрактні, щоб їх було легко застосувати на практиці, і все ж правильна робота програми залежить від глибокого розуміння проблеми дизайнером.
Це оновлене та розширене видання бестселера з найновіших інструментів і методів навчання закріплення. Він представляє теорію навчання з підкріпленням і пояснює практичні способи кодування самонавчальних агентів для вирішення практичних завдань. Це видання додає шість нових розділів, присвячених таким технологічним досягненням, як дискретна оптимізація, багатоагентні методи, середовище Microsoft TextWorld і передові методи видобутку. Також розглядаються інші теми, зокрема глибокі мережі Q, градієнти політики, безперервний контроль і високомасштабовані безградієнтні методи. Окремі проблеми проілюстровано кодом разом із описом деталей впровадження.
У книзі, серед іншого:
- зв'язки між навчанням із підкріпленням і глибоким навчанням
- різні методи навчання з підкріпленням, включаючи крос-ентропію, мережу DQN, а також алгоритми: актор-критик, TRPO, PPO, DDPG, D4PG та інші
- Практичне застосування дискретної оптимізації для розв’язання задачі кубика Рубіка
- навчання агентів за допомогою програмного забезпечення AlphaGo Zero
- чат-боти на основі штучного інтелекту
- передові методи дослідження, включаючи методи мережевої дистиляції
Привіт, світ справжнього штучного інтелекту!