Удобнее в приложении:

iOS

·

Android

Судхарсан Равичандиран

Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи

Сообщить о появлении

Elena Levinaцитирует2 года назад
Когда мы говорим о «решении задач MDP», на самом деле имеется в виду задача нахождения оптимальных функций политики и ценности.
- Нравится
- Комментировать
- Поделиться
  Facebook
  Twitter
  Скопировать ссылку
- Пожаловаться
Дмитрий Орловцитирует3 года назад
При неконтролируемом обучении модель изучает скрытую структуру, тогда как в RL модель учится на максимизации наград.
- Нравится
- Комментировать
- Поделиться
  Facebook
  Twitter
  Скопировать ссылку
- Пожаловаться

fb2epub

Перетащите файлы сюда, не более 5 за один раз