Судхарсан Равичандиран

Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи

Сообщить о появлении
Загрузите файл EPUB или FB2 на Букмейт — и начинайте читать книгу бесплатно. Как загрузить книгу?
  • Elena Levinaцитирует2 года назад
    Когда мы говорим о «решении задач MDP», на самом деле имеется в виду задача нахождения оптимальных функций политики и ценности.
  • Дмитрий Орловцитирует3 года назад
    При неконтролируемом обучении модель изучает скрытую структуру, тогда как в RL модель учится на максимизации наград.
fb2epub
Перетащите файлы сюда, не более 5 за один раз