Последнее обновление: 2021-10-08 09:36:17
Существует множество моделей для машинного обучения, но они, как правило, относятся к одному из трех типов: обучение с учителем (supervised learning); обучение без учителя, или самообучение (unsupervised learning); обучение с подкреплением (reinforcement learning).
Обучение с подкреплением применяется там, где нужно соизмерить отсроченную выгоду – цель – с ситуативным принятием решения. Этот вид обучения решает сложную задачу соотнесения немедленных действий с отсроченной отдачей, которую они производят.