Способы постановки эксперимента
Существует следующие виды постановки эксперимента по обучению в искусственном интеллекте:
Они очень похожи. Принципиальная схема показана на рисунке. Разницу составляют следующие нюансы:
- При обучении с учителем, система подкрепления в режиме обучения, если классифицирующая система подает неправильный выход, в память системы вводится прямое подкрепление, указывающие, что выход неверен. Требуется найти зависимость между стимулами и реакциями системы.
- При обучении без учителя, система подкрепления отсутствует. Требуется обнаружить внутренние взаимосвязи существующие между объектами только на основе сенсорных данных. Пригодно только для задач, в которых заранее описаны множества объектов (обучающей выборки), то есть память системы изначально не пуста.
- При обучении с подкреплением, система подкрепления не наблюдает за выходом системы, а подает воздействующий сигнал (помимо сенсорных данных), характеризующие приближение состояние среды к конечному (нужному для экспериментальной задачи) состоянию. Требуется найти наилучшую стратегию (траекторию) достижения из начального состояния в конечное.