Машинное обучение заключается в извлечении знаний из данных.
Машинное обучение это научная область, находящаяся на пересечении статистики, искусственного интеллекта и компьютерных наук, а также известная как прогнозная аналитика или статистическое обучение.
Методы, используемые машинным обучением, условно можно разделить на подходы:
- Контролируемое обучение или обучение с учителем (supervised learning)
- Не контролируемое обучение или обучение без учителя
Исходной информацией для машинного обучения являются данные, состоящие из наборов объектов. Эти данные, например, могут быть собраны в таблицы. В такой таблице каждый объект или строка таблицы называется примером (sample) или точкой данных (data point), а столбцы называются свойствами, которые описывают эти примеры, или характеристиками или признаками (features).
На практике подготовка данных для машинного обучения может оказаться самым сложным и трудоемким этапом процесса. Подготовки данных называется выделение признаков (feature extraction) или конструирование признаков (feature engineering).