Лекция по машинному обучению и прогнозированию

Jul 26, 2024

Список ключевых моментов лекции по математической основе машинного обучения и прогнозирования

Введение в спецкурс

  • Спецкурс называется «Математическая основа машинного обучения и прогнозирования».
  • Данный курс считает первостепенным внимание к математическим аспектам машинного обучения.
  • Главное внимание уделяется:
    • Точности оценок.
    • Обобщающим способностям алгоритмов.
  • Отличие от других спецкурсов по машинному обучению:
    • Другие курсы часто рекомендуют методы (например, нейросети, случайные леса), но не дают точных оценок качества алгоритмов.

Математика в машинном обучении

  • Математика важна для оценки качества алгоритмов, используемых в машинном обучении.
  • В курсе будет рассмотрена классическая теория машинного обучения и прогнозирование.
  • По прогнозированию в других курсах информации мало, исключение - курс Вьюгина на Физтехе.

Литература и ресурсы

  • Важные книги:
    • Книга Мерфи - базовый учебник по машинному обучению в Стэнфорде.
    • Книга Бишоп.
    • Книга по обучению с подкреплением Сатана Барто.
  • Рекомендуется активно читать дополнительную литературу, так как курс охватывает лишь часть информации.

Подходы к обучению

Классификация

  • Наиболее простейший случай в классификации - когда существует два класса.
  • Алгоритм классификации сопоставляет объекты (например, изображения) с классами.
  • Примеры задач:
    • Оценка кредитоспособности клиента на основании различных признаков (возраст, зарплата и т. д.).

Обучение на основе данных

  • Процесс обучения заключается в обучении алгоритма на основе существующей обучающей выборки.
  • Цель - научиться вычислять значения функции на новых объектах.
  • Проблема переобучения - когда модель учится слишком хорошо на обучающей выборке, но плохо обобщает на новых данных.

Теоретические концепции

Гиперплоскости и линейная разделимость

  • Найти гиперплоскость для линейного разделения двух классов точек в многомерном пространстве.
  • Условие линейной разделимости:
    • Выпуклые оболочки классов не должны пересекаться.

Метод опорных векторов

  • Основан на поиске гиперплоскости, максимально удаленной от классов объектов.
  • Метод опорных векторов позволяет достичь сильного обобщения и применяется в случае линейной неразделимости классов.
  • Ядра используются для пространства большей размерности, чтобы сделать выборку линейно разделимой.

Замечания и рекомендации

  • Для успешного усвоения темы важно заниматься практикой и находить дополнительные источники информации.
  • Учащиеся могут обратиться к преподавателю для участия в проектах и командной работе.

Заключение

  • Курс будет содействовать созданию базовых знаний и умений в области машинного обучения, с акцентом на математические основы.
  • Неполное покрытие материала в курсе предполагает необходимость самостоятельного изучения дополнительных тем.