Чему вы научитесь:
О курсе:
- Изучите классические и современные алгоритмы машинного обучения
- Повторите или освоите математические подходы, необходимые для анализа данных
После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.
Организация курса
Знакомство с машинным обучением
- О курсе
- Инструменты
- Kaggle
- Глоссарий
Линейные модели регрессии
- Введение
- Основные понятия машинного обучения
- Типы задач в машинном обучении
- Схема проекта по машинному обучению
- Оценка обобщающей способности модели
- Домашнее задание
- Разведочный анализ данных
Градиентный спуск
- Основы линейной регрессии
- Регуляризация
- Практические особенности линейной регрессии
- Feature engineering
- Метрики качества регрессии
Линейные модели классификации - 1
- Градиентный спуск для функции одной переменной
- Градиентный спуск в общем случае
- Стохастический градиентный спуск
Обработка признаков
- Переход от регрессии к классификации
- Задача оценивания вероятностей, логистическая регрессия
- Базовые метрики классификации
Линейные модели классификации - 2
- Работа с пропущенными значениями
- Нормализация данных
- Кодирование категориальных признаков
Многоклассовая классификация
- Метод опорных векторов
- Ядровой метод опорных векторов
- Продвинутые (интегральные) метрики классификации
Решающие деревья и их композиции
- Многоклассовая и multilabel-классификация
- Метод ближайших соседей
- Быстрый поиск соседей
- Домашнее задание
Композиции решающих деревьев
- Решающее дерево. Введение
- Обучение решающих деревьев
- Тонкости решающих деревьев
- Домашнее задание
Модификация бустинга и ускорение обучения
- Разложение ошибки на смещение и разброс
- Бэггинг. Случайный лес
- Бустинг. Градиентный бустинг над решающими
деревьями- Домашнее задание
Пайплайн ML-модели
- XGBoost
- CatBoost
- LightGBM
- Optuna
- Домашнее задание
Снижение размерности данных
- Постановка задачи и разведочный анализ данных
- Построение базового решения и его первые улучшения
- Дальнейшие улучшения решения
- Получение предсказания и интерпретация результатов
- Соревнование
Кластеризация данных
- Методы отбора признаков
- Метод главных компонент
- Другие способы снижения размерности
- Методы визуализации данных
- Домашнее задание
- K-means
- Иерархическая кластеризация
- DBSCAN, HDBSCAN
- Метрики качества кластеризации
- Графовая кластеризация
- Домашнее задание
Внимание: курс постоянно обновляется, поэтому смотрите актуальное содержание под спойлером.
Продажник:
Скрытый текст. Доступен только зарегистрированным пользователям.Нажмите, чтобы раскрыть...
Новые складчины | страница 24
Категории
Страница 24 из 34

![[IMG]](https://i122.fastpic.org/big/2023/0715/57/64c7255fe4786fb23c8a5b4fea80db57.jpg?md5=zvEK_17t2UPcpaoTKVhyzA&expires=1689393600)
![[IMG]](proxy14p.php?image=https%3A%2F%2Fi.ibb.co%2FM772yyH%2Fscreenshot.png&hash=9f2fcf76c78cf5fd72c2893f8eb38f5e&v=4)
![[IMG]](proxy14p.php?image=https%3A%2F%2Fi.ibb.co%2FRcJ4m7q%2Fscreenshot.png&hash=151eef3ff8424f65f9a8c4bebdb79b75&v=4)
![[IMG]](proxy14p.php?image=https%3A%2F%2Fi.ibb.co%2F48WYdhG%2Fscreenshot.png&hash=efcba8b9ad8dbc6e069d0150f13cba86&v=4)