Открытый курс машинного обучения тема 4
Программа «Введение в машинное обучение»
ОНЛАЙН
Машинное обучение — один из самых востребованных разделов компьютерных наук. Именно с помощью машинного обучения сейчас удаётся строить рекомендательные системы для видео, прогнозировать спрос на тысячи товаров и автоматически обрабатывать огромные потоки писем в службе поддержки.
Основные темы курса:
- Обучение с учителем — линейные модели, решающие деревья, композиции моделей на основе бэггинга и бустинга
- Обучение без учителя — кластеризация и визуализация многомерных данных
- Подготовка данных — отбор признаков, обработка категориальных и текстовых признаков
По итогам курса вы будете понимать основные постановки задач в машинном обучении, изучите основные виды моделей, будете уметь пройти путь от обработки сырых данных до построения и валидации модели.
Все темы сопровождаются практическими домашними заданиями на реальных данных.
Мы ожидаем, что слушатели владеют языком Python, который является де-факто стандартным инструментом для анализа данных: знают про условные операторы, циклы, функции, разбираются в числовых и строковых типах данных, умеют работать со списками и словарями, знают встроенные функции языка.
академических часов, включая 40 часов онлайн-работы с преподавателем.
рублей.
Оплату можно разбить на две части.
Для студентов, выпускников и слушателей основных и дополнительных программ НИУ ВШЭ предусмотрены скидки.
Начальные требования
Законченное высшее или среднее профессиональное образование. Слушателями также могут стать студенты, получающие высшее образование.
Документы для зачисления
- паспорта (3-4 страница, а также страница с адресом регистрации);
- диплома о высшем или среднем профессиональном образовании (первые две страницы);
- актуальной справки из вуза (если вы являетесь студентом);
- свидетельства о смене фамилии (если в паспорте и дипломе фамилия не совпадает).
Расписание занятий
Общий период обучения: 16 мая — 22 июля 2020 г.
Один раз в неделю, онлайн
16 мая — 4 июля 2020 г. по субботам с 15:30 до 18:30.
8 июля — 22 июля 2020 г. по средам с 19:00 до 22:00.
Для прохождения курса вам понадобятся основы программирования на Python и знание базовых разделов высшей математики.
Преподаватели
Елена Кантонистова
Кандидат физико-математических наук, ведущий Data Scientist в консалтинговой компании UCG. Приглашенный преподаватель факультета компьютерных наук НИУ ВШЭ.
Окончила механико-математический факультет МГУ им. М.В. Ломоносова и Школу анализа данных Яндекса, направление «Компьютерные науки».
Как устроено обучение
Занятия проходят раз в неделю. Каждое занятие состоит из лекции и семинара. На лекции преподаватель объясняет, как работают методы машинного обучения, какие математика и алгоритмы за ними стоят. На семинаре слушатели работают с данными и решают реальные задачи с помощью Python и его библиотек. После каждого занятия выдаётся домашнее задание, которое поможет закрепить навыки.
16 бесплатных онлайн-курсов по машинному обучению
Популярная тенденция в сфере онлайн-образования — массовые открытые онлайн-курсы (Massive open online-courses, MOOC). Появились бесплатные курсы по машинному обучению и data science. Они доступны каждому и основаны на образовательных программах от ведущих университетов, например, МФТИ.
Большинство MOOC по машинному обучению доступны на английском языке и представлены на известных платформах онлайн-образования, таких как Coursera, Udacity, World Education University и edX.
Отдельно стоит отметить, что курсы Coursera доступны бесплатно только для прослушивания лекций. Для того, чтобы выполнять задания или получить сертификат по окончании курса, нужно оформить подписку или оплатить курс.
Видео-материалы и лекции курса можно получить бесплатно, для этого на странице курса внизу нужно нажать кнопку «прослушать курс», как показано на картинке:
Как бесплатно прослушать курсы по машинному обучению
В этой статье собраны бесплатные курсы по машинному обучению и Data Science на русском языке или с русскими субтитрами.
Введение в машинное обучение
Авторы: ВШЭ и Яндекс
Платформа: Coursera
Язык: русский
На курсе Константина Воронцова Введение в машинное обучение рассматриваются популярные задачи, решаемые с помощью машинного обучения — классификация, регрессия, кластеризация. Слушателю нужно знать об основных понятиях математики: функциях, производных, векторах, матрицах, желательно иметь базовые навыки программирования и быть знакомым с python.
Продолжительность: 35 часов
Машинное обучение и анализ данных
Авторы: МФТИ и Яндекс
Платформа: Coursera
Язык: русский
Специализация Машинное обучение и анализ данных включает 6 курсов. Осваиваются основные инструменты, необходимые в работе с большим массивом данных: современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, фундаментальная математика, основы программирования на python.
Продолжительность: 8 месяцев (7 часов в неделю)
Python для анализа данных
Авторы: МФТИ, ФРОО, Mail.ru Group
Платформа: Coursera
Язык: русский
Курс Python для анализа данных ориентирован на решение практических задач. Студенты будут применять свои навыки программирования для построения предиктивных моделей, визуализации данных и работы с нейросетями.
Продолжительность: 25 часов
Введение в науку о данных
Автор: СПбГУ
Платформа: Coursera
Язык: русский
Курс Введение в науку о данных рассматривает постановку и решение типичных задач, с которыми может столкнуться в своей работе data scientist, подходы к сбору, анализу, обработке и визуализации массивов данных.
Продолжительность: 17 часов
Глубокое обучение в творчестве с TensorFlow
Автор: Google Magenta
Платформа: Kadenze
Язык: английский, русские субтитры
MOOC Использование глубокого обучения в творчестве с помощью TensorFlow расскажет о том, как строить алгоритмы глубокого обучения на основе сверточных, рекуррентных, генеративных нейросетей и применять их для создания творческих приложений.
Продолжительность: 60 часов
Data Science
Автор: Johns Hopkins University
Платформа: Courserа
Язык: английский, русские субтитры
В специализацию Data Science университета John Hopkins входят 10 курсов, включая сбор и сортировку данных, программирование на языке R, регрессионные модели, разработку продуктов для обработки данных и другие.
Продолжительность: 8 месяцев (5 часов в неделю)
Data science для руководителей
Автор: Johns Hopkins University
Платформа: Courserа
Язык: английский, русские субтитры
Data Science для руководителей — это ускоренная обучающая программа — 5 курсов, которые дают базовое понимание о том, что такое data science и как работать с проектами в этой сфере, собирать и развивать команду и даже лидерские качества.
Продолжительность: 40 часов
Нейронные сети
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
Бесплатный курс Нейронные сети дает основы теории нейронных сетей и практики применения. Детальный разбор процесса создания и применения нейронных сетей. Алгоритмы, лежащие в основе нейросетей и множество практических задач.
Продолжительность: 33 часа
Программирование на Python
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
На курсе Программирование на Python представлены базовые понятия программирования на python и большое количество практических задач. Решения будут проверяться автоматической системой.
Продолжительность: 22 часа
Алгоритмы: теория и практика. Методы
Автор: Computer Science Center
Платформа: Stepic
Язык: русский
Рассматриваются теоретические основы создания алгоритмов и особенности реализации на языках C++, Java и Python.
Продолжительность: 35 часов
Основы программирования на R
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
На курсе Основы программирования на R изучаются основные типы данных и семантические правила, анализ и обработка данных.
Продолжительность: 19 часов
Анализ данных в R
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
На курсе рассматриваются этапы статистического анализа на R — предварительная обработка данных, применение статистических методов анализа и визуализация данных.
Продолжительность: 21 час
Базы данных
Автор: СПбГУ
Платформа: Coursera
Язык: русский
В основе курса Базы данных изучение и применение языка SQL для создания, модификации объектов и управления данными в реляционных базах данных. Рассматриваются сферы применения NoSQL баз данных и современные подходы к обработке big data.
Продолжительность: 20 часов
От Excel до MySQL: способы анализа бизнес-данных
Автор: Duke University
Платформа: Coursera
Язык: английский, русские субтитры
В специализацию входят 5 курсов, которые демонстрируют, как использовать Excel, Tableau и MySQL для анализа данных, прогнозирования, создания моделей и визуализации данных для решения задач и улучшения бизнес-процессов.
Продолжительность: 8 месяцев (5 часов в неделю)
Линейная регрессия
Автор: СПбГУ
Платформа: Coursera
Язык: русский
В курсе Линейная регрессия разбираются основные методы описания взаимосвязей между количественными признаками, регрессионный анализ и построение моделей. Специальное место отводится операциям с матрицами. Курс ориентирован на людей, которые уже знакомы с базовыми понятиями анализа данных.
Продолжительность: 22 часа
Анализ данных
Автор: НГУ
Платформа: Coursera
Язык: русский
В специализацию Анализ данных Новосибирского государственного Университета входят 4 курса. Курсы содержат материалы по основам теории вероятностей и математической статистики, исследованию связей между признаками, построению прогнозов на основе регрессионных моделей, кластерному и статистическому анализу. Курсы разработаны совместно с 2GIS.
Продолжительность: 4 месяца (3 часа в неделю)
Основы машинного обучения
- 11 недель
от 5 до 8 часов в неделю
понадобится для освоения
4 зачётных единицы
для зачета в своем вузе
Курс посвящён основам анализа данных и машинного обучения. По результатам слушатели освоят способы предобработки и визуализации данных, изучат основные методы машинного обучения (линейные, метрические, решающие деревья и их композиции), научатся оценивать качество моделей. Курс пригодится всем, кто хочет «с нуля» погрузиться в область машинного обучения, получить первые практические навыки и начать применять их для решения собственных задач по извлечению пользы из данных.
О курсе
Курс посвящён основам анализа данных и машинного обучения. По результатам слушатели освоят способы предобработки и визуализации данных, изучат основные методы машинного обучения (линейные, метрические, решающие деревья и их композиции), научатся оценивать качество моделей. Практика проходит на языке Python и основана на библиотеках pandas, matplotlib, scikit-learn. Для успешного прохождения курса требуются знания математики на уровне школьных курсов, а также навыки программирования на Python. Контроль на курсе представлен в виде заданий на программирования, заданий на построение выводов (проверяются с помощью взаимного оценивания), а также тестов на знание теоретического материала.
Формат
Курс состоит из 11 недель, каждая включает в себя несколько коротких видеолекций (суммарная продолжительность — от 60 до 90 минут), тест на знание теоретического материала (5-15 вопросов), а также тест, включающий в себя выполнение задания по программированию. На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестов.
Информационные ресурсы
Python, библиотеки numpy, pandas, matplotlib, seaborn, scikit-learn
Требования
Освоение школьного курса математики, навыки программирования на Python
Программа курса
- Основные понятия и задачи в машинном обучении
- Метод k ближайших соседей
- Линейная регрессия
- Градиентный спуск
- Линейная классификация
- Логистическая регрессия и метод опорных векторов
- Решающие деревья
- Бэггинг и случайный лес
- Градиентный бустинг
- Обучение без учителя
- Рекомендательные системы
Поделиться
- 11 недель
от 5 до 8 часов в неделю
понадобится для освоения
4 зачётных единицы
для зачета в своем вузе
Соколов Евгений Андреевич
Должность: Старший преподаватель факультета компьютерных наук, Департамент больших данных и информационного поиска
Зимовнов Андрей Вадимович
Должность: Старший преподаватель факультета компьютерных наук, Департамент больших данных и информационного поиска
Ковалев Евгений Игоревич
Должность: Приглашенный преподаватель факультета компьютерных наук
Кохтев Вадим Михайлович
Должность: Приглашенный преподаватель факультета компьютерных наук
Рысьмятова Анастасия Александровна
Должность: Приглашенный преподаватель факультета компьютерных наук
Филатов Артём Андреевич
Должность: Приглашенный преподаватель факультета компьютерных наук