Elettracompany.com

Компьютерный справочник
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Data scientist новый курс от нетологии

Нетология [Нетология] Профессия — Data Scientist (2019)

Перейти к странице

DreaMeR

Автор: Нетология
Название: Профессия — Data Scientist (2019)

Курс состоит из более чем 180 часов видео и домашних заданий от ведущих специалистов по Data Scientist компаний Mail.ru, Ivi и Avito.

Первые два набора уже удачно состоялись, и студенты вовсю погрузились в базовые алгоритмы ML, feature engineering, машинное зрение, Data Scientist в e-commerce, временные ряды и прогнозирование стоимости акций и других товаров. Их преподавателями стали эксперты из Yandex Data Factory, Rambler&Co, Сбербанк Технологии и теперь у вас появится возможность получить все необходимые знания и навыки для работы в области больших данных.

I Подготовительный блок:

Экспресс-обучение основным инструментам: Python 3, git, библиотеки numpy, pandas. Обзор основного математического аппарата: матричные операции, введение в статистику и проверку гипотез.

II Введение в data science, основные инструменты:

Что такое data science, big data, как это работает и где применяется. Эксплоративный анализ и библиотеки визуализации данных. Обзор методов машинного обучения в бибилотеке scikit-learn.

III Базовые алгоритмы и понятия машинного обучения:

Разбор основных задач и алгоритмов машинного обучения: деревья решений, метод k ближайших соседей, линейный классификатор и логистическая регрессия, кластеризация. Проверка точности модели. Проблема переобучения и борьба с ней: регуляризация, ансамблирование.

IV Feature engineering:

Проблемы качества и размерности данных. Уменьшение размерности данных. Методы декомпозиции. Cпрямляющие пространства.

V Рекомендательные системы:

Введение в рекомендательные системы. Неперсонализированные рекомендации. Персонализированные рекомендации. Развитие рекомендательных систем.

VI Распознавание изображений, машинное зрение:

Базовая теория. Обзор кейсов применения. Нейросети. Разбор реальных задач: рукописный ввод, детекция и сегментация объектов на изображении.

VII Обработка естественного языка (NLP):

Введение в обработку текста. Обзор существующих библиотек, их использование и доработка. Использование внешних ресурсов. Грязные тексты: что это такое и как с ними работать. Дистрибутивная семантика. Чатботы: разбор генерации текстов. Нейросети для NLP.

VIII Анализ временных рядов, прогнозирование:

Временные ряды, модели ARMA/ARIMA. Сложные модели прогнозирования. Эксплоративный анализ временных рядов.

IX Общение с заказчиком:

Проекты машинного обучения: как выявить требования и оценить проект. Составление отчетов по исследованиям. Мастер-класс по презентации результатов.

X Data Science в маркетинге и e-commerce:

Цели, задачи, решения и критерии успешности применения Data Science. Маркетинг Data-Driven vs интуиция. Типы данных и примеры датасетов. Методы сбора из разных источников. Подготовка и обработка данных, извлечение смысла и визуализация. Разбор атрибуции маркетинговых расходов для увеличения дохода интернет-магазина.

XI Дополнительные инструменты, среды:

Экосистема Google: BigQuery, Dataflow, Dataproc, Datalab и др. Коммерческие решения HP: Vertica, Haven, IDOL, коннекторы данных. Решения от Amazon (AWS). Хранение и обработка данных в Clickhouse.

XII Дипломная работа:

Разработка и внедрение собственного ML-решения/проекта либо разработка предложенного нами кейса.

Скачать:
Для просмотра скрытого содержимого необходимо Войти или Зарегистрироваться. Если у Вас нет Премиум статуса:
Преимущества Премиум подписки
Оформить Вечный Премиум

Как стать Data Scientist — 10 лучших онлайн-курсов для начинающих

Руководители крупных и успешных компаний уделяют большое внимание сбору информации и ее анализу. Объективные данные позволяют привлекать максимум целевых клиентов, создавать более совершенные продукты, повышать качество услуг. Отсюда высокий спрос на специалистов в области Data Science. На рынке труда не хватает специалистов в этой сфере программирования и работы с нейронными сетями.

Сводная таблица по всем курсам

🥇 Курс «Профессия Data Scientist» от SkillBox

Данный курс позволяет овладеть профессией с нуля. В числе преподавателей ведущие специалисты в области разработки ПО, Deep Learning инженеры, эксперты в области нейронных сетей. Во время обучения они предлагают реальные ситуации, данные и задачи, решение которых станет важнейшим опытом работы с большим массивом данных.

Курс разбит на три уровня. На начальном этапе обучающиеся научатся работать с XLSX, CSV, XML, получат навыки применения Python и освоят различные модели машинного обучения. Далее будет предложена более узкая специализация (на выбор), после освоения которой необходимо будет написать дипломную работу для реального проекта — онлайн-кинотеатра ivi. По итогам обучения вы напишете курсовую и защитите дипломную работу. Преподаватели помогут подготовиться к собеседованиям у 3-х компаний-партнеров.

🥈 Профессия Data Scientist: анализ данных

Более узкий курс от Skillbox. Программа идеально подойдет новичкам и даже тем, кто не имеет представления о статистике и теории вероятности. Преподают курс ведущие специалисты в области IT и машинного обучения. Программа разделена на три этапа, которые позволят последовательно и подробно изучить все аспекты данной специальности.

На начальном уровне вы познакомитесь с Python, изучите библиотеки Numpy и Pandas и работу с данными различных фарматов. Далее вы перейдете в блок статистики и теории вероятности, а в завершение овладеете языком программирования R, и т. д. Подробная программа на сайте курса. Вы самостоятельно выбираете сроки выполнения домашнего задания, после сдачи которого преподаватель подробно разбирает ошибки и помогает исправить их.

Профессия Data Scientist: машинное обучение

Курс по машинному обучению от Skillbox. Преподаватели — лидеры digital-рынка, программисты, инженеры и разработчики ПО. Обучение разбито на несколько блоков, каждый из которых подробно знакомит с базами данных, математическим анализом, статистикой и основными концепциями машинного обучения. Завершающий блок направлен на практическую работу с нейронными сетями.

После просмотра видеоуроков и общения с наставником вы сможете приобрести одну из самых востребованных профессий современности. Курс поможет освоить аналитику, научит работать с матрицами и статистикой. По результатам дипломной работы вы получите специальность «специалист по машинному обучению» и подтверждающий сертификат.

Курс обучения Data Science от GeekBrains

Обучение рассчитано на 1,5 года и разбито на четыре этапа. Своими знаниями с учащимися делятся ведущие специалисты IT-сегмента, разработчики ПО, практикующие эксперты. По окончании курса вы получаете навыки программирования Python, работы с нейронными сетями и машинного обучения.

Читать еще:  Курсы по обществознанию

Кроме теории большое внимание уделяется реальным практическим проектам. В завершающей четверти специалисты компании «МагаФон» проведут практический курс по машинному обучению. Они предоставят свои массивы данных и практические кейсы из собственной практики.

Курс Data Science с нуля от SkillFactory

Программа разработана для обучения людей, не имеющих глубоких знаний в программировании и аналитике. За каждым обучающемся закрепляют личного ментора. Он помогает разобраться в возникающих вопросах, решать практические задачи, быстро включиться в процесс освоения профессии.

На курсе вы научитесь проектировать алгоритмы при помощи Python, освоите визуализацию данных при помощи Seaborne, Pandas и Matplotlib, работать с хранилищами данных, создавать промышленные модели для задач Data Science при помощи нейронных сетей и машинного обучения, обрабатывать данные с помощью методов статистики, математического анализа и теории вероятности. По окончании слушатель может добавить до 10 самостоятельных проектов в портфолио и получить сертификат, подтверждающий специализацию.

Обучение аналитике данных на Python от SkillBox

Программа специально разработана для аналитиков и руководителей компаний. Она направлена на быстрое решение задач по анализу, сбору и сортировке данных. Уникальный контент и видеоуроки по темам предоставляют ведущие эксперты крупных компаний. Курс рассчитан на четыре месяца. По завершении обучающийся защищает дипломную работу, написанную на основе данных реального заказчика.

На первом этапе происходит знакомство с языком программирования Python и основными аналитическими библиотеками. Вы научитесь проводить глубокий конкурентный анализ на основе реальных данных существующих социальных сетей и бизнес-структур, визуализировать данные при помощи библиотек Seaborn и Matplotlib, и т. д.

Курс Data Scientist от Нетологии

С обучающимися работают ведущие специалисты IT-сегмента и аналитики-разработчики. Программа включает в себя вебинары и личное общение с экспертами. Во время прохождения курса студенты создают несколько проектов, основанных на данных реальных предприятий, сайтов и компаний. Всего предусмотрено 10 блоков.

Каждый этап обучения направлен на освоение и практическое применение ключевых навыков, которые требует профессия data scientist. Вы научитесь применять машинное обучение для сбора и анализа данных, создавать эффективные ml-проекты и нейронные сети, рекомендательные системы. Сможете свободно работать с Pandas и анализировать полученную информацию в Python.

Обучение Python для работы с данными от Нетологии

Курс предусматривает удаленный вариант обучения. Теория выдается в виде вебинаров, которые записываются и сохраняются в личном кабинете учащегося. Так он сможет в любое время вернуться к нужной теме. Программа направлена на освоение и уверенное использование основного инструмента для современного аналитика — Python. Преобладающее количество вакансий с высоким вознаграждением требуют именно знаний этого языка.

Во время обучения эксперты в области разработки, анализа и IT открывают для обучающихся доступ к реальным дата-сетам. Вы научитесь работать в сырыми данными, систематизировать их для грамотного анализа, применять математические модели и автоматизировать трудоемкие процессы. Работать с библиотеками numpy, scipy, pandas, seaborn, plotly, matplotlib. Кроме сертификата о прохождении курса, вы получите карьерное консультирование и возможность трудоустройства в компаниях-партнерах.

Специалист по Data Science

программа профессиональной переподготовки

«Специалист по Data Science» — это программа по анализу данных и машинному обучению, которая охватывает все разделы современного анализа данных, в том числе глубинное обучение и его применения.

Программа начинается с самых основ — изучения программирования и базовых разделов математики — и переходит к разделам по машинному обучению, прикладной статистике и обработке данных, работе с большими данными, глубинному обучению, его применениям к изображениям, текстам и сигналам. При разработке программы мы сделали акцент на практическую работу и проектную деятельность.

По итогам программы вы получите самые актуальные знания в одной из самых востребованных областей 21 века, проекты в портфолио и диплом о профессиональной переподготовке установленного НИУ ВШЭ образца.

В декабре 2019 г. программа «Специалист по Data Science» стала сертифицированной программой нацпроекта «Цифровая экономика» и победила в номинации «Подготовка профессионалов цифровой индустрии».

академических часа, в том числе 440 часов лекций и семинаров.

Общий срок обучения — 17 месяцев.

Оплату можно разбить на 8 частей.

Для студентов, выпускников и слушателей основных и дополнительных программ НИУ ВШЭ предусмотрены скидки.

По итогам программы выдается Диплом о профессиональной переподготовке установленного НИУ ВШЭ образца.

Старт — 13 мая 2020 г.

Два раза в неделю, по средам с 19:00 по 22:00 и субботам с 15:30 по 18:30, очно

Каникулы в августе, перерыв на майские праздники.

Содержание программы

  • Введение в язык Python. Знакомство со средой программирования. Базовые операции. Интерпретация ошибок.
  • Строки и списки в Python.
  • Понятие управляющих конструкций. Условные операторы.
  • Циклы for и while.
  • Устройство функций в Python. Поиск ошибок в коде и отладка.
  • Итераторы, генераторы, генераторы списков. Рекурсия.
  • Работа с файлами. Продвинутая работа со словарями.
  • Библиотеки для хранения и работы с данными в табличном формате: pandas.
  • Сбор данных: web-scraping с BeautifulSoup.
  • Сбор данных: Selenium, работа с сервисами через API.
  • Объектно-ориентированное программирование. Классы.
  • Введение в numpy.
  • Введение в pandas.
  • Работы с пропущенными данными.
  • Визуализация для презентации данных: matplotlib. Основные виды графиков. Основные ошибки при создании визуализаций.
  • Создание интерактивных визуализаций: plotly.
  • Разведывательный анализ данных. Особенности исследования текста.
  • Асимптотический анализ.
  • Базовые структуры данных.
  • Сортировки.
  • Бинарные деревья поиска.
  • Хеш-таблицы.
  • Алгоритмы на графах.
  • Алгоритмы на строках.
  • Динамическое программирование.

Дискретная математика:

  • Множества и логика.
  • Комбинаторика и вероятность.
  • Неориентированные графы.
  • Ориентированные графы и алгоритмы на графах.

Математический анализ:

  • Функции одной переменной, пределы, производные.
  • Касательные, критические точки, поиск минимумов и максимумов.
  • Интегралы, введение в вычисление интегралов.
  • Функции нескольких переменных, градиент, производная по направлению, линии уровня, касательная плоскости, критические точки, поиск минимумов и максимумов.
  • Оптимизационные задачи, лагранжиан и его геометрический смысл, нахождение минимума или максимума с заданными ограничениями.

Линейная алгебра:

  • Системы линейных уравнений, матрицы, обратимость и невырожденность.
  • Определитель, обратная матрица.
  • Векторные пространства и подпространства, размерности, ранги матриц.
  • Линейные отображения и их матричное описание. Собственные значения и векторы, связь со спектром.
  • Билинейные и квадратичные формы. Скалярные произведения, углы и расстояния. Ортогонализация и QR-разложение. Линейные многообразия и линейные классификаторы, отступы.
  • Операторы в евклидовых пространствах. Сингулярное разложение (SVD).
Читать еще:  Мгту им баумана курсы повышения квалификации

Теория вероятностей:

  • Пространство элементарных исходов. События. Вероятность и её свойства. Условная вероятность. Формула полной вероятности. Формула Байеса.
  • Дискретные случайные величины и их распределения. Независимость случайных величин. Распределение функции от дискретной случайной величины. Математическое ожидание и дисперсия.
  • Случайные величины, имеющие плотности. Математическое ожидание случайной величины, имеющей плотность. Равномерное, экспоненциальное, нормальное распределения.
  • Функция распределения. Распределение функции от случайной величины, имеющей плотность. Многомерные случайные величины. Ковариация и корреляция.
  • Неравенства концентрации (неравенства Маркова и Чебышёва). Распределение суммы случайных величин. Закон больших чисел. Центральная предельная теорема.

Как стать Data Scientist, не потратив ни копейки

Учёба на магистра Data Science в обычном офлайновом вузе США может стоить от $30 тысяч до $120 тысяч. Даже онлайн-курсы по этой специальности могут «влететь» минимум в $9 тысяч. DEV.BY опубликовал перевод статьи «How to Learn Data Science for Free» с сайта Towards Data Science — для тех, кто не желает тратиться или просто не может себе позволить такое удовольствие, но очень хочет стать дата-сайентистом. В этой статье Ребекка Викери (10 лет в сфере) поделилась программой обучения, по которой изучала DS сама.

План состоит из трех частей (технические навыки, теория, практика) и полностью построен на бесплатных материалах. Для тех, кто всё же готов немного инвестировать в самообразование, прикреплены ссылки на курсы, которые ускорят процесс.

Технические навыки

— Советую начинать именно с них, чтобы вы сразу ориентировались на практику, а не уходили в математическую теорию. Самый популярный язык программирования в DS — Python. По опросу Kaggle, который площадка проводила внутри своего сообщества специалистов по обработке данных и машинному обучению в 2018 году, 83% респондентов используют Python ежедневно. Поэтому в первую очередь изучите его, но немного внимания нужно будет уделить кое-каким другим языкам. Например, R.

Основы Python

В сети масса бесплатных вводных курсов, но лично я считаю, что лучшие — это курсы Codecademy: в них много практических заданий, все они выполняются в браузере.

Предлагаю пройти вот этот вводный курс по Python. Здесь изложены основы синтаксиса, функции, поток управления, циклы, модули и классы.

Python и анализ данных

Далее нужно очень хорошо разобраться с тем, как Python используют в анализе данных.

  1. Для начала пройдите хотя бы бесплатную часть материалов по анализу данных на dataquest.io. Этот ресурс предлагает полноценные учебные программы по подготовке дата-аналитиков, дата-сайентистов и дата-инженеров.
  2. Очень много контента, особенно по анализу данных, находится в бесплатном доступе, но если вы захотите выучиться побыстрее и не пожалеете денег, то очень рекомендую оформить подписку на несколько месяцев. Этот курс заложит прочный фундамент для дальнейшего изучения DS. Я прошла программу для дата-сайентистов за полгода. Цены у Dataquest в диапазоне от $24,5 до $49 в месяц в зависимости от того, на какой срок покупать подписку (годовая — дешевле).

Missed our Black Friday sale? It’s back for a few more days for #CyberWeek. Now through Friday, save big when you make an investment in yourself.View plans: buff.ly/35T4IG8

Опубликовано Dataquest Вторник, 3 декабря 2019 г.

Python и машинное обучение

  1. По возможности не скупитесь на полный курс по DS на Dataquest: он даст вам крепкую базу по использованию Python в машинном обучении. В противном случае есть множество бесплатных источников. Начинайте со scikit-learn — это, пожалуй, самая популярная ML-библиотека для Python.
  2. Ещё мне повезло попасть на двухдневный воркшоп Андреаса Мюллера, одного из ключевых разработчиков scikit-learn. Материал того курса (и не только) он целиком выложил на GitHub. Здесь есть наглядная графика, конспекты и заметки, над которыми можно поработать самостоятельно, что я вам настоятельно рекомендую.
  3. Стоит ознакомиться с некоторыми туториалами из документации scikit-learn, после чего уже можно попробовать делать настоящие ML-приложения и разбираться с тем, как устроены ML-модели (но об этом позже).

SQL — обязательный навык для дата-сайентиста, так как одним из ключевых процессов моделирования данных является, прежде всего, их извлечение. В большинстве случаев вам будет нужно уметь запускать SQL-запросы к базам данных.

Вот пара бесплатных ресурсов для тех, кто решил не брать полный курс на Dataquest.

  1. Бесплатный вводный курс в SQL есть на Codecademy. Он очень удобный, кодить нужно не выходя из браузера.
  2. Тем, кто интересуется облачными базами данных и отправкой запросов в них, рекомендую заглянуть на Google Cloud BigQuery. Здесь есть пробная версия (можно потренироваться бесплатно), доступ к обширному массиву публичных датасетов и толковая документация.

Не ограничивайтесь Python: дата-сайентисту очень полезно владеть языком R, поэтому советую пройти вводный курс ещё и по нему.

Бесплатный вариант есть на Codecademy. Стоит отметить, что эта площадка тоже предлагает комплексную программу по подготовке дата-сайентистов, но только по подписке на тариф Pro. Стоит она от $15,99 до $ 31,99 в месяц — смотря на сколько месяцев вперёд платить. Лично мне курс Dataquest показался гораздо более содержательным, хотя здесь может получиться немного дешевле, если вы предпочитаете заниматься по одной платформе.

Разработка программного обеспечения

Дата-сайентисту будет нелишним освоить навыки и лучшие практики разработки софта: это улучшит читабельность вашего кода, и его будет проще дополнять — как вам самим, так и другим. Кроме того, чтобы выкатывать модели в продакшн, нужно научиться генерировать качественный, хорошо проверенный код и работать с такими инструментами, как системы контроля версий.

Читать еще:  Военная кафедра с какого курса начинается

В помощь вам — два ресурса:

  1. Python like you mean it охватывает руководство PEP 8, которое описывает общепринятый стиль оформления кода на Python, документацию, и ещё в нём очень сильная часть про объектно-ориентированное программирование.
  2. Этот гайд — о том, как вносить вклад в разработку scikit-learn. Здесь здорово разобраны лучшие подходы и принципы, которые на самом деле универсальны и применимы не только к этой библиотеке. Затрагивается GitHub, юнит-тестирование и отладка кода, причём всё рассмотрено в контексте DS.

Глубокое обучение

Самое лучшее и развёрнутое введение в глубокое обучение дают авторы fast.ai — этот ресурс тоже бесплатный, и на нём совершенно нет рекламы.

Курс включает введение в машинное обучение, практические аспекты глубокого обучения, вычислительную линейную алгебру, а также введение в обработку естественного языка с акцентом на программирование. Все курсы на этом сайте объединяет прикладной подход, поэтому очень советую не проходить мимо.

Теория

По ходу изучения технических моментов вам неизбежно будет встречаться теория, которая стоит за кодом.

Призываю вас учить теорию без отрыва от практики.

Например, я изучаю код, чтобы научиться применять какую-то технику (скажем, метод k-средних, KMeans), а когда она сработает, начинаю глубже разбираться с понятиями, которые с ней связаны (например, с инертностью, Inertia).

  1. Все сопутствующие алгоритмам математические термины есть в той же документации scikit-learn.
  2. Ниже я перечислю главное, что нужно изучить из теории вместе с прикладными аспектами. Почти по всем этим вещам есть бесплатные уроки на khan academy. Во время регистрации или в профиле можно выбрать нужные вам дисциплины, и сайт выдаст пошаговый план по каждому предмету.

Математика

Математический анализ (Calculus)

В этом разделе математики рассматривается связь между функцией и её производной, из-за которой изменение одной переменной величины приводит к изменению другой. Матанализ позволяет, например, выявлять паттерны, понимать, как функция меняется с течением времени.

В машинном обучении матанализ помогает оптимизировать производительность алгоритмов. Один из примеров — метод градиентного спуска. Он состоит в том, что при обучении по одному изменяют весовые коэффициенты нейросети для поиска минимального значения функции потерь.

Что нужно знать.

  • Геометрический смысл (Geometric definition)
  • Вычисление производной функции (Calculating the derivative of a function)
  • Нелинейные функции (Nonlinear functions)

Цепное правило (или Правило дифференцирования сложной функции, Chain rule)

  • Сложные функции (Composite functions)
  • Производные сложных функций (Composite function derivatives)
  • Множественные функции (Multiple functions)
  • Частные производные (Partial derivatives)
  • Производные по направлению (Directional derivatives)
  • Интегралы (Integrals)

Линейную алгебру (Linear Algebra)

Многие распространённые инструменты машинного обучения, в том числе XGBOOST, для хранения входных данных и обработки данных используют матрицы. Матрицы, наряду с векторными пространствами и линейными уравнениями, изучает линейная алгебра. Уверенное знание этого раздела математики очень важно для понимания механизма многих методов машинного обучения.

Что нужно знать

Векторы и пространства (Vectors and spaces)

  • Векторы (Vectors)
  • Линейные комбинации (Linear combinations)
  • Линейная зависимость и независимость (Linear dependence and independence)
  • Скалярное произведение и векторное произведение (Vector dot and cross products)

Матричные преобразования (Matrix transformations)

  • Функции и линейные преобразования (Functions and linear transformations)
  • Умножение матриц (Matrix multiplication)
  • Обратные функции (Inverse functions)
  • Транспонирование матрицы (Transpose of a matrix)

Статистика

Что нужно знать

  • Описание выборки данных (How to summarise a sample of data)
  • Типы распределений (Different types of distributions)
  • Асимметрия, эксцесс, меры центральной тенденции, например среднее арифметическое, медиана, мода (Skewness, kurtosis, central tendency, e.g. mean, median, mode)
  • Меры зависимости и взаимосвязь переменных величин, например корреляция и ковариация (Measures of dependence, and relationships between variables such as correlation and covariance)

Планирование эксперимента (Experiment design)

  • Проверка гипотез (Hypothesis testing)
  • Семплирование (Sampling)
  • Тесты на статистическую значимость (Significance tests)
  • Случайность (Randomness)
  • Вероятность (Probability)
  • Доверительные интервалы и статистический вывод по двум выборкам (Confidence intervals and two-sample inference)

Машинное обучение (Machine learning)

  • Вывод о наклоне линии регрессии (Inference about slope)
  • Линейная и нелинейная регрессия (Linear and non-linear regression)
  • Классификация (Classification)

Практика

Теперь можно приступить к третьей части программы — практическому опыту. Чтобы отточить полученные скиллы, их нужно задействовать в проектах — желательно, чтобы они были похожи на какие-то уже существующие приложения. Попутно перед вами будут возникать разные сложности, но справляясь с ними, вы очень хорошо «прощупаете» предмет и прокачаете свои знания.

Андерс Эрикссон, «Максимум. Как достичь личного совершенства с помощью современных научных открытий»: «Чтобы научиться чему-то, чего вы не умели раньше, нужно постоянно выходить из состояния равновесия и заставлять мозг и тело адаптироваться к изменяющимся условиям».

Kaggle

Конкурсы по машинному обучению — отличная возможность потренироваться создавать модели. Там есть доступ к множеству датасетов, предназначенных для решения отдельных задач. По турнирной таблице можно сравнивать свои успехи с другими участниками. А ещё по результатам вам будет видно, в каких темах у вас пробелы и что нужно подтянуть.

Помимо Kaggle, есть разные другие платформы, где можно попробовать свои силы. Например Analytics Vidhya и DrivenData.

ML-репозиторий UCI

UCI Machine Learning Repository — огромный клад публичных датасетов, которые можно использовать в домашних ML-проектах. Создайте портфолио на GitHub и размещайте проекты в нём. Оно будет не только демонстрировать ваши способности и достижения, но и в дальнейшем может помочь найти работу.

Вклад в Open Source

Участвуйте в чужих проектах. Очень многие Python-библиотеки поддерживаются опенсорс-сообществом. В рамках митапов и конференций часто проводят хакатоны, куда приглашают даже новичков. Это хорошая возможность для взаимного «обмена премудростями»: здесь можно и чему-то научиться у других, и поделиться знаниями. Один из вариантов — хакатон, спонсируемый фондом NumFOCUS.

Практические ресурсы хорошо разнообразят книги по Data Science из этого списка. Все можно найти в открытых источниках.

Ссылка на основную публикацию
ВсеИнструменты 220 Вольт
Adblock
detector