Школа анализа данных билайн

Обновлено: 04.07.2024

В подборку Rusbase вошли самые известные курсы для руководителей таких проектов и их разработчиков — начиная с бесплатных для новичков и заканчивая углубленными программами с акцентом на проекты конкретных отраслей.

Для менеджеров и руководителей:

1. A crash course in Data Science на Coursera

Слушатели изучат основные термины и инструменты, которые используют дата-аналитики, и способы оценки успешности data science-проектов. Для этого у них будут видеолекции и материалы для самостоятельного изучения. Курс идет на английском, но есть субтитры на русском языке.

Продолжительность: 1 неделя, 4-6 часов.

Даты: курс стартовал 20 августа, но на него еще можно записаться.

Стоимость: первый курс — бесплатно. Для обучения на следующем курсе придется заплатить 2468 рублей за месяц. Этого хватит на все оставшиеся четыре курса — каждый из них длится неделю.

2. Курс Business Analytics в Udacity

Для кого этот курс: для новичков. Здесь они смогут получить навыки анализа больших данных и изучить инструменты, которые помогут в любой области: будь то инженерное дело, продажи, маркетинг или что-то еще. В рамках программы они изучат Excel, SQL и Tableau, и научатся анализировать данные для того, чтобы принимать лучшие стратегические решения.

Программа является подготовительной для двух других курсов Udacity — Data Analyst и Business Analyst Nanodegree programs. Студентам доступны видеолекции, текстовые инструкции и консультации менторов. Обучение ведется на английском.

Продолжительность: 3 месяца, 10 часов в неделю. После окончания программы студентам дается еще около 4 недель (130 часов) на завершение всех проектов.

Даты: запись открывается 21 августа.

Стоимость: 599 долларов (около 40 тысяч рублей).

Для кого этот курс: для тех, кто хочет научиться применять инструменты Big Data в зависимости от индустрии и конкретной бизнес-задачи. Среди основных тем: как повысить продажи, управлять лояльностью, рисками, предсказывать эффективность кандидата для HR-менеджеров, делать банковский скоринг и т. д.

Продолжительность: 5 недель, 10 занятий.

Даты: 28 августа.

Стоимость: 100 тысяч рублей.

Для кого этот курс: для коммерческих директоров, директоров по маркетингу, а также руководителей и владельцев бизнеса. В рамках курса они должны научиться исследовать рынок и выявлять тренды, прогнозировать продажи, проводить сегментацию клиентов, а также набирать команду для проектов с использованием больших данных и ставить задачи для разработчиков.

Для дипломной работы потребуется спроектировать аналитическую структуру для своей компании или отдельного продукта/проекта, а также настроить дашборды в BI Tableau Software по ключевым метрикам. После окончания программы обещают помощь в трудоустройстве.

Продолжительность: 8 недель. Занятия проходят офлайн в кампусе Нетологии дважды в неделю по три часа. Видеозапись и материалы после каждого занятия добавляются в личный кабинет участника.

image

Если бы вы задали этот вопрос два года назад, я бы ответил – большим компаниям. У малого бизнеса нет инфраструктуры и технических мощностей. Но сейчас положение дел кардинально поменялось. Проблема уже не в железках, анализ данных можно без особых трудностей делать и на ноутбуке. Такую работу способна выполнять компания любого размера, если у нее есть готовность использовать данные на пользу своего бизнеса. Как раз недавно, на одной из конференций я познакомился с владельцем сети шаверм. Бизнесмену очень важно понимать, где открывать новые ларьки, где есть большая потребность стимулировать потенциального потребителя совершить покупку в момент, когда тот находится в непосредственной близости от точки продаж. Это относительно небольшой бизнес, но его владелец уже думает о том, как ему может пригодиться Big Data.

Существует мнение, что Big Data это не вполне маркетинг и не вполне IT, понятие гораздо шире. Вы с этим согласны?

Хорошо, пусть руководство большой компании осознало потребность в использовании Big Data для эффективной работы бизнеса, но не имеет опыта запуска такого высокотехнологичного подразделения. С чего начать? Как оценить объем инвестиций и КПД?

Как и в любом бизнесе, все начинается с идеи. Прежде всего необходимо понять, как именно данные могут развить бизнес и помочь решить проблемы. Хотя бы приблизительно. В моем представлении аналитика данных сейчас – это намерение компании, воплощенное в жизнь через использование доступных данных и полученных с помощью машинной обработки выводов из них для разных целей, будь то маркетинг или логистика. Необязательно данные должны быть большими в привычном понимании, маленький бизнес может не иметь массивных данных, но уже сейчас он должен задумываться, как их можно применить на практике. С моей точки зрения, это тоже Big Data, потому что любой бизнес любого размера задумывается над тем, как монетизировать те знания, что он имеет.

Необходимо привлечь экспертов в области аналитики. Это сложный вопрос. Можно воспользоваться аналитической экспертизой Data Scientist, но этих специалистов крайне мало. И Data Scientist может построить математическую модель, но не всегда способен ответить, как полученную аналитику экстраполировать на специфику бизнеса.

Экспертиза в области бизнес-применения аналитики данных только начала развиваться и многим компаниям ее не хватает. Отчасти поэтому мы и запустили курс менеджмента Data-MBA: чтобы дать возможность владельцам бизнеса разной величины и топ-менеджерам понимание, как данные могут им помочь повысить выручку, как делать продукты более таргетированными, а сервис более качественным.

Допустим, компания может позволить себе инвестиции в Big Data. Как ей понять, какие сотрудники должны развивать это направление. Какие навыки, знания и опыт должны быть у специалистов?

Как правило, используются две компетенции. Первая – построение математических моделей и анализ данных (Data Science). Вторая – принятие решений, что именно необходимо исследовать и анализировать. Никто лучше сотрудников специфику бизнеса не знает, и как монетизировать данные, полученные в результате анализа, понимают именно они. В том числе и маркетологи.

Все гораздо сложнее с Data Scientist. Развею известный миф, что таким специалистом может стать только очень умный математик. На мой взгляд, машинное обучение – скорее ремесло, чем наука. В том смысле, что в работе с большими данными используются давно известные и понятные алгоритмы. Существует большое количество алгоритмических библиотек в открытом доступе. Задача – понять, в какой ситуации какой алгоритм использовать, и что будет значить его результат на выходе. Проще говоря, это набор инструментов в машинном обучении, которые нужно знать, а это достигается только практикой и опытом.

Кто поставляет таких специалистов?

Считается, что разобраться в Big Data без глубокого знания математики невозможно, да и учиться тяжело. Нужно ли знать хорошо высшую математику, чтобы управлять процессами, связанными с обработкой больших данных?

Если говорить о программе для маркетологов и менеджеров, то нет. Мы как раз построили курс таким образом, чтобы знание математики не было обязательным условием для обучения. Прежде всего необходимы интерес и опыт работы с аналитикой. Маркетологи в силу специфики своей профессии привыкли смотреть и читать графики, работать в Excel, считать кейсы и так далее. Скорее важно умение работать с цифрами. Людям без этих навыков, конечно, будет сложно.
Совсем другое дело – аналитический курс, который мы запустили в октябре прошлого года. Для него важно базовое знание математики, преимущественно линейной алгебры, и необходимо понимать принципы статистики. Обязательным требованием является Python, поскольку именно этот язык программирования мы используем как базовый на курсе. Но каких-то более высоких требований к абитуриентам мы пока не предъявляем.

Какие специалисты получатся на выходе после обучения в вашей школе?

Есть ли у Data Scientist деление на специализации?

Обычно они делятся на тех, кто фокусируется на машинном обучении в целом, и тех, кого больше занимают специфичные области: анализ социальных сетей, рекомендательные системы, обработка текстов, анализ изображений и видео. Но на практике сейчас все занимаются всем.

Возможна ли работа с большими данными на аутсорсе?

От кого чаще приходят идеи продуктов – от специалистов Data Science или маркетологов?

Специалист Data Science способен самостоятельно предлагать идеи продуктов и сервисов, но на практике это происходит не так часто. Маркетинг больше и глубже погружен в знание о клиенте, его потребностях и образе жизни, поэтому чаще создает запрос на анализ, который мы, исследователи, должны произвести и подтвердить или опровергнуть маркетинговую гипотезу. Но это не значит, что в результате обработки данных аналитик не способен выявить какие-то интересные потребительские особенности или неочевидные закономерности. Просто на практике это происходит реже.

Какие рекламные тренды вы видите в Big Data?

Скажу больше, это решение уже сегодня серьезно прорабатывается в индустрии, просто пока оно не вышло на массовый рынок. Скоро ТВ-реклама станет такой же таргетированной, как реклама в интернете.

Закончите фразу: еще десять лет назад нельзя было представить, что Big Data даст рекламе…

Возможность создавать персональные предложения на уровне каждого человека. Если раньше потребителей делили на несколько групп по разным признакам, таким как возраст, пол, география проживания и прочее, то сейчас мы можем персонифицироваться до каждого потребителя.

Big Data и анализ данных – одно из наиболее перспективных карьерных направлений современности и точно – одна из профессий будущего. Такие специалисты востребованы на отечественном, международном рынке, а также имеют хорошие зарплаты даже на начальном этапе карьеры. Если вы видите себя в этой профессии, готовы посвятить себя этой интересной, но непростой работе, вам точно пригодится наша подборка топ курсов в 2021 году.

✅ ТОП-5 Лучших курсов по Анализу данных в 2021 году

1. Аналитик данных с нуля до middle | Нетология ( сайт школы )

Коротко о главном:

  • Длительность: год;
  • Формат: видеолекции, воркшопы, вебинары, тестирование;
  • Документ об окончании: документ о профессиональной подготовке.

Программа

  1. Введение, погружение. Развитие аналитического мышления, базовые знания по визуализации данных, основные метрики, точки роста, гипотезы.
  2. Работа с данными. SQL, получение данных, работа с Big Data.
  3. Автоматизация. Языки R, Python, A/B-тестирование, SeaBorn.
  4. Soft Skills. Ведение переговоров, эмоциональный интеллект, выступления на публике.

Чему научитесь

  • Использовать в работе SQL, сможете писать запросы, работать с массивами данных без переноса в таблицу, научитесь использовать в работе разные форматы файлов.
  • Программировать для получения данных из внешних источников, грамотно работать с массивами, искать в цифрах закономерности.
  • Внедрять data-driven подход.
  • Эффективно работать с Big Data, используя актуальные инструменты анализа.
  • Делать понятные, ёмкие графики, диаграммы, другие типы интерактивной визуализации.

Преимущества :

Отзывы 💖

Полная информация 👈

⭐ Больше курсов от Нетологии:

BIG DATA с нуля

2-месячный курс, который поможет получить базовые знания в работе с большими данными и научит их грамотно анализировать, рассчитан на начинающих специалистов без опыта. Студенты узнают, как сформировать команду для Big Data проекта, и как ею грамотно управлять, используя CRISP-DM подход, научатся выстраивать стратегию работы с большими данными, улучшать результаты своей работы.

Преимущества:

  1. Поддержка лекторов, личных наставников.
  2. Практические домашние задания, актуальные материалы.
  3. Документ о повышении квалификации.

Дата-инженер с нуля до middle

Основательный курс на 15 месяцев обучения, который позволит с нуля освоить профессию дата-инженера, получить диплом о профессиональной переподготовке.

Выпускники смогут эффективно автоматизировать работу с большими данными, правильно создавать конвейеры обработки, схемы для хранения данных, настраивать мониторинги. Полученные знания позволят претендовать на вакансии уровня middle, работать инженером данных, MLOps или ETL-экспертом.

Преимущества:

  1. Фундаментальный курс.
  2. Платформа выдает диплом установленного образца.
  3. 10 кейсов в портфолио.

Аналитика и аналитическое мышление для начинающих

Базовая программа обучения, продолжительностью в 1,5 месяца, которая даст студентам базу аналитического мышления, поможет определиться, интересно ли вам развиваться в этом направлении. В рамках обучения научитесь работать с Google-таблицами, изучите основы статистики, визуализацию данных, познакомитесь с машинным обучением.

Преимущества:

  1. Обратная связь от экспертов.
  2. Документ об окончании установленного образца.

Старт в аналитике

Базовый курс, продолжительностью в 15 дней. В рамках обучения вы узнаете о том, какими знаниями, навыками, инструментами должен владеть современный аналитик. Познакомитесь с Excel, SQL, Power BI, Google Data Studio, Python.

Преимущества:

  1. Базовое понимание профессии, необходимых навыков.
  2. Доступная цена.

Как стать аналитиком данных и стартовать в Data Science

Бесплатный пошаговый план для тех, кто заинтересовался анализом данных, хочет узнать, как развиваться в профессии. Пользователь сможет получить подробный гид на свою электронную почту после регистрации.

Преимущества:

  1. Путь изучения новой профессии, выстраивания карьеры.
  2. Бесплатно.

Python для анализа данных

Обучение для новичков. На курсе вы узнаете, как при помощи языка Пайтон автоматизировать рутинные задачи, как обрабатывать большие объемы информации, изучите ключевые инструменты машинного обучения, аналитики.

Преимущества:

  1. Практические знания.
  2. Поддержка экспертов.

2. Аналитик Данных | SkillFactory ( сайт школы )

Коротко о главном:

  • Длительность: 10 месяцев;
  • Формат: видеоуроки, практические задания;
  • Документ об окончании: удостоверение о повышении квалификации.

Программа

  1. Тренажер по Google таблицам для анализа данных.
  2. Тренажер по базам данных.
  3. Тренажер по Python.
  4. Статистика для аналитиков.
  5. Отчеты в BI системах.
  6. Выбор специализации: маркетинговая или продуктовая аналитика.

Чему научитесь

  • С нуля выстраивать сквозную аналитику.
  • Применять дата-драйвен подход для принятия решений.
  • Эффективно автоматизировать обработку данных.
  • Обрабатывать большие массивы при помощи языка Пайтон.
  • Создавать удобную инфраструктуру для подготовки отчетов специалистов из других отделов компании.
  • Проектировать, создавать аналитическую архитектуру компании, учитывая специфику бизнеса.
  • Составляю рекомендации по изменению стратегии, рекламных кампаний на основе анализа данных.
  • Создавать аналитические дашборды.
  • Просчитывать эффективность бизнеса.
  • Выстраивать гипотезы, проверять, отсеивать неработающие, проводить А/В тесты.
  • Использовать прикладную математику для решения бизнес-задач.
  • Возможность выбрать специализацию.
  • Много практических заданий, работа над проектами для портфолио.
  • Обратная связь от преподавателей, поддержка личного куратора.
  • Помощь в трудоустройстве: карьерные консультации, помощь в составлении резюме, подготовке к собеседованиям.
  • Удостоверение о повышении квалификации.
  • Несколько пакетов обучения на выбор – стандартная и расширенная версии.
  • Рассрочка.
  • Нет стажировок у работодателя.
  • Дорого.

Отзывы 💖

Полная информация 👈

⭐ Больше курсов от SkillFactory:

Python для анализа данных

2-месячная программа для аналитиков, маркетологов, менеджеров, которая поможет освоить необходимую базу языка Python, применять его для работы с большими массивами данных. Научитесь работать с библиотеками, парсить данные из интернета, автоматизировать отчеты.

Преимущества:

  1. Практические знания.
  2. Сертификат.
  3. Помощь в трудоустройстве.

Тренажёр Power BI

Курс продолжительностью в 12 недель, который в формате тренажера позволит вам обучиться работе в популярной программе для BI аналитике. Вы изучите основной функционал, возможности, разберете программу на примере реальных кейсов, выполните практические задания для проверки, закрепления знаний.

Преимущества:

  1. Можно учиться в удобное время.
  2. Практические знания.

3. Факультет аналитики Big Data | GeekBrains ( сайт школы )

Коротко о главном:

  • Длительность: 18 месяцев;
  • Формат: лекции, вебинары, практические задания;
  • Документ об окончании: документ о профессиональной переподготовке.

Программа

  1. Подготовительный модуль.
  2. Основы: Python, Linux, MySQL, реляционные базы данных, библиотеки NumPy, Matplotlib, Scikit-learn.
  3. Работа с данными: сбор, обработка, хранение.
  4. Алгоритмы обработки, анализа данных, разработан при поддержке Х5 retail group.
  5. Машинное обучение, рекомендательные системы.
  6. Возможности аналитики Big Data для бизнеса.

Чему научитесь

  • Владеть методами анализа данных, машинного обучения.
  • Применять в своей работе прикладную статистику, теорию вероятностей.
  • Применять современные технологии для обработки больших данных – Hadoop, Hive, Spark, Hue, HBase, Kafka, Spark Streaming.
  • Работать с СУБД, SQL, NoSQL, MongoDB, Redis, Elasticsearch.
  • Использовать ВI-системы для анализа, формирования отчетов.
  • Работать с Python, его библиотеками, с Java Script на базовом уровне.
  • Использовать фреймворк Apache Spark, Python API.
  • Сможете участвовать в соревнованиях Kaggle.

Преимущества :

  • Диплом установленного образца.
  • Рассрочка.
  • 9 работ в портфолио выпускника.
  • Программа трудоустройства.
  • Обратная связь по домашним заданиям от экспертов, поддержка личного наставника.
  • Бонусное изучение английского.

Отзывы 💖

Полная информация 👈

⭐ Больше курсов от GeekBrains:

Алгоритмы и структуры данных на Python. Базовый курс

Месячная программа обучения, которая даст возможность улучшить свое программирование на Пайтоне и алгоритмическое мышление. Вы разберетесь с фундаментальными алгоритмами, сможете использовать их для решения реальных задач бизнеса.

Преимущества:

Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn

Курс из 10 уроков, рассчитанный на новичков в науке о данных. Он даст возможность разобраться с основными терминами, понятиями, изучить популярные библиотеки для работы с данными, визуализацией, машинным обучением.

Преимущества:

Подборка курсов от других школ

Python для анализа данных | SkyPro

Прохождение курса займет 2,5 месяца. За это время студенты смогут изучить основы языка Python и его популярные библиотеки, а также визуализацию данных, способы получения данных из различных источников, статистические тесты, прогнозы. Выполнят дипломную работу, которая продемонстрирует реальный уровень знаний.

Преимущества:

  1. Поддержка наставников.
  2. Удобный формат обучения.

Профессия Data Analyst | SkillBox

Фундаментальная программа обучения, рассчитанная на 2 года. После ее прохождения выпускник сможет стать продуктовым, BI-аналитиком или аналитиком-маркетологом.

Вы научитесь правильно вести переговоры с заказчиком, переводить задачи бизнеса в исследования. Также вы сможете грамотно извлекать данные из различных источников, очищать, трансформировать их, находить аномалии. Изучите исследования: когортный анализ, прогнозирование, коэффициенты корреляции, научитесь формулировать гипотезы, проверять их. Кроме того, сможете емко, интересно визуализировать результаты своих исследований, презентовать их для клиентов.

Преимущества:

  1. Лояльная, адекватная оплата с рассрочкой, отсрочкой первого платежа.
  2. Помощь в трудоустройстве.
  3. Поддержка преподавателей, личных кураторов.

Язык R для анализа данных

4-месячный видеокурс, в рамках которого студенты узнают, как обрабатывать большие объемы данных, работать с библиотеками и выстраивать графики, как грамотно автоматизировать рутинные задачи, а также прокачаться в аналитике при помощи языка R.

Преимущества:

  1. Обучение на практике.
  2. Рассрочка.
  3. Пожизненный доступ к материалам.

Профессия: Аналитик (с 0 до PRO) | ProductStar

Годовая программа обучения, подойдет для новичков без предварительного опыта. За это время студенты смогут освоить актуальные инструменты продуктового аналитика: Google Analytics, Python, BI-инструменты, Machine Learning и DataScience.

На курсе изучите множество тем, среди которых: основные метрики, вычислительные функции, формулы, BigQuery, ClickHouse, OWOX BI, vатематическая статистика, базы данных, Python, Pandas, Tableau, линейная регрессия, валидация, Feature Engineering, Feature Selection, бинарная классификация, Tensorflow + Keras, Hadoop, MapReduce, AWS, GCP, Azure, прогностические и предсказательные модели, переобучение.

Преимущества:

  1. Акцент на практике.
  2. Поддержка личного наставника.
  3. Программа трудоустройства.

SQL с 0 для анализа данных | ProductStar

Базовый курс, продолжительностью 2 месяца, рассчитанный на начинающих аналитиков, менеджеров, разработчиков, программистов, бухгалтеров, специалистов по маркетингу, руководителей. Он позволить изучить работу с базами данных, научится обрабатывать большие массивы данных и самостоятельно визуализировать результаты своих исследований.

Преимущества:

  1. Практические знания и опыт.
  2. Цифровой сертификат.

BIG DATA для менеджеров | Product Live

Полугодовая программа обучения для менеджмента, которая поможет изучить основы Big Data и AI, а также научиться грамотно внедрят современные технологии в деятельность компании, понимать, какие проблемы они реально могут решить и какие аспекты деятельности оптимизировать.

Преимущества:

  1. Обучение на практике, разбор кейсов.
  2. Расширение деловых контактов.
  3. Есть корпоративное обучение с оплатой от юрлица.

Как стать специалистом по Data Science | Яндекс Практикум

Основательная программа обучения от топовых специалистов Яндекса, которая позволит за 8 месяцев изучить основной инструментарий и пополнить свое портфолио целым набором достойных кейсов. Вы изучите: Python и его библиотеки, в том числе Scikit-Learn и XGBoost, Jupyter Notebook, SQL.

Преимущества:

  1. Проекты в портфолио.
  2. Есть тестовые модули, которые можно пройти бесплатно.
  3. Обучают топовые эксперты.

Data Science academy | SF Education

7-месячная программа обучения, которая позволит изучить машинное обучение, программирование, работу с данными и математические расчеты. Освоите линейную алгебру, статистику, теорию вероятностей, математический анализ и методы оптимизации.

Преимущества:

  1. Удостоверение о повышении квалификации.
  2. Поддержка личного ментора.
  3. Гибкий формат обучения.

Лучшие бесплатные программы

Специализация Анализ данных | Coursera

Интересная образовательная программа от Новосибирского государственного университета. Подходит для продвинутых слушателей с релевантным опытом, позволит изучить задачи по статистическому анализу данных – взаимосвязям, трендам, классификациям, предсказаниям.

Анализ данных в R | Stepik

Трехнедельная программа, позволяющая разобраться с основными этапами статистического анализа, чтения и предобработки данных, применении статистических методов, вычислений и визуализации, взаимосвязями признаков.

Python для непрограммистов | SkillFactory

Вводный микро-курс в формате игрового тренажера, который позволит вам всего за несколько часов изучить и понять Jupyter Notebook.

BI разработчик. Основы работы в Tableau | Stepik

Базовый курс по популярной программе для создания дашбордов. Пройдете путь от основ до опытного пользователя.

Анализ данных просто и доступно | Stepik

Авторский курс Игоря Клейнера, который ранее работал в Microsoft, Intel, Skype. Полезный курс для тех, кто хочет освоить профессию Data Scientist или Data Engineer. Охватывает такие темы: ML – машинное обучение, обучение без учителя, кластеризация, нейронные сети и deep learning, многое другое. Будет интересен и взрослой аудитории, и старшеклассникам.

Профессиональная сертификация 'Наука о данных IBM' | Coursera

Англоязычный курс от IBM, который позволит изучить науку о данных, искусственный интеллект и машинное обучение, освоить моделирование. С возможностью цифровой сертификации. Отличный introduction course, дающий хорошую теоретическую и практическую базу. Будет полезно и начинающим специалистам, и предпринимателям, желающим качественно внедрять современные технологии в свой бизнес.

Основы статистики | Stepik

Программа от Института биоинформатики, в рамках которой вас учат методологии и принципам статистического анализа, интерпретации и визуализации результатов. Изучите дисперсионный, регрессионный, кластерный анализ, коэффициенты корреляции и корреляционный анализ. Подготовлен практикующими специалистами, поможет структурировать информацию и потренироваться на решении практических заданий.

Введение в информационный поиск | Coursera

Резюмируя

Наука о данных и data mining – это обширное направление, которое связано с самыми передовыми технологиями. В этой сфере можно хорошо зарабатывать, а освоение профессии не требует обязательного высшего образования. Сегодня не один интернет-ресурс предоставляет образовательные программы, которые позволяют углубленно изучить эту тему, а при должной внимательности вы сможете самостоятельно оценить полезность и актуальность этих курсов, учитывая такие критерии, как помощь в трудоустройстве, соответствие запросам работодателям в вакансиях, серьезный выпускной экзамен и наличие документа государственного образца, лицензии на образовательную деятельность.

Востребованность специалистов, которые владеют набором актуальных компетенций в сфере больших данных, не вызывает сомнений! Такие профессионалы сегодня необходимы во всех сферах – от разработки, науки, технологий до промышленности, медицины, банковской, финансовой сферы, агентств рекламы и соцсетей.

Если вы хотите повысить свои профессиональные знания, попасть в категорию самых высокооплачиваемых специалистов на Linkedin и получить достойный оффер от работодателя, советуем не откладывать свое образование на потом.

В своем топе мы собрали разносторонние курсы, изучив которые, вам не нужно будет разбираться самому во всех тонкостях этой профессии. Опытные преподаватели помогут вам пройти этот путь, дадут основные теоретические блоки и практический опыт.

Надеемся, наша выборка онлайн курсов позволила вам подобрать для себя оптимальную программу обучения, сделать первый шаг на пути к желаемой профессии. Выбирайте образование обдуманно!

Рассказываю о Школе данных Билайн, где слушаю курс "Введение в машинное обучение". Делюсь впечатлениями о первом занятии.


Впечатления от первого занятия получил яркие! По-сравнению с теми лекциями, с которыми сталкивался раньше, темп намного выше, не успеваю записывать конспект. Кроме того, лекция - это отнюдь не попытка "надиктовать" некое готовое содержание учащимся. Нет, это частично диалог - когда преподаватель бросает в аудиторию вопрос и хочет немедленно получить на него ответ, а частично трансляция практического опыта применения теоретических сведений, которые (предположительно) уже имеет аудитория.

Занятия проходят в главном офисе Билайна на Садовом с 18 до 20, два раза в неделю - в пнд и пятницу. Удобно, что есть время на домашние задания, их задают и ставят баллы, которые используются для ренкинга всех занимающихся.

Кто и зачем пришел учиться?

Часть тех, кто записался на курс - это сотрудники крупных компаний. Часть людей - "физики", работающие в различных бизнесах, которые отправили себя на учебу самостоятельно и за свой счет. Кому-то освоить тему нужно по-работе, кто-то пришел, поскольку тема интересна и хочется повысить эрудицию. Учатся также люди из Киева - они участвуют в занятиях дистанционно в режиме видеоконференции.

Мне показалась особенно интересной мотивация участников, вот несколько "кейсов", которые я записал, когда участники представлялись друг-другу. Проверьте, не найдете ли вы свой случай?

Занимаюсь автоматизацией, IT-шник в агентстве по ипотечному кредитованию. Профессия немного отличается. Машинное обучение - не моя область, но я этой темой интересуюсь несколько последних лет. Иногда вижу "точки пересечения" с тем, что делаю на работе. Поэтому хотелось бы разобраться в теме глубже, чтобы затем решать свои задачи.

Работаю в дочернем подразделении известного интернет-поисковика. Хотелось бы на практике попробовать решения задач типа прогнозирования показателей оттока, роста числа клиентов.

Продуктовый аналитик в стартапе. Практически нет пересечений с моей работой, машинное обучение интересует в качестве хобби.

Аналитик известной системы онлайн-обучения английскому языку. Мы уже на работе решаем задачи, связанные с машинным обучением, по оттоку, рекомендательные системы. Хочется пройти интересный курс, надеюсь углубить текущие знания.

Новостной интернет-ресурс, отвечая на нем за все digital-активности, включая машинное обучение. Для меня это прямая специальность. Хочется расширить свои знания.

Работаю в операторе сотовой связи. Новый IT-директор ставит задачи внедрения машинного обучения. Будем вплотную этим заниматься. Так что нужны знания для практического их применения.

Работаю в крупном торгово-производственном холдинге. У нас порядка 20 тысяч наименований продуктов. У меня задача поиска скрытых закономерностей в продажах, классификации клиентов. Надеюсь в ходе курса почерпну что-то, что смогу применить.

Занимаюсь аналитикой ценообразования в крупной розничной продуктовой сети. Хотелось бы больше применять методы машинного обучения в моей работе. Поэтому я здесь.

Работаю в крупном зарубежном автопроизводителе. Машинное обучение никак не связано с моей работой. Просто тема очень любопытна.

Работаю в социальной сети. Борюсь там со спамом. Очень много где можно в моей работе применить машинное обучение. Хотелось бы получить практические знания.

Работаю в компании решений для авто навигации, включая автомобильную навигацию, моделирование поведения водителей. Мне кажется в этой области можно будет применить технологии машинного обучения.

Интернет-агентство. Машинное обучение интересно с точки зрения анализа поведения пользователей на сайте во время рекламных кампаний. Поэтому я здесь.

Работаю в интернет-компании аналитиком. Классифицирую различные угрозы, malware и т.д. С машинным обучением познакомился в аспирантуре, сейчас продолжаю применять в областях, необходимых по работе.

Крупный банк. Машинное обучение не является основной специальностью, но может мне упростить решение моих задач, поэтому пришел сюда.

Аналитик телеком-компании. Непосредственно занимаюсь обработкой данных из web-каналов. С машинным обучением пока не работал, но планирую его применять.

Системный администратор хранилища данных телеком-компании. С машинным обучением пока не сталкивался, интересно вникнуть.

Первое занятие проводил Александр Крот, тема - Введение в теорию машинного обучения.

Не буду вдаваться в подробности курса. Общий подход такой. Между теорией машинного обучения и практикой есть "зазор". Не все теоретические решения практически применимы в реальных ситуациях. Ведущие курса собрали решения, которые показали практическую эффективность, собрали навыки, которые пригождаются в работе и ими делятся. Т.е. это не академический, а прикладной курс, где "машинное обучение" рассматривается как "черный ящик", которым можно и нужно научиться пользоваться. Одна из целей - научиться правильно формулировать задачи на основе реальных жизненных ситуаций реального бизнеса.

По-прикладным задачам, которые решает "машинное обучение", их можно разделить на много сегментов. Мы не будем изучать целый ряд сегментов, например, анализ изображений и видео (computer vision), не уделим время анализу аудиосигналов (signal processing), оставим за бортом обработку естественного языка (natural language processing) тем более, что в этой области применительно к русскому языку пока все слабо развито. В общем в сферу deep learning не пойдем, но поговорим об обработке текстов, анализе соцсетей

На первом занятии начали практически от печки - что делает машинное обучение с объектами на основе признаков, чем отличается обучение с учителем от обучения без учителя (в понятиях машинного обучения). Вспомнили, что такое класификация, регрессия и кластеризация и KMeans.

Поговорили о том, что может быть внутри "черного ящика" машинного обучения - какие методы могут использоваться и для чего. Поговорили о метриках качества алгоритмов классификации.

Немало внимания было уделено инструментам анализа данных. Причем, когда об этом зашла речь, то четко провели разграничение - какие из инструментов и для чего уместно использовать.
Скажем, если речь о хранении и обработки BigData, то это Hadoop и Spark.
А если речь о работе с обучающими выборками (куда меньшими по объемам), то уместны совсем иные продукты, такие, как RapidMiner, Weka, языки программирования Python (с Jupyter и библиотеками scikit-learn) и R (RStudio) - все менее популярный.

Если все же нужно работать с Big Data, то это файловая система HDFS и модель вычислений MarReduce. Для работы с ними есть целый набор инструментария: ZooKeeper, Ooze, Azkaban, Scoop, Flume, Kafka, Hbase, Cassandra, Hive, Pig, NameNode. Про каждый продукт коротко прошлись - чем от других отличается и где уместен.

Конечно упомянули и in-memory, Apache Spark. Поговорили о том, как обойтись без кластера и что делать, если даные не лезут в память - Vowpal Wabbit и доучивание.

Затем подробно говорили о бизнес-процессе разработки продукта.

Поговорили на тему подготовки специалистов в областях Data Science и Big Data. Какая нужна подготовка (математика, мат.статистика, навыки программирования), что затем следует выучить. Навыки программирования нужны минимальные (по крайней мере для аналитиков - им достаточно научиться писать грамотные запросы на Python, SQL, R).

Пояснили почему так важна практика, в частности, практика построения алгоритмов. Важно понимать, какие задачи хорошо решаются, т.к. решаются не все задачи. Что в книгах далеко не все описывается, например, где и как искать обучающую выборку, какие признаки использовать для конкретной задачи, как разбивать данные.

Это все было забито в мой мозг и сверху притоптано за 120 минут времени. На деле пришлось задержаться еще минут на 20, чтобы Александр Крот успел дорассказать все, что планировал дать нам на первом занятии.

Отступление на тему "сколько стоят все эти чудеса"?

Вопрос стоимости почему-то все время поднимается, когда я пишу про Школу данных Билайн. Предупреждая вопросы тех, кто их еще не задал - да, обучение на курсе стоит 100 000 (сто тысяч) российских рублей. С одной стороны, это немалые деньги, а с другой мой MBA-курс в ВШЭ стоил и вовсе $7 тысяч. "Свет знаний" стоит немало. бесплатно можно полежать на диване с бутылочкой пива. Вопрос личного выбора.

О моих впечатлениях от занятия

Абсолютное большинство учащихся в группе с темой на этом уровне уже знакомо, многие хотели бы вводное занятие если не пропустить, то проскроллить намного быстрее. Мне же, даже при том, что знакомство с темой не нулевое, все равно было непросто все усваивать в таком темпе. Конспект потянул на 20 тысяч симоволов! А прочитать не спеша и подробнее "на досуге" - тоже кажется сейчас нереалистичным.

Между тем, домашку действительно задали и при первом взгляде на некоторые вопросы, я пока не знаю, как подойтик к решению. И это мы еще не добрались до тем, требующих программирования! При том, что я не более процентов 40-50% введения в Python прочел/прорешал примитивные задачки.
Ладно, пока рано пугаться, еще есть среда и четверг, чтобы во всем разобраться. :)

Раньше на эту тему написал здесь - там есть еще полезные подробности для тех, кого тема заинтересовала.

Читайте также: