Высшая школа экономики анализ данных в биологии и медицине

Обновлено: 07.07.2024

В связи с масштабным развитием технологий в области наук о живых системах, современная биология ежегодно накапливает огромные массивы данных. Для их обработки необходимо грамотное владение компьютерными методами и специальными алгоритмами. Ввиду этого ежегодно возрастает спрос на специалистов в области вычислительной биологии, способных применять математический аппарат для решения биологических и медицинских задач. Выпускники программы получат междисциплинарное образование, необходимое для анализа медико-биологических данных.

Варианты обучения

Условия поступления

Английский язык

квалификационный экзамен - тестирование + аудирование

Портфолио

Работодатели-партнеры

Логотип

Логотип

По словам руководителя кафедры и президента ГК InfoWatch Натальи Касперской, здесь будут готовить выпускников с фундаментальными навыками проектирования, разработки и тестирования ПО для защиты организаций от внутренних угроз информационной безопасности, предотвращения утечек корпоративной информации, защиты предприятий от кибератак, а также угроз, исходящих от интернета вещей.

Логотип

Направление: МАТЕМАТИКА И МЕХАНИКА
Уровень: Магистратура
Предмет: Прикладная математика и информатика
Код: 01.04.02
Документ об образовании, степень или квалификация: Магистр по направлению "Прикладная математика и информатика"

Язык обучения: русский, английский
Форма обучения: Очная
Продолжительность: 2 года
Возможность бесплатного обучения: есть
Стоимость: 390 000 руб.



Мы в WeChat


Курс охватывает все основные статистические концепции. В первой половине курса слушатели знакомятся с основными понятиями из математической статистики и нарабатывают необходимый для их понимания бэкграунд из теории вероятностей. Слушатели научатся делать описательный анализ данных, визуализировать данные и исследовать линейные взаимосвязи.

Вторая часть посвящена более продвинутым темам: параметрическим и непараметрическим тестам, принципу проверки статистических гипотез, а также построению прогностических моделей на основе линейной и логистической регрессии. Кроме того, в течение курса демонстрируется представление результатов анализа данных в графическом виде: рассматриваются как самые простые и классические методы визуализации, так и более сложные.

Формат

Каждая неделя курса состоит из теоретического блока и практической части. Особенность практической части заключается в том, что она реализуется сразу с использованием двух инструментов: Google Sheets и языка программирования Python. Можно научиться реализации изученных методов с применением обоих инструментов или выбрать один.

Требования

Для прохождения данного курса не требуется специальная математическая подготовка, поэтому курс подойдет для слушателей любого уровня.

  1. Google Sheets
  2. MS Office (2016 или 2019 года)
  3. Anaconda (Individual Edition)

Программа курса

  1. Введение в статистику и работа с данными
  2. Генеральная совокупность и выборка. Частоты. Распределения.
  3. Описательные статистики: меры центральной тенденции и разброса
  4. Z-распределение и его свойства
  5. Корреляция
  6. Визуализация данных: часть 1
  7. Повторение
  8. Визуализация данных: часть 2
  9. Введение в статистику выводов: постановка гипотез
  10. Применение параметрических критериев
  11. Непараметрические тесты
  12. Линейная регрессия
  13. Логистическая регрессия
  14. Повторение

Результаты обучения

  1. Слушатель знает основные понятия статистики и умеет ими оперировать.
  2. Слушатель умеет загружать и исследовать данные в выбранном ПО.
  1. Слушатель умеет проводить описательный анализ данных.
  2. Слушатель умеет выбирать корректный тип визуализации и визуализировать данные.
  3. Слушатель умеет определять тип распределения по визуализации и интерпретировать его.
  4. Слушатель умеет определять силу и направление корреляции по коэффициенту и визуализации. Умеет интерпретировать корреляцию в данных.
  5. Слушатель умеет построить линейный тренд в данных и интерпретировать его уравнение.
  6. Слушатель умеет поставить гипотезу, выбрать критерий значимости и корректный параметрический или непараметрический тест для проверки гипотезы.
  7. Слушатель умеет рассчитать и интерпретировать критерий Стьюдента для разных выборок.
  8. Слушатель умеет применять к данным модель линейной регрессии и интерпретировать ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели.
  9. Слушатель умеет применять к данным модель логистической регрессии и интерпретировать ее метрики и коэффициенты. Умеет проверить ограничения и допущения для построения такой модели

Направления подготовки

Что может быть прибыльнее, чем вести войну, торговать оружием и промышлять в даркнете? Правильно – лечить людей и продавать лекарства. Рассказываем, что нужно знать и уметь, чтобы влиться в выгодную и легальную индустрию здравоохранения.

⚕ Какие специалисты по Data Science требуются в медицинских проектах и что им нужно знать?

Кто сталкивался с чем-то посложнее простуды знает, что при нестандартных симптомах шансы на успешное лечение резко падают по нескольким причинам:

Работа по стандарту подразумевает наличие алгоритма:

  • Узнать симптоматику.
  • Провести диагностику и сделать анализы.
  • Определить диагноз.
  • Назначить лечение.

Эти четыре шага может выполнить машина на основе массива данных.

Наука о данных использует большие объемы информации, полученной из разрозненных источников, таких как медицинские карты пациентов, результаты диагностики, планы и результаты лечения, чтобы создать базу данных симптомов и успешных планов лечения, которая поможет врачам принимать правильные решения.

Читайте также: