Статистический анализ биомедицинских данных реферат

Обновлено: 05.07.2024

Характеристика основных программных средств математической статистики. Особенности медицинских данных. Основные характеристики распределения. Подготовка, предварительный анализ информации и выбор методов обработки, используемых в клинической практике.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 06.10.2014
Размер файла 26,6 K

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Компьютерный анализ медицинских данных с использованием методов математической статистики

Программные средства математической статистики

Математическая статистика -- универсальный инструмент для анализа любых данных, в том числе экспериментальных клинических и биомедицинских. Но выбираемый метод должен отвечать поставленной цели и быть адекватным по отношению к характеру анализируемых данных. Современный врач-исследователь должен осмысленно выбирать методы, применяемые к конкретной клинической (экспериментальной) задаче, и критически оценивать, а также содержательно интерпретировать полученные результаты.

Статистический анализ можно проводить вручную, если данных немного, используемые методы просты, а расчеты вследствие этого не трудоемки. Но в подавляющем большинстве случаев необходимо пользоваться специальными программными пакетами для ПК, которые так и называются -- статистическими.

В первой половине 1990-х гг. лидерство захватили статистические пакеты для персональных ЭВМ, работающие под управлением ОС MS DOS. Одним из математически мощных, не накладывающих практически никаких ограничений на объем обрабатываемой информации, был пакет SAS. Часть исследователей работала с пакетом BMDP для ПК, но безусловным лидером по количеству пользователей был пакет Statgraphics, обладающий широкими возможностями, достаточно простой в эксплуатации, но имеющий ограничения по числу анализируемых переменных.

В настоящее время наибольшее распространение в России получили статистические пакеты, работающие под Windows: Statistica, SPSS, SAS

Для того чтобы успешно применять математическую статистику, ее нужно знать хотя бы в том объеме, который реально необходим для осознанных действий. Кроме того, нужно уметь использовать статистический пакет. С практической точки зрения лучше ориентироваться на один и тот же пакет в течение ряда лет. Переход от пакета к пакету ведет к необходимости переучивания, пусть и в относительно небольшом объеме.

Особенности медицинских данных

Первым шагом, предваряющим собственно статистический анализ, является исследование типа данных, основными из которых являются количественные и качественные.

Качественные данные подразделяются на порядковые, или ранговые (например, тяжесть проявлений заболевания), и классификационные, или номинальные (например, перенесенные заболевания, классы ксенобиотиков). Процедура ранжирования данных, т.е. упорядочивания их в соответствии с числовыми градациями, проводится в возрастающем, либо в нисходящем ряду значений. Число градаций, характеризующих данные, не должно быть излишне большим, так как в этом случае увеличивается элемент субъективности.

При обработке данных часто приходится переводить качественные данные в количественные. В свою очередь количественные данные могут подвергаться квантованию в зависимости от поставленной задачи (для выделения интервалов, соответствующих различным состояниям, например температура нормальная, субфебрильная, высокая и др.), и тогда они становятся аналогичны качественным шкалированным.

В клинической практике переменные часто описываются шкалами. Как было отмечено ранее, шкалы бывают качественными (сознание ясное, спутанное и т.д.), классификационными (цвет кожных покровов -- розовые, синюшные, желтушные, характер хрипов в легких -- сухие, влажные мелкопузырчатые, крупнопузырчатые и т.д.) и количественные, в том числе интервальные, порядковые, балльные.

Интервальные переменные (например, ударный объем, мл: 50 -- 80, менее 50, более 80) полезно использовать для решения конкретной клинической задачи. Их также можно переводить в порядковые (на основе построения шкал), но лучше (при наличии возможности и если это не противоречит смыслу решаемой задачи) использовать собственно количественные значения переменной.

Балльные шкалы получают по-разному: после предварительной математической обработки, на основе чисто клинической оценки параметра, комбинированным способом.

Особым типом данных являются даты. Бывает, что по смыслу работы с ними приходится производить действия (например, определять, сколько времени прошло между соседними исследованиями), поэтому нужно следить, чтобы они записывались в определенном формате.

Важен вопрос о точности измерения и представления медицинских параметров. Понятно, что точность исходных данных определяется точностью метода и(или) прибора, с помощью которых осуществляется измерение.

В описательной статистике при работе с медицинскими данными необходимо поступать следующим образом: с одной стороны, не допускать потерь информации исходно -- использовать данные с той точностью, которая имеет место при измерении; с другой -- при представлении результатов статистической обработки данных не приводить избыточной информации -- в большинстве случаев достаточно той точности представления информации, что и в исходных данных, либо использования одного Дополнительного разряда. Обычно при предъявлении числовых данных указываются два знака после запятой. Исключением являются случаи представления констант и весовых коэффициентов функций, полученных в результате многомерного анализа (например, дискриминантного); тогда в результирующих таблицах обязательно должны приводиться все цифры после запятой.

Следует остановиться на еще одной особенности медицинских данных.

В математической статистике выводы основаны на допущении: то, что верно на случайной выборке, верно и для генеральной совокупности, из которой она получена.

Генеральная совокупность -- это набор данных, описывающих нечто всеобъемлющее, например все дети, живущие на планете Земля, вся совокупность пациентов, которые могли бы получать определенный препарат и т. п.

Выборка -- часть генеральной совокупности, описывающая ее с той или иной долей погрешности.

Часто сформировать истинно случайную выборку из генеральной совокупности не представляется возможным в силу того, что для выполнения требований репрезентативности объекты исследования (пациенты) должны проживать на разных континентах земного шара. Проведение таких исследований в настоящее время возможно, однако в силу существенных физиологических различий между людьми, живущими в разных уголках планеты, может быть потерян клинический смысл исследования. Это утверждение справедливо для достаточно широко распространенных в настоящее время международных мультицентровых исследований, посвященных, например, метаболическому синдрому, в которых принимают участие крупные отечественные центры и институты. В таких случаях выборка должна быть репрезентативна к исследуемой популяции (населению РФ или определенных, этнически сходных, регионов России).

Современная технология статистического анализа данных включает:

1) постановку задачи и планирование исследования: составление детального плана сбора исходных данных, определение характера выборки;

2) подготовку данных;

3) выбор методов обработки данных;

4) проведение анализа данных;

5) интерпретацию и представление результатов анализа.

Суть современной технологии обработки медицинских данных с помощью методов математической статистики и их последующей интерпретации кратко изложена в подразд. 3.3 -- 3.5.

Подготовка, предварительный анализ информации и выбор методов обработки данных

Рассмотрим пример из клинической дисциплины.

Постановка задач и планирование исследования. Предпочтительным вариантом является строгий подход, когда до проведения исследования есть полная ясность, для чего предпринимается работа, сколько и каких исследований будет осуществлено, какие методы и почему будут применяться для обработки полученного материала. Это позволяет оптимизировать усилия исследователя и затраты ресурсов.

Подготовка данных. Данные для статистического анализа принято готовить в виде таблицы (таблиц). Современные статистические пакеты работают с данными наиболее распространенных в настоящее время форматов, в том числе .dbf и .xls.

Современные статистические пакеты дают возможность управлять данными: часто при решении задач возникает необходимость объединения или разделения файлов (содержащих таблицы) по условию.

Выбор методов анализа и их реализация. Для грамотного выбора метода обработки данных необходимо знать характер распределения используемых переменных, поэтому предварительный анализ данных начинают с определения характера их распределения.

Распределение элементов выборки по значениям параметра -- это совокупность частот встречаемости интервалов его значений в данной выборке. К наиболее часто встречающимся видам распределений относятся: колоколообразное (нормальное, гауссово), полимодальное (чаще -- бимодальное), равномерное и др.

К основным характеристикам распределения относятся:

среднее арифметическое (М) -- при непрерывных числовых типах параметров; все значения по выборке сложить и поделить на их количество;

медиана -- значение параметра, делящее распределение параметра пополам; выборка значений параметра ранжируется (по возрастанию или убыванию); если число значений нечетно, то медиана -- это центральное значение, если число значений четно, то медиана -- это среднее арифметическое двух центральных значений;

квантили (центили) -- весь диапазон значений разбивается на 10 интервалов. Границы между интервалами -- квантили, от 10%-го до 90%-го квантиля укладываются 80 % значений;

мода -- значение параметра с наибольшей частотой встречаемости на выборке;

асимметрия -- характеристика несимметричности распределения элементов выборки относительно среднего арифметического. В случае симметричного распределения значение асимметрии равно нулю.

В медицинских публикациях часто встречается запись значений в виде М± т, где т -- стандартная ошибка среднего (standard error of mean). Это допустимо делать в случае нормально распределенного параметра, а к величине т нужно относиться с определенной долей скептицизма. Правда, при увеличении выборки распределение параметра достаточно часто стремится к квазинормальному, и тогда использование т в какой-то мере оправдано. Лучше указывать само выборочное стандартное отклонение (среднее квадратичное отклонение -- standard deviation -- s), которое характеризует ширину нормального распределения. Основанием для такого подхода является то, что s не уменьшается при увеличении числа наблюдений п; в диапазон М ± s укладывается около 70% значений нормального распределения параметра.

Параметрические методы. Для решения многих клинико-научных задач необходимо формулировать статистические гипотезы. Среди них можно назвать анализ соответствия распределения значений параметра определенному закону, сравнение групп по характеристикам распределения параметров и др.

Статистическая гипотеза -- это формально строго сформулированное предположение.

Нулевой (Н0) называют гипотезу, которую исследователь предполагает отклонить (например, об отсутствии различий между группами).

Альтернативная гипотеза (Н1) противоположна нулевой (например, о наличии различий между группами).

Уровень статистической значимости (а) -- это пороговое значение для ошибочного отклонения верной нулевой гипотезы (ошибки первого рода). В медицине принято выбирать а = 0,05 или а = 0,01.

Ошибка второго рода -- это ошибочное принятие ложной нулевой гипотезы.

В настоящее время в публикациях принято указывать реальное значение р (вероятность ошибки первого рода). Если значение р меньше 0,05, говорят о наличии статистически значимых отличий между выборками параметра.

Статистически значимые различия следует отличать от клинически значимых. Встречаются результаты, значимые статистически, но не значимые с клинической точки зрения, бывает и наоборот. Клинически значимые, но статистически незначимые результаты обычно получаются на малых выборках, а при увеличении выборок они, как правило, подтверждаются и статистически.

Чем распределения отличаются с практической точки зрения? Тем, что наиболее распространенные методы параметрической статистики (например, t-критерий Стьюдента) можно применять только для нормально распределенных величин (колоколообразных распределений). Неправомочное использование t-критерия Стьюдента -- самая часто встречающаяся ошибка статистической обработки данных клинических исследований, приводящая к ошибочным выводам.

Непараметрические методы. В клинической медицине и при обработке данных медико-биологических экспериментов в большинстве случаев необходимо пользоваться непараметрическими методами статистического анализа. Они являются менее мощными, чем параметрические, но применимы для любых видов распределений.

Анализ характера распределения данных (его еще называют проверкой на нормальность распределения) осуществляется по каждому параметру. Для проверки на нормальность используют как визуализирующие методы (метод построения гистограмм), так и статистические (например, тест Колмогорова--Смирнова, критерий Шапиро--Уилкса). Для того чтобы уверенно судить о соответствии распределения параметра нормальному закону, необходимо, чтобы выборка была достаточно многочисленной (не менее 50 значений).

Кроме разделения по уже описанному важнейшему статистическому подходу (параметрические, непараметрические) методы статистического анализа данных принято классифицировать несколькими способами:

1) по количеству одновременно анализируемых параметров (одномерные, двухмерные, многомерные или многофакторные);

2) имеющимся исходно предположениям о характере распределений выборок (односторонние тесты -- при наличии предположения о смещении распределения

математический статистика клинический распределение

Таблица 1 - Методы математической статистики, используемые в клинической практике

3. Медицинская статистика: Назначение, Задачи

4. СТАТИСТИКА

5. СТАТИСТИКА

изучает КОЛИЧЕСТВЕННУЮ СТОРОНУ массовых общественных явлений в
неразрывной связи с их КАЧЕСТВЕННОЙ СТОРОНОЙ
ДАННЫЕ
ИНФОРМАЦИЯ
ОБОСНОВАННЫЕ
КЛИНИЧЕСКИЕ, УПРАВЛЕНЧЕСКИЕ РЕШЕНИЯ
5

6. Закон больших чисел

ЗАКОН БОЛЬШИХ ЧИСЕЛ: количественные закономерности массовых явлений
отчетливо проявляются лишь на достаточно большом числе единиц наблюдения
Сущность его заключается в том, что в числах, получающихся в результате
массового наблюдения, выступают определенные закономерности, которые не
могут быть обнаружены в небольшом числе фактов
2 следствия
6

7. Закон больших чисел

следствие 1
ЭКОЛОГИЧЕСКАЯ ОШИБКА (ecological fallacy) – результаты, полученные на
выборке, нельзя экстраполировать на единицу наблюдения
Закономерности, обнаруженные на выборке, не могут являться императивом
действий с конкретным человеком (пациентом)
АТОМИСТИЧЕСКАЯ ОШИБКА (atomistic fallacy) – данные, полученные на единице
наблюдения, нельзя экстраполировать на выборку
Мнение одного эксперта не должно быть императивом действий на выборке
7

8. Закон больших чисел

9. СТАТИСТИЧЕСКИЕ МЕТОДЫ

Статистические методы - методы анализа статистических данных
методы прикладной
статистики
применяются во всех областях
научных исследований
и любых отраслях экономики
и управления
специальные методы
статистики
применяются в отдельных областях
научных исследований
+
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВ
9

10. СТАТИСТИЧЕСКИЕ МЕТОДЫ

11. БИОМЕТРИКА или БИОСТАТИСТИКА

Биометрия (биологическая статистика / биостатистика) — научная отрасль на
стыке биологии и вариационной статистики, связанная с разработкой и
использованием статистических методов в научных исследованиях (как при
планировании количественных экспериментов, так и при обработке
экспериментальных данных и наблюдений) в биологии, медицине,
здравоохранении и эпидемиологии
КЛИНИЧЕСКИЕ ИСПЫТАНИЯ
БИОСТАТИСТИКА
ЭПИДЕМИОЛОГИЧЕСКИЕ ИССЛЕДОВАНИЯ
ЗДРАВООХРАНЕНИЕ :
ПЛАНИРОВАНИЕ, УПРАВЛЕНИЕ, КОНТРОЛЬ
11

12. ИНФОРМАЦИОННАЯ БАЗА СИСТЕМЫ ЗДРАВООХРАНЕНИЯ

13. Статистическая система здравоохранения: ИНФОРМАЦИОННАЯ БАЗА

14. Статистическая система здравоохранения. ИНФОРМАЦИОННАЯ БАЗА (1). ФЕДЕРАЛЬНЫЕ СТАТИСТИЧЕСКИЕ НАБЛЮДЕНИЯ

Статистическое наблюдение – это массовое, планомерное, научноорганизованное наблюдение за явлениями социальной и
экономической жизни, которое заключается в регистрации
отобранных признаков у каждой единицы совокупности
14

15. Статистическая система здравоохранения. ИНФОРМАЦИОННАЯ БАЗА (1). ФЕДЕРАЛЬНЫЕ СТАТИСТИЧЕСКИЕ НАБЛЮДЕНИЯ

В отечественной статистике используются три организационные формы
(типа) статистического наблюдения:
- ОТЧЕТНОСТЬ (предприятий, организаций, учреждений и т. п.)
- СПЕЦИАЛЬНО ОРГАНИЗОВАННОЕ СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ (переписи,
единовременные учеты, обследования сплошного и несплошного характера)
- РЕГИСТРЫ
15

16. Статистическая система здравоохранения: ИНФОРМАЦИОННАЯ БАЗА (2)

Недооцененный
источник
статистических данных
(в России)
Основной источник
статистических данных
за рубежом
ПРИЧИНА: дефицит
знаний, дорогие
стат.программы
16

17. СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ

СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ — это научно организованный по единой
программе сбор, сводка и анализ данных (фактов) о социально-экономических,
демографических и других явлениях и процессах общественной жизни в
государстве с регистрацией их наиболее существенных признаков в учетной
документации
17

18. СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ

формулирование
научной
проблемы
постановка цели
и задач
исследования
НАУЧНАЯ
ПРОБЛЕМА
составление
программы
исследования
идентификация
единицы
наблюдения и типа
статистической
совокупности
подведение
итогов
сбор материала
контроль
качества
материала
статистическая
обработка
материала
формулирование
методических
рекомендаций /
управленческих
решений
РЕКОМЕНДАЦИИ /
РЕШЕНИЕ
18

19. СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ: где нужны знания статистики .

подведение
итогов
формулирование
научной
проблемы
анализ имеющихся
данных о научной
проблеме
составление
программы
исследования
сбор материала
расчет объема
выборки
контроль
качества данных
(quality control)
статистическая
обработка
материала
+
контроль
стат.мощности
результатов
формулирование
методических
рекомендаций /
управленческих
решений
сопоставление
полученных
результатов с
аналогами
19

20. ТИПЫ переменных В СТАТИСТИКЕ

ТИП ПЕРЕМЕННЫХ ОПРЕДЕЛЯЕТ НАБОР СТАТИСТИЧЕСКИХ МЕТОДОВ АНАЛИЗА
ПЕРЕМЕННЫЕ
КОЛИЧЕСТВЕННЫЕ
КАТЕГОРИАЛЬНЫЕ
ДИСКРЕТНЫЕ
НЕПРЕРЫВНЫЕ
ПОРЯДКОВЫЕ
НОМИНАЛЬНЫЕ
(DISCRETE)
(CONTINUOUS)
(ORDINAL)
(NOMINAL)
ЧИСЛОВОЕ ОБОЗНАЧЕНИЕ ИМЕЕТ
СОДЕРЖАТЕЛЬНЫЙ СМЫСЛ
ЧИСЛОВОЕ ОБОЗНАЧЕНИЕ НЕ ИМЕЕТ
СОДЕРЖАТЕЛЬНЫЙ СМЫСЛ
21

22. КОЛИЧЕСТВЕННЫЕ НЕПРЕРЫВНЫЕ ПЕРЕМЕННЫЕ

23. КОЛИЧЕСТВЕННЫЕ ДИСКРЕТНЫЕ ПЕРЕМЕННЫЕ

24. КАТЕГОРИАЛЬНЫЕ НОМИНАЛЬНЫЕ ПЕРЕМЕННЫЕ

25. КАТЕГОРИАЛЬНЫЕ ПОРЯДКОВЫЕ ПЕРЕМЕННЫЕ

26. ПРАВИЛА ОФОРМЛЕНИЯ БАЗЫ ДАННЫХ

27. СПОСОБЫ ПРЕЗЕНТАЦИИ ДАННЫХ В СТАТИСТИКЕ (ДИСКРИПТИВНАЯ / ОПИСАТЕЛЬНАЯ СТАТИСТИКА)

ТИП ПЕРЕМЕННЫХ ОПРЕДЕЛЯЕТ НАБОР СТАТИСТИЧЕСКИХ МЕТОДОВ АНАЛИЗА
ПЕРЕМЕННЫЕ
КОЛИЧЕСТВЕННЫЕ
КАТЕГОРИАЛЬНЫЕ
ДИСКРЕТНЫЕ
НЕПРЕРЫВНЫЕ
ПОРЯДКОВЫЕ
НОМИНАЛЬНЫЕ
(DISCRETE)
(CONTINUOUS)
(ORDINAL)
(NOMINAL)
ЧИСЛОВОЕ ОБОЗНАЧЕНИЕ ИМЕЕТ
СОДЕРЖАТЕЛЬНЫЙ СМЫСЛ
ЧИСЛОВОЕ ОБОЗНАЧЕНИЕ НЕ ИМЕЕТ
СОДЕРЖАТЕЛЬНЫЙ СМЫСЛ
28

29. СПОСОБЫ ПРЕЗЕНТАЦИИ ДАННЫХ В СТАТИСТИКЕ (ДИСКРИПТИВНАЯ / ОПИСАТЕЛЬНАЯ СТАТИСТИКА)

ТИП ПЕРЕМЕННОЙ
НЕПРЕРЫВНЫЕ
(CONTINUOUS)
ДИСКРЕТНЫЕ
(DISCRETE)
ПОРЯДКОВЫЕ
(ORDINAL)
НОМИНАЛЬНЫЕ
(NOMINAL)
ЧАСТОТНОЕ
РАСПРЕДЕЛЕНИЕ
СРЕДНИЕ
ВЕЛИЧИНЫ
ТАБЛИЦЫ /
ГРАФИКИ
+
+
+
+
+
-
+
+
+
+
29

30. ЧАСТОТНОЕ РАСПРЕДЕЛЕНИЕ

31. Частотное распределение переменной (frequency distribution)

ЧАСТОТНОЕ РАСПРЕДЕЛЕНИЕ (frequency distribution) – обнаружение соответствия
между значениями переменной и их вероятностями (частотой встречаемости)
15
16
14
12
10
12
10
8
6
3
4
2
0
Неудовл.
Удовл.
Хорошо
Отлично
31

32. ЧАСТОТНОЕ РАСПРЕДЕЛЕНИЕ КОЛИЧЕСТВЕННЫХ НЕПРЕРЫВНЫХ ПЕРЕМЕННЫХ

МОГУТ ПРИНИМАТЬ ЛЮБЫЕ ЗНАЧЕНИЯ [В НЕКОТОРОМ ЗАДАННОМ ИНТЕРВАЛЕ]
0,6 3,5 10,0 19,3 30,2 50,8 78,2
ПРИМЕРЫ:
- Возраст
- Масса
- Рост
- АД
- Биохимические
показатели
32

33. ЧАСТОТНОЕ РАСПРЕДЕЛЕНИЕ КОЛИЧЕСТВЕННЫХ НЕПРЕРЫВНЫХ ПЕРЕМЕННЫХ

ЭТАПЫ ПОСТРОЕНИЯ ЧАСТОТНОГО РАСПРЕДЕЛЕНИЯ
1. Упорядочить (по возрастанию) значения
переменной
17,6
3,6
0,6
10,6
12,6
12,8
18,3
19,1
19,9
0,8
33

34. ЧАСТОТНОЕ РАСПРЕДЕЛЕНИЕ КОЛИЧЕСТВЕННЫХ НЕПРЕРЫВНЫХ ПЕРЕМЕННЫХ

ЭТАПЫ ПОСТРОЕНИЯ ЧАСТОТНОГО РАСПРЕДЕЛЕНИЯ
2. Разбить выборку на группы по равным интервалам (по формуле Стерджесса)
n = 1 + 3.322lgN
n – число групп
N – количество единиц наблюдения
n = 1 + 3.322lg10 = 4
34

В ходе выполнения курсовой работы необходимо решить следующие задачи:

  1. Основные термины и определения;
  2. Формирование выборки с помощью программы Graph2Digit;
  3. Произвести изотоническое и изоморфное разбиение;
  4. Построить дендриты;

КЛАСТЕРНЫЙ АНАЛИЗ, ДЕНДРИТ, КЛАСТЕР, ИЗОТОНИЧЕСКИЙ, ИЗОМОРФНЫЙ, РАЗБИЕНИЕ, КЛАССЫ, МАТРИЦА.

Целью выполнения курсового проекта является изучение степени зависимости между величинами.

Для выполнения работы были использованы следующие программные средства: Microsoft Office Word и Microsoft Office Excel 2007.

Объектом исследования являются: кластерный анализ биомедицинских данных на примере ЭМГ.

Назначение и область применения: учебный процесс кафедры БмИ.

1 КЛАСТЕРНЫЙ АНАЛИЗ 6

1.1 Назначение применения кластерного анализа 6

1.2 Расстояние и качество разбиения между классами 8

1.3 Алгоритм выполнения кластерного анализа 9

2 ПРАКТИЧЕСКАЯ ЧАСТЬ 12

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 19

ВВЕДЕНИЕ

Кластерный анализ - совокупность математических методов, предназначенных для формирования относительно "отдаленных" друг от друга групп "близких" между собой объектов по информации о расстояниях или связях между ними. Кластерный анализ широко используется в науке как средство типологического анализа. В любой научной деятельности классификация является одной из фундаментальных составляющих, без которой невозможны построение и проверка научных гипотез и теорий.

Анализ отечественных и зарубежных публикаций показывает, что кластерный анализ находит применение в самых разнообразных научных направлениях: биология, медицина, археология, история, география, экономика, филология и т.д.

По приблизительным оценкам специалистов число публикаций по кластерному анализу и его приложениям в различных областях знания удваивается каждые три года. Объективно существуют три основные причины этого явления. Это появление мощной вычислительной техники, без которой кластерный анализ данных практически не реализуем. Вторая причина заключается в том, что современная наука все сильнее опирается в своих построениях на классификацию. И последняя причина - углубление специальных знаний приводит к увеличению количества переменных, учитываемых при анализе тех или иных объектов и явлений. Вследствие этого субъективная классификация, которая ранее опиралась на достаточно малое количество учитываемых признаков, часто оказывается уже ненадежной. А объективная классификация, с все возрастающим набором характеристик объекта, требует использования сложных алгоритмов кластеризации, которые могут быть реализованы только на базе современных компьютеров. Именно эти причины и породили "кластерный бум". К сожалению, в среде медиков и биологов кластерный анализ еще не стал достаточно популярным и обыденным методом исследования.

Платонов А.Е. Статистический анализ в медицине и биологии

М.: РАМН, 2000. Описаны параметрические и непараметрические методы статистического анализа и их использование в медицинских и биологических исследованиях.

Агарков В.И., Бутева Л.В.; Грищенко С.В. и др. Методические указания по социальной медицине и организации здравоохранения - 1 модуль

  • формат pdf
  • размер 1.35 МБ
  • добавлен 17 октября 2011 г.

– Донецк: ДонНМУ, 2011. – 203 с. Методические указания по социальной медицине и организации здравоохранения для студентов 4 курса медицинских факультетов (1 модуль: Статистика здоровья. Организация основных видов медицинского обеспечения населения на современных его уровнях) Методические указания призваны помочь студентам в изучении основ статистики здоровья, овладении методикой оценки здоровья населения с помощью демографических показателей и п.

Васильева Л.А. Статистические методы в биологии, медицине и сельском хозяйстве

  • формат djvu
  • размер 5.07 МБ
  • добавлен 13 июня 2011 г.

Васильева Любовь Антоновна - главный научный сотрудник, доктор биологических наук, профессор, Заслуженный деятель науки Российской Федерации - специалист в области популяционной и эволюционной генетики, генетики дрозофилы, генетики количественных признаков, биологической статистики, теоретических основ селекции животных, генетики и разведения сельскохозяйственных животных. Учебное пособие к курсу лекций "Биометрия" описывает статистические методы.

Ланг Т.А., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов

  • формат djvu
  • размер 7.83 МБ
  • добавлен 09 мая 2011 г.

Ланг Т.А., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов

  • формат pdf
  • размер 9.5 МБ
  • добавлен 09 мая 2011 г.

Леонов В.П. Ошибки статистического анализа биомедицинских данных

  • формат pdf
  • размер 254.39 КБ
  • добавлен 07 декабря 2011 г.

PDF-версия статьи с одноимённым названием, опубликованной в "Международном журнале медицинской практики" (2007, вып. 2, стр.19- 35.). В статье рассмотрено много примеров ошибочного использования статистики в российской биологии и медицине. Дана классификация основных видов ошибок, обсуждаются обзоры по этой теме за предыдущие 50 лет. Дана классификация причин возникновения таких ошибок в биологии и медицине. С позиций меметики рассмотрены более 1.

Новиков Д.А., Новочадов В.В. Статистические методы в медико-биологическом эксперименте

  • формат pdf
  • размер 668.65 КБ
  • добавлен 19 февраля 2010 г.

Ответы к зачету - Социальная медицина

  • формат doc
  • размер 134 КБ
  • добавлен 26 марта 2011 г.

1. Индивидуальное и общественное здоровье. 2. Социальная и клиническая медицина. Объект, предмет и задачи социальной медицины. 3. Генетическая обусловленность здоровья. 4. Социальная обусловленность здоровья. 5. Эпидемиология в социальной медицине. Санитарно – эпидемическое благополучие населения. 6. Вирулентность и иммунитет. Социальная защита населения от медикаментозной агрессии. 7. Санитарное законодательство. Влияние загрязнения окружающей.

Реброва О.Ю. Статистический анализ медицинских данных

  • формат pdf
  • размер 11.32 МБ
  • добавлен 15 декабря 2010 г.

Реферат - Применение статистики в статьях и диссертациях по медицине и биологии. Описание методов статистического анализа в статьях и диссертациях. Определение критерия достоверности по критерию Стьюдента

  • формат doc
  • размер 376.95 КБ
  • добавлен 26 июля 2011 г.

Содержание Описание методов статистического анализа в статьях и диссертациях Статистические методы и критерии, используемые чаще всего Заключение Литература.

Урбах В.Ю. Статистический анализ в биологических и медицинских исследованиях

  • формат djvu
  • размер 6.6 МБ
  • добавлен 05 мая 2011 г.

М: Медицина - 1975 г. - 297 с. В книге подробно изложены вопросы статистического планирования медицинских и биологических экспериментов, предварительной статистической обработки полученного в опытах материала, оценки параметров распределения но эмпирическим данным, выявление значимости различия двух распределений; рассмотрены важные для биологических и медицинских приложений распределения (нормальное, биномиальное, пуассоновское), описаны методы.

Читайте также: