Статистические методы обработки экспериментальных данных реферат

Обновлено: 19.05.2024

Курс содержит основы теории вероятностей и дает серьёзную подготовку по математической статистике, преимущественно по тем её разделам, которые используются при планировании и обработке экспериментов и измерений в педагогике и психологии.

Цель и задачи курса

– сообщить студентам основные теоретические сведения по общим и частным вопросам курса;

– научить студентов применять полученные знания при решении практических задач;

– учить студентов самостоятельно работать с научной литературой;

– развивать у студентов аналитическое, логическое мышление и математическую речь.

Знания, умения и навыки, приобретаемые студентами при изучении курса.

Студенты должны знать:

– основные понятия теории вероятностей и математической статистики;

– формы подготовки и представления экспериментальных данных;

– методы математической статистики, используемые при планировании, проведении и обработке результатов экспериментов в педагогике и психологии.

Студенты должны уметь:

– планировать процесс математико–статистической обработки экспериментальных данных;

– практически рассчитывать типовые для педагогики и психологии статистические задачи;

– пользоваться статистическими таблицами при проведении расчетов и формировании выводов и заключений;

– анализировать полученные результаты.

Курс рассчитан на 36 аудиторных часов.

ПРИМЕРНЫЙ ТЕМАТИЧЕСКИЙ ПЛАН КУРСА

Лекции – 16 часов, лабораторные занятия – 20 часов.

№ п/пТемаКоличество часов
лекции практические занятия
1.Введение в теорию вероятностей.2
2.Методы математической статистики.68
3.Непараметрические методы анализа данных.812
Всего1620

Основные понятия теории вероятностей

Примеры стохастических явлений: рост людей, разброс показателей способностей, скорость реакции. Частота случайного события. Устойчивость частот. Примеры.

Классическое определение вероятности.

Случайная величина. Непрерывные и дискретные случайные величины. Числовые характеристики случайной величины. Функция распределения, плотность распределения случайной величины, их свойства.

Виды функций распределения. Биномиальное распределение. Распределение Пуассона. Т-распределение Стьюдента. Распределение c 2.

Нормальное распределение. Качественное и количественное сопоставление эмпирического распределения теоретическому.

Математическое ожидание случайной величины, его свойства. Дисперсия, её свойства, среднеквадратичное отклонение случайной величины. Примеры.

Корреляционный момент. Коэффициент корреляции, его свойства.

Требования к компетентности:

знатьосновные понятия теории вероятностей;

понимать содержание основных понятий теории вероятностей;

уметь использовать научную терминологию при решении классических задач теории вероятностей.

Основы математической статистики

Определение прикладной статистики. Основные этапы статистической обработки данных. Принципы группировки информации. Статистические таблицы. Графические методы представления информации.

Генеральная совокупность. Случайная выборка.

Вариационный ряд. Объём вариационного ряда. Размах. Частота. Накопленная частота. Дискретный ряд. Интервальный вариационный ряд, способы его построения. Графическое представление вариационных рядов: полигон, гистограмма, кумулянта, огива.

Выборочные характеристики – среднее, дисперсия, среднеквадратичное отклонение и способы их вычисления.

Асимметрия, эксцесс, их интерпретация, связь с видом распределения.

Мода, способы её вычисления в дискретных и интервальных вариационных рядах. Понятие бимодальности, полимодальности ряда.

Медиана, способы её вычисления в дискретных и интервальных вариационных рядах.

Меры центральной тенденции - мода, медиана, среднее - и их соотношение как априорная характеристика вида эмпирического распределения выборки.

Основные понятия, связанные с проверкой статистических гипотез: гипотезы H0, H1, критическое множество, ошибки первого и второго рода, уровень значимости, мощность. Число степеней свободы.

Предельная ошибка и необходимый объем выборки.

Проверка нормальности эмпирического распределения по Плохинскому, по Пустыльнику. λ критерий Колмогорова – Смирнова. Критерий Шапиро – Уилки.

Доверительный интервал. Правило 3σ.

Проверка статистических гипотез об однородности двух нормально распределенных выборок с помощью критерия Стьюдента. Критерий оценки для сравнения средних. F – критерий для сравнения дисперсий.

Меры связи. Коэффициент корреляции Пирсона, его свойства, интерпретация. Корреляционный анализ. Достоверность коэффициента корреляции.

Линейная регрессия. Метод наименьших квадратов. Коэффициент регрессии. Уравнение регрессии, способ его построения. Точечные оценки и доверительные интервалы для параметров линейной регрессии.

Нелинейная корреляционная зависимость. Корреляционное отношение η 2 .

Интерпретация значений коэффициента корреляции.

Дисперсионный анализ, суть метода.

Однофакторный дисперсионный анализ, алгоритм расчета. Однофакторный дисперсионный анализ с неравными объёмами выборок.

Двухфакторный дисперсионный анализ. Двухфакторный дисперсионный анализ с одинаковым числом наблюдений. Двухфакторный дисперсионный анализ с параллельными наблюдениями на сочетаниях уровней факторов.

Требования к компетентности:

знать:

– основные понятия математической статистики;

– формы подготовки и представления экспериментальных данных;

– методы математической статистики, используемые при планировании, проведении и обработке результатов экспериментов в педагогике и психологии;

уметь:

– планировать процесс математико–статистической обработки экспериментальных данных;

– практически рассчитывать типовые для педагогики и психологии статистические задачи;

– пользоваться статистическими таблицами при проведении расчетов и формировании выводов и заключений;

– анализировать полученные результаты.

Непараметрические методы статистического анализа

Типы измерений данных в психологии. Номинальные, порядковые интервальные и относительные шкалы измерений.

Ранжирование. Ранг. Связанные ранги, способы их вычисления.

Квантили: децили, квинтили, квартили, процентили, их вычисление и соотношение между собой.

Измерение связей между разнотипными данными. Коэффициент сопряженности. Коэффициент ассоциации. Коэффициенты взаимной сопряженности Пирсона и Чупрова. Коэффициент корреляции τ Кендалла. Коэффициент ранговой корреляции Спирмена. Биссериальный коэффициент корреляции. Биссериальная ранговая корреляция. Коэффициент конкордации.

Номинальные шкалы. Дихотомические переменные. Биномиальный критерий и критерий c 2 для проверки соответствия выборочной статистики параметру генеральной совокупности. Построение и анализ таблиц сопряженности признаков 2´2. Критерий точной вероятности Фишера. Критерий c 2 . Схема “до – после”. Критерий значимости изменений Макнимара. Q – критерий Кокрена.

Порядковые шкалы измерений. Критерий Колмогорова – Смирнова. U - критерий Манна – Уитни для сравнения средних, критерий Вальда – Вольфовица для исследования гипотез о различиях в распределении. Критерий знаков. Критерий множественных сравнений Уилкоксона для оценки статистической значимости всевозможных пар воздействий. Знаково – ранговый критерий Уилкоксона для сравнения средних. Двухфакторный дисперсионный анализ по Фридману.

Критерий φ * - угловое преобразование Фишера. Q – критерий Розенбаума. Н – критерий Крускала – Уолисса.

Интервальные шкалы. Стэны. Критерий рандомизации.

Использование статистических таблиц.

Требования к компетентности:

знать:

– методыопределения типов данных в педагогике и психологии, назначние методов непараметрической статистики в зависимости от типа данных, назначение статистических таблиц;

уметь:

– планировать процесс математико–статистической обработки экспериментальных данных, распределение которых отличается от нормального;

– практически рассчитывать статистические задачи, возникающие в педагогике и психологии;

– пользоваться статистическими таблицами при проведении расчетов и формировании выводов и заключений;

– анализировать полученные результаты.

1. Артемьева Е.Ю., Мартынов Е.М. Вероятностные методы в психологии. – М.: Изд-во Московского университета. – 1975. – 206 с.

2. Гласс Дж., Стенли Дж. Статистические методы в педагогике и психологии. – М.: Прогресс. – 1976. – 494 с.

3. Гнеденко В.В. Курс теории вероятностей. – М.: Наука. – 1973. – 400 с.

4. Ермолаев О.Ю. Математическая статистика для психологов. – М.: Флинта. – 2003. – 336с.

5. Кендалл М., Стюарт А. Статистические выводы и связи. – М.: Наука. – 1973.

6. Кокс Д., Снелл Э. Прикладная статистика: принципы и примеры. – М.: Мир. – 1984.

7. Крылов В.Ю. Геометрическое представление данных психологических исследований. – М.: Наука. – 1990.

8. Лакин Г.Ф. Биометрия. – М.: Высшая школа. – 1973. – 343 с.

9. Лбов Г.С. Методы обработки разнотипных данных. – М.: Наука. – 1981.

10. Математические методы в исследованиях индивидуальной и групповой деятельности п/ред. Крылова В.Ю. – М.: Наука. – 1990.

11. Мацкевич И.П., Свирид Г.П. Высшая математика. Теория вероятностей и математическая статистика. – Мн.: Вышэйшая школа. – 1993. – 269 с.

12. Митропольский А.К. Техника статистических вычислений. – М.: Наука. – 1971.

13. Основы математической статистики. Учебное пособие для институтов физической культуры п/ред. В.С. Иванова. – М.: Физкультура и спорт. – 1990. – 174 с.

14. Поллард Дж. Справочник по вычислительным методам статистики. – М.: Финансы и статистика. – 1982. – 343 с.

15. Ракицкий П.Ф. Биологическая статистика. – Мн.: Вышэйшая школа. – 1967. – 396 с.

16. Сидоренко Е.В. Методы математической обработки в психологии. С.-Петербург. – 1996. – 349 с.

17. Справочник по прикладной статистике п/ред. Ллойда и др. – М.: Финансы и статистика. – 1989.

18. Суходольский Г.В. Основы математической статистики для психологов. – Изд-во Ленинградского университета. – 1998. – 461 с.

19. Холлендер М., Вулф Д.А. Непараметрические методы статистики. М.: Финансы и статистика. – 1983. – 517 с.

20. Эренберг А. Анализ и интерпретация статистических данных. – М.: Финансы и статистика. – 1981. – 406 с.

Методами статистической обработки результатов эксперимента называются математические приемы, формулы, способы количественных расчетов, с помощью которых показатели, получаемые в ходе эксперимента, можно обобщать, приводить в систему, выявляя скрытые в них закономерности. Речь идет о таких закономерностях статистического характера, которые существуют между изучаемыми в эксперименте переменными величинами.

Содержание
Работа состоит из 1 файл

реферат 1.docx

4. Методы выявления внутренней статистической структуры эмпирических данных (например, факторный анализ). Рассмотрим каждую из выделенных подгрупп методов вторичной статистической обработки на примерах.

2.1 Регрессионное исчисление

Регрессионное исчисление - это метод математической статистики, позволяющий свести частные, разрозненные данные к некоторому линейному графику, приблизительно отражающему их внутреннюю взаимосвязь, и получить возможность по значению одной из переменных приблизительно оценивать вероятное значение другой переменной.

Графическое выражение регрессионного уравнения называют линией регрессии. Линия регрессии выражает наилучшие предсказания зависимой переменой (Y) по независимым переменным (X).

Регрессию выражают с помощью двух уравнений регрессии, которые в самом прямом случае выглядят, как уравнения прямой.

Y = a 0 + a 1 * X (1)

X = b 0 + b 1 * Y (2)

В уравнении (1) Y - зависимая переменная, X - независимая переменная, a 0 - свободный член, a 1 - коэффициент регрессии, или угловой коэффициент, определяющий наклон линии регрессии по отношению к осям координат.

В уравнении (2) X - зависимая переменная, Y - независимая переменная, b 0 - свободный член, b 1 - коэффициент регрессии, или угловой коэффициент, определяющий наклон линии регрессии по отношению к осям координат.

Количественное представление связи (зависимости) между Х и Y (между Y и X) называется регрессионным анализом. Главная задача регрессионного анализа заключается в нахождении коэффициентов a 0, b 0, a1и b 1 и определении уровня значимости полученных аналитических выражений, связывающих между собой переменные Х и У.

При этом коэффициенты регрессии a 1 и b 1 показывают, насколько в среднем величина одной переменной изменяется при изменении на единицу меры другой. Коэффициент регрессии a 1 в уравнении можно подсчитать по формуле:

а коэффициент b 1 в уравнении по формуле

где ryx - коэффициент корреляции между переменными X и Y;

Sx - среднеквадратическое отклонение, подсчитанное для переменной X;

Sy - среднеквадратическое отклонение, подсчитанное для переменной У/

Для применения метода линейного регрессионного анализа необходимо соблюдать следующие условия:

1. Сравниваемые переменные Х и Y должны быть измерены в шкале интервалов или отношений.

2. Предполагается, что переменные Х и Y имеют нормальный закон распределения.

3. Число варьирующих признаков в сравниваемых переменных должно быть одинаковым.

2.2 Корреляция

Следующий метод вторичной статистической обработки, посредством которого выясняется связь или прямая зависимость между двумя рядами экспериментальных данных, носит название метод корреляций. Он показывает, каким образом одно явление влияет на другое или связано с ним в своей динамике. Подобного рода зависимости существуют, к примеру, между величинами, находящимися в причинно-следственных связях друг с другом. Если выясняется, что два явления статистически достоверно коррелируют друг с другом и если при этом есть уверенность в том, что одно из них может выступать в качестве причины другого явления, то отсюда определенно следует вывод о наличии между ними причинно-следственной зависимости.

Когда повышение уровня одной переменной сопровождается повышением уровня другой, то речь идёт о положительной корреляции. Если же рост одной переменной происходит при снижении уровня другой, то говорят об отрицательной корреляции. При отсутствии связи переменных мы имеем дело с нулевой корреляцией.

Имеется несколько разновидностей данного метода:

Линейный корреляционный анализ позволяет устанавливать прямые связи между переменными величинами по их абсолютным значениям. Эти связи графически выражаются прямой линией, отсюда название "линейный". Ранговая корреляция определяет зависимость не между абсолютными значениями переменных, а между порядковыми местами, или рангами, занимаемыми ими в упорядоченном по величине ряду. Парный корреляционный анализ включает изучение корреляционных зависимостей только между парами переменных, а множественный, или многомерный, - между многими переменными одновременно. Распространенной в прикладной статистике формой многомерного корреляционного анализа является факторный анализ.

Коэффициент линейной корреляции определяется при помощи следующей формулы:

где rxy - коэффициент линейной корреляции;

х, у - средние выборочные значения сравниваемых величин;

хi, уi - частные выборочные значения сравниваемых величин;

n - общее число величин в сравниваемых рядах показателей;

S 2 x, S 2 y - дисперсии, отклонения сравниваемых величин от средних значений.

К коэффициенту ранговой корреляции в психолого-педагогических исследованиях обращаются в том случае, когда признаки, между которыми устанавливается зависимость, являются качественно различными и не могут быть достаточно точно оценены при помощи так называемой интервальной измерительной шкалы. Интервальной называют такую шкалу, которая позволяет оценивать расстояния между ее значениями и судить о том, какое из них больше и насколько больше другого. Например, линейка, с помощью которой оцениваются и сравниваются длины объектов, является интервальной шкалой, так как, пользуясь ею, мы можем утверждать, что расстояние между двумя и шестью сантиметрами в два раза больше, чем расстояние между шестью и восемью сантиметрами. Если же, пользуясь некоторым измерительным инструментом, мы можем только утверждать, что одни показатели больше других, но не в состоянии сказать на сколько, то такой измерительный инструмент называется не интервальным, а порядковым.

Большинство показателей, которые получают в психолого-педагогических исследованиях, относятся к порядковым, а не к интервальным шкалам (например, оценки типа "да", "нет", "скорее нет, чем да" и другие, которые можно переводить в баллы), поэтому коэффициент линейной корреляции к ним неприменим. В этом случае обращаются к использованию коэффициента ранговой корреляции, формула которого следующая:

где Rs - коэффициент ранговой корреляции по Спирмену;

di - разница между рангами показателей одних и тех же испытуемых в упорядоченных рядах;

n - число испытуемых или цифровых данных (рангов) в коррелируемых рядах.

Метод множественных корреляций в отличие от метода парных корреляций позволяет выявить общую структуру корреляционных зависимостей, существующих внутри многомерного экспериментального материала, включающего более двух переменных, и представить эти корреляционные зависимости в виде некоторой системы.

Для применения частного коэффициента корреляции необходимо соблюдать следующие условия:

1. Сравниваемые переменные должны быть измерены в шкале интервалов или отношений.

2. Предполагается, что все переменные имеют нормальный закон распределения.

3. Число варьирующих признаков в сравниваемых переменных должно быть одинаковым.

4. Для оценки уровня достоверности корреляционного отношения Пирсона следует пользоваться формулой (11.9) и таблицей критических значений для t-критерия Стьюдента при k = n - 2.

2.3 Факторный анализ

Факторный анализ - статистический метод, который используется при обработке больших массивов экспериментальных данных. Задачами факторного анализа являются: сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, т.е. классификация переменных, поэтому факторный анализ используется как метод сокращения данных или как метод структурной классификации.

Важное отличие факторного анализа от всех описанных выше методов заключается в том, что его нельзя применять для обработки первичных, или, как говорят, "сырых", экспериментальных данных, т.е. полученных непосредственно при обследовании испытуемых. Материалом для факторного анализа служат корреляционные связи, а точнее - коэффициенты корреляции Пирсона, которые вычисляются между переменными (т.е. психологическими признаками), включенными в обследование. Иными словами, факторному анализу подвергают корреляционные матрицы, или, как их иначе называют, матрицы интеркорреляций. Наименования столбцов и строк в этих матрицах одинаковы, так как они представляют собой перечень переменных, включенных в анализ. По этой причине матрицы интеркорреляций всегда квадратные, т.е. число строк в них равно числу столбцов, и симметричные, т.е. на симметричных местах относительно главной диагонали стоят одни и те же коэффициенты корреляции.

Главное понятие факторного анализа - фактор. Это искусственный статистический показатель, возникающий в результате специальных преобразований таблицы коэффициентов корреляции между изучаемыми психологическими признаками, или матрицы интеркорреляций. Процедура извлечения факторов из матрицы интеркорреляций называется факторизацией матрицы. В результате факторизации из корреляционной матрицы может быть извлечено разное количество факторов вплоть до числа, равного количеству исходных переменных. Однако факторы, выделяемые в результате факторизации, как правило, неравноценны по своему значению.

С помощью выявленных факторов объясняют взаимозависимость психологических явлений.

Чаще всего в итоге факторного анализа определяется не один, а несколько факторов, по-разному объясняющих матрицу интеркорреляций переменных. В таком случае факторы делят на генеральные, общие и единичные. Генеральными называются факторы, все факторные нагрузки которых значительно отличаются от нуля (нуль нагрузки свидетельствует о том, что данная переменная никак не связана с остальными и не оказывает на них никакого влияния в жизни). Общие - это факторы, у которых часть факторных нагрузок отлична от нуля. Единичные - это факторы, в которых существенно отличается от нуля только одна из нагрузок.

Факторный анализ может быть уместен, если выполняются следующие критерии:

1. Нельзя факторизовать качественные данные, полученные по шкале наименований, например, такие, как цвет волос (черный / каштановый / рыжий) и т.п.

2. Все переменные должны быть независимыми, а их распределение должно приближаться к нормальному.

3. Связи между переменными должны быть приблизительно линейны или, по крайней мере, не иметь явно криволинейного характера.

4. В исходной корреляционной матрице должно быть несколько корреляций по модулю выше 0,3. В противном случае достаточно трудно извлечь из матрицы какие-либо факторы.

5. Выборка испытуемых должна быть достаточно большой. Рекомендации экспертов варьируют. Наиболее жесткая точка зрения рекомендует не применять факторный анализ, если число испытуемых меньше 100, поскольку стандартные ошибки корреляции в этом случае окажутся слишком велики.

Однако если факторы хорошо определены (например, с нагрузками 0,7, а не 0,3), экспериментатору нужна меньшая выборка, чтобы выделить их. Кроме того, если известно, что полученные данные отличаются высокой надежностью (например, используются валидные тесты), то можно анализировать данные и по меньшему числу испытуемых.

Если данные, полученные в эксперименте, качественного характера, то правильность делаемых на основе их выводов полностью зависит от интуиции, эрудиции и профессионализма исследователя, а также от логики его рассуждений. Если же эти данные количественного типа, то сначала проводят их первичную, а затем вторичную статистическую обработку.

Проведение анализа формы гистограммы и выдвижение гипотезы о законе распределения физической величины Во многих случаях при изучении статистических данных (выборки) необходимо знать закон распределения генеральной совокупности. Для этого проводится сравнение формы гистограммы с внешним видом закономерностей законов распределения. Делается предположение о законе изменения физической величины, т… Читать ещё >

  • статистические методы контроля качества и обработка экспериментальных данных

Статистические методы обработки данных ( реферат , курсовая , диплом , контрольная )

Математические законы теории вероятностей не являются беспредметными абстракциями, лишенными физического содержания, а представляют собой математическое выражение реальных закономерностей, существующих в массовых случайных явлениях [23]. Теория вероятностей дает возможность определить вероятности событий, законы распределения и числовые характеристики случайных величин, но для того, чтобы провести обработку и представить данные, необходимо провести эксперимент, применить (разработать) метод фиксации данных.

Раздел математики, изучающий методы сбора, систематизации и обработки результатов наблюдений с целью выявления статистических закономерностей, получил название математическая статистика (рис. 11).

Направления математической статистики.

Рис. 11. Направления математической статистики

В связи с этим основной задачей, решаемой математической статистикой, является [23] определение закона распределения случайной величины и нахождение числовых характеристик распределения либо вида функции отклика и ее параметров.

Методы математической статистики используются при планировании организации производства, анализе технологических процессов, для контроля качества продукции и многих других целей.

Определение закона распределения случайной величины

Для определения закона распределения, описывающего заданную выборку (набор экспериментальных данных), необходимо сравнить две выборки данных: экспериментальную и теоретическую, для чего требуется выполнить следующие шаги.

1. Группировка данных и построение гистограммы Для построения гистограммы данные группируют, для чего диапазон изменения значений выборки разбивают на несколько равных интервалов к шириной.

Статистические методы обработки данных.

Рекомендации по выбору количества интервалов

где хтт и jcmax — соответственно минимальное и максимальное значения в выборке xN>. Количество интервалов к согласно различным рекомендациям [24] может получиться разным, а при больших объемах выборок п достаточно большим.

Можно воспользоваться рекомендациями Всероссийского научно-исследовательского института метрологии (табл. 6) [24, 25].

Далее, для каждого интервала подсчитывается количество попадающих в него значений т. Затем для каждого интервала вычисляется относительная частота (3).

По полученным данным строится гистограмма (см. рис. 3).

2. Проведение анализа формы гистограммы и выдвижение гипотезы о законе распределения физической величины Во многих случаях при изучении статистических данных (выборки) необходимо знать закон распределения генеральной совокупности. Для этого проводится сравнение формы гистограммы с внешним видом закономерностей законов распределения. Делается предположение о законе изменения физической величины, т. е. выдвигается статистическая гипотеза о том, что генеральная совокупность распределена по выбранному закону. Данная гипотеза является основной (нулевой) гипотезой Н0.

Одновременно с основной гипотезой //0 выдвигается альтернативная гипотеза Н, являющаяся логическим отрицанием гипотезы Я0 и принимаемая при отвержении гипотезы Н0.

После выдвижения гипотезы вычисляются значения функции распределения (плотности вероятности и т. д. ) для экспериментальной выборки в ряде точек по принятому закону.

3. Проверка правдоподобия гипотезы о законе распределения Проверка статистической гипотезы означает проверку согласования исходных выборочных данных (выборки) с выдвинутой основной гипотезой.

При этом возможны две ситуации — основная гипотеза:

Таким образом, при проверке статистических гипотез существует вероятность допустить две ошибки: или, соответственно:

  • • опровергнуть верную гипотезу — ошибка первого рода а;
  • • принять ложную гипотезу — ошибка второго рода (3.

Вероятность совершения ошибки первого рода называется уровнем значимости. Чаще принимаются уровни значимости а= 0,05; 0,01; 0,001, которые называют пятипроцентным, однопроцентным и 0,1%-м [26].

ЗАДАНИЕ НА ВЫПОЛНЕНИЕ КУРСОВОЙ РАБОТЫ 3
ВВЕДЕНИЕ 4
РАЗДЕЛ 1. ИСТОРИЯ РАЗВИТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 5
РАЗДЕЛ 2. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ 6
2.1. Основные законы распределения непрерывных случайных величин 6
2.1.1. Функция распределения вероятностей случайнойвеличины 6
2.1.2. Числовые характеристики случайных величин 6
2.1.3. Равномерное распределение вероятностей 8
2.1.4. Показательное распределение вероятностей 9
2.1.5. Нормальное распределение 10
2.2. Анализ статистических распределений 12
2.2.1. Выборочная совокупность 12
2.2.2. Статистические оценки параметров распределения 13
2.2.3. Методмоментов 14
2.2.4. Проверка статистических гипотез 16
РАЗДЕЛ 3. ИССЛЕДОВАНИЕ ВЫБОРОЧНЫХ СОВОКУПНОСТЕЙ 20
3.1. Статистический анализ выборочных совокупностей 20
3.1.1. Составление статистических распределений 21
3.2. Вычисление параметров статистических распределений 25
3.3. Установление законов распределения выборочных совокупностей 29
3.3.1. Сопоставление видаплотности эмпирического и теоретического распределений 29
3.3.2. Формулировка нулевой гипотезы 31
3.3.3. Сравнение коэффициентов асимметрии, эксцессы и коэффициентов вариации статистических и теоретических распределений 31
3.3.4. Проверка гипотезы о равномерном распределении выборки 1 32
3.3.5. Проверка гипотезы о нормальном распределении выборки 2 35
3.3.6. Проверкагипотезы о показательном распределении выборки 3 38
ЗАКЛЮЧЕНИЕ 41
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 43


ЗАДАНИЕ НА ВЫПОЛНЕНИЕ КУРСОВОЙ РАБОТЫ

Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных - результатов наблюдений.

Современнаяматематическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирование эксперимента), в ходе исследования (последовательный анализ) и решает многие другие задачи. Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности.

Целью курсовой работы является формирование умения анализировать статистические данные иопределять их распределения. Выполнение курсовой работы обеспечивает углубление знаний о математических моделях вероятностных явлений, методах оценки параметров распределений и проверки статистических гипотез, а также развивает навыки работы с графическими и статистическими программами.

Методика обработки экспериментальных данных

Вся процедура обработки экспериментальных данных может быть разделена на два этапа. На первом производится первичная обработка сведений, полученных при проведении эксперимента по химическому равновесию, с целью определения значений констант равновесия. К этому же этапу относится и статистическая обработка данных, позволяющая провести выбраковку ошибочных сведений.

На втором этапе полученные значения констант равновесия подвергаются анализу c целью непосредственного определения роли энтальпийного и энтропийного факторов в равновесии позиционной изомеризации изучаемых веществ и выработки подходов к прогнозированию равновесия превращений родственных структур.

4.1. Первичная обработка экспериментальных данных

Первичная обработка результатов исследования химического равновесия основана на рекомендациях [38, 101-104] и включала в себя следующее.

Расчет отношений концентраций компонентов, характеризующих константы равновесия изучаемых реакций.

Анализ изученных отношений с целью установления момента достижения равновесия и включения в обработку только равновесных данных.

Исключение грубых ошибок внутри серии определений константы равновесия. Для каждой температуры исследования сериями считали опыты, различающиеся между собой либо составом исходной смеси, либо количеством катализатора. Отбраковку промахов в сериях проводили с использованием критерия - наибольшего по абсолютной величине нормированного выборочного отклонения:

,где - значение константы равновесия; - среднее арифметическое значение константы равновесия в серии j; - смещенная дисперсия ; - число результативных определений константы равновесия в серии j.

Процентные точки наибольшего по абсолютной величине нормированного выборочного отклонения заимствованы из работы [102].

Расчет среднего арифметического значения константы равновесия и дисперсии воспроизводимости в сериях после исключения грубых ошибок:

Сопоставление дисперсий воспроизводимости констант равновесия в сериях при одной температуре. Эта стадия дисперсионного анализа является весьма полезной, так как позволяет контролировать ошибки воспроизводимости, возникающие на всех этапах получения экспериментальной информации. Проверку равенства дисперсий воспроизводимости в сериях выполняли по двум критериям: Фишера - если число серий равнялось двум и Бартлетта - когда количество серий превышало два [38, 102]. Если нуль-гипотеза выполнялась, то дисперсию воспроизводимости вычисляли по следующей формуле:

Для всех изученных в данной работе превращений дисперсии воспроизводимости констант равновесия в сериях были однородны.

Расчет среднего значения константы равновесия для каждой температуры исследования:

Проверку значимости расхождения средних значений констант равновесия в сериях. Для этого вычисляли дисперсию :

где m - число серий, j - вес серии j, равный числу определений nj.

Величина характеризовала рассеяние значений относительно . Число степеней свободы дисперсии равнялось . Проверку гипотезы равенства средних значений констант равновесия в сериях проводили с помощью распределения Фишера. Если нуль-гипотеза выполнялась, то вычисляли сводную дисперсию

с числом степеней свободы . На этом обработка заканчивалась.

Для всех исследованных реакций расхождения между серийными константами равновесия не превышали дисперсии воспроизводимости, что указывало на отсутствие систематических отклонений.

4.2. Анализ равновесных данных

Полученные значения констант равновесия анализировались с помощью подхода, основанного на последовательном исключении из исходной жидкофазной константы равновесия вкладов, обусловленных:

симметрией внешнего вращения молекул,

вращением молекулы как целого,

вращением отдельных групп в молекулах реагентов.

Результатом подобного исключения является переход к газофазной константе равновесия , рассчитываемой следующим образом:

где - бессимметрийная газофазная константа равновесия реакции, DS(or) = S o II,g,(or) - S o I,g,(or); DS(mix) = S o II,g,(mix) - S o I,g,(mix); DS(vib) = S o II,g,(vib) - S o I,g,(vib); DS(ir) = S o II,g,(ir) - S o I,g,(ir).- соответственно, энтропийные вклады, обусловленные вращением молекулы как целого, смешением конформеров, колебательным движением и заторможенным вращением групп в молекуле, рассчитываемые как разность соответствующих энтропийных составляющих конечных (II) и исходных веществ (I).

Анализ констант равновесия проводился следующим образом.

Путем исключения вклада на симметрию молекул находилась бессимметрийная жидкофазная константа реакции , здесь числа симметрии s формируются на основании как симметрии наружного вращения молекулы, так и симметрии внутреннего вращения тех групп, симметрия которых не может быть учтена при анализе энтропийного вклада, обусловленного внутренним вращением. Для систем, рассмотренных в данной работе, такими группами были фениленовые фрагменты.

Путем снятия вклада на межмолекулярные взаимодействия рассчитывалась бессимметрийная газофазная константа равновесия реакции . Давления насыщенного пара рассчитывались методом Ли-Кеслера [50] или по экспериментальным данным. Применение к расчету давлений насыщенного пара методики, описанной в главе 2.1, позволяет обеспечить погрешность расчета не более 10% отн. для всех давлений, приведенных в данной работе. Вопросы расчета критических температур и давлений (Tc и Pc) изложены в главе 2, ацентрические факторы (w) рассчитывались по уравнению Ли-Кеслера [50].

Остальные вклады требовали привлечения информации о геометрии, энергетических характеристиках молекул и частотах колебательного спектра. Для получения подобной информации нами использовались различные расчетные методы. Окончательная обработка информации и вычисление энтропийных вкладов выполнялась с помощью программы Entropy, описание которой будет приведено в п. 4.3.

Геометрия молекулы оптимизировалась методом молекулярной механики (силовое поле MMX на базе силового поля Аллинджера MM2) программой PCModel 3.2. Для оптимизации молекул бифенилов использовалась PCModel 4.0, обладающая большими возможностями при расчетах в p-электронных системах. Выходной информацией являлись оптимизированная геометрия молекулы для наиболее устойчивого конформера и информация об изменении энергии молекулы при вращении каждого из волчков, сохраняемые в отдельных файлах. Для формирования потенциальной кривой барьера вращения каждого из волчков использовались значения потенциальной энергии молекулы при изменении двугранного угла между избранными связями волчка и остова от 0 о до 360 о с шагом 10 о , при этом на каждом фиксированном значении угла проводилась оптимизация геометрии молекулы.

На основании сведений о геометрии молекулы рассчитывалось произведение главных центральных моментов инерции IAIBIC , являющееся свободным членом кубического уравнения

где , , , , , - моменты инерции молекулы (здесь n - число атомов в молекуле; mi - масса i-го атома; xi, yi, zi - координаты i-го атома в системе координат с центром, находящемся в центре инерции молекулы). Отсюда

В дальнейшем рассчитывалась сумма состояний жесткого ротатора

и вклад в энтропию, обусловленный вращением молекулы как целого

где s - число симметрии молекулы, h - постоянная Планка, k - постоянная Больцмана.

На основании полученных ранее сведений об изменении энергии молекулы при вращении каждой из ее групп рассчитывался вклад в энтропию от смешения конформеров

где m - общее количество конформеров (в нашем случае учитывались все состояния, полученные при повороте волчка от 0 о до 350 о с шагом 10 о , то есть m=36•n, где n - число вращающихся групп в молекуле), xi - мольная доля каждой конформации

где n - число вращающихся групп в молекуле, m - количество конформеров, Ei - энергия молекулы в данном состоянии равная , где - исходное значение энергии, - наименьшая энергия молекулы, полученная при вращении всех возможных волчков.

Для нахождения вклада в энтропию, обусловленного колебательным движением были использованы расчетные значения частот колебательного спектра, полученные полуэмпирическим методом PM3 (HyperChem 5.0) для оптимизированной тем же методом геометрии молекулы. Критерием качества оптимизации служило отсутствие в спектре отрицательных значений частот.

Расчет вклада в энтропию, обусловленного колебательным движением производился следующим образом.

где нi - частота из принятого к расчету набора, m - количество частот в наборе. Из полного набора частот колебательного спектра исключены крутильные колебания, соответствующие вращению групп, участвующих в расчете вклада в энтропию от заторможенного вращения, таким образом , где n - число атомов в молекуле, ntop - число волчков. При отсутствии надежных методик определения крутильных колебаний в спектре нами применялась приближенная оценка типов колебаний с использованием режима Animate программы HyperChem 5.0.

Информация о геометрии молекулы и потенциальных кривых барьеров вращения волчков использовалась для расчета вклада в энтропию, обусловленного внутренним вращением групп в молекуле. Энтропийный вклад определялся как

здесь n - число максимумов потенциальной кривой барьера вращения группы, s- число симметрии группы (подходы к определению чисел симметрии вращающихся групп были рассмотрены в главе 1), Sfr - энтропия свободного вращения волчка, - разность между энтропиями свободного и заторможенного вращения, определяемая по таблицам Питцера и Гуинна [21] как функция и , где Vo - эффективный барьер вращения волчка, Qfr - статистическая сумма по состояниям свободного внутреннего вращения.

Величина эффективного барьера вращения принималась равной , где - зависимость изменения потенциальной энергии молекулы от угла поворота волчка ц. Для расчета Vo полученные методом молекулярной механики значения потенциальной энергии молекулы при заданных значениях угла поворота волчка описывались с помощью кубического сплайна, затем полученный сплайн интегрировался по методу Симпсона.

Статистическая сумма по состояниям свободного внутреннего вращения рассчитывалась как , где Iпр - приведенный момент инерции волчка, который рассчитывался в соответствии со следующей процедурой [105].

Для вращающейся группы вводится координатная система с осями x, y, z, расположенными следующим образом: ось z совпадает с осью вращения волчка, ось x проходит через центр масс волчка и перпендикулярна оси z, ось y проходит через точку пересечения осей x, z и перпендикулярна к ним. Атомы волчка, лежащие на оси z из дальнейшего рассмотрения исключаются. Далее производится расчет следующих величин: - момент инерции волчка относительно оси z, и - произведения моментов инерции, - фактор несбалансированности волчка.

Затем находятся направляющие косинусы осей x, y, z относительно главных центральных осей 1, 2, 3 инерции молекулы. Направление осей выбирается таким образом, чтобы обе системы координат были или правыми или левыми. При этом должно соблюдаться условие равенства единице определителя матрицы направляющих косинусов, то есть

что может использоваться для проверки правильности определения направляющих косинусов.

Приведенный момент инерции рассчитывается следующим образом:

где . Здесь r ( i ) - проекции на главные оси инерции молекулы вектора, направленного из центра тяжести молекулы в центр координат волчка, индекс i принимает значения 1, 2, 3 в циклическом порядке, то есть при i=1 индекс i-1 равен 3, а индекс i+1 при i=3 равен 1.

В ходе анализа для изучения влияния каждого из энтропийных вкладов на константу равновесия рассматривался следующий ряд величин, получаемых при последовательном исключении из исходной константы равновесия Kx каждого из обозначенных ранее энтропийных вкладов:

Бессимметрийная константа равновесия в жидкой фазе -

Бессимметрийная константа равновесия в газовой фазе -

с исключенным вкладом на вращение молекулы как целого -

“Существенная” газофазная константа равновесия, полученная после исключения из вклада на смешение конформеров -

с исключенным вкладом от колебательного движения -

после исключения вклада на внутреннее вращение -

Значения энтропийных вкладов и констант равновесия для изученных превращений приводится в табл. 5.1.

Одной из целей данной работы является совершенствование подхода к прогнозированию химического равновесия в реакциях позиционной изомеризации алкилароматических углеводородов и их функциональных производных. При прогнозировании констант равновесия с использованием уравнения

необходима как можно более достоверная информация об энтальпии и изменении энтропии реакции. При этом экспериментальные данные по указанным свойствам не охватывают весь набор веществ, представляющих практический и теоретический интерес. Таким образом, при прогнозировании приходится прибегать к расчетным методам.

Расчет энтальпии реакции, как правило, производится при помощи аддитивных методов с учетом эффектов взаимодействия заместителей, полученных на основе экспериментальных калориметрических данных.

Использование аддитивных методов при прогнозировании энтропии веществ более проблематично по причине особой природы этого свойства, несмотря на то, что такие методы развиты и применяются при массовых расчетах термодинамических свойств органических веществ [50, 111]. Лучшим, на наш взгляд, подходом является расчет изменения энтропии реакций в соответствии с методами статистической термодинамики [21, 105, 106, 112], где свойство представляется в виде суммы вкладов различных видов движения молекул:

В связи с тем, что в данной работе рассматриваются реакции позиционной изомеризации, вклад поступательного движения молекул () и вклад электронных состояний молекул () принимаются равными нулю вследствие равенства значений соответствующих составляющих энтропии у изомерных молекул. Методики расчета остальных составляющих энтропии описаны ранее в данном разделе.

В заключение следует остановиться еще на одном вопросе.

Очевидным является факт существования температурных зависимостей у вкладов, обусловленных смешением конформеров, колебательным движением и внутренним вращением, причем вид и параметры этих зависимостей определяются структурой молекул. Таким образом, при проведении анализа исключение указанных энтропийных вкладов приводит к изменению энтальпийного эффекта реакции при переходе от к . То есть, в общем случае, формирование дополнительной энтальпийной шкалы [12, 144] с самостоятельным набором эффектов взаимодействия заместителей в молекуле представляется вполне обоснованным.

Эти эффекты должны корректно описывать равновесие превращений при условии, что для последних выполняется условие =0.

Источником значений подобных эффектов служит эксперимент по химическому равновесию. Значения этих эффектов являются зависимыми от набора методов, с помощью которых рассчитываются энтропийные вклады в константу равновесия, особенно вклады, обусловленные внутренним вращением групп в молекулах и смешением конформеров. Поэтому результативным при прогнозировании может быть только совместное использование указанных энтальпийных эффектов и всей совокупности рекомендуемых расчетных методов.

Учитывая то, что для позиционных изомеров в сравнительно узком (100-150 К) температурном интервале изменения с температурой невелико [21], следует ожидать небольших изменений с температурой отдельных вкладов и энтальпийных эффектов при переходе от к . Это в идеале предполагает отсутствие необходимости формирования дополнительной шкалы для эффектов взаимодействия заместителей в молекуле.

Читайте также: