Программные средства обработки статистических данных реферат

Обновлено: 06.07.2024

Осн. цель регресс. анализа: 1. необходимо построить форму корреляционной связи, 2. необходимо оценить силу коррел. связи. В кач-ве уравнения регрессии чаще всего использ. линейное уравнение у=ао+вх. Даже когда связь имеет нелинейную форму, она различными способами приводится к линейной зависимости. Для выполнения регрессионного анализа Exel предлагает 5 осн. ф-ций: ПРИБЛ ЛИНЕЙН нахождение… Читать ещё >

Программные средства для статистического анализа данных ( реферат , курсовая , диплом , контрольная )

Предварительный анализ данных: Exel (сред. значение, дисперсия), анализ данных — надстройка Exel, Statistica.

Для выполнения регрессионного анализа Exel предлагает 5 осн. ф-ций: ПРИБЛ ЛИНЕЙН нахождение коэф-тов уравнения, РОСТ ТЕНДЕНЦИЯ — использ. для предсказания поведения модели, ПРЕДСКАЗ — оценка значений, кот. выходят за интервал наблюдений, дисперсия, среднее, среднее кв. отклонение, коэф. корреляции.

Корреляционный и регрессионный анализ данных

Проведение коррел. анализа позволяет ответить на вопрос, имеется ли статистическая связь между исследуемым показателем качества и управляемым фактором и какова теснота этой связи. Метод регрессионного анализа (метод наименьших квадратов) позволяет математически описать связь между независимой переменной Х и зависимой величиной У и найти ф-цию У=f (Х) Во многих научно-исследовательских задачах требуется установить и оценить зависимость изучаемых величин У от одной или нескольких величин Х.

Осн. цель регресс. анализа: 1. необходимо построить форму корреляционной связи, 2. необходимо оценить силу коррел. связи. В кач-ве уравнения регрессии чаще всего использ. линейное уравнение у=ао+вх. Даже когда связь имеет нелинейную форму, она различными способами приводится к линейной зависимости.

Коэф. коррел. подбирают таким образом, чтобы отклонения реальных значений от расчетных были минимальными. Рассматривают среднеквадратическое уравнение. Метод нахождения наименьшего отклонения называют методом наименьших квадратов.

Модели регрессии получают путем об-ки выборочных данных могут использоваться для прогноза значений зависимого параметра У. Достаточно часто статистический анализ позволяет выделить более одного фоктора, влияющего на зависимый параметр. Коррел. зависимость, кот. описывает связь между несколькими параметрами — множественная. Соответствующее ур-ние регрессии — ур-ние множественной регрессии у=ао1х1+…+апхп. Определение коэф. регрессии осуществляется по матрице планирования, используя средние результаты по опытам и знаки матрицы планирования.

Программный продукт, предназначенный для статистической обработки данных. Отечественные статистические пакеты, представленные на рынке. Статистические пакеты STATA, STADIA, SPSS, STATISTICA и др., их особенности, возможности, преимущества и недостатки.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 30.01.2014
Размер файла 18,5 K

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Статистический пакет - программный продукт, предназначенный для статистической обработки данных.

Являются надежным инструментом повышения качества принимаемых решений. В пакет, как правило, входит: деловая графика, дисперсионный анализ, регрессионный анализ, анализ временных рядов и пр.

Для успешной работы любой организации в условиях рынка и конкуренции, конечно, необходим тщательный анализ имеющейся информации о создании продукции, её сбыте, эксплуатации, а также анализ информации о конкурентах и т. п. Конечно можно положиться на интуицию, но, скорее всего, правильное решение будет принято, только если у вас имеется огромный многолетний опыт в этой сфере деятельности. Но можно (и даже нужно, несмотря на весь опыт) пойти другим путём -- воспользоваться специальными средствами для обработки информации. И вот здесь-то и потребуется профессионализм -- необходимо правильно выбрать программное обеспечение, корректно ввести информацию, которую вы хотите проанализировать, выбрать методы и алгоритмы для решения именно этой задачи и многое другое.

Можно выделить 2 вида статистических пакетов.

Из зарубежных пакетов это STATGRAPHICS, SPSS, SYSTAT, BMDP,SAS, CSS, STATISTICA, S-plus, и др. Из отечественных можно назвать такие пакеты, как STADIA, ЭВРИСТА, МЕЗОЗАВР, ОЛИМП: Стат-Эксперт, Статистик-Консультант, САНИ, КЛАСС-МАСТЕР и др.

Отечественные статистические пакеты, которые устойчиво представлены на рынке в течение последних лет, в значительной степени лишены таких недостатков, которые есть у западных продуктов. Они предполагают наличие широкого первоначального статистического образования, доступной литературы и консультационных служб. Поэтому они содержат мало экранных подсказок и требуют внимательного изучения документации на английском языке.

Одним из обязательных этапов любого научного исследования является статистический анализ данных. Продолжительное время анализ медицинских данных был уделом специалистов, так как это требовало серьезной предварительной подготовки. С появлением и совершенствованием современных программ обработки данных статистическая обработка поднялась на новый уровень. Теперь исследователь-медик может и не иметь математической подготовки. Достаточно оперировать статистическими понятиями и, самое главное, правильно выбрать метод анализа. Все осуществимо благодаря компьютеру и новейшим программам.

Все программы статистической обработки данных можно разделить на профессиональные, полупрофессиональные (популярные) и специализированные. Статистические программы относятся к наукоемкому программному обеспечению, цена их часто недоступна индивидуальному пользователю. Профессиональные пакеты имеют большое количество методов анализа, популярные пакеты - количество функций, достаточное для универсального применения. Специализированные же пакеты ориентированы на какую-либо узкую область анализа данных. Создатели программных статистических пакетов заявляют, что их продукт превосходит аналоги. Отсутствие у большинства исследователей времени для освоения нескольких программ, делает непростым ее выбор. В данной статье приведена базовая информация о присутствующих на рынке основных полупрофессиональных программных пакетах пригодных для статистической обработки биомедицинских данных.

STADIA. Программа отечественной разработки с 16-и летней историей. Включает в себя все необходимые статистические функции. Она прекрасно справляется со своей задачей - статистическим анализом. Но. Программа внешне фактически не изменяется с 1996 года. Графики и диаграммы, построенные при помощи STADIA, выглядят в современных презентациях архаично. Цветовая гамма программы (красный шрифт на зеленом) очень утомляет в работе. К положительным качествам программы можно отнести русскоязычный интерфейс и наличие книг описывающих работу.

STATA. Профессиональный статистический программный пакет с data-management system, который может применятся для биомедицинских целей. Один из самых популярных в образовательных и научных учреждениях США наряду с SPSS. Официальный сайт. Программа хорошо документирована, издается специальный журнал для пользователей системы. Однако возможности предварительного ознакомления с демо-версией нет.

STATISTICA. Производителем программы является фирма StatSoft Inc. (США), которая выпускает статистические приложения, начиная с 1985 года. STATISTICA включает большое количество методов статистического анализа (более 250 встроенных функций) объединенных следующими специализированными статистическими модулями: Основные статистики и таблицы, Непараметрическая статистика, Дисперсионный анализ, Множественная регрессия, Нелинейное оценивание, Анализ временных рядов и прогнозирование, Кластерный анализ, Факторный анализ, Дискриминантный функциональный анализ, Анализ длительностей жизни, Каноническая корреляция, Многомерное шкалирование, Моделирование структурными уравнениями и др. Несложный в освоении этот статистический пакет может быть рекомендован для биомедицинских исследований любой сложности.

Статистический пакет STATISTIKA

Statistica-- пакет для всестороннего статистического анализа, разработанный компанией StatSoft.

Алгоритмы математической статистики, реализованные в пакете:

Многомерная линейная и нелинейная регрессия;

Дискриминантный и кластерный анализ, деревья классификаций;

Проверка гипотез о виде распределения;

Некоторые алгоритмы непараметрической статистики;

Прогнозирование временных рядов на основе одномерных моделей АРПСС.

Преимущества и недостатки пакета STATISTICA

Преимущества пакета STATISTICA:

- Наибольший из всех изученных пакетов инструментарий визуализации полученных результатов;

- Наличие руссифицированной версии;

- В пакете представлена полная реализация алгоритмов статистической классификации;

- Наличие возможности реализовать и использовать собственные алгоритмы (через написание макросов).

- Алгоритмы интеллектуального анализа данных (Data Mining).

Недостатки пакета STATISTICA:

- Применение пакета требует высокой теоретической подготовки в ТВиМС. статистический обработка данные пакет

- Отсутствие реализации некоторых важных тестов временных рядов (в частности - тестов на стационарность).

Иногда это можно сделать, изменив порядок следования команд в коде, предназначенном для проведения атаки. Иногда проще организовать нападение таким образом, чтобы взламывать пакеты выборочно. Так же как антивирусным компьютерным программам нужно постоянное обновление и пополнение новыми образцами кода, этому типу системы обнаружения вторжений необходимо постоянное обновление базы данных образцов нападения. Не ясно, сможет ли когда-нибудь такая база данных не отстать в соревновании с инструментом хакера. Другим принципом работы системы обнаружения вторжений является обнаружение аномалии. IDS осуществляет некоторое статистическое моделирование вашей сети и вычисляет, что является нормой. Затем, если происходит какое-либо отклонение от нормы, она подает звуки тревоги. Здесь все может быть сделано по правилам (система знает, что нормально, и сигнализирует обо всем остальном), с использованием статистики (система статистически вычисляет, что нормально, и сигнализирует обо всем остальном) или с применением методов искусственного интеллекта

SPSS Statistics (Statistical Package for the Social Sciences) -- компьютерная программа для статистической обработки данных, предназначенная для проведения прикладных исследований в первую очередь социальных науках.

По сравнению с ранее приведенными пакетами, обладает существенно меньшим инструментарием статистического анализа данных.

Преимущества и недостатки пакета SPSS

Преимущества пакета SPSS:

- Имеются русифицированные версии пакета.

- Позволяет параллельно обрабатывать несколько подвыборок.

- Простота в освоении.

- Имеются специфические методы, нацеленные исключительно на маркетинговые и социологические исследования (например, Conjoint analysis). Удобен при обработке результатов опроса.

- Имеется модуль для автоматизации процесса разработки анкеты и ввода результатов опросов (Data Entry).

Недостатки пакета SPSS:

- Отсутствует возможность реализации собственных алгоритмов;

- Существенно уступает в глубине анализа данных.

Список использованной литературы

1. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере / Под ред. В. Э. Фигурнова. 3-е изд., перераб. и доп. М.:ИНФРА - М. 2003. 544 с.

3. Тюрин Ю.Н. Исследования по непараметрической статистике (непараметрические методы и линейная модель): Автореф. дисс. … д-ра физ.-мат. наук. М., 1985. 33 с.

Подобные документы

Спектр задач, которые решают математические программные пакеты (Maple, MathCad, Mathematica и MatLab). Математические исследования, требующие вычислений и аналитических выкладок. Разработка и анализ алгоритмов. Визуализация, научная и инженерная графика.

презентация [148,7 K], добавлен 06.01.2014

Развитие новых информационных и телекоммуникационных технологий. Решение экономической задачи с использованием табличного процессора Microsoft Excel. Возможности Excel при работе с функциями. Математические и статистические пакеты прикладных программ.

курсовая работа [452,8 K], добавлен 01.04.2009

курсовая работа [36,8 K], добавлен 23.06.2011

Сущность понятия "диапазон ячеек". Правила образования выражений. Приоритеты выполнения операций в выражениях. Категории стандартных функций: математические; статистические; логические; финансовые. Стандартные действия, которые можно выполнять с данными.

лабораторная работа [19,0 K], добавлен 11.12.2009

Базы данных, содержащие информацию о графических редакторах. Предметная область, словарь понятий и терминов. Построение функциональных зависимостей. Синтез схемы базы данных на основании функциональных зависимостей. Построение неизбыточного покрытия.

Кафедра Экономической Информатики и Автоматизации Управления.

Ростовский Государственный Экономический Университет

Выполнила Рыбакова О.А.

Проверила Нельзина О.Г.

Номер зачетки 03146

Специальность Актуарий для банков и страховых компаний

г. Ростов-на-Дону 2004г.

С О Д Е Р Ж А Н И Е

2. Общие сведения об СПП.

3. Легкость использования пакета и его освоения

4. Виды статистических пакетов

5. Требования к статистическим пакетам общего назначения

6. Пакет STADIA

7. История создания системы ЭВРИСТА.

10. Заключение

11. Список литературы

В В Е Д Е Н И Е

Статистический пакет -программный продукт , предназначенный для статистической обработки данных .

Являются надежным инструментом повышения качества принимаемых решений. В пакет, как правило, входит: деловая графика, дисперсионный анализ, регрессионный анализ, анализ временных рядов и пр.

Для успешной работы любой организации в условиях рынка и конкуренции, конечно, необходим тщательный анализ имеющейся информации о создании продукции, её сбыте, эксплуатации, а также анализ информации о конкурентах и т. п. Конечно можно положиться на интуицию, но, скорее всего, правильное решение будет принято, только если у вас имеется огромный многолетний опыт в этой сфере деятельности. Но можно (и даже нужно, несмотря на весь опыт) пойти другим путём — воспользоваться специальными средствами для обработки информации. И вот здесь-то и потребуется профессионализм — необходимо правильно выбрать программное обеспечение, корректно ввести информацию, которую вы хотите проанализировать, выбрать методы и алгоритмы для решения именно этой задачи и многое другое.

Можно выделить 2 вида статистических пакетов.

Из зарубежных пакетов это STATGRAPHICS, SPSS, SYSTAT, BMDP,SAS, CSS, STATISTICA, S-plus, и др.

Из отечественных можно назвать такие пакеты, как STADIA, ЭВРИСТА, МЕЗОЗАВР, ОЛИМП: Стат-Эксперт, Статистик-Консультант, САНИ, КЛАСС-МАСТЕР и др.

Отечественные статистические пакеты, которые устойчиво представлены на рынке в течение последних лет, в значительной степени лишены таких недостатков , которые есть у западных продуктов. Они предполагают наличие широкого первоначального статистического образования, доступной литературы и консультационных служб. Поэтому они содержат мало экранных подсказок и требуют внимательного изучения документации на английском языке.

Общие сведения об СПП.

Здесь излагается методика сравнительного анализа однотипных отечественных пакетов, позволяющая такой продукт правильно выбрать и в дальнейшем эффективно использовать.

Статистическая система

Минимальные системные требования

Категория пользователя

Емкость НЖМД

РМ и ПК Казахстан

Легкость использования пакета и его освоения

Этот раздел методики построения рейтинга предлагает учитывать качество документации по наличию "Руководства пользователя" и учебных пособий по методам, реализованным в пакете. Кроме того, оценивается удобство интерфейса "человек - компьютер", качество встроенной подсистемы помощи, степень удобства управления данными и работы с графикой и таблицами.

Степень интеллектуальности пакета в первую очередь предполагает организацию такого режима работы СПП, при котором пользователь имеет достаточно квалифицированное статистическое ассистирование в ходе всего процесса статистического анализа, т. е. при выяснении природы (генезиса) анализируемых данных, при выборе подходящих моделей и методов, их увязывании в технологическую цепочку, при интерпретации результатов и т. п. При этом основные показатели вовсе не обязательно связаны с наличием в пакете подходящей экспертной системы. Речь идет о развитой системе компьютерной консультационной поддержки (по статистике), охватывающей различные стадии решения задачи :

· ориентирование пользователя в существующих литературных источниках по применяемым статистическим методам, а также обеспечение его подсказками по используемой терминологии, понятиям, существующим решениям аналогичных задач;

· помощь в постановке задачи, подробный предварительный анализ исходных данных c акцентированием внимания пользователя на их генезисе и особенностях;

· подбор подходящего вида модели и технологической цепочки обрабатывающих модулей;

· описание набора типичных статистических "ловушек" и способов, как их избежать;

· помощь в интерпретации промежуточных и финальных результатов статистического анализа;

· предложение направлений дальнейшего исследования.

Необходимым условием обеспечения достаточной степени интеллектуальности СПП мы считаем привлечение к разработке пакета (а при оценке готового - учет научного уровня) специалистов по теории и методам статистического анализа данных. Кроме того, представляется важным, как используются интерактивные и графические возможности современного ПК, а также средства, связанные с формализацией и предоставлением опыта и профессиональных знаний специалистов по прикладной статистике.

Виды статистических пакетов

Основную часть имеющихся пакетов составляют специализированные пакетов и пакеты общего назначения.

Специализированные пакеты обычно содержат методы из одного - двух разделов статистики или методы, используемые в конкретной предметной области (контроль качества промышленной продукции, расчет страховых сумм и т.д.). Чаще всего встречаются пакеты для анализа временных рядов (например, ЭВРИСТА, МИЗОЗАВР, ОЛИМП: Стат-Эксперт), регрессионного и факторного анализа. Обычно эти пакеты содержат весьма полный набор традиционных методов в своей области, а иногда включают также и оригинальные методы и алгоритмы, созданные разработчиками пакета. Как правило, пакет и его документация ориентированы на специалистов, хорошо знакомых с соответствующими методами.

Пакеты общего назначения . Особое место на рынке занимают так называемые статистические пакеты общего назначения. Широкий диапазон статистических методов, дружелюбный интерфейс пользователя привлекает в них не только начинающих пользователей, но и специалистов. Универсальность этих пакетов особенно полезна:

    • на начальных этапах обработки, когда речь идет о подборе статистической модели или метода анализа данных;
    • когда поведение статистических данных выходит за рамки использовавшейся ранее модели;
    • в процессе обучения основам статистики.

    Именно пакеты общего назначения составляют большинство продаваемых на рынке статистических программ. К таким пакетам относятся системы STADIA и SPSS, а также пакеты STATGRAPHICS, STATISTICA, S-plus, и др.

    Требования к статистическим пакетам общего назначения

    Для того чтобы статистический пакет общего назначения был удобен и эффективен в работе, он должен удовлетворять многочисленным и весьма жестким требованиям. В частности, необходимо, чтобы он:

    · содержал достаточно полный набор стандартных статистических методов;

    · был достаточно прост для быстрого освоения и использования;

    · отвечал высоким требованиям к вводу, преобразованиям и организации хранения данных;

    · имел широкий набор средств графического представления данных и результатов обработки;

    · предоставлял удобные возможности для включения в отчеты таблиц исходных данных, графиков, промежуточных и окончательных результатов обработки;

    · имел подробную документацию, доступную для начинающих и информативную для специалистов-статистиков.

    Наконец, немаловажное значение имеет цена пакета.

    Пакеты, рассчитанные на массового пользователя, стоят дешевле, чем западные – обычно 500-1500 долларов. Эти пакеты отличаются от профессиональных, прежде всего ориентацией на индивидуального пользователя: преимущественно диалоговым режимом работы, наличием ограничений по объему обрабатываемых данных и т.д.

    Отечественные статистические пакеты стоят существенно дешевле, как правило, их цена составляет от 50 до 300 долларов.

    Пакет STADIA

    Пакет STADIA разработан и поддерживается НПО “Информатика и компьютеры” при активном участи ведущих специалистов МГУ им. М.В.Ломоносова. Пакет содержит широкий набор методов анализа данных из всех областей статистики и доступен широкому кругу прикладных специалистов, менеджеров и студентов. Сейчас распространяется версия 6.2 для среды Windows. Пакет может появляться в трех вариантах: study, basе и рrоf, различающихся лишь объемами обрабатываемых массивов и ценой. Самый дешевый вариант study имеет максимальный объем матрицы данных в 400 чисел. Он предназначен главным образом для учебных заведений и задач с небольшими объемами данных. Самая дорогая версия STADIA 6.2 рrоf. имеет максимальный объем матрицы данных 20000 чисел и расширенные возможности статистических процедур для их обработки по сравнению с базовыми версиями. У пакета имеется бесплатная учебно-демонстрационная версия, позволяющая обрабатывать большое количество демонстрационных примеров из всех разделов статистического анализа. Эта версия также допускает ввод с клавиатуры и полную обработку данных пользователей. Однако при этом существуют ограничения на объемы вводимых данных, и отсутствует возможность сохранения введенных данных в файле. Документация пакета является одновременно детальным справочником по использованию статистических методов и может быть приобретена отдельно от пакета.

    История создания системы ЭВРИСТА.

    Идея создания специализированного статистического пакета по анализу и прогнозированию временных рядов возникла вначале 80-х годов на кафедре математической статистики Московского государственного университета. Главным идеологом будущей программной системы выступил старший научный сотрудник кафедры, к.ф.-м.н. Ю.Г.Баласанов. Первая версия системы ЭВРИСТА была реализована на языке ФОРТРАН для ЭВМ БЭСМ-6 и с 1984 года началось и использование системы в учебном процессе факультета.

    Первая коммерческая версия системы ЭВРИСТА для персонального компьютера появилась 1987 году и ее первым покупателем стало объединение КАМАЗ (г. Набережные Челны). Несмотря на то, что первые персональные компьютеры имели слабые (особенно с нынешних позиций) графические возможности, разработчики по максимуму старались их использовать, и в результате ЭВРИСТА, одна из немногих программных систем того времени, уже имела полностью графический многооконный интерфейс.

    В 1988 году Ю.Г.Баласанов и его коллеги создают специализированную статистическую группу высокопрофессиональных статистиков-программистов в СП ДИАЛОГ.

    В 1991 году выходит вторая версия системы для IBM-совместимых компьютеров.

    В январе 1993 года коллектив разработчиков системы ЭВРИСТА в полном составе переходит в ТОО “Центр Статистических Исследований” и все последующие версии системы выходят в рамках этой организации.

    С функциональной точки зрения пакет состоит из следующих программ (процедур): редактора средств графического отображения и утилит преобразования данных, а также программ реализации методов статистического анализа.

    Редактор данных обеспечивает возможность ввода, просмотра и редактирования исходных данных (в том числе пропущенных наблюдений).

    Средства графического отображения данных позволяют выводить различные виды графиков на экран, а также сохранять их на диске для дальнейшего использования.

    Утилиты преобразования данных выполняют арифметические преобразования данных (унарные и бинарные), различные виды сортировки (в том числе по нескольким переменным), агрегирование (объединение по одному признаку) и фильтрование данных (отбор по одному признаку).

    Для анализа и прогнозирования динамических данных применяются следующие методы:

    · адаптивные методы прогнозирования;

    · модели динамической регрессии;

    · модели прогнозирования на основе линейной регрессии;

    · модели гармонического, спектрального анализа и частотной фильтрации.

    Каждая из перечисленных выше моделей может управляться пользователем с помощью параметров, характеризующих эту модель. Такой подход позволяет постепенно осваивать заложенные в программе возможности и облегчает работу с ней.

    С помощью корреляционного анализа рассчитывается матрица парных корреляций, матрица частных корреляций, а также коэффициенты множественных корреляций.

    На основе регрессионного анализа решаются следующие задачи: установление форм зависимости (положительная, отрицательная, линейная, нелинейная).

    Компонентный и факторный анализ – два принципиально различных статистических метода. В программе они объединены в единый блок, поскольку такое объединение оправдано с вычислительной точки зрения.

    Компонентный анализ служит для определения структурной зависимости между случайными переменными. В результате его использования получается сжатое описание явления, несущее почти всю информацию, содержащуюся в исходных данных.

    Факторный анализ является более общим методом преобразования исходных переменных по сравнению с компонентным анализом. В задачи факторного анализа входит: определение числа общих факторов, определение оценок общих и специфических факторов.

    Анализ временных рядов включает в себя расчет статистических характеристик, анализ кривых роста по 16 функциям и некоторые адаптивные параметрические модели для анализа одномерных временных рядов.

    Анализ автокорреляции динамического ряда выполняется с помощью графика автокорреляции.

    Расчет кривых роста рассматривается как построение парной регрессии, в которой основной переменной является время.

    Углубленный анализ предполагает использование адаптивных методов, сезонных методов прогнозирования. Для решения задач частотного анализа могут быть использованы методы частотной фильтрации, гармонического анализа, спектрального анализа.

    Электронная таблица MNCALC представляет собой табличный процессор, сходный по своим функциональным возможностям с пакетами LOTUS 1-2-3 или EXCEL.

    Преимущество MNCALC по сравнению со стандартным редактором пакета ОЛИМП заключается в том, что он позволяет отображать и редактировать сразу весь набор данных. Кроме того, в таблице могут находиться формулы, с помощью которых можно формировать новые переменные на основе существующих. Таблицы могут содержать различную текстовую информацию, позволяющую именовать переменные и комментировать наборы данных.

    Программное средство ПСИ предназначено для формирования структуры анкет и ввода данных по этим анкетам. ПСИ содержит пять стандартных типов вопросов, наиболее часто встречающихся в анкетах.

    Под временным рядом понимается последовательность наблюдений за некоторой числовой характеристикой показателей, сделанных с постоянным шагом во времени (например ежегодно, ежемесячно, каждый час и т.п.). В статистике примерами подобных показателей могут служить на макроэкономическом уровне ежегодные, ежеквартальные, ежемесячные и т.п. объемы производства, поставок, перевозок, потребления; индексы цен и другие макроэкономические показатели; на уровне предприятия – объемы выпуска продукции, затраты, расход ресурсов, эволюция характеристик качества и др.

    · предоставляет возможность сохранения в стандартных файлах любых данных, полученных в ходе анализа;

    · допускает экспорт и импорт информации из текстовых файлов.

    Предельная длина одного анализируемого временного ряда равна 16 тыс. значений, однако возможности анализа такого ряда будут весьма ограничены и поэтому наиболее эффективно работать с рядами до 2 – 3 тыс. значений.

    Одновременно можно анализировать до 256 рядов, однако их суммарная не должна превышать 60 тыс. чисел. При этом можно пользоваться либо реальными временными шкалами (шаг по времени – начиная от 1 мин. до любого (целого) числа лет), или же условной временной шкалой.

    Редактирование данных осуществляется с помощью встроенного табличного редактора или же в графическом режиме, а их преобразование – с помощью дополнительного меню преобразований более специального характера.

    Кроме того, есть возможность непосредственно указать предварительное преобразование данных, которое далее учитывается в процессе анализа. При всех арифметических операциях над рядами учитывается совместимость временных шкал.

    В настоящее время рынок математического программного обеспечения очень развит. На нём можно найти свыше тысячи программ, различного уровня, направленности, качества, требованиям к аппаратному обеспечению и, наконец, отличающиеся ценой.

    Число статистических пакетов, получивших распространение в России, достаточно велико и спрос на них продолжает возрастать.

    В данном реферате я рассказывала про отечественные статистические пакеты и про статистические пакеты в целом. Так же он содержит описание и характеристики некоторых пакетов.

    В моей работе приведена таблица общих сведений об СПП, которая наглядно показывает категорию пользователей, цену, продавцов и т.д.

    Для наиболее доступного понимания, в реферате описывается легкость использования пакета и его освоение.

    В моей работе перечислены виды статистических пакетов.

    Особенности отечественных пакетов: более простой путь; аккумулируют опыт передовой российской науки; методы анализа сгруппированы по содержательному принципу, а не по фамилии авторов.

    Недостаток отечественных пакетов – это их малочисленность.

    Документация отечественных пакетов не уступает зарубежным пакетам(Fore Cast Expert, Олимп Старт Эксперт).

    При впечатляющем разнообразии статистических программных продуктов, которым характеризуется современный мировой и отечественный рынок (по официальным данным Международного статистического института, число наименований СПП приближается к тысяче), крайне важно - как для производителя, так и для потребителя этой продукции - правильно ориентироваться в этом многообразии.

    СПИСОК ЛИТЕРАТУРЫ

    1. Прикладная статистика: Классификация и снижение размерности: Справ. изд. М ., 1989. 607 с .

    Методы анализа данных реализуются, как правило, в виде пакетов прикладных программ, в состав которых входят известные процедуры дисперсионного, корреляционного, регрессионного, факторного, дискриминантного и кластерного анализа, а также другие процедуры многомерной прикладной статистики. Эти процедуры относятся к классу линейных диагностических правил и превалируют в психодиагностике.

    Statistica разрабатывается компанией StatSoft. На сегодняшний день последней версией является Statistica10.

    Statistica - это система для статистического анализа данных, включающая широкий набор аналитических процедур и методов: более 100 различных типов графиков, описательные и внутригрупповые статистики, разведочный анализ данных, корреляции, быстрые основные статистики и блоковые статистики, интерактивный вероятностный калькулятор, T-критерии (и другие критерии групповых различий), таблицы частот, сопряженности, флагов и заголовков, анализ многомерных откликов, множественная регрессия, непараметрические статистики, общая модель дисперсионного и ковариационного анализа, подгонка распределений, добыча данных, нейронные сети и многое другое.

    Продукты серии STATISTICA основаны на самых современных технологиях, полностью соответствуют последним достижениям в области IT, позволяют решать любые задачи в области анализа и обработки данных, идеально подходят для решения практических задач в маркетинге, финансах, страховании, экономике, бизнесе, промышленности, медицине и т.д.[3]

    Программа SPSS, название которой - это аббревиатура от Statistical Package for the Social Sciences, относительно недавно стала принадлежать компании IBM и сменила название на PASW (Predictive Analytics SoftWare) Statistics [6].

    Она предоставляет широкие возможности для анализа данных. Интуитивно понятный интерфейс программного обеспечения включает в себя все функции управления данными, статистические процедуры и средства создания отчетов для проведения анализа любой степени сложности.

    Используя IBM SPSS Statistics, можно эффективно анализировать данные, наглядно представлять результаты в виде таблиц и диаграмм, а также распространять и внедрять полученные результаты.

    Новый IBM SPSS Statistics обогащен мощными аналитическими инструментами и средствами ускорения работы для того, чтобы проще и быстрее выявлять ценную информацию в данных, делать более точные прогнозы и обеспечивать большую отдачу от аналитики.

    Моделирование данных методом Монте-Карло. Богатые возможности имитационного моделирования данных с заданными характеристиками (в том числе, с характеристиками фактических данных – формой распределения и связями между переменными). Это позволит специалистам, связанным с планированием и моделированием затрат и рисков надежнее оценивать диапазон возможных значений прогнозируемого показателя и оценивать его отклик при воздействии на управляемые переменные;

    Чтение данных из IBM Cognos BI. Прямой импорт данных из платформы Cognos с помощью встроенного конструктора импорта. Поддерживается загрузка выбранных пользователем данных, или готовых отчетов IBM Cognos.

    Сравнение файлов данных. Удобная утилита сравнения файлов данных SPSS Statistics для выявления расхождений в версиях файлов. Появляется возможность быстро сравнивать как содержимое файлов (значения данных по выбранным переменным), так и метаданные, то есть состав и описания (метки и коды) переменных.

    Безопасность и эффективность хранения данных. Встроенная возможность сохранения файлов данных с паролем защитит Ваши данные от нежелательного просмотра и повысит безопасность обмена данными с коллегами. IBM SPSS Statistics 21 также поддерживает новый эффективный алгоритм сжатия, значительно сокращающий место, необходимое для хранения больших данных.

    Описательные статистики в одно действие. Простым щелчком по заголовку переменной можно быстро запросить вывод ее базовых описательных статистик, например, количество значений, диапазон, среднее и гистограмму для количественной переменной.

    Гибкие возможности слияния файлов. Новая команда слияния позволяет избежать предварительной сортировки наборов данных и файлов SPSS Statistics, а также дает возможности слияния нескольких наборов с помощью подобия SQL-инструкций и разрешает использовать строковые переменные-ключи различной длины.

    Долгожданные возможности управления готовыми таблицами. Теперь прямо в редакторе вывода SPSS Statistics в готовой мобильной таблице можно заменить отображение имен переменных и значений на их метки и наоборот, отсортировать строки, вставить новые строки и столбцы, а также изменить язык вывода таблицы, например, с английского на русский.

    Расширенная поддержка экспорта результатов. Добавлена поддержка экспорта результатов в файлы MS Excel 2007 и более поздних версий, а также включена поддержка стилей вывода (фон, шрифты, ширина столбцов) при экспорте в HTML. Ваши таблицы в веб-браузере выглядят также опрятно, как и в редакторе выводаSPSS Statistics.

    Основные характеристики IBM SPSS Statistics:

    Доступ к данным и управление данными:

    1. Чтение файлов Excel.

    2. Чтение файлов данных SAS 7, 8, или 9 версии.

    3. Возможность одновременно работать с несколькими наборами данных.

    4. Поддержка источников данных OLE DB.

    5. Возможность импорта и экспорта данных в PASW Data Collection Interviewer Web.

    6. Доступ к базам данных с помощью средств ODBC (Oracle, SQL Server, IBM AIX).

    7. Поддержка Unicode.

    8. Экспорт данных в SAS и текущие версии Excel.

    9. Конструктор экспорта в базы данных.

    10. Конструктор реструктуризации данных .

    11. Конструктор дат и времени.

    12. Поиск дублирующихся наблюдений.

    13. Визуальная категоризация.

    14. Средство копирования свойств данных.

    1. Конструктор диаграмм, позволяющий быстро создать любую необходимую диаграмму.

    2. Панель выбора диаграмм, позволяющая подобрать оптимальный вариант графического представления данных.

    3. Язык создания диаграмм (Graphic Production Language).

    4. Диаграммы для переменных с множественными ответами.

    5. Диаграммы с двумя осями Y.

    Выходные результаты:

    1. Экспорт результатов в MS Office: Excel/Word/PowerPoint.

    2. Экспорт результатов в PDF.

    3. Экспорт результатов в HTML формат.

    4. Средства управления выводом OMS.

    5. Возможность просмотра выходных результатов PASW Statistics другими пользователями с помощью PASW Smartreader.

    1. Улучшенный редактор синтаксиса с поддержкой автозавершения и цветового кодирования команд

    2. Поддержка языков программирования Python и R

    3. Возможность создания пользовательских процедур и диалоговых окон.

    Обе программы снабжены великолепным графическим интерфейсом, а также имеют встроенный язык программирования и возможность интеграции с языком статистических вычислений R.

    Следует отметить, что почти безграничные возможности в статобработке, предоставляемые данными инструментами, требуют от компьютера больших ресурсов. Так, для работы SPSS необходимо не менее 1 Гб оперативной памяти. Операционные системы, в которых можно запускать SPSS: Windows, MacOS и Linux. Statistica же разработана только под Windows, что несколько уменьшает число ее пользователей.

    В программах есть все наиболее востребованные статистические методы: частотный анализ, расчет статистических характеристик, таблиц сопряженности, корреляций, построения графиков, t-тесты и большое количество непараметрических критериев, многомерный линейный регрессионный анализ, дискриминантный анализ, факторный анализ, кластерный анализ, дисперсионный анализ, анализ надежности, многомерное шкалирование и ряд других. Вызов этих статистических процедур делается с помощью выбора из меню соответствующих окон и внесения в них необходимых настроек. Все типы анализа разбиты по группам, что помогает быстро ориентироваться в интерфейсе приложений.

    Системы STATISTICA и SPSS обладают широкими графическими возможностями. Они включают в себя большое количество разнообразных категорий и типов графиков, в том числе научные, деловые, трехмерные и двухмерные графики в различных системах координат, специализированные статистические графики — гистограммы, матричные, категоризованные графики и др.

    Статистические функции, которыми располагают оба приложения, поражают своим разнообразием. Главным препятствием на пути освоения этих программ является время, которое необходимо затратить на обучение. Именно из-за недостатка знаний у пользователя, в большинстве случаев, мощь статистических пакетов подобного уровня не используется даже в половину.

    Существует множество приложений для статистического анализа больших и маленьких, дорогих и бесплатных программ. Однако такое изобилие софта не должно пугать исследователя, достаточно будет один раз сделать продуманный выбор в пользу одной-двух программ, тщательно изучить тонкости их применения, и они будут не один год служить верными помощниками в статистическом анализе результатов экспериментов.

    В последнее время все большая альтернатива сложившимся психодиагностическим подходам видится в применении методов теории распознавания образов. По заключению специалистов, имеется большое количество математических моделей распознавания образов, которые опираются на геометрическое изображение и истолкование характеристик распознаваемых объектов в пространстве признаков. В то же время ограниченное применение алгоритмов распознавания образов в психодиагностике, прежде всего, связано с высокой размерностью пространства признаков, которыми должен оперировать экспериментатор при проведении психодиагностических исследований. Развитие компьютерной информационной технологии дает возможность использования мощного математического аппарата анализа подобных данных и, следовательно, применения методов теории распознавания образов в качестве ближайшей реальной перспективы совершенствования психодиагностики.

    Читайте также: