Математическая статистика как наука о случайных явлениях. Статистика – это раздел общественной науки, который занимается сбором представлением и анализом информации массовых социально-экономических явлений. Математическая статистика отличается от статистики тем, что она использует методы математики, и она выявляет закономерности развития социально-экономических явлений. Так как, любое статистическое исследование по своей сути является стохастическим испытанием, а результаты этого испытания случайными событиями, которые объединяясь в множество образуют случайную величину, то теоретической основой выводов математической статистики является теория вероятностей. Случайные и неслучайные события. Событие - всякий реальный или воображаемый факт, который изучается исследователем. Случайное событие – событие, которое при определенных условиях опыта может происходить, а может и не происходить. Неслучайное событие – могут быть достоверными и невозможными. Достоверные – это события, которые всегда происходят при определенном комплексе условий. Невозможное событие – это такое событие, которое никогда не происходит. Достоверные и невозможные события и есть не случайные события. Большинство фактов психической жизни являются случайными событиями. Одни происходят часто, другие редко. Частота, частость и вероятность. Ожидаемая степень появления случайного события. Мера – частота, частость, вероятность события. Частота (частотный анализ в мат. статистике) – количество случаев появления измеряемого события. Частость – отношение частоты к количеству измерений (частота деленная на количество испытаний). Вероятность – некоторое постоянное значение, встречающееся при неограниченном количестве испытаний. Это положительное число не может быть больше 1, количественная мера возможности появления случайного события, повторяющееся от опыта к опыту. Система случайных событий. Совокупность событий, рассматриваемых совместно и приобретающих в системе такие свойства, которые не имеют места при рассмотрении по отдельности. События в системе могут быть по-разному упорядочены. Уровни количественного определения событий. Уровни количественного определения событий также называют квантификацией – замена одного или другого события числами.
- Уровень словесного, качественного описания событий.
- Уровень количественного описания событий (степень проявления свойств – измерение).
Случайная величина и закон ее распределения. Величина – какие-либо физические или психологические явления, которые относительно совокупности изучаемых явлений характеризуются совокупностью чисел. Случайная величина – психологическое явление, которое в совокупности существующих условий характеризуется совокупностью чисел. В постоянных условиях постоянна. В изменяющихся условиях совокупность чисел изменяется по определенному закону – переменная. Признаки и переменные. Признак – это общее свойство, которым обладают единицы совокупности. По своей сути признак является случайной величиной. Признаки бывают качественные и количественные. Признак называется количественным, если его значение можно выразить числом (например, рост). Признак называется качественным (атрибутивным), если его значение нельзя выразить числом (например, цвет глаз). Переменные бывают независимыми и зависимыми. В качестве независимой переменной могут выступать: характеристика заданий; особенности экспериментальной ситуации; особенности испытуемого, его состояний; константные переменные испытуемого (пол, возраст и т. д.). В качестве зависимой переменной выбирают: параметры вербального и невербального поведения; формально динамические (темп или частота действий, продуктивность и др.); содержательные (формы поведения). Переменные являются случайными величинами, поскольку неизвестно, какие именно значения они примут. Эти понятия могут использоваться как взаимозаменяемые. Показатели, уровни. Вместо понятий признаки и переменные могут использовать понятия показателя или уровня. Например, уровень настойчивости или показатель вербального интеллекта. Математическая обработка – это оперирование со значениями признака, полученными у испытуемых в ходе исследования. Такие результаты называют индивидуальными показателями или наблюдаемыми значениями. Значение признака определяется при помощи специальных шкал измерения. Шкалы измерения. Измерение – процедура установления взаимооднозначного соответствия между множеством объектов (состояний) и множеством символов (чисел). Стивенс предложил 4 типа шкал:
- Шкала наименований, или классификационная шкала строится на единственном отношении — отношении эквивалентности. Деления на шкале характеризуют критерии, на основании которых производится классификация. Это способ классификации объектов.
- Шкала порядка строится на основании сразу двух отношений — эквивалентности и порядка. Это шкала по принципу «больше» - «меньше».
- Шкала интервалов. Этот тип шкалы требует дополнительной возможности устанавливать равенство попарных различий между двумя парами стимулов, иначе говоря, определять равенство субъективных интервалов. Работает по принципу «больше на определенное количество единиц – меньше на…Каждое из возможных значений признака отстоит от другого на равном расстоянии.
- Шкала отношений получается, когда, кроме уже перечисленных операций: эквивалентности, порядка и сравнения разностей — можно осуществить для объектов сравнение попарных отношений.
Это обусловлено возможностью оценивать абсолютное значение величины реакции, и требует наличия на шкале нулевой точки. Можно сказать во сколько раз один объект больше другого. Ряд специалистов выделяет также абсолютную шкалу и шкалу разностей. Описательная статистика. Она предполагает перечисление (описание) полученных данных (например, чему равно среднее значение, максимальное, минимальное и т. д.). ??? Распределение признака. Закономерность встречаемости разных его значений. Может быть нормальным (приближаться к нормальному) или не нормальным (отличается от нормального). Параметры распределения. Это числовые характеристики, указывающие где «в среднем» располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественные проявления определенного значения признака. Наиболее важными параметрами является среднее арифметическое, дисперсия, показатели асимметрии и эксцесса. В исследованиях же оперируем не параметрами, их приближенными значениями, называемыми оценками параметров. Это объясняется ограниченностью выборки. Чем больше выборка, тем ближе может быть оценка параметра к его истинному значению. Нормальное распределение. Отличается тем, что крайние значения встречаются достаточно редко, а значения, близкие к средней величине – достаточно часто. График нормального распределения представляет собой параболу. Меры центральной тенденции. Среди множества мер центральной тенденции для обработки результатов психологических исследований чаще всего используют среднюю арифметическую величину и медиану. Медиана – это точка на измерительной шкале, выше которой находится точно половина наблюдений и ниже которой – также точно половина наблюдений. Данная мера необходима для проверки статистической значимости различий между результатами исследования двух разных выборок, а также для вычисления так называемых коэффициентов корреляции. Статистика «проверяющая». Проверка полученных результатов на достоверность. При использовании выборочного метода для сбора статистической информации может быть совершена ошибка репрезентативности, в связи с чем, данные, полученные на основе выборки, могут недостоверно отражать характеристики генеральной совокупности. А поэтому, одной из задач, которая решается на основе выборочного метода является задача определения ошибки выборки. В математической статистике принято находить: среднюю ошибку выборки; предельную ошибку выборки; относительную ошибку выборки. Данные ошибки связаны между собой. При расчете указанных выше ошибок учитывается тип выборки, который может быть бесповторный и повторный. Все эти ошибки рассчитываются по формулам. ??? Проверка статистических гипотез. Теория проверки статистических гипотез. Статистическая гипотеза – это гипотеза, которая выдвигается относительно вида распределения значений признака генеральной совокупности или относительно числовых характеристик генеральной совокупности и, которая проверяется при помощи математических методов. Нулевая – гипотеза об отсутствии различий. То, что мы хотим опровергнуть, если стоит задача найти значимые различия. Альтернативная гипотеза – о значимости различий, это, что хотим доказать, иногда ее называют экспериментальной гипотезой. Для проверки статистической гипотезы используется статистический критерий, который позволяет сделать выводы о правильности или неправильности основной гипотезы. Статистическим критерием называют случайную величину, относительно которой известен закон распределения. В математической статистике принято различать: параметрические и непараметрические критерии. Основное правило проверки основной гипотезы: если наблюдаемое значение критерия попало в критическую область, то гипотеза отклоняется. Отклонение нулевой гипотезы означает, что сделанное предположение не соответствует экспериментальным данным. Если наблюдаемое значение критерия попало в область принятия гипотезы, то гипотеза принимается. Алгоритм проверки статистической гипотезы: сформулировать основную гипотезу; сформулировать альтернативную гипотезу; указать уровень значимости проверки гипотезы; выбрать критерий для проверки гипотезы; найти наблюдаемое и теоретическое значение критерия; на числовой оси построить критическую область и нанести значения наблюдаемого критерия; сравнить К наблюдаемое и К критическое; сделать выводы о принятии или отклонении гипотезы Но. Статистические критерии. Это то решающее правило, которое обеспечивает надежное поведение, т. е. принятие истинных и отклонение ложных гипотез с высокой вероятностью. Статистические критерии определяют метод расчета определенного числа, а также само это число. Выделяют параметрические и непараметрические критерии. Параметрические и непараметрические критерии. Критерий называется параметрическим, если для него определен закон распределения (средние и дисперсия). К таким критериям относятся: Т-критерий Стьюдента, критерий Фишера, линейный Пирсона. Критерий называется непараметрическим, если он не основывается на каком-то определенном законе распределения (оперирование частотами или рангами). К таким критериям относятся: критерий Спирмена, критерий Манна-Уитни и др. Уровни статистической значимости. Это вероятность того, что мы сочли различия существенными, а они оказались случайными. Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или при р≤0,05, то мы имеем в виду, что вероятность того, что они все-таки не достоверны, составляет 0,05. Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или при р≤0,01, то мы имеем в виду, что вероятность того, что они все-таки не достоверны, составляет 0,01. Классификация задач и методов их решения.
- Выявление различий в уровне исследуемого признака – критерий Манна-Уитни для двух выборок испытуемых; критерий Стьюдента для одной выборки и др.;
- Оценка сдвига значений исследуемого признака – Т-критерий Вилкоксона и др.;
- Выявление различий в распределении признака – критерий Пирсона и др.;
- Выявление степени согласованности изменений – коэффициент ранговой корреляции Спирмена;
- Анализ изменений признака под влиянием контролируемых условий – однофакторный и двухфакторный дисперсионный анализ Фишера и др.;
- исследование структуры данных – факторный анализ;
- Группировка испытуемых – кластерный анализ. Компьютерный анализ результатов эмпирических исследований. SPSS