Инновации и эксперимент в образовании

Критерии результативности в эксперименте PDF Печать E-mail
Добавил(а) Тимофеева О.Ю.   
19.07.09 22:41

Критерии результативности в эксперименте: применение методов математической статистики1

Статистические гипотезы

Статистический метод расчета определенного числа также обозначают и называют статистическим критерием. Статистический критерий – это решающее правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью (Суходольский Г.В., 1972, С.291).

Когда мы говорим, что достоверность различий определялась по критерию χ2, то имеем в виду, что использовали метод χ2 для расчета определенного числа. Когда мы говорим, далее, что χ2= 12,676, то имеем в виду определенное число, рассчитанное по методу χ2. Это число обозначается как эмпирическое значение критерия.

По соотношению эмпирического и критического значений критерия мы можем судить о том, подтверждается ли или опровергается нулевая гипотеза. Например, если χ2эмп > χ2кр, Н0 отвергается. В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть критерии (например, критерий Манна – Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила. Правила для каждого критерия свои и оговариваются в руководстве метода.

Полный текст доступен зарегистрированным пользователям    [Вход] [Регистрация]

Непараметрические критерии лишены всех этих ограничений и не требуют таких длительных и сложных расчетов. По сравнению с параметрическими критериями они ограничены лишь в одном – с их помощью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака. Эту задачу может решить только дисперсионный двухфакторный анализ [6 С.29].

Очень важно, на наш взгляд, разобраться с уровнем статистической значимости, который показывает вероятность того, что мы сочли различия существенными, а они на самом деле случайны. Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или при p ≤ 0,05, то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,05. Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или при p ≤ 0,01, то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01. Если перевести на более формализованный язык, то уровень значимости – это вероятность отклонения нулевой гипотезы, в то время как она верна. Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время как она верна, называется ошибкой 1 рода.

Вероятность такой ошибки обычно обозначается как α, В сущности, мы должны были бы указать в скобках не p ≤ 0,05 или p ≤ 0,01, а α ≤ 0,05 или α ≤ 0,01.

Если вероятность ошибки – это α, то вероятность правильного решения: 1 – α. Чем меньше α, тем больше вероятность правильного решения. Исторически сложилось так, что в психологии и педагогике принято считать уровнем статистической значимости 5%-ый уровень (p ≤ 0,05): достаточным – 1%-ый уровень (p ≤ 0,01) и высшим 0,1%-ый уровень (p ≤ 0,001), поэтому в таблицах критических значений обычно приводятся значения критериев, соответствующих уровням статистической значимости p ≤ 0,05 и p ≤ 0,01, иногда p ≤ 0,001.Для некоторых критериев в таблицах указан точный уровень значимости их разных эмпирических значений. До тех пор, однако, пока уровень статистической значимости не достигнет p = 0,05, мы еще не имеем права отклонить нулевую гипотезу. Вслед за Р. Рунионом (1982), мы будем придерживаться следующего правила отклонения гипотезы об отсутствии различий (Н0) и принятия гипотезы о статистической достоверности различий (Н1).

Правило отклонения Н0 и принятия Н1

Если эмпирическое значение критерия равняется критическому значению, соответствующему p ≤ 0,05 или превышает его, то Н0 отклоняется, но мы еще не можем определенно принять Н1. Если эмпирическое значение критерия равняется критическому значению, соответствующему p ≤ 0,01 или превышает его, то отклоняется Н0 и принимается Н1.

Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна-Уитни. Для них устанавливаются обратные соотношения.

Полный текст доступен зарегистрированным пользователям    [Вход] [Регистрация]

Для сравнения результатов двух зависимых выборок используют следующие непараметрические критерии:

  • критерий Макнамары;
  • критерий знаков;
  • критерий Вилкоксона.

Для сравнения результатов двух независимых выборок применяют такие непараметрические критерии, как:

  • медианный критерий;
  • критерий Вилкоксона-Манна-Уитни;
  • критерий χ2 (хи-квадрат);
  • критерий Колмогорова-Смирнова.

Тимофеева О.Ю.,
кандидат педагогических наук,
доцент ФГОУ АПК и ППРО,
учитель экологии ГОУ СОШ
с углубленным изучением экологии №446
г. Москва


1 Тимофеева О.Ю. Критерии результативности в эксперименте: применение методов математической статистики: Учебно-методическое пособие. – М.: АПКиППРО, 2008. – 36 с.

 

This content has been locked. You can no longer post any comment.

Инновации и эксперимент в образовании