Критерии согласия
План:
- Проверка гипотезы о нормальном распределении генеральной совокупности.
- Критерий согласия Пирсона.
- Методика вычисления теоретических частот нормального распределения.
Если закон распределения генеральной совокупности неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), то проверяется нулевая гипотеза: генеральная совокупность распределена по закону А.
Проверка гипотезы о предполагаемом законе неизвестного распределения производится так же, как и проверка гипотезы о параметрах распределения, т.е. при помощи специально подобранной случайной величины — критерия согласия.
Критерием согласия называется критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Одним из критериев согласия является критерий («хи квадрат») К.Пирсона проверки гипотезы о нормальном распределении генеральной совокупности (этот критерий можно применять и для других распределений). Для применения этого критерия будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты.
Обычно эмпирические и теоретические частоты различаются. Например:
эмп. частоты . . . . . | 6 | 13 | 38 | 74 | 106 | 85 | 30 | 10 | 4 |
теорет. частоты . . | 3 | 14 | 42 | 82 | 99 | 76 | 37 | 11 | 2 |
Расхождение эмпирических и теоретических частот может быть случайным (незначимым) и объясняется либо малым числом наблюдений, либо способом их группировки, либо другими причинами. С другой стороны, расхождение частот может быть неслучайным (значимым) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности. Критерий Пирсона отвечает на вопрос: случайно ли расхождение эмпирических и теоретических частот? Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений. Пусть по выборке объема получено эмпирическое распределение:
Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты . При уровне значимости требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально. В качестве критерия проверки нулевой гипотезы принимается случайная величина . (17.1) Эта величина случайная, так как в различных опытах она принимает различные, заранее не известные значения. Ясно, что чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия (17.1), и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений. При закон распределения случайной величины (17.1) независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределения с степенями свободы. Число степеней свободы находится по равенству , где — число групп (частичных интервалов) выборки; — число параметров предполагаемого распределения, которые оценены по данным выборки. В частности, если предполагаемое распределение — нормальное, то оцениваются два параметра ( математическое ожидание и среднее квадратическое отклонение), поэтому и число степеней свободы . Если же предполагается, что генеральная совокупность распределена по закону Пуассона, то оценивается один параметр , поэтому и . Построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости: . (17.2) Таким образом, правосторонняя критическая область определяется неравенством , а область принятия нулевой гипотезы — неравенством . Правило. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу : генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия (17.3) и по таблице критических точек распределения , по заданному уровню значимости и числу степеней свободы найти критическую точку . Если — нет оснований отвергнуть нулевую гипотезу. Если — нулевая гипотеза отвергается. Сущность критерия согласия Пирсона состоит в сравнении эмпирических и теоретических частот. Ясно, что эмпирические частоты находятся из опыта. Как найти теоретические частоты, если предполагается, что генеральная совокупность распределена нормально? Эту задачу, например, можно решить следующим способом. 1. Весь интервал наблюдаемых значений (выборки объема ) делится на частичных интервалов одинаковой длины. Затем находятся середины частичных интервалов ; в качестве частоты варианты принимается число вариант, которые попали в i-й интервал. В итоге получается последовательность равноотстоящих вариант и соответствующих им частот:
При этом . 2. Вычисляются выборочная средняя и выборочное среднее квадратическое отклонение . 3. Нормируется случайная величина , т.е. переходят к величине и вычисляются концы интервалов : , , причем наименьшее значение , т.е. , полагают равным , а наибольшее, т.е. , полагают равным . 4. Вычисляются теоретические вероятности попадания в интервалы по равенству ( — функция Лапласа) и, наконец, находятся искомые теоретические частоты .
Вопросы для повторения и контроля:
Опорные слова:
Критерий согласия, критерий Пирсона, эмпирическая частота, теоретическая частота, правило проверки нулевой гипотезы о нормальном распределении генеральной совокупности.
варианты . . . . . . . .
. . .
эмп. частоты . . . . .
. . .
. . .
. . .
Список литературы