Выборочный коэффициент корреляции и его свойства
План:
- Корреляционный момент и коэффициент корреляции.
- Выборочный коэффициент корреляции.
- Выборочное корреляционное отношение.
- Свойства выборочного корреляционного отношения.
Корреляционным моментом случайных величин и называется математическое ожидание произведения отклонений этих величин:
. (15.1)
Отсюда легко можно получить соотношение
. (15.2)
Коэффициентом корреляции случайных величин и называется отношение корреляционного момента к произведению средних квадратических отклонений этих величин:
. (15.3)
Из соотношения (15.2) вытекает, что корреляционный момент и, следовательно, коэффициент корреляции независимых случайных величин равен нулю.
Две случайные величины и называются коррелированными, если их коэффициент корреляции отличен от нуля; и называются некоррелированными величинами, если их коэффициент корреляции равен нулю.
Из вышесказанного следует, что независимые случайные величины всегда являются некоррелированными, а две коррелированные случайные величины также и зависимы. Действительно, если предположить, что коррелированные случайные величины независимы, то для них должно выполняться соотношение , а это противоречит тому, что для коррелированных величин всегда выполняется .
С другой стороны, две зависимые случайные величины могут быть как коррелированными, так и некоррелированными; некоррелированные случайные величины могут быть как зависимыми, так и независимыми.
Если случайные величины и независимы, то коэффициент корреляции ; если , то случайные величины и связаны линейной функциональной зависимостью. Отсюда следует, что коэффициент корреляции измеряет силу (тесноту) линейной связи между и .
Величина , определяемая равенством
, (15.4)
называется выборочным коэффициентом корреляции. Здесь и — варианты (наблюдавшиеся значения) признаков и ; — частота пары вариант ; — объем выборки (сумма всех частот); , — выборочные средние квадратические отклонения; , — выборочные средние.
Выборочный коэффициент корреляции является оценкой коэффициента корреляции генеральной совокупности. Поэтому его можно использовать и для измерения линейной связи между величинами — количественными признаками и .
Пример 1. Найти выборочное уравнение прямой линии регрессии на по данным следующей корреляционной таблицы:
Решение. Сначала вычислим выборочный коэффициент корреляции по формуле (15.4): ; ; ; ; ; ; ; . Теперь подставим найденные значения в формулу (14.18) и получим выборочное уравнение прямой линии регрессии на : или окончательно .
Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репрезентативна), то заключение о тесноте линейной зависимости между признаками, полученное по данным выборки, в известной степени может быть распространено и на генеральную совокупность. Например, для оценки коэффициента корреляции нормально распределенной генеральной совокупности (при ) можно воспользоваться формулой . Итак, для оценки тесноты линейной корреляционной связи между признаками в выборке служит выборочный коэффициент корреляции. Для оценки тесноты нелинейной корреляционной связи вводится понятие выборочного корреляционного отношения. Выборочным корреляционным отношением к называется следующее отношение . (15.5) Здесь ; , где — объем выборки (сумма всех частот); — частота значения признака ; — частота значения признака ; — общая средняя признака ; — условная средняя признака . Аналогично определяется выборочное корреляционное отношение к : . (15.6) Пример 2. Найти по данным следующей корреляционной таблицы: Т а б л и ц а 15.2
Решение. Сначала найдем , и : ; ; . Теперь подставим все эти значения в формулу (15.5) и найдем : .
Перечислим свойства выборочного корреляционного отношения. Свойство 15.1. Выборочное корреляционное отношение удовлетворяет двойному неравенству . Свойство 15.2. Если , то признак с признаком корреляционной зависимостью не связан. Свойство 15.3. Если , то признак связан с признаком функциональной зависимостью. Свойство 15.4. Выборочное корреляционное отношение не меньше абсолютной величины выборочного коэффициента корреляции: . Свойство 15.5. Если выборочное корреляционное отношение равно абсолютной величине выборочного коэффициента корреляции, то имеет место точная линейная корреляционная зависимость.
Вопросы для повторения и контроля:
Опорные слова:
Корреляционный момент, коэффициент корреляции, коррелированные случайные величины, некоррелированные случайные величины, выборочный коэффициент корреляции, выборочное корреляционное отношение.
10
20
30
40
50
60
15
5
7
—
—
—
—
12
25
—
20
23
—
—
—
43
35
—
—
30
47
2
—
79
45
—
—
10
11
20
6
47
55
—
—
—
9
7
3
19
5
27
63
67
29
9
10
20
30
15
4
28
6
38
25
6
—
6
12
10
28
12
21
15
20