logo
Рождаемость населения

162. Корреляция.

Раз­личают две формы связи меж явлениями в природе и обществе: функциональную и корреляционную.При корреляционнойсвязи значению каждой средней величины одного признака соответствует множество случайных значений друго­го взаимосвязанного с ним признака.

Например: Вес человека, при прочих равных, зависит в основном от его роста. Однако по­мимо роста на величину веса влияют и другие факторы: питание, сос­тояние здоровья и т.д. Поэтому у лиц одинакового роста относи­тельно редко встречаются одни и те же величины веса, обычно вес варьирует в определенных пределах.

При наличии действительной связи, установленной на основе конкретного анализа, статистика дает возможность измерить силу этой связи и установить степень зави­симости между изучаемыми явлениями.

Коэффициент корреляции одним числом измеряет силу связи между изучаемыми явлениями, а знак дает представление о ее направле­нии.

При положительной (прямой)связи, когда из­менение одного какого-либо явления идет в том же направлении, что и другого коэффициент корреляции может принимать любое значение в пределах от 0 до + 1.

В случае отрицательной (обратной)связи, когда изменение одного из изучаемых явлений сопровождается изменением другого в обратном направлении коэффициент корреляции выражается отрицательным числом и соответственно нахо­дится в пределах от 0 до (-1).

Чем ближе величина коэффициента корреляции к 1, тем соответственно сильнее (теснее) измеряемая им прямая или обратная связь. Коэффициент корреляции, равный 0, говорит о полном отсутствии связи.

Последовательность расчета коэффициента корреляции методом квадратов:1.Расчет средних Мхи Мyдля рядов «х» и «y».2.Вычисление отклонений каждой варианты ряда «х» и ряда «y» от их средних Мхи Мy.3.Возведение отклоненийdxиdyв квадрат.4.Вычисление произведенияdx·dy5.Определение суммdx2,dy2иdx·dy.6.Вычисление коэффициента корреляции по формуле:

Σ dx · dy

rxy = ------------------

Σ dx2 · dy2

7.Определение направления и силы связи (см. таблицу 2.14).

8.Расчет ошибки коэффициента корреляции по формуле:

1 – r2xy

mr = ± -------------

n - 2

9.Оценка достоверности коэффициента корреляции. t=rxy /mr

Коэффициент корреляции достоверен, если он превышает свою ошибку в 3 и более раз.

можно использовать вычисление коэффициента корреляции рангов по методу Спирмена (ρ).

Схема вычисления коэффициента корреляции методом рангов между возрастом студентов медицинского университета и их массой тела

Последовательность расчета коэффициента корреляции методом рангов:

1.Составление рядов парных признаков х и y.

2.Замена каждой величины признака ранговым (порядковым) но­мером - х1иy1.

При обозначении показателей рангами, начинают с меньшего (или с большего) в обоих рядах. Если отдельные показатели ряда встречаются несколько раз (например, 22; 23; 24), ранги проставляются следующим образом: возраст 22 года – встречается дважды, занимая по величине 2 и 3 ранговые места, поэтому порядковые номера в этом случае будут равны полусумме занимаемых этим возрастом мест - (2 + 3) : 2 = 2,5, то есть против каждого показателя возраста 22 года проставляется ранг 2,5. Возраст 23 года встречается 3 раза, занимая 4, 5 и 6 ранговые места. Ранги для возраста 23 года будут равны: (4 + 5 + 6) : 3 = 5, то есть против каждого показателя возраста 23 года проставляется ранг 5 и т.д.

3.Определение разности рангов d=x1-y1.

4.Возведение в квадрат разности рангов - d2.

5.Получение суммы квадратов разности рангов Σd2.

6.Вычисление коэффициента ранговой корреляции по формуле:

6 · Σd2

ρxy = 1 - ---------------

n · (n2 – 1)

6 - постоянный коэффициент,

n- число наблюдений.

7.Определение направления и силы связи (см. таблицу )8.Расчет ошибки коэффициента ранговой корреляции mρпо фор­муле:

1- ρ2xy

mρ = ± -----------------

n - 2

9.Расчет критерия tи оценка достоверности коэффициента корреляции:

ρxy

t = ----------

mρ

Метод Спирмена имеет некоторые преимущества перед методом Пирсона.

1. Метод Спирмена можно использовать при открытых значениях вариант (< 20; > 15 и т.д.).

2. Метод Спирмена можно использовать, если нет возможности измерить числовые значения вариант. Например, если нужно установить есть ли связь между ростом и весом у студентов в аудитории, в которой нет измерительных приборов. Можно проранжировать (построить) студентов по росту и весу. Метод Пирсона в этом случае не применим.