logo
УЧЕБНИК

Методы измерения между явлениями

Корреляционный анализ

Одной из важных задач исследовательской работы является выявление и измерение связи между признаками, характеризующими изучаемые явления или процессы. Различают функциональную и корреляционную связи.

При наличии функциональной связи изменение величины одного признака неизбежно вызывает совершенно определенные изменения величины другого признака. Примером такой связи может служить зависимость площади круга от его радиуса. Функциональная связь между явлениями присуща неживой природе. В биологических науках чаще приходится иметь дело с иной связью между явлениями, когда одной и той же величине одного признака соответствует ряд варьирующих значений другого признака, что обусловлено чрезвычайным многообразием взаимодействия различных явлений живой природы. Такого рода связь носит название корреляционной (correlation — соответствие, соотносительность). В то время, как функциональная связь имеет место в каждом отдельном наблюдении, корреляционная связь проявляется только при многочисленном сопоставлении признаков.

Рассмотрим, например, связь между возрастом детей-дошкольников и их ростом. Из приведенных данных видно, что с возрастом рост детей увеличивается, и поэтому можно предположить наличие связи между указанными признаками.

Таблица 5.13

Возраст

3 года

4 года

5 лет

6 лет

7 лет

Рост в см

100,3

102,9

108,1

113,7

118,3

92,6

100,1

106,8

113,8

119,2

93,8

101,6

107,8

113,3

119,4

93,7

98,4

104,6

111,8

116,1

94,2

99,4

107,4

112,1

Вместе с тем, следует отметить, что одному и тому же возрасту соответствует различный рост детей. Это происходит потому, что рост детей определяется не только возрастом, на него влияют многие другие секторы, в том числе условия жизни, питание, занятия физкультурой и др. Таким образом, можно прийти к выводу, что связь между возрастом и ростом детей является корреляционной.

Исследователю следует помнить, что обнаружение корреляции между сопоставляемыми явлениями не говорит еще о существовании причинной связи между ними. Для установления последней необходим всесторонний логический и специальный анализ существа изучаемых процессов. Статистический же метод позволяет обосновать полученные в результате научного исследования выводы о наличии тех или иных связей между явлениями, выделить самые главные из них.

Сила связи между явлениями, ее теснота и направленность определяются величиной коэффициента корреляции, который колеблется в пределах от 0 до 1. При r = 0 связь отсутствует, при r = 1 — связь полная, функциональная.

По направленности связь между явлениями может быть прямой (положительной), когда с увеличением (уменьшением) значений одного признака увеличиваются (уменьшаются) значения другого (то есть, когда признаки меняются в одном направлении), и обратной (отрицательной), когда с увеличением значений одного признака значения другого уменьшаются и наоборот (то есть, изменения признаков — разнонаправленны).

Таблица 5.14

Схема оценки тесноты корреляционной связи по коэффициенту корреляции

Теснота связи

Величина коэффициента корреляции при наличии

прямой связи ( + )

обратной связи ( — )

Связь отсутствует

Связь слабая

Связь умеренная

Связь сильная

Связь полная (функциональная)

0

от 0 до +0,3

от +0,3 до +0,7

от +0,7 до +1,0

+ 1,0

0 от

0 до —0,3

от -0,3 до -0,7

от -0,7 до -1,0

- 1,0

Приведем пример вычисления коэффициента корреляции по приведенной формуле (см. табл. 5.15).

• Ход вычислений здесь чрезвычайно прост. Суммируя ряды х и у, получаем х = 119 и у = 105,2. Деля суммы на число членов ряда (п), получаем средние арифметические этих рядов: Мх = 119: 12 = 9,9 и Мх = 105 : 12 = 8,8. Ряды dx и dy, то есть отклонение чисел рядов х и у представляют собой разность между соответствующими значениями х и у и средним арифметическим этих рядов. Так, для ряда х, dx равно для января: х-М = 5-9,9 = -4,9; для февраля: х-М = 2-9,9 = -7,9 и т.д. Возводя поочередно числа рядов dx и dy в квадрат, получаем ряды и ,a преумножая попарно числа рядов dx и dy между собой, получаем ряд dx • dy.

Таблица 5.15

Корреляция между среднемесячной температурой воздуха

и числом умерших детей до 1 года от кишечных заболеваний

(в одной из стран Центральной Азии)

Месяц года

х

y

dx

dy

средняя температура воздуха (в °С)

среднедневные числа умерших от острых

кишечных инфекций

январь

5

5,0

-4,9

-3,8

24,01

14,44

18,62

февраль

2

5,5

-7,9

-3,3

62,41

10,89

26,07

март

4

6,2

-5,9

-2,6

34,81

6,76

15,34

апрель

8

5,4

-1,9

-3,4

3,61

11,56

6,46

май

15

6,5

5,1

-2,3

26,01

5,29

11,73

июнь

17

9,6

7,1

0,8

50,41

0,64

5,68

июль

18

11,2

8,1

2,4

65,61

5,76

19,44

август

17

15,3

7,1

6,5

50,41

42,25

46,15

сентябрь

15

14,9

5,1

6,1

26,01

37,21

31,11

октябрь

9

13,0

-0,9

4,2

0,81

17,64

-3,78

ноябрь

6

7,0

-3,9

-1,8

15,21

3,24

7,02

декабрь

3

6,2

-6,9

-2,6

47,61

6,76

17,94

п= 12

=119

= 9,9

=105,2

Му = = 8,8

=

406,92

=

162,44

=

178,32

Подставляем значения сумм этих рядов в формулу:

получим:

То есть, между среднемесячной температурой воздуха и числом умерших от острых кишечных инфекций существует прямая корреляционная связь.

Это чрезвычайно простое для понимания вычисление требует довольно кропотливой, хотя и несложной математической работы. Вычислительная работа особенно затрудняется тогда, когда члены коррелируемых рядов имеют большие числовые значения, особенно, если варианты коррелируемых рядов приведены в виде сгруппированных интервалов и, следовательно, приходятся вычислять не простую, а взвешенную среднюю.

Средняя ошибка коэффициента корреляции. Поскольку коэффициент корреляции в клинических исследованиях рассчитывается обычно для ограниченного числа наблюдений, нередко возникает вопрос о надежности полученного коэффициента. С этой целью определяют среднюю ошибку коэффициента корреляции. При достаточно большом числе наблюдений (больше 100) средняя ошибка коэффициента корреляции (mr) вычисляется по формуле:

п — число наблюдений.

В том случае, если число наблюдений меньше 100, но больше 30, точнее определять среднюю ошибку коэффициента корреляции, пользуясь формулой:

С достаточной для медицинских исследований надежностью о наличии той или иной степени связи можно утверждать только тогда, когда величина коэффициента корреляции превышает или равняется величине трех своих ошибок ( 3mr). Обычно это отношение коэффициента корреляции ( ) к его средней ошибке (mr) обозначают буквой t и

Если 3, то коэффициент корреляции достоверен.

Дисперсионный анализ

Дисперсионный анализ позволяет дать обобщенную характеристику трем и более средним величинам или показателям и позволяет:

— измерить силу влияния;

— оценить разность частных средних или показателей;

— определить достоверность разности частных средних или показателей.

Дисперсионный анализ показывает степень рассеивания вариации (дисперсии) измеряемых признаков вокруг среднего типичного уровня, поэтому он дает возможность изучить действие на конечный результат исследования нескольких факторов вместе, роль каждого из них и сравнить действие отдельных факторов между собой.

Изучение действия факторов производится путем сравнения средних значений наблюдаемого признака, полученных в результате воздействия каждого из этих факторов при разном их сочетании.

Различают следующие виды дисперсионного анализа: однофакторный, двухфакторный и многофакторный.

Методика проведения дисперсионного анализа изложена в многочисленных специальных изданиях по медицинской статистике.