Корреляционный анализ

Корреляционный анализ — один из главных методов статистической обработки результатов исследований в области психологии, биологии, медицины и т.д. — всех тех наук, которые изучают то, что уже существует в природе, а человек пытается понять, каким же закономерностям оно подчиняется.

Метод корреляционного анализа позволяет обнаружить линейные (прямые и обратные) связи между двумя переменными.

Что такое линейная связь? Говоря доступным языком, это связь между двумя измеряемыми переменными, которую можно обозначить словами «чем больше одно, тем больше другое» (прямая связь) или «чем больше одно, тем меньше другое» (обратная связь).

Простой пример прямой связи — это связь между возрастом и ростом детей. Всем нам хорошо известно, что связь между возрастом и ростом детей такова: чем больше возраст, тем больше (выше) рост. У маленького по возрасту ребенка — маленький рост, у ребенка побольше — рост повыше, а у большого ребенка — совсем большой рост, практически как у взрослого.

Для наглядности находим на просторах интернета соответствующую таблицу, отражающую связь между возрастом и ростом детей:

Возраст детей (лет) Средний рост детей (см) Возраст детей (лет) Средний рост детей (см)
0 50 8 125
1 74 9 129
2 86 10 135
3 93 11 140
4 100 12 145
5 106 13 150
6 114 14 157
7 119 15 160

Поскольку таблица нужна только для примера, не будем зацикливаться на вопросе о том, насколько она достоверна. Удовлетворимся тем фактом, что данные в таблице похожи на настоящие.

Для еще большей наглядности построим график: шкала Х отражает возраст ребенка в годах, шкала Y — рост ребенка в сантиметрах.

Корреляция. Пример

И в таблице, и на графике хорошо видно, что по мере увеличения одного показателя (возраст детей) увеличиваются и значения второго показателя (рост детей). Об этом же нам говорит и собственный опыт: все мы знаем, что дети с возрастом становятся выше. Чем больше возраст ребенка, тем выше его рост. Это и есть прямая связь между двумя переменными (в данном случае — возрастом и ростом).

Какие еще простые примеры прямой связи можно привести из жизни? Чем больше книг читает человек, тем более начитанным он становится. Чем более высокооплачиваемой является работа, тем больше желающих на нее устроиться. Чем активнее мы используем свои холодильники, тем шире наши лица. Чем дальше в лес, тем больше дров. Ну и так далее. Увеличивается одно — увеличивается другое.

Бывает и наоборот: увеличивается одно — уменьшается другое. Чем чаще ребенка ругают, тем ниже его самооценка. Чем в большей мере наше внимание сконцентрировано на чем-то одном, тем меньше мы замечаем другое. «Чем меньше женщину мы любим, тем легче нравимся мы ей». Тише едешь — дальше будешь. Это обратная связь между двумя переменными.

Прямая связь и обратная связь — это две разновидности линейной связи между переменными. Именно такие связи выявляет корреляционный анализ.

На практике далеко не всегда ответ настолько очевиден, как в случае связи между возрастом и ростом детей. Очень часто встречаются случаи, когда невозможно навскидку с уверенностью сказать, существует линейная связь между двумя переменными или нет. Поэтому ученые математики придумали способ достоверно определять ее наличие или отсутствие — корреляционный анализ. А мы этим способом пользуемся в своих исследованиях.

Нам не нужно помнить формулы наизусть и уметь их выводить — это задача математиков. Наша задача — правильное применение корреляционного анализа в своих исследованиях, правильный расчет коэффициентов корреляции в компьютерных программах и верная интерпретация результатов корреляционного анализа.