Кластерный анализ

Кластерный анализ — многомерный метод статистической обработки данных, применяемый для классификации объектов, т.е. разделения их на группы или классы, таким образом, что объекты в каждой группе больше похожи друг на друга, чем на объекты из других классов. Группы, выделенные по результатам кластерного анализа, называют кластерами.

Объектами для кластеризации в психологических исследованиях могут быть как испытуемые, так и признаки (шкалы психодиагностических методик, показатели социально-демографических характеристик и т.д.), а также корреляции, результаты социометрии и т.д.

На практике кластерный анализ корреляций можно применять как альтернативу факторному. В сравнении с факторным анализом, кластерный анализ обладает следующими преимуществами:

  1. Отсутствие даже минимальной потери исходных данных. Если факторный анализ неизбежно сопровождается потерей 30%-50% данных, то при кластерном анализе потери исходных данных нулевые.
  2. Наглядность результатов. По результатам кластерного анализа строится так называемая дендрограмма — древовидный график, диаграмма в виде дерева, ветви которого наглядно отражают результат кластеризации.
  3. Обнаружение не только степени связанности, но и иерархической соподчиненности кластеров.

Недостаток кластерного анализа в сравнении с факторным: если факторный анализ «умеет» включать одну и ту же шкалу в состав нескольких факторов, то кластерный анализ может включить одну шкалу в состав только одного кластера. Поэтому результаты факторного анализа могут быть более полными и информативными в сравнении с результатами кластерного анализа.

В исследованиях, требующих многомерных методов обработки данных, желательно проводить оба метода и сравнивать результаты. Существует большая вероятность того, что результаты факторного анализа совпадут с результатами кластерного анализа корреляций.

Кластерный анализ можно осуществить в компьютерной программе SPSS (PASW Statistics). Программа MicroSoft Excel, при всех ее преимуществах, кластерный анализ считать не умеет.