OqPoWah.com

Метод главных компонент

Метод главных компонент основывается на попытках пояснить максимальный уровень дисперсии в определенном наборе переменных, и сориентирован на элементы, расположенные в корреляционной матрице по диагонали. Существует еще один метод, построенный на факторном анализе, направленный на осуществление аппроксимации корреляционной матрицы с использованием определенного числа факторов (меньшего, чем заданное количество переменных), но самими способами аппроксимации существенно отличается от первого предложенного метода.

Итак, метод факторного анализа позволяет объяснить корреляцию между самими переменными, и сориентирован на элементах матрицы корреляционного типа, находящихся вне ее диагонали.

Исходя из практического применения, попробуем разобраться в необходимости применения того или иного метода. Факторный анализ применяется тогда, когда существует заинтересованность исследователя в изучении взаимосвязи между переменными, метод главных компонент же используется в случае необходимости сокращения размерности данных и в меньшей степени требуется интерпретация их.

Исходя из практики, можем увидеть, что методы факторного анализа используют достаточно большое количество наблюдений. При этом данное количество на порядок должно быть выше, чем число выявленных факторов.

Метод главных компонент является очень популярным в маркетинговых исследованиях, так как его можно использовать при наличии мультиколлинеарности исходных данных. В процессе таких маркетинговых исследований опросные листы содержат подобные вопросы, и полученные ответы на них и будут отвечать принципам мультиколлинеарности.

Метод главных компонент целесообразно рассматривать в совокупности показателей, которые должны быть для исследователя ориентиром при предварительном выборе числа компонент или факторов. Наиболее важными из них являются собственные числа, выражающие уровень дисперсии переменных, объясняемые этим фактором. Существует и одно важное эмпирическое правило, которое весьма полезно для оценки числа факторов (должно быть столько факторов, сколько существует собственных чисел свыше единицы). Можно это правило объяснить и несколько проще – собственные числа выражают долю нормированных дисперсий переменных, которые объясняются фактором, и в случае превышения его единицы они должны выражать эти дисперсии, содержащиеся более чем в одной переменной.




Необходимо еще раз уточнить, что правило «единичных собственных чисел» – эмпирическое, и вопрос о необходимости его применения может быть решен только самим исследователем. Например, собственное число имеет значение, меньшее единицы, но при этом объясняется разброс, распределяемый между переменными. Для специалиста в маркетинговой сфере очень важно, чтобы при сегментировании выявленные факторы имели содержательный смысл. И те факторы, содержащие собственные числа свыше единицы, но не имеющие содержательную интерпретацию, будут им не приняты во внимание. И может возникать ситуация совершенно наоборот.

Еще один важный вопрос, касающийся практического применения методов факторного анализа – вопрос вращений. Может рассматриваться такие варианты вращений. Самый популярный из них – метод варимакс. Он основан на достижении максимального уровня дисперсией переменных на каждый отдельный фактор. Указанный метод помогает найти вращение, у которого одни переменные принимают высокие значения, а другие – достаточно низкие на каждый отдельный фактор.

Другой метод вращения – квартимакс, он помогает найти определенный поворот, в котором факторы на каждую отдельную переменную имеют одновременно и низкие, и высокие нагрузки.

Метод вращения эквимакс является некоторым компромиссом между двумя способами, рассмотренными выше.

Все указанные методы относятся к ортогональным с взаимно перпендикулярными осями, при их использовании прослеживается отсутствие корреляции между отдельными факторами.

Zdieľať na sociálnych sieťach:

Príbuzný