Krzysztof Dudziak

Krzysztof Dudziak Analityk danych

Temat: Problem z wynikami analizy kanonicznej.

Witam wszystkich,

Badam związek 8 zmiennych objaśniających z 8 zmiennymi objaśnianymi przy użyciu analizy kanonicznej. Wyniki wskazują na 40% całkowitą redundancję zbioru prawego przy danym lewym zbiorze, przy czym jedynie pierwszy pierwiastek kanoniczny (o redundancji = 10%) jest istotny statystycznie.

Zastanawiam się czy w raporcie mam prawo "chwalić" się wartością redundancji całkowitej, skoro tylko jeden pierwiastek kanoniczny jest istotny?

Moją drugą wątpliwość budzi to, że analizowany zbiór ma zaledwie 40 obserwacji, czyli zdecydowanie mniej niż jest to zalecane. Czy wobec tego warto jest w ogóle bawić się w analizę kanoniczną?

Z góry dzięki za pomoc.

Temat: Problem z wynikami analizy kanonicznej.

Są co najmniej dwa powody, dla których nie warto.

1 (zarzut techniczny)
Przy tej liczebności próby wyniki analizy korelacji kanonicznych można traktować w zasadzie jako przypadkowe. Próba musiałaby być dużo większa, aby uzyskać wyniki stabilne. W szczególności, że nie wygląda na to, aby istniały jednoznaczne i silne zależności pomiędzy zbiorami zmiennych.

2 (zarzut esencjonalny).
Analiza korelacji kanonicznych być może ma pewne walory eksploracyjne, ale w mojej opinii są one jednak mniejsze, niż to, co pokazuje zwykła macierz korelacji, macierz wykresów rozrzutu lub macierz wykresów rozrzutu między kilkoma pierwszymi dwoma-trzema składowymi głównymi dla zbiorów zmiennych.

Gdy mamy już jakąkolwiek wiedzę, która teoretycznie może ukierunkować analizę (a tylko wtedy warto się za analizę w ogóle zabierać), technika ta przestaje być użyteczna. Widzę pewne możliwości dla zastosowania jej w celu zautomatyzowanej redukcji danych, ale - po prawdzie - dobrego praktycznego zastosowania ani nie znam ani nawet nie bardzo jestem w stanie wymyślić takie zastosowanie, dla którego nie byłoby lepszej alternatywy.

Ateoretyczny charakter analizy łatwo może prowadzić do wyników sprawiających problemy interpretacyjne. Lecz nawet wtedy, gdy interpretacja jest oczywista, wynik analizy nie może być porównywany pomiędzy próbami. Aby możliwość porównań czy replikowalności wyniku zapewnić, i tak potrzebna jest zmiana podejścia (i wykorzystanie analizy korelacji kanonicznych wyłącznie eksploracyjnie).

W rezultacie lepszą alternatywą, która będzie mogła mieć teoretyczne podstawy i może być teoretycznie ukierunkowana, jest redukcja danych (tworzenie skal, wskaźników) dla obu zbiorów zmiennych a następnie analiza korelacji lub budowa modeli statystycznych na wskaźnikach. Prostota idzie tu w parze z użytecznością. Drugą alternatywą jest budowa modelu równań strukturalnych. W obu przypadkach łatwiej poradzić sobie można z niewielką liczebnością próby.

HTH. Być może jest tutaj ktoś, kto ma lepszą opinię o korelacjach kanonicznych.

Następna dyskusja:

Problem z tabelami




Wyślij zaproszenie do