Macierz korelacji w Excelu

Macierz korelacji w Excelu

Posted on Posted in wykresy

W dzisiejszym wpisie dowiemy się jak stworzyć macierz korelacji liniowej w Excelu. Wspomniana macierz pozwoli nam na szybkie zorientowanie się w zależnościach jakie zachodzą pomiędzy badanymi zjawiskami.

 

Trochę teorii

Badając korelację liniową zmiennych, sprawdzamy jak zachowują się one względem siebie np. gdy jedna wzrasta to druga maleje. Współczynnik korelacji liniowej, mieści się w przedziale <1,-1>, gdzie 1 oznacza silną korelację dodatnią (zmienne reagują w tym samym kierunku) a -1 silna korelację ujemną (zmienne reagują w przeciwnym kierunku). Jeżeli współczynnik wynosi 0 mówimy o braku korelacji.

Chcąc ocenić poziom zależności zmiennych, przyjmuje się następujące zakresy:
- <0,2 brak zależności

- 0,2-0,4 słaba zależność

- 0,4-0,7 umiarkowana zależność

- 0,7-0,9 dość silna zależność

- >0,9 bardzo silna zależność

Zakresy te mogą się oczywiście różnić, w zależności od dziedziny nauki, której dotyczą. Przykładowo w naukach ekonomicznych, niższe wartości mogą już oznaczać silną korelację, w przeciwieństwie do precyzyjnych badań przeprowadzanych np. w fizyce.
Warto również dodać, że wyliczenie współczynnika korelacji liniowej możemy przeprowadzić tylko dla cech ilościowych, charakteryzujących się rozkładem jak najbardziej zbliżonym do normalnego.
Na koniec jedna ważna rzecz. Korelacja to nie wynikanie! To, że jedna zmienna jest silnie skorelowana z drugą, wcale na nie musi oznaczać, że istnieje pomiędzy nimi jakieś logiczne powiązanie. Przykładowo liczba osób, którzy utonęli wypadając z łódki podczas wędkowania a współczynnik zawieranych małżeństw w stanie Kentucky są ze sobą mocno skorelowane.

 

Przykład korelacji bez powiązań pomiędzy danymi

 

Więcej ciekawych przykładów możecie znaleźć na stronie Tylera Vigen’a.

 

Macierz korelacji w Excelu

Do wykonania naszej macierzy posłużymy się dodatkiem Analysis ToolPak, którego włącza się korzystając ze ścieżki Plik-->Opcje-->Dodatki-->Przejdź do dodatków programu Excel-->Analysis ToolPak. Dodatek będzie później dostępny pod Kartą Dane w grupie Analiza. Stworzona przez nas macierz, posłuży nam do sprawdzenia korelacji pomiędzy danymi, dotyczącymi uzyskanej oceny z egzaminu. Aby wykonać macierz, klikamy na dodatek Analysis ToolPak i wybieramy z niego opcję Correlation. Następnie jako zakres danych, zaznaczamy obszar naszej tabelki włączając w to nagłówki kolumn. Na końcu wybieramy miejsce, w którym ma zostać zwrócone nasze zestawienie np. nowy arkusz.

 

Dodatek analiza danych Excel - korelacja

 

Teraz, kiedy pół macierzy mamy już gotowe, wystarczy zaznaczyć jej zawartość a następnie skopiować jej wartości korzystając z opcji transponacji.

 

Wklej specjalnie z opcją transponacji

 

W kolejnym kroku ponownie kopiujemy zaznaczony obszar i wklejamy go do komórki B1 wybierając opcję wartości + pomijaj puste.

 

Pomijaj puste wartości przy wklejeniu

 

Aby macierz była bardziej czytelna można zastosować dla niej formatowanie warunkowe w postaci heat mapy oraz zmniejszyć szczegółowość wyświetlanych liczb. Nasza macierz jest już gotowa. Możemy teraz na niej bez problemu sprawdzić jak skorelowane są ze sobą poszczególne zmienne.

 

Macierz korelacji w Excelu

2 thoughts on “Macierz korelacji w Excelu

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *