jump to navigation

O przyczynowości i korelacji 03/26/2008

Posted by Mikołaj Morzy in eksploracja danych, teoria.
trackback

Causality

  • korelacja (dodatnia) występuje między wartościami dwóch zmiennych losowych jeśli wysokie wartości jednej zmiennej z dużym prawdopodobieństwem wiążą się z wysokimi wartościami drugiej zmiennej,
  • przyczynowość występuje między dwoma zmiennymi losowymi jeśli jedna zmienna wyznacza wartości drugiej zmiennej.

Jak widać z powyższych definicji, przyczynowość implikuje korelację, ale korelacja wcale nie musi implikować przyczynowości. Najlepszym dowodem na to jest fakt, że na przestrzeni 10 lat wskazania indeksu S&P 500 są doskonale skorelowane z produkcją sera i masła w Bangladeszu oraz tamtejszą populacją owiec. Z grubsza można założyć, że obserwacje prowadzą tylko do ustanowienia relacji korelacji, podczas gdy losowe eksperymenty prowadzą do ustanowienia przyczynowości. Jak się okazuje, takie proste rozgraniczenie może mieć poważne konsekwencje. Jak dowodzą autorzy artykułu pt. „Parachute use to prevent death and major trauma related to gravitational challenge„, brak poważnych eksperymentów losowych nie pozwala ocenić, na ile spadochrony rzeczywiście łagodzą skutki upadku z dużej wysokości (polecam lekturę, to przykład bardzo śmiesznego artykułu naukowego – ale z góry uprzedzam, że jest to humor bardzo, ale to bardzo hermetyczny).

Komentarze»

No comments yet — be the first.

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s

%d bloggers like this: