Mi a korreláció?

olvasási idő: 2-3 perc


A köznyelvben a korreláció kölcsönös viszonyt, egymástól való függést jelent. Éppen ez utóbbi definíció adja a legtöbb félreértést a matematikai vagy statisztikai közegben használt korreláció fogalmával szemben. Amikor ugyanis tudományos szövegben találkozunk a korreláció szóval, ott szó sincs ok-okozati viszonyról. Ezt érdemes észben tartani tudományos publikációk olvasása során.

Mi a korreláció?

Ha arra vagyunk kíváncsiak, hogy két jelenség mennyire függ össze egymással, azt korrelációszámítással végezzük. Ha például arra vagyunk kíváncsiak, hogy a gyakori fogmosás összefügg-e a haj korpásodásával, akkor korrelációszámításba kezdünk. Ennek eredményeként egy -1 és +1 közötti számot kapunk. Ez a korrelációs együttható (jele r). A szám előjele a kapcsolat irányát, abszolút értéke pedig a kapcsolat szorosságát jellemzi. Ha az eredmény nulla, akkor a két jelenség teljesen független egymástól. A -1 és a +1 a tökéletes összefüggést jelentené, de ilyen eredmény valódi kutatási helyzetben sosem jön ki. Minél inkább megközelíti a végeredmény a két végletet, annál erősebb a viszony a két változó között.

Három példa

Abban a mondatban, hogy “a depresszió megléte nem korrelál a neurológiai állapot súlyosságával”, a korrelációs együttható értéke minden bizonnyal a nullához közelít. Ez arra utal, hogy nincs kapcsolat a két megfigyelés között, azaz megközelítőleg ugyanolyan arányban élnek jó állapotban lévő depressziós és jó állapotban lévő nem depressziós, illetve súlyos állapotban lévő depressziós és súlyos állapotban lévő nem depressziós SM betegek egyaránt. A depresszióból tehát nem lehet következtetni az SM súlyosságára, és megfordítva, a neurológiai állapotból sem következik, hogy a beteg hogy érzi magát.

Az a mondat, hogy “a fáradékonyság korrelál leginkább a kognitív hanyatlással”, azt sejteti, hogy a korrelációs együttható a +1 felé közelít. Ez az egyenes arányosság. Minél fáradékonyabb tehát a beteg, annál valószínűbb, hogy szellemileg is eltompul, vagy megfordítva, minél rosszabbak a beteg kognitív képességei, annál nagyobb esélye van a fáradékonyságra.

Abból a mondatból, hogy “a sportteljesítmény fordítottan korrelál a depresszió mértékével”, gyaníthatjuk, hogy a korrelációs együttható a -1 felé tendál. Ez a fordított arányosság. Azaz minél jobb eredményeket produkál a beteg a sport terén, annál kevésbé depresszív, vagy megfordítva, minél kevésbé érzi magát levertnek valaki, annál jobban teljesít a sportban.

Mit jelent, ha két jelenség korrelál egymással?

A fenti három példában pirossal kiemelt fordított értelmezésekkel azt kívántam szemléltetni, hogy a korreláció egy szimmetrikus fogalom, azaz nem lehet az egyik vizsgált jelenséget felelőssé tenni a másik jelenség változásáért. A korreláció mögötti ok-okozati összefüggésről semmit nem tudhatunk meg. Ha két jelenség korrelál egymással, abból nem következik, hogy az egyik dolog okozza a másikat. A Wikipédia vicces példáján szemléltetve a gyakori félreértést, “ha egy vidéken a gólyafészkek és a gyerekek száma korrelál, akkor az nem bizonyítja azt, hogy a gyereket a gólya hozza”.

Éppen ezért megtévesztő, hogy a köznyelvben a korreláció szót az egymástól való függés értelmében használjuk, hiszen a statisztikai korrelációra ez hangsúlyozottan nem igaz. A korreláció mögötti oknyomozás szolgáltatja a leggazdagabb táptalajt a statisztikai félreértelmezések számára.

képregény a korreláció értelmezéséről

Mentés

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük