Statistikken komme ikke i mål
- Astrologien bevist? En kommentar til en artikel om
statistisk undersøgelse af astrologien i Månedsbladet
Stjernerne. Her blev det fremført, at antallet af
Væddere blandt danske fodboldspillere var signifikant (Lars
Sten Larsen, 1993)
Statistikken kom ikke i mål
- Astrologien bevist? af Lars Steen Larsen
Stjernerne • August 1993
Teorien om de 40% flere Væddere
blandt danske fodboldspillere kan diskuteres. Lars Steen
Larsen har gennemgået det fremviste, statistiske
materiale, og hans beregninger fører til et noget andet
resultat.
I en artikel af Birthe Kirk fra
Tvillinge-nummeret (Stjernerne 3/93, side 51-55) kunne
man læse, at der nu findes en statistik, der beviser
astrologien - nemlig en undersøgelse om danske
fodboldspillere og deres stjernetegn. Undersøgelsen er
lavet af Jens Kirk. Der er bare det ved det, at en
matematisk analyse konkluderer, at materialet ikke er
signifikant. Om sin egen undersøgelse siger Jens Kirk:
"Videnskaben bliver hermed tvunget til at erkende, at
verden (naturen) ikke kan determineres fuldstændigt. Der
er endnu sider af naturen, der ikke er klarlagt".
Hermed mener han sikkert, at hans analyse er et bevis på
eksistensen af andre sammenhænge end dem, videnskaben
kender til. Dette kan udmærket være rigtigt, men det kan
bare ikke udledes af undersøgelsen.
Demografiske forhold har
indflydelse på soltegnene
Fejlen er, at Jens Kirk anvender
tests, der ikke kan bruges i denne sammenhæng. Han
anvender såkaldte parametriske tests, der forudsætter en
normal-fordeling. En normal-fordeling vil sige, at de
enkelte udfald (her om man er født i Vædder, Tyr,
Tvilling etc.) er lige sandsynlige.
I en astrologisk analyse af soltegn spiller de
demografiske forhold ind. Disse betyder, at fødsler ikke
fordeles jævnt året rundt. De varierer fra land til
land. Jens Kirk opgiver estimerede tal - givetvis
baseret på Danmarks Statistik - og finder så frem til
det forventede antal fodboldspillere for hvert tegn,
hvilket han sikkert har gjort rigtigt.
Fodboldspillere og "Væddere"
Resultatet af Jens Kirks
undersøgelse kan ses i tabellen »Alle spillere« i
Tvillinge-nummeret på side 55 øverst.
Jens Kirk regner, som om tallene
er normal-fordelte. Han bruger f.eks. en F-test - men
denne kan kun anvendes, såfremt der i virkelighedens
verden er født lige mange i hvert tegn. Den eneste
anvendelige test, han benytter til ikke-normalt-fordelte
data, er Chi-^2-testen. Denne test kan anvendes som
ikke-parametrisk test. Jens Kirk bruger den dog ikke,
hvor den skal bruges, nemlig til at sammenholde
observerede data med estimerede. En Chi-^2-test er ret
enkelt at bruge.
For hver observation (Vædder er en observation, Tyr den
næste etc.) findes:
(O-E)^2/E
hvor
O = observeret
E = Teoretisk forventet (estimeret)
For Vædder giver dette: (107-76.3)^2/76.3 = 13.35
For Tyren fås: (67-74.7)^2/74.7 = 0.79
Sådan gør man nu med de sidste 10 tegn, og de fundne tal
skal nu adderes. Dette giver sammenlagt 18.20. Dette tal
er ikke signifikant på 95% niveau (svarende til 95%
sikkerhed), hvilket normalt er den »magiske« grænse.
Tallet skulle være større end eller lig med 19.60.
Chi^2-testen er meget brugt, og det er svært at
overbevise videnskaben, når denne test ikke giver
resultat.
Ikke-parametriske tests
Man kan finde andre
ikke-parametriske tests, og jeg har nedenfor anvendt to.
Den første kræver en del regning, så her er blot
resultatet:
Testen (Hutcheson, 1970) for to sæt observationer viser,
at der er 96% sikkerhed for, at de to fordelinger
(observeret gruppe kontra estimeret gruppe) er
uafhængige - altså at de observerede tal er
signifikante. Der er bare den indsigelse, at
ikke-parametriske tests er velmenende forsøg i mangel af
bedre på at sammenligne materiale, der er svært at
sammenligne. Der findes derfor en del af sådanne tests.
En anden meget anvendt test - med denne type
problemstilling - er Mann-Whitney. Denne er ret simpel,
og man tæller »rang-ordenen« i begge grupper. Det
højeste tal er de observerede (Vædder med 107),
næsthøjeste tal (rang) er også i den observerede gruppe
(Tvilling med 78), mens tallet fra den estimerede gruppe
kommer tredje højest (76.3).
Ved at tælle hvilken gruppe, der bidrager med hvilken
rang, kan man beregne eventuel signifikans. Her fås det
facit, at den observerede gruppe, hvor Vædder bidrager
med 107 fodboldspillere, ikke engang er signifikant på
80% niveau.
Nu er man i den situation, man kan forvente:
Chi^2-testen giver ikke resultat - hvilket altid er
yderst betænkeligt, hvorved det ikke overrasker, at én
test lige netop sniger sig over grænsen med 96%
sikkerhed, mens en anden test ikke engang kan love 80%
sikkerhed. Som nævnt før, er konklusionen derfor: Kan
Chi^2-testen ikke give resultat (anvendt som beskrevet),
skal man ikke tro, at man har fundet noget bevis.
Matematisk er der ikke nok at hente her.
Trods de 40% flere Væddere kunne man tro, at dette tal
ville bevise astrologien, men dette vil kræve et større
antal fodboldspillere end de anvendte 827.
Matematikken er her sådan, at hvis den samme procent
holder ved 1000 data, så begynder det at ligne mere. Så
hvis Jens Kirk kan finde f.eks. et par hundrede flere
fodboldspillere (eller ca. 1000 engelske spillere) der
også viser 40% flere Væddere, ja, så har han fat i
noget. Så vil de fleste måske sige, at det er nemt nok
at få det 40% forspring, som Vædderne har, til at holde
- også ved 1000 fodboldspillere. Det må tiden vise.
Signifikans
Øvrige konklusioner fra
materialet, som f.eks. at Fisk kan lide midtbanen, er
konklusioner, der falder væk. Gruppen af
midtbanespillere giver en Chi^2-test på 14,55 - altså
endnu lavere end før.
Resultatet: Der er således intet tegn, heller ikke
Vædder, der opnår et afgørende udslag. Konklusionen i
Jens Kirks undersøgelse, at Vædderen er signifikant
repræsenteret, holder ikke matematisk.
Den anden af hans konklusioner - at de øvrige tegn dog
ikke er signifikante - er ganske korrekt. Så facit
bliver, at man ikke kan konkludere noget som helst ud
fra tegnene.
Tilbage står, om de fire grupper - målmænd, midtbane,
forsvarere og angribere - i forhold til hinanden har en
signifikant variation. Jens Kirks tal er ret
signifikante. Hans metode er her rimelig, men større
nøjagtighed fås ved konsekvent at anvende
ikke-parametriske tests i hele analysen.
Udregnes for eksempel gruppen »målmænd« kontra
»midtbane« med de to tidligere omtalte tests, fås
signifikante resultater. Målmænd fordeler sig i soltegn
anderledes end midtbanespillere, men så længe der ikke
er noget tegn, der er signifikant i nogen gruppe, har
man altså et resultat, man ikke kan bruge til noget.
Jens Kirk har fundet frem til - ud fra det foreliggende
materiale - at stjernetegnene »søger« forskellige
opgaver i fodboldspil - men der er ingen, der véd hvilke
stjernetegn, der søger hvad.
Samlet konklusion
Den samlede konklusion er, at
materialet er for lille i forhold til den opgave,
undersøgelsen går ud på. Hvis vi antager, at Vædderen
fortsætter med sit + 40% udsving ved en større
datamængde, vil Vædderen som sagt blive signifikant, og
samtidig vil de enkelte grupper få et bedre testresultat
- men stadigvæk ikke nok. Her skal Jens Kirk undersøge
ca. 1400 fodboldspilleres soltegn for at man kan
konkludere, at f.eks. Fisk gemmer sig på midtbanen.
Hvis hypotesen om, at Vædderen er overrepræsenteret,
ikke holder stik ved et større datamateriale, vil der
ske det, at de enkelte grupper målmænd, midtbane,
forsvarere og angribere ikke længere viser forskellig
fordeling. Det er nemlig hyppigt forekommende, at
undergrupper i et ikke-signifikant materiale viser
udslag i deres indbyrdes variation, når man anvender små
data-grupper, men at dette udslag hører op ved større
antal data. Bolden kom måske i mål - men beviset gjorde
det ikke.