Välj konfidensnivå:

www.indstat.se

www.ing-stat.se

Konfidensintervall – en animering

Sannolikhetsfördelning

Konfidensintervall

μ:

σ:

+/-

röda intervall

μ-parameter

σ-parameter

Stickprovsstorlek

Antal stickprov

Grundläggande om konfidensintervall

En vanlig beskrivning i litteraturen är följande: "Ett konfidensintervall är ett numeriskt intervall som med en viss angiven konfidens omfattar det sanna värdet på parametern".
Konfidensintervallet beräknas med hjälp av en given datamängd; typiska parametrar i en fördelning är väntevärde, standardavvikelse, median men kan också vara andra percentiler. (Man kan ibland vilja skatta 5-percentil i en fördelning - det värde på X-axeln som delar utfallet i 5%/95%. Med hjälp av data kan man beräkna en punktskattning av percentilen ifråga och dessutom ett konfidensintervall runt denna skattning.)
Man kan också beräkna ett konfidensintervall för t.ex. parametrarna ('beta-värdena') i en regressionsmodell.

I dessa simuleringar visas bara dubbelsidiga konfidensintervall men man är ibland intresserad av enkelsidiga intervall, t.ex. då man skattar en felkvot är man oftast endast intresserad av en övre gräns. I mer komplicerade situationer kan man beräkna en konfidensregion som då är en (konfidens)yta som med en viss sannolikhet samtidigt omfattar två parameterar (t.ex. väntevärde och standardavvikelse).

Konfidensnivå.   Konfidensnivån är sannolikheten att ett intervall träffar/omfattar/omfamnar/innefattar parameterns (okända) värde. Observera att det är fel att påstå att "parametern ligger med 95%-sannolikheten mellan 48.5 och 52.3". I stället kan man göra ett något mer modest påstående: "jag har en beräkningsmetod som beräknar ett intervall som vid upprepade mätningar förväntas träffa rätt (dvs omfatta det rätta värdet på parametern) i 95% av fallen".

Konfidensintervall och hypotestest.   Konfidensintervall och hypotestest hänger intimt ihop. Man kan säga att ett konfidensintervall omfattar alla de numeriska värden på hypotesen som man inte kan förkasta. Antag att ett beräknat konfidensintervall är 48.5 – 52.3. Man kan då säga att "jag förkastar alla värden på hypotesen som är < 48.5 och alla värden på hypotesen som är > 52.3, men inte värdena mellan 48.5 och 52.3".
Konfidensintervallets längd kan minskas på fler sätt. Det vanligaste är ju att öka stickprovsstorleken men man kan ibland åstadkomma samma sak med en bättre eller smartare uppläggning av studien.

Ärligare redovisning.   Att redovisa ett konfidensintervall — istället för en punktskattning — kan anses vara ärligare. I massmedier älskar man punktskattningar och beskriver mängder av procentsatser. Ytterst sällan anger man ett konfidensintervall eller annan indikation om statistisk osäkerhet. (Enda undantaget är diskussioner i samband opinonsundersökningar om politisk hemvist då man säga något om 'felmarginalen'.)
Kanske det kan bero på att ett konfidensintervall för en procentsats tenderar att bli obehagligt långt om antal observationer inte är stort? Bättre då att endast redovisa en punktskattning...

••••

Några grundläggande övningar på normalfördelningen


Övning 1 – ändra de fyra sliderna
Flytta de fyra sliderna och notera att diagrammen förändras som förväntat. Sliderna kan också flyttas med vänter/högerpil på tangentbordet.

Övning 2 – ändra konfidensnivån till 0.50
Klicka på 0.50 för att välja den lägsta konfidensnivån. Öka antal intervall och notera att ungefär hälften av alla intervall inte träffar parameterns sanna värde. Klicka på 'Repetera' för att göra upprepade simuleringar. Ju lägre konfidensnivå desto kortare intervall men också större risk för att ett intervall missar det sanna värdet. En statistisk redovisning, med konfidensnivå 0.50, är naturligtvis av föga värde.
Notera också att antal röda intervall har en relativt stor variation. Detta beror ju på att en binomialfördelad variabel har störst variation då proportionen är 0.50.

Övning 3 – ändra konfidensnivån till 0.95
Ändra konfidensnivån till 0.95 och 'Antal stickprov' till 100. Gör upprepade simuleringar med 'Repetera'-knappen och notera att antal röda intervall är omkring 5 och med en mindre variation jämfört med övning 2.

Övning 4 – ändra konfidensnivån till 0.99
Ändra konfidensnivån till 0.99 och 'Antal stickprov' till 100 och 'Stickprovstorlek' till ett lågt värde, t.ex. 5. Gör upprepade simuleringar med 'Repetera'-knappen och notera att antal röda intervall är omkring 1 och med liten variation. Notera också att många intervall tycks nå utanför diagrammets grå bakgrund. Öka värdet i "+/-"-fältet och använd 'Repetera'-knappen igen. (Möjligtvis måste "+/-"-fältet ökas ytterligare för att få alla intervall inom diagrammets begränsningar.)

••••

Något om konfidensintervall-diagrammet


Diagrammet innehåller en grå lodrät linje som är fördelningens väntevärde. Denna linje ligger alltid i mitten på diagrammet. Väntevärdet visas i rött längst ned i diagrammet.
Varje vågrät linje är ett konfidensintervall för väntevärdet, baserad på den simulerade datamängden. Om intervallet inte omfattar väntevärdet, ritas det i rött. I mitten på intervallet finns en markering för det beräknade medelvärdet.
Det nedersta intervallet ritas också i normalfördelningen på två ställen.

"+/-"-fältet.   Längst ned finns ett fält markerat med '+/-'. Om de simulerade intervallen är långa och når utanför det grå området, kan man ändra skalan för intervallen. Ett ökat '+/-'-värde gör att långa intervall bättre får plats (vid en ändring av skalan rensas de simulerade intervallen).

Antal röda intervall.  Längst ned till höger anges antal röda intervall, dvs intervall som missar parameterns sanna värde. Observera att detta antal är en observation av en binomialfördelad variabel: 'felkvoten' är 1-konfidensnivån och 'stickprovet' är antal simulerade stickprov.

••••

Något om sannolikhetsfördelning-diagrammet


Diagrammet visar en normalfördelning med givet väntevärde och standardavvikelse. Väntevärdet visas med en kort röd linje på X-axeln. Standardavvikelsen anges med små korta röda skalstreck.

De röda markeringarna under fördelningen anger de enskilda, simulerade värdena i den sist simulerade datamängden. Dessutom anges motsvarande konfidensintervall (samma som det nedersta i det högra diagrammet).

••••

Info om in/utdata


Slider.  Det finns fyra olika slider – väntevärde, standardavvikelse, stickprovsstorlek och antal stickprov.
Väntevärdet och standardavvikelsen skrivs ut i rött till vänster på sidan. Då värdet på någon av sliderna ändras sker en simulering.
Observera att sliderna också kan ändras med hjälp av vänster/högerpil på tangentbordet. (Det går inte att ändra max eller min på skalorna.)

Konfidensnivå.  Det finns tre konfidensnivåer att välja bland – 0.50, 0.95 och 0.99. Man väljer nivå med respektive tryckknapp.

Repetera.  Man kan repetera en simulering med de aktuella parameterinställningarna genom knappen längst ned till vänster.

••••