{{ verbatimTextOutput("liteinfo") }}

- Visa histogram

- Visa simulerad modell

- Visa skattad modell

- Visa båda modellerna

- Visa modellutskrift

- Visa data

En blandad modell

- En kontinuerlig variabel (X)

- En faktor (Y) med fyra nivåer (A, B, C, D)

{{ actionButton("knapp1", "Kommentar", class = "minaknappar") }} {{ actionButton("knapp2", "Övningar", class = "minaknappar") }}

Övning:

Antal värden per grupp (n):

Residual (stddev):

Koefficient (b0)    Koefficient (b1)

A -

B -

C -

D -

{{ slider11 }}
{{ slider1 }}
{{ slider2 }}
{{ slider3 }}
{{ slider5 }}
{{ slider7 }}
{{ slider9 }}
{{ slider4 }}
{{ slider6 }}
{{ slider8 }}
{{ slider10 }}
{{ verbatimTextOutput("divtext") }}

{{ verbatimTextOutput("orgdata") }}


Allmänt
Detta program illustrerar olika samband mellan ett mätresultat (Y) och en kontinuerlig förklaringsvariabel (X). Indata består av mätpunkter i X-intervallet 0, 10.
Mätdata är dock indelade i fyra olika grupper t.ex. fyra olika maskiner, fyra olik material, fyra olika metoder, etc. Alltså en ganska vanlig situation. Analysen går i enkla drag ut på att hitta samband mellan Y och X. Möjligtvis är detta samband olika för olika grupper. (Sambandet här är av typ 'räta-linjen', det finns ingen kurvatur i exemplet.)

Slider
Den översta sliden anger sex olika övningar (plus ett ´0´-läge). Den andra sliden antal mätvärden per grupp.
Den tredje sliden anger sigma för den normalfördelade slumpterm som representerar alla förklaringsvariabler (kända eller okända) som inte ingår i modellen.
De fyra nedersta sliderna anger 'intercept' och 'lutning' på de fyra möjliga räta linjerna.

Resultatsruta
Resultatet från analysen visas i en 'summary'-ruta och är ett av flera verktyg för att förstå om modell och data passar ihop och vilken betydelse de ingående detaljerna har.
(De flesta detaljerna är mer eller mindre standardinfo och kan hittas i många böcker om regressionsanalys.)


- Visa histogram
Visar alla Y-värden som ett histogram.

- Visa simulerad modell
Visar simulerad modell alltså de räta heldragna linjer som specificeras med slidinställningarna.

- Visa skattad modell
Visar skattad modell alltså de räta streckade linjer som skattas vid analysen.

- Visa båda modellerna
Visar bägge modellerna.

- Visa modellutskrift
Visar analysen i tabellformat.

- Visa data
Visar de simulerade data som använts vid analysen.

••••


Kommentarer

I kapitlet 'Linjär regression' i läroböckerna har man ibland med en variabel ('faktor') som är uppdelad i distinkta nivåer. Men nästa alltid gäller exemplet bara två nivåer, tex. två olika maskiner, två olika material, två olika metoder, etc.
Men i praktiskt arbete stöter man ofta på en aning mer komplicerade metoder, tex fler nivåer på en faktor. I detta exempel visas hur en dylik situation kan analyseras med statistikprogrammet 'R'.

Notera dock att analysen är inte uttömd bara genom en första analys. Det kan finnas behov av att t.ex. omformulera eller begränsa modellen men detta får inte plats i denna övning.

••••


Ett antal övningar




I 'Övning 0' används sliderinställningar från programstart och kan ändras. 'Övning 1' – 'Övning 8' har programmerade inställningar.

Övning 1   Här har funktionen samma intercept och samma lutning för alla grupper (koefficienterna b0 och b1, vänster och höger slider). 'Visa skattad modell' visar de skattade räta linjerna. Utskriften visar att de teoretiska värdena skattas ganska väl (numerisk kolumn till vänster).
Kolumnen 'Pr' visar låga (mycket låga) värden för 'Intercept' och lutning ('X'). För nivåerna B, C, D är mostvarande värden ganska höga (traditionella gränsvärde är 0.05 eller 0.01).

Övning 2   Här är det olika intercept men samma lutning på modellerna. Utskriften visar att de simulerade parametrarna skattas ganska väl. Kolumnen 'Pr' visar låga värden för 'Intercept' och lutning ('X'). För nivåerna typB, typC, typD är motsvarande värden också mycket låga och visar alltså på signifikanta värden för varje nivå (framgår också av diagrammet). Det finns inget samspel mellan variablerna ('X:typB', etc, har höga 'Pr'-värden.)

Övning 3   Här är det olika intercept men samma lutning på tre av modellerna. Utskriften visar att de simulerade parametrarna ganska väl. Kolumnen 'Pr' visar låga värden för 'Intercept' och lutning ('X'). För nivåerna typB, typC, typD är motsvarande värden också mycket låga och visar alltså på signifikanta värden för varje nivå. Det finns också tydliga s.k. samspelseffekter dvs att lutningarna beror nivån på faktorn. (Om man i en reell situation inte tar med samspel i en modell, och att det verkligen finns i data, blir analysen felaktig.)

Övning 4   Här är det olika intercept och ingen lutning på modellerna, alltså en jämförelse mellan medelvärden på faktorns olika nivåer. De teoretiska medelvärdena (koefficient b0) är 5.5, 9.1, 11.2, 14.9. En skattning för respektive består av 'Intercept' (som är 'typA') samt en addition av varje nivå till detta värde.

Övning 5   Här är det samma intercept (10.5) och ingen lutning på modellerna, alltså en helt homogen datamängd. Här är 'Intercept' på utskriften en skattning av totalmedelvärdet. Övriga effekter har antagligen högt 'Pr'-värde. 'Residual standard error' på utskriften är en skattning av det inställda värdet (2.1).
Om tolkningen av utskriften blir att det inte finns skillnader mellan nivåer eller några lutningar så görs antagligen analysen med en mycket mer kortfattad modell.

Övning 6   Här är det olika intercept men samma negativa lutning. Denna övning är alltså i allt väsentligt samma som övning 2. Skattning av intercept sker på samma sätt som beskrivs i övning 4. Det finns inga samspel mellan variablerna.

••••