linneaspsykologi.blogg.se

Statistik begrepp

Publicerad 2015-09-24 13:52:46 i Allmänt,

¢Population är en grupp av individer eller objekt som försöksledaren vill undersöka.
¢En population kan bestå av t.ex. alla människor som bor i Jönköping eller alla elever i Högskolan i Jönköping.
 
Innan undersökningen startas måste vi definiera vilka enheter/individer som skall undersökas.
 
Den population som en försöksledare vill undersöka kallas målpopulation.
 
¢Rampopulation är listan över objekten som ingår i populationen. Från denna lista gör försöksledaren sitt urval.
 
¢T.ex. brottsligheten i Sverige (målpopulation). Brottslighet som anmäls till och registreras av polisen (rampopulation).
¢
¢Vi kan inte undersöka alla individer i rampopulationen. Istället väljer vi ut en delmängd ur populationen: vi drar ett stickprov.
 
Ett stickprov är en representativ grupp (mindre grupp) av en hel population.
¢
För att genomföra statistiska undersökningar tas ett stickprov från populationen.
 
¢Baserat på stickprov data vill försöksledaren dra slutsatser om populationen. Detta kallas  ”inferens.”
 
Urvalsmetoder är metoder som försöksledaren använder för att plocka ut stickprovet.
 
Målet är att korrekt representera en population.
 
Varje individ eller enhet i populationen måste ha samma chans att bli utvalda i stickprovet
 
 
 
URVALSMETODER:

OSU(Obundetslumpmässigturval)

  • Vid varje dragning av en enhet har de i populationen kvarvarande enheterna samma sannolikhet att bli valda

  • Vid OSU av n enheter har alla möjliga kombinationer av n enheter samma chans att bli valda 

Systematiskturval

  • Välj t.ex. var 10:e från urvalsramen, med slumpmässig start bland de 10 första

  • Om urvalsramen är ”slumpmässigt” ordnad är detta ”likvärdigt” med OSU

  • Risk för stora fel om det finns periodicitet i urvalsramen

  • Möjlighet till större precision om ramen är ordnad efter en bakgrundsvariabel, som är korrelerad med undersökningsvariabeln 

Stratifieraturval
• Populationen delas in i strata och ett OSU

dras ur varje stratum • Skäl:

  • –  Om resultatet skall redovisas för varje stratum kan urvalsstorlekarna för varje stratum avpassas så att vissa precisionskrav uppfylles utan att man erhåller överflödiga observationer från vissa strata

  • –  Skattningar av populationsparametrar (t.ex. populationsmedelvärdet) kan göras med bättre precision än vid ett OSU, om bara stratifieringsvariabeln är ”bra” (homogent inom strata, heterogent mellan strata) 

 

Gruppurval(klusterurval)

  • Populationen delas in i grupper (kluster) av enheter. Ett antal sådan kluster väljs slumpmässigt. Samtliga enheter inom ett kluster undersöks.

  • Skäl:
    – Ramproblem
    – Geografisk spridning – Kostnader 

 
 
Variabler: 

Typer av variabler

Det finns två huvudgrupper av variabler;

1) Kvalitativa variabler (kategoriska variabler)

2) Kvantitativa variabler

  a) Diskreta eller diskontinuerliga variabler

  b) Kontinuerliga kvantitativa variabler

 

Detfinns tre andragrundläggandetyper av variabler

som vi oftasttalar om i experimentellasammanhang.

1) Oberoende variabel (OV),

2) Beroende variabel (BV),

3) Bakomliggande variabel (extraneous variable).

 

- Kvalitativa variabler (kategoriska variabler)

En kvalitativ variabel är en variabel som definierar olika kategorier som t.ex. kön, ras, yrke, nationalitet, om en person har husdjur eller ej osv.
 
Kvalitativa variabler  har inte något numeriskt värde (icke numeriska värden). 
Räkneoperationer kan ej utföras eftersom de är icke-numeriska.
 
När man studerar kvalitativa variabler är man oftast intresserad av antalet eller proportionen (procent) för varje kategori.

Kvalitativa variabler presenteras oftast i diagram (graphic). 

Kvantitativa variabler

Kvantitativa variabler är variabler som har numeriska värden (siffervärden).
 T.ex. ålder, en persons längd, vikt, temperatur osv.
Räkneoperationer kan utföras.
 
 

Detfinnstvåhuvudgrupper av kvantitativavariabler:

a) Diskreta eller diskontinuerliga variabler: Variabler som endast kan anta heltalsvärden.

  T.ex. antalet syskon i en familj, antalet rum i ett hus, antalet invånare i  Jönköping osv.

 

b) Kontinuerliga kvantitativa variabler: Kontinuerliga variabler kan anta vilket värde som helst.

  T.ex. en persons längd, vikt, tid, temperatur, osv
 
OB BV 

Exempel:

Anta att en forskare vill undersöka effekten av att titta på våldsamma filmer på barns aggressiva beteende.

  Här våldsamma filmer är OV och barns aggressivt beteende är BV.

 Men t.ex. föräldrars reaktioner eller barnen ålder kan påverka sambandet mellan OV och BV. 

  De är störningsvariabler och forskaren bör ha kontroll på de variablerna. 

 

Det finns fyra nivåer av mätning.

1- Nominalskala (nominal scale)

2- Ordinalskala (ordinal scale)

3- Intervalskala (interval scale)

4- Kvotskala (ratio scale)

 

- Nominalskala (nominal scale)

¢Nominalskala refererar till kategorier av mätning t.ex. kön, ras, religiös preferens, ja-nej svar eller hårfärg.
¢Denna kallas ”nominell mätning”  eller ”nominaldata” också och hör endast till kvalitativavariabler.
¢Den enda operation som man kan göra vid nominalskala är klassificering (gruppindelning).
Vi kan fråga eleverna om de röker eller ej. Sedan kan vi gruppera dem som rökare och icke-rökare.
En kategori (grupp) är inte bättre än en annan kategori.
Nummer används bara som etiketter
Exempelnominalskala:
¢Markera det rätta alternativet nedan.
  a) kvinna  b) man 
¢Vilken nationalitet är du?
  a) svensk      b) norsk    c) dansk  d) finsk
Ordinalskala (ordinal scale)
Denna kallas ”ordinal mätning” eller ”ordinaldata” också.  Till denna skala hör både kvalitativa och kvantitativa variabler.
Variabelvärdena kan rangordnas.
Ett variabelvärde kan vara större eller mindre än ett annat men det finns ingen matematisk information om hur mycket större eller mindre. 
FORTS???
 

- Intervalskala (interval scale)

Denna kallas ”interval mätning”  eller ”interval data” också. Till denna skala hör kvantitativavariabler.
Avsaknaden av en absolutnollpunktär en sak som karakteriserarintervallmätning.
”0 (nollpunkten)” är godtycklig (arbiträr). Nollpunkten indikerar inte den verkliga frånvaron av något. ¨
T.ex. celsiusskalan för temperatur.
I celsiustemperaturskalan är varje grad på lika avstånd från varandra.  ”0 (nollpunkt)” betyder inte att det inte finns temperatur.
Andra exempel på intervallskala är kalender av år, IQ poäng och testpoäng liksom betygsskalor. 
 

Kvotskala (ratio scale)

¢Kvotskala är den mest avancerade typen av mätning.

¢Till denna skala hör kvantitativavariabler och kallas ”ratio mätning”  eller ”ratio data.”¢Kvotskala har alla de egenskaper hos intervalskala, plus en absolut nollpunkt. Dvs att kvotskala har ett givet startvärde (noll). 
 
Alla positioner är lika distanser och ”0 (nollpunkt)” betyder att värdet verkligen är  ”0 (noll).”
 
T.ex.”jag har  noll pengar”, betyder det att jag har inga pengar.
Vikt och längd är bra exempel på denna typ av skala.
Alla aritmetiska beräkningar är möjligt på kvot mätning.
 

Nominalskala: Olika grupper utan naturlig ordning. Ordinalskala: Olika grupper med en naturlig ordning.

Intervallskala: Numeriska v ̈arden, skillnader meningsfulla, nollan godtycklig.

Kvotskala: Numeriska v ̈arden, naturligt nollv ̈arde. 

 

Fel är avvikelser från ett sant värde.

Det finns många orsaker till fel i en undersökning.

Vi kan indela de orsakernatillfelfemkategorier:

1- Urvalsfel (sampling error)

2- Täckningsfel (coverage error)

3- Bortfallsfel (non-response error)

4- Mätfel (measurement error)

5- Bearbetningsfel (processing error)

 

Urvalsfel (sampling error)

Det är en felkälla som beror på urvalet som inte är representativt för populationen.
¢Urvalsfel kan uppstå om stickprovet inte är representativt.
¢Urvalsfel kallas även ”samplingsfel” eller ”selektionbias.” 
 

2. Täckningsfel (coverage error)

¢Täckningsfel uppstår då rampopulationen inte överensstämmer med målpopulationen.

 Detfinnstvåtyper av täckningsfel:

a) Undertäckning: Rampopulationen innehållerinte individer som finnsi målpopulationen.

b) Övertäckning: Rampopulationen innehållerindivider som intefinnsi målpopulationen.

Exempel på övertäckningsfel:

¢En forskare vill undersöka personer som nu har fast telefon och väljer sina deltagare med hjälp av telefonkataloger.
¢Om telefonkataloger inte uppdateras så ofta då personer som förut hade fast telefon men nu inte har fast telefon kan komma med i undersökningen.

  Detta leder till övertäckningsfel.

Exempel på undertäckningsfel:

En forskare vill mäta politiska opinioner och väljer sina deltagare med hjälp av telefonkataloger.

Men personer utan fast telefon inte kan komma med i undersökningen.

Alla har inte telefon, vissa personer har skyddade telefonnummer, vissa personer har enbart mobiltelefon. Detta kan leda till undertäckningsfel

3- Bortfallsfel (non-response error)

Bortfallsfel avser de intervjupersoner som inte svarar.
Det är viktigt att göra en bortfallanalys.
Detta innebär att man försöker redovisa om de personer som inte har svarat.
Hur många var det?
Vilken könsfördelning? 
Bortfallsfel kan indelas i tvågrupper;

a) Individbortfall: Innebär att forskare inte får något svar från en eller flera individer på t.ex. en postenkät.

b) Partiellt bortfall: Innebär att några av deltagare vägrar att svara på en del av frågor.

 T.ex. tenderar vissa deltagare att vägra svara på frågor om inkomster, politiska åsikter, respondentens sexliv osv. 

 

-Mätfel (measurement error)

Mätfelet definieras som skillnaden mellan ett uppmätt värde (observationsvärde) och det sanna värdet. 
Den observerade mätningen är en summa av den sanna mätningen och det felet.
  Den observationsvärde = Sann värde + Fel

Ett mätfel kan definieras också som summan av

två komponenter;systematiskt fel och slumpmässigt

fel.

a) Systematiskt fel:  Det beror exempelvis på olämpligheter eller felaktigheter i mätapparaturen eller mätprincipen.

Det här felet är svåra att upptäcka och inte kan analyseras statistiskt. 

Systematiska fel kan inte upptäckas eller reduceras genom att öka antalet observationer. 

b) Slumpmässigt fel (osystematiskt fel): Slumpmässigt fel kan variera från observation till observation.

Slumpmässiga fel kan analyseras statistiskt  och kan reduceras med genomsnitt över ett stort antal observationer.

Tvåhuvudtyper av slumpmässiga fel är;

Typ 1-fel: Vi drar slutsatsen att det finns en skillnad när det egentligen inte gör det.

  Typ 1 fel uppstår när man förkastar H0 trots att den är sann.

Typ 2-fel: Vi drar slutsatsen att det inte finns en skillnad när det egentligen gör det.

  Typ 2 fel uppstår när man accepterar H0 trots att den är falsk.

 

Mätfelen kan kopplas till olika källor:

a) Mätfel som beror på mätinstrumentet.

b) Mätfel som beror på mätmetoden: Olika mätmetoder (besöksintervju, telefonintervju, postenkät, osv.) kan ge olika resultat.

c) Mätfel som beror på försöksledaren.

d) Mätfel som beror på deltagare: T.ex. socialt önskvärda svar.

e) Mätfel som beror på frågeformuläret: T.ex. oklara frågeformuleringar och definitioner, dåliga instruktioner.'

 

- Bearbetningsfel (processing error)

  Bearbetningsfel är fel som uppkommer vid bearbetning av data t.ex. vid inkodning.

- Kodningsfel

- Inmatningsfel

- Datorbearbetningsfel

 Det totala felet är summan av täckningsfel, urvalsfel, bortfallsfel, mätfel och bearbetningsfel. 

 

 

Till bloggens startsida

Kategorier

Arkiv

Prenumerera och dela