-
Välkommen till spellistan för statistik.
-
Det är något jag tänkt göra länge.
-
Hur som hellst, jag vill börja med det samma och
-
försöka ge så många exempel som möjligt och förhoppningsvis
-
ge dig en känsla för vad statistik handlar om.
-
Och bara för att komma igång om du
-
är ny i området -- även om jag tror att de flesta har en
-
viss känsla för vad statistik är.
-
Grunden -- eller i mycket generella termer handlar det om
-
att få en förståelse för data.
-
Och det kan grundläggande klassificeras.
-
Säg att det finns tre kategorier.
-
Det finns deskriptiv statistik
-
säg att du har en stor mängd data och du vill berätta för någon
-
om den utan att ge dem all data.
-
Kanske kan du hitta sammanfattande nummer som
-
på något sätt representerar all data utan att behöva
-
gå igenom alla data.
-
Detta är deskriptiv statistik.
-
Det finns även förutsägande statistik.
-
Låt mig gruppera dem på ett ungefär
-
Det finns estimerande statistik.
-
det är när du använder data med syftet att
-
dra slutsatser om något.
-
Låt oss säga att du samlat data ifrån en population --
-
vi kommer att prata mycket mer om urval och populationer men
-
jag tror att du har en viss känsla för vad det är, eller hur?
-
Om jag frågar tre personer vem de kommer att rösta på
-
som president, så har jag uppenbarligen inte frågat alla som får rösta
-
Jag har frågat ett urval.
-
Men vad trendanalys handlar om är om vi kan göra
-
beräkningar på urvalet, kanske vi kan skatta eller
-
dra slutsatser om populationen som helhet.
-
Det är bara för att få en överblick om vad
-
statistik handlar om.
-
Låt oss komma igång, vi börjar med
-
beskrivande statistik.
-
Så till att börja med, vad jag vill
-
göra, eller vad många skulle vilja göra när de
-
får ett dataset som ska beskrivas
-
Ok, kanske kan jag komma på ett nummer som är mest
-
representativt för alla nummer i datasetet.
-
Eller ett nummer som representerar medelvärdet
-
-- ett ord du kommer stöta på ofta i statistik böcker.
-
Medelvärdet för en grupp nummer
-
vilket också kallas genomsnitt.
-
För att vara lite mer exakt än vad jag vanligtvis är
-
omkring "genomsnitt". När jag pratar om det här,
-
betyder det att genomsnittet är ett tal som
-
säger någonting om medelvärdet.
-
Eller kanske ett nummer som mest representativt för ett dataset.
-
Jag vet att det låter väldigt abstrakt men låt oss
-
göra ett par exempel
-
Så det finns alltså en mängd olika sätt du kan mäta
-
medianen eller medelvärde i en samling nummer
-
och du har troligen sett dessa tidigare
-
Medelvärde
-
det finns dock flera typer av medelvärde men vi använder
-
det aritmetiska medelvärdet
-
geometriskt medelvärde och jag kanske går igenom harmoniskt
-
medelvärde en annan gång.
-
Det finns ett medelvärde, median och modalvärde.
-
och när man pratar statistik kan alla dessa vara
-
representativa för datamängden eller populationes genomsnitt
-
eller ett genomsnittet för urvalet.
-
Tillsammans är de -- kan de vara
-
ett genomsnitt.
-
När vi tittar på exempel tror jag att det
-
blir tydlig.
-
Vanligtvis när man talar om genomsnitt,
-
du har säkert förstått detta i din vardag,
-
talar man om det aritmetiska medelvärdet.
-
Så vanligtvis när man säger "ta genomsnittet av
-
dessa tal" och man förväntar sig att du gör någonting, vill man
-
att du ska komma fram till det aritmetiska medelvärdet.
-
Man tänker sig inte att du ska räkna ut medianen eller modalvärdet.
-
Men innan vi fortsätter så tittar vi på
-
vad det här är för något.
-
Vi tar ett antal nummer.
-
Säg att vi har en etta
-
vi har ytterligare en etta, en tvåa, en trea
-
så har vi en fyra
-
Det räcker.
-
Vi vill ha ett lätt exempel.
-
Så det aritmetiska medelvärdet är antagligen det du
-
tänker på när man talar om genomsnitt.
-
Och det är -- att du summerar alla nummer och
-
dividerar med antalet nummer.
-
I det här fallet blir det ett plus ett plus tre plus fyra.
-
och det divideras med ett, två, tre,
-
fyra, fem nummer.
-
Och det är?
-
Ett plus ett är två.
-
Två plus två är fyra.
-
Fyra plus tre är sju.
-
Sju plus fyra är elva.
-
Så det här blir elva delat med fem.
-
Vad blir det?
-
Det blir två och en femtedel?
-
Så det blir två komma två.
-
Och man skulle kunna säga
-
"Det är ett ganska representativt
-
nummer för vårt dataset.
-
Det är vad man kan säga att dessa nummer är
-
närmst till." Eller, två komma två representerar
-
medelvärdet för det här datasetet.
-
Och i dagligt tal, är det genomsnittet.
-
Men om vi är lite petiga, det här
-
är det aritmetiska medelvärdet av dessa nummer.
-
Och medelvärdet representerar dem.
-
Om man inte vill ge hela listan på fem nummer, kan
-
man säga, "Jag har ett dataset med fem nummer och
-
deras medelvärde är två komma två" Det säger något om
-
var numren befinner sig.
-
Vi kommer att gå igenom mer om hur man vet
-
numrens avstånd från medelvärdet i antagligen nästa video.
-
Så det är ett sätt att mäta.
-
Ett annat sätt istället för medelvärdet
-
kan man se på genomsnitt genom att ordna numren
-
som jag faktiskt redan gjort.
-
Jag skriver dem i ordning igen.
-
ett, ett, två, tre, fyra.
-
Och så tar man bara det mittersta numret.
-
Det blir, ett, två, tre, fyra, fem nummer.
-
Det mittersta numret är detta, eller hur?
-
Det mittersta numret är två.
-
Det är två nummer som är större än två och två
-
nummer som är mindre.
-
Detta kallar man för median.
-
Så det är faktiskt väldigt lite uträkning.
-
Man måste bara sortera numren.
-
Och så finner du det nummer där det är
-
lika många större nummer, som mindre.
-
Så medianen för dessa nummer är två.
-
Och som man kan se, är detta ganska
-
nära medelvärdet.
-
Det finns inget riktigt svar
-
En av dessa är inte ett bättre svar på vad genomsnittet är.
-
Det är bara olika sätt att mäta genomsnitt.
-
Detta är medianen.
-
Och du kanske tänker, "Det var
-
lätt med bara fem nummer.
-
Vad händer när vi har sex nummer?"
-
Om nu det här är våra nummer
-
ett, ett, två, tre, och ytterligare en fyra här.
-
Så nu finns det inget nummer i mitten.
-
Två är inte numret i mitten, eftersom det är två mindre
-
nummer och tre större.
-
Trean är inte heller i mitten, eftersom det är två
-
större nummer och tre
-
mindre nummer.
-
Så det finns inget nummer som är i mitten.
-
När du har ett jämt antal nummer och
-
du ska hitta medianen så tar du
-
det aritmetiska medelvärdet
-
av de två mittersta numren.
-
Så i det här fallet skulle medianen vara två komma fem.
-
Men det behöver vi inte ta med, eftersom jag vill jämföra
-
median, medelvärde och modalvärde för samma
-
nummer.
-
Men det är bra att veta, eftersom det
-
kan vara lite förvirrande.
-
Och detta är definitioner
-
det är en sorts matematiska verktyg för att kunna
-
förstå nummer.
-
Det är inte som att någon hittat dessa formler
-
ute i naturen och sagt "Ah, detta är en del av
-
universum och hur genomsnitt borde beräknas."
-
Det är mänskliga konstruktioner och bara ett sätt att
-
förstå stora dataset.
-
Detta är inte något stort dataset, men istället för fem nummer, om
-
vi hade fem miljoner nummer, kan du förstå att man inte
-
vill tänka på varje nummer individuellt.
-
Innan jag går igenom det ytterligare, vill jag tala om
-
vad ett modalväde är.
-
Modalvädet är till viss del det värde som
-
de flesta antagligen glömmer eller aldrig lär sig, och som
-
förvirrar när det är med på ett prov eftersom de tänker "Hm, det
-
låter avancerat." Men på sätt och vis är det det lättaste
-
av alla mätningar av genomsnitt eller medelvärde.
-
Modalvärdet är det nummer som är vanligast förekommande i ett dataset.
-
I det här exemplet är det två ettor och en
-
av allt annat.
-
Modalvärdet är alltså ett.
-
Modalvädet är alltså det vanligast förekommande numret.
-
Och så kan du säga att "Men Sal, vad händer
-
om det här är vårt dataset?
-
ett, ett, två, tre, fyra, fyra." Här har jag två ettor och två fyror.
-
Och det är här som modalvärde kan bli lite klurigt eftersom
-
båda dessa kan vara modalvärden.
-
Man kan faktiskt säga att modalvädet är antingen ett
-
eller att modalvädet är fyra, och det blir lite vagt.
-
Antagligen vill du ha ett förtydligande från
-
personen som ställt frågan.
-
För det mesta när det förekommer på prov, kommer det inte
-
att vara så här vagt.
-
Det kommer för det mesta vara ett nummer som är vanligast förekommande.
-
Varför kan man inte
-
bara välja antingen medelvärde, median eller typvärde?
-
Vi har lärt oss genomsnitt, varför
-
kan vi inte bara använda genomsnitt?
-
eller, varför inte använda aritmetiskt medelvärde hela tiden?
-
vad är median och typvärde bra för
-
Jag skall försöka förklara med ett exempel och
-
se om det går hem hos dig
-
och sedan kan du själv hitta på fler exempel
-
Låt säga att jag har följande nummer
-
tre, tre, tre, tre, tre, och jag vet inte, 100
-
vad är det aritmetiska medelvärdet här?
-
jag har en, två, tre, fyra fem stycken treor och en 100
-
det blir 115 dviderat med 6, eller hur?
-
jag kan har en, två, tre, fyra, fem, sex nummer
-
115 är summan av dessa
-
så det är lika med - hur många gånger får 6 plats i 115=
-
sex går i elva en gång
-
ett gånger sex är sex, rest femtiofem
-
sex går i femtiofem nio gånger
-
nio gånger sex är femtiofyra
-
så det blir nitton med rest en sjättedel
-
ok
-
jag lade ihop alla talen och dividerade med
-
antalet
-
men, är nitton och en sjättedel verkligen representativt
-
för de här numren
-
jag menar, jag har massor av treor och sedan plötsligt
-
100 och så säjer vi att genomsnittet är nitton och en sjättedel
-
jag menar, nitton och en sjättedel verkar inte beskriva hur
-
numren är fördelade
-
kanske gör det det, det beror på vad du skall använda det till
-
med det verkar vara lite