Tere tulemast statistika esitusloendisse.
Midagi, mida ma olen juba ammu mõelnud teha.
Niisiis, ma tahaks siis kohe asja juurde asuda ja
Ma püüan teha niipalju näiteid kui võimalik ja loodetavasti
anda Teile aimu, mis see statistika üldse on.
Ja alustuseks, juhul kui Te ei ole
selle teemaga tuttav, kuigi ma arvan, et paljudel inimestel on
siiski eelaimdus, mis see statistika on.
Ja põhiliselt, üsna üldises sõnastuses, on see
andmetest aru saamine ja nendega tegutsemine.
Ning seda saab üldjoontes liigitada.
Seal on võib-olla kolm kategooriat.
Kõigepealt on meil kirjeldav.
Ütleme et Teil on palju andmeid ja Te soovite kellelegi
nendest rääkida, andmata talle kõik andmed.
Võib-olla Te suudate leida mingi otsese numbri, mis
mingil viisil esindab kõiki antud andmeid ilma, et
peaksite kõiki andmeid vaatlema.
See oleks siis kirjeldav statistika.
Siis on ka olemas ennustav statistika.
Ma teatud määral grupeerin nad kokku.
Siis on ka järelduslik statistika.
Ja see on siis kui Te kasutate andmeid selleks, et
teha kokkuvõtteid.
Ütleme, et Te olete lisanud mõned andmed üldkogumist valimisse
ja me räägime veel palju valimitest ja üldkogumist, aga
Ma arvan, et teil on aimdus olemas millega tegu?
Kui ma uurin kolme inimest, kes lähevad
presidenti valima, siis silmnähtavalt pole ma uurinud kogu populatsiooni.
Ma uurisin valimit.
Kuid järelduslik statistika on see kui me saame teha
mõningaid matemaatilisi tehteid valimiga, siis võib-olla saame ka sealt midagi järeldada või
teha kokkuvõtte kogu antud kogumist.
See on alles üsna suur pilt sellest, mis
statistika üldse on.
Hakkame siis asjaga pihta ja alustame
kirjeldava statistikaga.
Nii kõigepealt, ma ei tea mida ma tahaksin
teha või mida ma arvan,et enamus inimesi tahaks teha kui neile
antakse hunnik numbreid ja nad peaksid neid kirjeldama.
Võib-olla ma mõtlen välja mõne numbri mis on kõige
otsesem antud numbritest.
Või mõni number, mis kirjeldab, teatud mõttes, keskset tendentsi.
see on sõna, mida te kohtate statistika raamatutes väga palju.
Antud numbrite loetelu keskne tendents.
Seda nimetatakse ka keskmiseks.
Ja ma olen natukene täpsem siin kui ma muidu olen
sõnaga "keskmine". Kui ma räägin sellest siinses kontekstis
siis keskmine on number mis mingit moodi
annab Meile aimu kesksest tendentsis.
Või äkki number, mis on kõige esinduslikum antud numbrite loendis.
Ma tean et see kõik kõlab väga abstraktselt, aga
teeme mõned näited.
On olemas mitmeid võimalike viise kuidas Te saate mõõta
keskset tendentsi või keskmist antud numbrite loetelus.
Ja te olete tõenäoliselt neid enne näinud.
Rangelt öeldes on need keskmised.
Tegelikult on seal mitmeid tüüpi keskmisi, kui me jääme
aritmeetilise keskmise juurde.
Geomeetrilise keskmise ja võib-olla ühel päeval Me ka
avaldame harmoonilise keskmise.
Seal on siis keskmine, mediaan ja mood.
Ja statistilises keeles, need kõik võimaldavad kirjeldada
andmeid või kogumi keskset tendentsi.
Või valimi keskset tendentsi.
Ja need kõik on ülidselt- need võivad olla
keskmise vormid.
Ja ma arvan kui me näeme näiteid siis see kõik
on rohkem mõistlikum.
Igapäeva kõnes, kui inimesed räägivad keskmisest, ma arvan
et Te olete juba arvutanud keskmisi oma elus ja nad on
harilikult aritmeetilise tähendusega.
Siis tavaliselt kui keegi ütleb, et "Võtame nende arvude keskmise"
Ja nad eeldavad et Te teete midagi, nad tahavad
et te mõtleksite välja aritmeetilise tähenduse.
Nad ei taha et Te leiaksite mediaani või moodi.
Aga enne kui me liigume edasi, räägime mis need
asjad üldse on.
Teeme ühe numbrite loetelu.
Ütleme et mul on number 1
siis veel 1 ja 2 ja 3
siis veel 4
Sellest peaks piisama
Me tahame lihtsalt lihtsat näidet.
Niisiis keskmine või aritmeetiline keskmine on arvatavasti see, millega Te
olete kõige rohkem tuttav kui inimesed räägivad keskmisest.
Ja põhiliselt Te liidate kõik need numbrid ja
saadud summa jagate numbrite arvuga.
Praegusel juhul oleks see 1 +1+2+3+4
Ja Te jagate selle üks,kaks,kolm,
neli, viiega.
See on?
1+1 on 2
2+2 on 4
4+3 on seitse
7+4 on üksteist.
See on siis võrdne 11/5-ga
Ja see on?
See on 2 1/5
Ja see on võrdne 2,2-ga
Ja keegi võib öelda, et "Hei,kas tead.
See on päris esinduslik
number antud loetelus.
See on number millele kõik need numbrid on lähedal.
Või, et 2.2 on antud loetelu keskne
tendents.
Ja üldises keeles oleks see siis keskmine.
Aga kui me tahame olla natukene konkreetsemad, siis
see on meie loetelu aritmeetline keskmine.
Ja Te näete, et see natukene kirjeldab kõik neid numbreid.
Kui ma ei taha teile anda kogu listi viie numbriga, selle asemel
võiksin öelda. "Mul on 5 numbriline loetelu ja
nende keskmine on 2.2" See ütleb Teile natukene
millised need numbrid on.
Me räägime natukene rohkem kuidas Te saate teada kui kaugel
need numbrid on keskmisest, arvatavasti järgmises videos.
See on siis üks mõõde.
Teine mõõde oleks siis, selle asemel et arvutada, võiksime panna
numbrid järjekorda, mida ma
tegelikult juba tegin.
Lihtsalt kirjutame need järjekorras uuesti.
1,1,2,3,4
Ja võtame lihtsalt keskel asuva numbri.
Nii seal on siis üks,kaks,kolm,neli,viis numbrit
Siis keskel asuv number peaks olema see?
Keskel asuv number on kaks.
Siin on kaks numbrit mis on suuremad kui 2 ja siin on kaks
numbrit mis on väiksemad kui 2.
Ning seda kutsutakse mediaaniks.
See on tegelikult üsna lühike arvutus
Te peate lihtsalt sorteerima need numbrid.
Ja siis ükskõik mis numbri, millest on samapalju numbreid
suuremaid kui ka väiksemaid.
Niisiis antud järjestuse mediaan on 2.
Ja Te näete, et see arv on üsna lähedal
keskmisele.
Ning seal ei ole õiget vastust.
Kumbki neist pole parem vastus keskmiseks.
Need on lihtsalt erinevad viisid kuidas keskmist mõõta.
Nii siin siis on mediaan.
Ja ma tean mida Te arvatavasti mõtlete."See oli küll
parajalt lihtne kui meil on viis numbrit.
Mis siis oleks kui meil on kuus numbrit?" Mis siis teha tuleks?
Mis siis oleks kui see oleks meie numbrite järjestus?
1,1,2,3 lisame siia veel ühe 4.
Nii nüüd siin pole enam keskel asuvat numbrit.
Ma tahan öelda et 2 ei ole enam keskel asuv number, sest siin on kaks numbrit väiksemad
ja kolm numbrit suuremad kui 2.
Ja siis ka 3 ei ole keskmine number sest, seal on kolm numbrit
suuremad ja, vabandust, seal on 2 numbrit suuremad ja kolm
numbrit väiksemad.
Nisiisi siin ei olegi keskel asuvat numbrit.
Nii kui sul on paarisarvulisel hulgal numbreid ja keegi ütleb teile
et leia selle hulga mediaan, siis mida Te teete, Te võtate
kaks keskel asuvat numbrit ja leiate nende
aritmeetilise keskmise.
Praegusel juhul oleks siis meie mediaan 2.5
Olgu nii.
Aga jätame selle praegu sinna paika ja ma tahan võrrelda
mediaane ja keskmisi ja moode ühe ja sama
numbrite loeteluga.
Aga seda on hea teada, sest mõnikord
võib see olla natukene segane.
Ja need on kõik definitsioonid.
Need on kõik nagu matemaatilised tööriistad mille abil
üritame numbritest aru saada.
See ei ole keegi kunagi nägi neid valemeid
päikese pealt ja ütles, et oh see on osa universumist
siis järelikult niiviisi peakski keskmist arvutama.
Need on hoopis inimeste välja mõeldud selleks, et
oleks võimalik suurest hulgast numbritest aru saada.
See ei ole suur hulk andmeid, aga 5 numbri asemele kui Meil
oleks 5 miljonit numbrit, Te võite kindel olla, et
teile ei meeldiks igat numbriga eraldi tegeleda.
Igatahes, enne kui ma räägin rohkem sellest, tahan ma rääkida,
mis asi see mood on.
Ja mood mingil määral, on minu arvates enamiku inimeste jaoks
unustatud või nad pole seda kunagi õppinud ja kui nad näevad
sellist asja eksamil, on nad segaduses, sest nad arvavad et see kõlab väga
keeruliselt. Aga mingil määral on see kõige lihtsam
mõõde antud teemas.
Mood ütleb ära millist numbrit on kõige rohkem antud loetelus.
Selles näites on meil kaks ühte ja teisi numbreid
ainult üks kord.
Mood siin on siis 1.
Niisiis mood on enam levinud number.
Ja siis võidakse öelda, et mis oleks kui
see oleks meie loetelu?
1,1,2,3,4,4. Siin on meil kaks 1 ja kaks 4.
See on koht kus mood läheb vähekene keerulisemaks, sest
kumbki neist ei oleks õige vastus moodile.
Sa võid öelda, et mood on 1 või
mood on 4 ja siis läheks asi ebamääraseks.
Ja Te kindlasti soovite natuke selgitust inimeselt
kes sinult seda küsib.
Enamik kordadest kui testis küsitakse, siis seal puudub selline
kahemõttelisus.
Seal on kõige enam levinum number loetelus.
Nüüd siis mõtlete et miks ei ole üks
nendest piisavalt hea?
Kas teate miks me õpime keskmistest, miks me lihtsalt
ei kasuta keskmisi?
Võiks miks me ei kasuta aritmeetilist keskmist koguaeg?
Milleks on mediaan ja mood head?
Ma proovin teha nüüd ühe näite ja näha kas
Te saate aru.
Ja siis Te võite mõelda natukene rohkem.
Ütleme et mul on selline numbrite rida.
3,3,3,3,3 ja ma ei tea näiteks 100
Niisiis mis oleks aritmeetiline keskmine siin?
Mul on viis 3 ja 100
See oleks siis 115 jagada 6-ga
Sest meil on üks kaks kolm keli viis kuus numbrit.
115 on lihtsalt nende summa
See on siis võrdne- kui palju kordi läheb kuus 115 sisse.
Kuus läheb sinna ühe korra
Üks korda 6 on kuus
55 läheb sinna sisse 9 korda.
Üheksa korda 6 on 54
See on siis võrdne 19 1/6-ga
Heaküll.
Ma lihtsalt liitsin kõik need numbrid ja jagasin
nende numbrite kogusega.
Aga minu küsimus on, et kas see on tõesti piisav selle
numbrite loetelu kirjeldus.
Ma tahan öelda, et mul hunnik kolmesid ja siis on mul 100 ja
ootamatult, me ütleme, et keskne tendents on 19 1/6.
Ma tahan öelda et 19 1/6 ei tundu väga indikatiivne
selles loetelus.
Võibolla siiski on, see sõltub Teie vajadusest, aga
see tundub natuke mööda olevat ju.
Ma tahan öelad et minu vaist ütleks et keskne tendents on
natukene lähemal kolmele, sest seal palju kolmesi.
Aga mida siis mediaan meile ütleb?
Ma juba panin need numbrid järjekorda.
Kui ma annaksin need korrapäratult, siis te tahaksid need järjekorda
panna ja siis öelda mis on keskel asuv number.
Vaatame siis, kaks keskmist numbrit, kuna mul on paaris arv numbreid
on 3 ja 3
Kui ma nüüd võtan keskmise 3 ja 3-st või ma peaksin täpsemalt
ennast väljendama.
Kui ma võtaksin aritmeetilise keskmise numbritest 3 ja 3 siis saaksin vastuseks 3.
See oleks võib-olla parem mõõde keskseks tendentsiks
või keskmiseks selles loetelus.
Põhiliselt, mis see teeb, kui võtate mediaani, ma ei olenud
eriti mõjutatud sellest väga suurest numbrist, mis on teistest
palju erinev.
Statistikas kutsutakse seda eemalasujaks.
Number, mis ütleme et Te räägide keskmistest maja hindadest
võib-olla, et iga maja linnas maksab 100,000 dollarit
ja siis on seal üks maja mis maksab 1 triljon dollarit.
Ja kui keegi ütleb sulle et keskmine maja hind oleks
ma ei tea üks miljon dollarit, siis Teil oleks väga vale
ettekujutus sellest linnast.
Aga maja hindade mediaan oleks 100.000 dollarit ja
Teil oleks parem arusaam, millised majad on selles linnas.
Analoogiliselt, see mediaan, võib-olla, annab Teile
selgema arusaama millised numbrid on selles loetelus.
Sest aritmeetline keskmine oli viltune, selle
eemalasuja tõttu.
Ja mis see eemalasuja on, see on selline asi, mida
statistikaga tegeleja ütleks, et
Ma tean seda, kui ma seda näen.
Sellel puudub formaalne definitsioon, aga see kaldub olema
number, mis silmapaistvalt erineb teistest ja mõnikord
seetõttu, mõõtmise viga või midagi sellist.
Ja lõpuks mood.
Mis on kõige enam levinud number antud loetelus?
Meil on viis 3-e ja üks 100
Siis kõige levinum number jällegi on 3.
Sellisel juhul, kui Teil on selline eemalasuja, siis mediaan ja
mood kalduvad olema,
parem anda Teile tunnus mida need numbrid
esindavad.
Võib-olla see oli lihtsalt mõõtmise viga.
Aga ma ei tea, me tegelikult ei tea
mida nad kirjeldavad.
Kui need oleksid kodude hinnad, siis ma vaidleksin vastu,
tõenäoliselt rohkem indikatiivsemad mõõtmed kui need
kodud seal piirkonnas maksavad.
Aga kui see oleks midagi muud, kui need oleksid mingid testi tulemused,
võib-olla, seal on üks õpilane, üks kuuest, kes
tegi väga väga hästi, ja kõik teised
ei õppinud üldse.
See on rohkem indikatiivsem, umbes, et kuidas õpilased
sellisel tasemel oskavad keskmiselt.
Igatahes ma olen lõpetanud selle kõigega nüüd.
Ja ma julgustaks Teid mängima paljude numbritega ja tegelema
nende mõistetega ise.
Järgmises videos me uurime rohkem kirjeldavat
statistikat.
Selle asemel et rääkida kesksest tendentsist, me räägime
kui palju eemal on numbrid
kesksest tendentsist.
Näeme järgmise video aeg.