-
Bine ați venit la lista de clipuri despre statistică.
-
Ceva ce intenționam să fac de un timp încoace.
-
Așa că eu vreu doar să trec direct la treabă și
-
voi încerca să exemplific cât mai mult și sper
-
să vă arăt despre ce e statistica.
-
Și, pe bune, chiar este un fel de început în cazul în care nu vă este
-
familiară - deși cred că mulți oameni au
-
un sentiment intuitiv despre ceea ce este statistica.
-
Și în primul rând - ei bine, în termeni generali este un fel de
-
a te uita după date.
-
Și poate fi clasificată pe larg.
-
Ei bine, există poate trei categorii.
-
Aveți statistica descriptivă.
-
Să spunem ca aveți o mulțime de date și ați vrea să spuneți cuiva
-
despre acestea fără să le dați toate aceste date.
-
Poate ați putea găsi niște numere adecvate care
-
cumva reprezintă toate acele date fără să
-
treceți prin toate acestea.
-
Aceasta ar putea fi statistica descriptivă.
-
Mai este cea predictivă.
-
Ei bine, voi încerca să le grupez.
-
Mai este și statistica inferențială.
-
Și aceasta este în primul rând atunci când folosești date ca să
-
obții concluzii despre lucruri.
-
Așa că să spunem că ați luat un eșantion de date dintr-o populație --
-
și vom vorbi mult despre eșantioane versus populație --
-
Cred că aveți o idee de bază despre ce este asta, corect?
-
Dacă întreb 3 oameni pe cine urmează să voteze ca
-
președinte, în mod clar nu am întrebat toată populația.
-
Am întrebat un eșantion.
-
Dar ideea de bază în statistica inferențială este că dacă putem face
-
ceva matematică pe eșantioane, poate atunci putem face inferențe sau
-
trage concluzii despre populație ca întreg.
-
Ei bine, oricum asta e doar imaginea de ansamblu a ceea
-
ce este statistica.
-
Să intrăm în detalii și să începem
-
cu statistica descriptivă.
-
Așa că primul lucru pe care, nu știu, aș dori
-
să îl fac sau mă gândesc că cei mai mulți oameni ar dori să îl facă atunci când li
-
se pune la dispoziție un set întreg de numere este să îl descrie.
-
Ei bine, poate pot veni cu un număr care poate descrie
-
cel mai bine toate numerele din acel set.
-
Sau un număr care reprezintă, oarecum, tendința centrală
-
-- acesta este un cuvânt pe care îl veți întâlni ades în cărțile de statistică.
-
Tendința centrală a unui set de numere.
-
Și acesta se mai numește medie.
-
Și voi fi puțin mai explicit aici decât sunt de obicei
-
referitor la cuvântul ”medie”. Când vorbesc despre ea în acest context,
-
înseamnă doar că media este un număr care într-un anume fel
-
ne oferă un sens al tendinței centrale.
-
Sau poate un număr care reprezintă cel mai bine setul.
-
Și știu că asta sună foarte abstract dar haideți
-
să vedem câteva exemple.
-
Există așadar o mulțime de feluri în care puteți măsura
-
tendința centrală sau media unui set de numere.
-
Și probabil că le-ați mai văzut înainte.
-
Ele sunt media.
-
Și de fapt sunt mai multe feluri de medii dar ne vom opri
-
la media aritmetică.
-
media geometrică și poate vorbim și despre media armonică
-
într-o zi.
-
Există o medie, mediana și modul.
-
Și în limbaj statistic, acestea toate pot fi
-
reprezentative pentru seturi de date sau tendința centrală a unei populații
-
sau a unui eșantion.
-
Și ele sunt colectiv - toate pot fi
-
forme ale unei medii.
-
Și cred că atunci când vedem și niște exemple,
-
lucrurile vor avea mai mult sens.
-
În limbajul zilnic, atunci când oamenii vorbesc despre o medie,
-
cred că deja ați calculat medii,
-
ei vorbesc de obicei despre media aritmetică.
-
Așa că în mod obișnuit când cineva spune ”Să luăm media
-
acestor numere” și se așteaptă ca voi să faceți ceva, se dorește ca
-
voi să vă dați seama care este media aritmetică.
-
Nu vor să vă gândiți la mediană sau la mod.
-
Dar înainte să mergem mai departe, să vedem ce
-
sunt acestea.
-
Să luăm un set de numere.
-
Să spunem că avem numărul 1.
-
Să spunem că avm încă un 1, un 2, un 3.
-
Să spunem că avem un 4.
-
Astea sunt suficient de bune.
-
Vrem doar un exemplu simplu.
-
Așadar media sau media aritmetică este cea care vă este cea mai
-
cunoscută atunci când oamenii vorbesc despre medii.
-
Și asta și este în fond - aduni toate numerele și apoi
-
le împarți la câte sunt.
-
Așa că în cazul nostru, ar fi 1 plus 1 plus 2 plus 3 plus 4.
-
Și veți împărți la unul, două, trei,
-
patru, cinci numere.
-
Cât este?
-
1 plus 1 este 2.
-
2 plus 2 este 4.
-
4 plus 3 este 7.
-
7 plus 4 este 11.
-
Așadar aceasta este egală cu 11/5.
-
Cât înseamnă asta?
-
Este 2 și 1/5?
-
Este egală deci cu 2.2.
-
Și cineva ar putea spune, ”Hei, știi
-
Este un număr care reprezintă destul de bine
-
numerele din acest set.
-
Acesta este numărul față de care ați putea spune că
-
se apropie toate numerele din acest set”. Sau, 2.2 reprezintă
-
tendința centrală a acestui set.
-
Și în limbajul comun, aceasta ar fi media.
-
Dar dacă intrăm puțin mai mult în amănunte, aceasta
-
este media aritmetică a acestui set de numere.
-
Și vedeți că într-un fel le reprezintă.
-
Dacă nu aș fi vrut să vă dau toată lista de cinci numere eu
-
v-aș fi putut spune ”Știți, am un set de cinci numere și
-
media lor este 2.2”. Vă spune oarecum puțin despre
-
unde se află numerele.
-
Vom vorbi puțin mai mult despre cum știm cât de departe
-
sunt numerele de acea medie probabil în următorul clip.
-
Aceasta este una din măsuri.
-
Altă măsură, în loc de a calcula media în acest fel,
-
puteți face media prin punerea în ordine a numerelor, lucru pe care
-
l-am și făcut de fapt.
-
Să scriem numerele din nou.
-
1, 1, 2, 3, 4.
-
Și doar luăm numărul din mijloc.
-
Să vedem, sunt unul, două, trei, patru, cinci numere.
-
Așa că numărul din mijloc este chiar acolo, corect?
-
Numărul din mijloc este 2.
-
Sunt două numere mai mari decât 2 și sunt
-
două numere mai mici decât 2.
-
Și aceasta se numește mediană.
-
Este de fapt foarte puțin de calculat.
-
În fond trebuie doar să ordonați numerele.
-
Și apoi găsiți acel număr pentru care
-
aveți un număr egal de numere mai mici sau mai mari decât acel număr.
-
Astfel mediana acestui set este 2.
-
Și vedeți, este destul de îndeaproape
-
de medie.
-
Și aici nu există răspunsuri corecte.
-
Unul dintre acestea nu este un răspuns mai bun pentru medie.
-
Sunt doar modalități diferite de a măsura media.
-
Așadar avem mediana.
-
Și știu la ce vă gânditți, ”Ei bine, asta a fost
-
destul de ușor de făcut când am avut cinci numere.
-
Dar dacă am fi avut șase numere?” Dacă ar fi fost ca în acest caz?
-
Dacă ar fi fost acesta setul nostru de numere?
-
1, 1, 2, 3, să adăungăm încă un 4 aici.
-
Acum, nu mai există nici un număr în mijloc, corect?
-
Mă refer la faptul că 2 nu mai este numărul din mijloc pentru că avem două numere mai mici
-
și trei numere mai mari decât acesta.
-
Și apoi nici trei nu este numărul de mijloc deoarece avem trei mai mari
-
și - scuze, sunt două mai mari și trei
-
mai mici decât acesta.
-
Așadar nu avem număr de mijloc.
-
Atunci când avem un set cu număr par de cifre și cineva vă spune
-
să calculați mediana, ceea ce trebuie să faceți este să
-
luați cele două numere din mijloc și
-
să faceți media aritmetică a acestor numere.
-
Astfel, în cazul acestui set, mediana ar fi 2.5.
-
Destul de bine.
-
Dar să lăsăm asta deoparte deoarece vreau să compar
-
mediana și mediile și modurile pentru același
-
set de numere.
-
Este un lucru bun de știut pentru că uneori
-
poate fi puțin confuz.
-
Și acestea sunt toate definiții.
-
Sunt tot felul de mijloace matematice ca sa ajungem
-
să înțelegem numerele.
-
Nu este ca și cum cineva ar fi văzut aceste formule
-
pe suprafața soarelui și ar spune ”Oh, asta e parte din
-
univers și acesta este felul în care se calculează media”.
-
Acestea sunt constructe umane ca să putem
-
înțelege seturi mari de date.
-
Acesta nu este un set mare de date, dar dacă în loc de cinci numere
-
am fi avut cinci milioane de numere, puteți să vă imaginați
-
cum ar fi fost să luați fiecare număr în parte.
-
Oricum, înainte să vă spun mai multe despre asta, să vă
-
spun ce este modul.
-
Și modul, într-o anumită măsură, este cel despre care cred eu că
-
cei mai mulți oameni uită sau despre care nu învață niciodată și atunci când îl văd
-
la un examen, îi face să fie confuzi pentru ei sunt de părere că este un
-
lucru foarte avansat. Dar în unele feluri este cel mai ușor
-
dintre toate măsurile tendinței centrale sau ale mediei.
-
Modul este în esență numărul cel mai comun într-un set.
-
Astfel, în exemplu nostru, avem de două ori 1 și câte o dată
-
din toate celelalte numere, corect?
-
Astfel modul în cazul ăsta este 1.
-
Deci modul este cel mai comun număr.
-
Și atunci ați putea spune, ”Stai așa, Sal,
-
dar dacă ar fi fost acesta setul nostru?
-
1, 1, 2, 3, 4, 4”. Aici avem de două ori 1 și de două ori 4.
-
Și aici modul devine puțin amăgitor pentru că
-
oricare dintre aceste numere ar fi fost un răspuns decent pentru mod.
-
Ați fi putut spune că modul acestuia este 1 sau
-
modul acestuia este 4 și devine puțin ambiguu.
-
Și probabil vreți ceva mai multă claritate din partea persoanei
-
care vă întreabă.
-
De cele mai multe ori la un test unde veți fi întrebați, nu va
-
exista această ambiguitate.
-
Va exista un număr cel mai comun din set.
-
Și acum avem situația că, ei bine, de ce n-a fost doar unul
-
din acestea destul de bun?
-
Știm de ce am învățat medii, de ce nu
-
folosim doar mediile?
-
Sau de ce nu folosim doar media aritmetică tot timpul?
-
Pentru ce sunt bune mediana și modul?
-
Ei bine, voi încerca să vă dau un exemplu și să vedem dacă
-
vi se pare adevărat.
-
Și apoi puteți să vă gândiți puțin mai bine.
-
Să spunem că aș avea acest set de numere.
-
3, 3, 3, 3, 3, și, nu știu, 100.
-
Așadar care este media aritmetică aici?
-
Am unul, doi, trei, patru, cinci numere 3 și 100.
-
Ar fi deci 115 de împărțit la 6, corect?
-
Aș avea unul, două, trei, patru, cinci, șase numere.
-
115 este doar suma tuturor acestora.
-
Asta e egal cu - de câte ori intră 6 în 115?
-
6 intră o dată.
-
1 ori 6 este 6.
-
în 55 intră de 9 ori.
-
de 9 ori 6 fac 54.
-
Este egal deci cu 19 și 1/6.
-
Destul de bine.
-
Am adunat toate numerele și am împărțit rezultatul la
-
câte sunt.
-
Dar întrebarea mea este, este acest număr reprezentativ
-
pentru set?
-
Adică, am o mulțime de 3 și apoi am 100
-
dintr-o dată, și spunem că tendința centrală este 19 și 1/6.
-
Și, spun, 19 și 1/6 nu prea pare să fie reprezentativ pentru
-
set.
-
Sau poate că este, în funcție de aplicația voastră, dar
-
pare să fie puțin cam forțat, corect?
-
Adică, intuiția mea ar fi că tendința centrală ar trebui să fie ceva
-
mai aproape de 3 pentru că am o mulțime de 3 aici.
-
Ce ne-ar spune mediana?
-
Am așezat deja numerele în ordine, corect?
-
Dacă vi le-aș da neordonate și le-ați
-
ordona astfel care ați spune că este numărul din mijloc?
-
Să vedem, cele două numere din mijloc, din moment ce
-
am număr par de cifre, sunt 3 și 3.
-
Deci dacă iau media dintre 3 și 3 - sau ar trebui să
-
fiu mai atent la limbaj
-
Dacă iau media aritmetică a lui 3 și a lui 3, am 3.
-
Și acesta este poate o măsură mai bună a tendinței centrale decât
-
media acestui set de numere, corect?
-
În fond, ceea ce face este că prin luarea medianei
-
nu am mai fost afectat atât de mult de acel număr mare
-
care este foarte diferit de celelalte.
-
În statistică este denumit o valoare excepțională.
-
Un număr care, dacă ați vorbi despre prețurile medii la case
-
poate că dacă prețul fiecărei case din oraș ar fi $100,000 și apoi
-
ar fi o casă care ar costa $1 bilion.
-
Și apoi cineva v-ar spune că prețul mediu ar unei case ar fi
-
nu știu, 1 milion, v-ați putea face o impresie foarte greșită
-
despre acel oraș.
-
Dar mediana prețurilor caselor ar fi $100,000 și ați avea
-
o mai bună imagine despre cum sunt casele din acel oraș.
-
Similar, această mediană vă oferă poate o mai bună
-
înțelegere asupra felului în care sunt numerele din set.
-
Deoarece media aritmetică a fost întinsă de acest număr,
-
el este numit o valoare excepțională.
-
Și a fi capabil să spui care este o valoare excepțională, este unul din acele lucruri
-
despre care un statistician va spune că, ei bine,
-
voi ști când îl voi vedea.
-
Nu există o definiție formală pentru acesta dar tinde
-
să fie un număr care cu adevărat se evidențiază și câteodată
-
acest lucru se datorează, știți voi, unei erori de măsurare sau altui motiv.
-
Și în final, modul.
-
Care sete cel mai comun număr din set?
-
Ei bine, avem de cinci ori 3 și 100.
-
Cel mai comun număr, încă o dată, este 3.
-
Astfel, în cazul acesta, când aveți valoarea excepțională și mediana și
-
modul pe care le cunoașteți, poate acestea sunt puțin mai bune
-
în a vă oferi un indiciu asupra ceea ce
-
reprezintă numerelele.
-
Poate aceasta a fost doar o eroare de măsurare.
-
Dar nu știu, nu știm de fapt
-
ce reprezintă.
-
Dacă acestea sunt prețuri de case, aș argumenta atunci că acestea sunt
-
probabil mai reprezentative decât
-
cât costă casele dintr-o zonă.
-
Dar dacă ar fi altceva, dacă ar fi note la un test,
-
poate, știu eu, este vreun copil în clasă care
-
- unul din șase copii - care a făcut foarte, foarte bine și toți ceilalți
-
nu au învățat.
-
Și aceasta este mai reprezentativ pentru știu eu,
-
cum se descură în medie studenții de la acel nivel.
-
Oricum, am terminat de vorbit despre toate acestea.
-
Și vă încurajez să vă jucați cu o mulțime de numere și să vă
-
confruntați cu conceptele voi înșivă.
-
În următorul clip vom studia mai mult despre statistica
-
descriptivă.
-
În loc să vorbim despre tendința centrală, vom vorbi despre
-
cât de depărtate sunt lucrurile față de
-
tendința centrală.
-
Ne vedem în următorul clip.