Bem-vindo aos vídeos
de estatística.
Isso é algo que eu queria
fazer há algum tempo.
Bem, vou tentar ir
direto ao assunto.
Vou tentar fazer tantos exemplos
quanto possível e espero poder
passar a vocês a essência
sobre o que é a estatística.
Apenas para começar, caso
vocês ainda não estejam
familiarizado - embora eu ache
que muitas pessoas têm uma
noção do que trata a
estatística.
Em termos gerais, a estatística
é uma espécie de
imersão no mundo dos dados.
E em geral ela pode
ser classificada.
Bem, há talvez
três categorias.
Você tem a estatística descritiva.
Então vamos dizer que você tem um
monte de dados e você quer explicar
a alguém sobre eles, sem precisar
passar todos os dados a essa pessoa.
Talvez você possa encontrar
alguns números que de alguma forma
representam todos os dados
sem ter que
passar por todos os dados.
Pois isso seria a
estatística descritiva.
Há também a previsão.
Bem, eu vou agrupar estes
tipos em um só.
Temos também a inferência estatística.
E isso acontece essencialmente
quando você usa dados para tirar
conclusões sobre as coisas.
Então, digamos que você já testou
alguns dados de uma população -
e vamos falar muito sobre
amostras verso população, mas
acho que vocês tenham uma
idéia do que seja isso, não é?
Se eu estudo três pessoas
que vão votar para
presidente, eu claramente não
pesquisei toda a população.
Eu pesquisei somente uma amostra.
Portanto, a inferência estatística
é algo que podemos usar para
fazer alguns cálculos sobre as amostras,
assim talvez possamos fazer inferências ou
tirar conclusões sobre a
população como um todo.
Bem, de qualquer maneira, isso é apenas
um grande retrato do que
é a estatística.
Então para começar a entrar nos
meandros dela vamos começar
pela estatística descritiva.
Então, a primeira coisa que
eu gostaria de fazer
ou pelo menos acho que a maioria
das pessoas gostaria de fazer quando
lhes passam um conjunto de números
e pedem para descrevê-los.
Bem, talvez eu possa chegar a
alguns números que sejam mais
indicativos de todos os
números desse conjunto.
Ou a algum número que represente
a tendência central
- e esta é um termo que você vai ver
muito em livros de estatística.
A tendência central
em um conjunto de números.
E isso também é
chamado de média.
E eu vou ser um pouco mais
exato do que eu sou normalmente
com a palavra "média". Quando eu
falar sobre isso, neste contexto,
significa apenas que a média
é um número que de alguma forma
está nos dando uma noção de
tendência central.
Ou talvez um número que seja mais
representativo em um conjunto.
E eu sei que isso soa
muito abstrato, mas vamos
fazer um par de exemplos.
Enfim, há várias maneiras
de realmente medir
a tendência central ou a média
de um conjunto de números.
E vocês provavelmente
já viram isso antes.
Elas são as médias.
E, na verdade, há vários tipos
de médias, mas nós vamos continuar
com a média aritmética,
média geométrica e talvez
cubramos a média harmônica
algum dia.
Há a média, a mediana
e a moda.
E na maneira "estatística" de falar,
todos estes tipos de média podem
representar um conjunto de dados
ou a tendência central de uma população
ou a tendência central da amostra.
E todas elas são coletivamente
- todas elas podem ser
formas de uma média.
Eu acho que vendo
exemplos, isso tudo vai fazer
um pouco mais de sentido.
Em linguagem cotidiana, quando as pessoas
falam de uma média, eu acho
que vocês já calcularam
médias em suas vidas, elas estão
geralmente falando de
média aritmética.
Então, normalmente, quando alguém diz:
"Vamos tirar a média destes
números". E essas pessoas esperam
que vocês façam alguma coisa, eles querem
vocês descubram a
média aritmética.
Eles não querem que você encontre
a mediana ou a moda.
Mas antes de irmos adiante,
vamos descobrir o que
essas coisas são.
Deixe-me fazer um
conjunto de números.
Vamos dizer que tenho o número 1.
Vamos dizer que eu tenho
outro 1, um 2, um 3.
Vamos dizer que eu tenho um 4.
Isso já é o suficiente.
Queremos apenas um exemplo simples.
Assim, a média ou a média aritmética
é provavelmente o que você está
mais familiarizados quando
as pessoas falam sobre média.
E isso é essencialmente - você
somar todos os números e você
dividir pela quantidade de número
que existem.
Portanto, neste caso, seria 1
mais 1 mais 2 mais 3 mais 4.
E você vai dividir isso por
por um, dois, três,
quatro, cinco números.
O que é?
1 mais 1 é 2.
2 mais 2 são 4.
4 mais 3 é 7.
7 e 4 é 11.
Portanto, isso é igual a 11/5.
O que é isso?
Isso é 2 1/5?
Então isso é igual a 2,2.
E assim que alguém poderia
dizer: "Ei, você sabe.
Esse é um belo
representante
numérico deste conjunto.
Esse é o número cujo qual todos os
os outros números poderíamos
dizer que estão próximos. "Ou seja,
2,2 representa a tendência
central deste conjunto.
E em linguagem comum, essa
seria a média.
Porém, se formos um pouquinho
mais específicos, essa
seria a média aritmética
deste conjunto de números.
E você vê que ela mais ou menos
os representa.
Se eu não quisesse dar a vocês
a lista dos cinco números, eu
poderia dizer: "Bem, você sabe, eu
tenho um conjunto de cinco números e
sua média é de 2,2". Isso mais
ou menos te diria um pouco,
você sabe, sobre como
são estes números.
Vamos falar um pouco mais
sobre como você sabe o quão longe
Os números estão desta média
provavelmente no próximo vídeo.
Então essa é uma medida.
Outra medida, em vez de
uma média desta forma, você
pode colocar os
números em ordem, o que
na verdade, eu já fiz.
Então vamos escrevê-los
em ordem novamente.
1, 1, 2, 3, 4.
E você simplesmente pega
o número do meio.
Então vamos ver, há um, dois,
três, quatro, cinco números.
Portanto, o número médio vai
para estar aqui, certo?
O número médio é 2.
Há dois números maiores
que 2 e há dois
números inferiores a 2.
E isso é chamado de mediana.
Então realmente exige muito
pouco cálculo.
Você apenas tem que
ordenar os números.
E então você encontra o número
que tem uma quantidade de
números acima igual à quantidade
de números abaixo deste número.
Assim, a mediana deste conjunto é 2.
E você vê, quero dizer,
isso é realmente bastante
perto da média.
E não há resposta certa.
Qualquer uma delas não é melhor
resposta para a média.
São apenas maneiras diferentes
de medir a média.
Então aqui é a mediana.
E eu sei que você pode estar
pensando: "Bem, isso foi
fácil quando temos
cinco números.
E se tivéssemos seis números?"
E se fosse assim?
E se esse fosse o nosso
conjunto de números?
1, 1, 2, 3, vamos adicionar
mais um 4 aqui.
Então, agora, não há
número do meio, certo?
Quero dizer, 2 não é o número
do meio, pois há dois números
menores que ele e três maiores.
E então 3 não é o número do
meio, pois há três
maiores e - desculpe, há
dois maiores e três
menores do que ele.
Portanto, não há um número do meio.
Então, quando você tiver um conjunto
de números pares e alguém pedir
que você descubra a mediana,
o que você faz é tomar os
dois números do meio e você
tira a média aritmética
desses dois números.
Portanto, no caso deste conjunto,
a mediana seria de 2,5.
É isso aí.
Mas vamos colocar isso aqui ao lado
porque eu quero comparar a
mediana, a médias e a
moda para o mesmo
conjunto de números.
Mas isso é uma coisa boa para
saber porque às vezes
pode ser um pouco confuso.
E isso são definições.
São tipos de ferramentas
matemáticas para colocar
nossas mentes em torno a números.
Não é como se um dia alguém
visse uma dessas fórmulas no
céu e dissesse:
"Ah, isso é parte do
universo, é assim que uma
média deve ser calculada".
Estas são construções humanas
para posicionar nossas mentes
em torno a grandes conjuntos de dados.
Este não é um grande conjunto de dados,
mas se em vez de cinco números,
nós tivéssemoos cinco milhões de
números, você pode imaginar que não
gostaria de pensar em cada
número individualmente.
De qualquer forma, antes de eu falar mais
sobre isso, deixe-me dizer
o que é a moda.
E a moda, até certo ponto,
é a ferramenta que eu acho que a maioria
das pessoas provavelmente esquecem,
ou nunca aprendem e quando a vêem em
um exame, se confundem porque
ficam como: "Hum, isso parece
bem avançado". Mas, em
alguns aspectos, é a mais fácil
de todas as medidas de tendências
centrais ou de médias.
A moda é essencialmente o número
mais comum em um conjunto.
Assim, neste exemplo, há
dois 1's e depois há um
número de cada, certo?
Assim, a moda aqui é 1.
Assim, a moda é o número
mais comum.
E então vocês podem dizer algo
como: "Opa, Sal, e se
esse fosse o nosso conjunto?
1, 1, 2, 3, 4, 4". Aqui eu tenho
dois 1's e tenho dois 4's.
É aqui que a moda se
complica um pouco, porque
qualquer uma destas teria sido
uma resposta boa para a moda.
Vocês poderiam ter dito que
a moda deste conjunto é 1
ou que a moda deste conjunto é 4
mas isso fica um pouco ambíguo.
E vocês provavelmente vão querer
um pouco mais de clareza da
a pessoa que está perguntando.
Na maioria das vezes, em um teste,
quando perguntarem isso a você,
não vai haverá essa ambigüidade.
Haverá um número que será o
número mais comum do conjunto.
Então agora é como: bem, você
sabe, porque não era apenas uma
destas médias boa o suficiente?
Você sabe por que nós aprendemos
médias, porque não
usamos apenas médias?
Porque não usamos médias
aritméticas o tempo todo?
Para que servem a mediana
e a moda?
Bem, vou tentar mostrar um
exemplo e ver se parece
bom para vocês.
E então vocês podem pensar
um pouquinho mais.
Vamos dizer que eu tivesse esse
conjunto de números.
3, 3, 3, 3, 3, e,
sei lá, 100.
Então qual é a
média aritmética aqui?
Eu tenho um, dois, três,
quatro, cinco 3's e um 100.
Então seria 115
dividido por 6, certo?
Eu poderia ter um, dois, três,
quatro, cinco, seis números.
115 é apenas a soma
de todos estes.
Então isso é igual a - quantas
vezes o 6 cabe dentro de 115?
6 cabe aqui uma vez.
Uma vez 6 é 6.
55 cabe aqui 9 vezes.
9 vezes 6 é 54.
Então, isso é igual a 19 1/6.
Certo.
Acabei de adicionar todos os
números e dividi por
quantos são.
Mas a minha pergunta é, isso é
realmente representativo
deste conjunto?
Quero dizer, tenho um monte de 3's
e então eu tenho um 100,
e derrepente, estamos dizendo que
a tendência central é 19 1/6.
E, quero dizer, 19 1/6 não
realmente parece indicativo
do conjunto.
Bem, talvez sim, dependendo
da sua aplicação, mas
parece apenas um pouco
pouco fora, certo?
Quero dizer, minha intuição seria
que a tendência central é
algo mais próximo de 3 porque
há um monte de 3 aqui.
Então, o que a mediana
nos diria?
Eu já coloquei esses
números em ordem, certo?
Se eu desse para vocês estes
números fora de ordem, vocês
colocariam nesta ordem, mas qual
número seria o número do meio?
Vamos ver, os dois números do
meio, já que tenho uma
quantidade par de números, são 3 e 3.
Portanto, se eu tirar a média de
3 e 3 - eu deveria ser mais
específico em como me expresso.
Se eu tirar a média aritmética
média de 3 e 3, eu tenho 3.
E esta talvez seja a melhor
medida de tendência central
tendência ou da média deste
conjunto de números, certo?
Essencialmente, o que acontece ao
usarmos a mediana, é que não somos
muito afetados por este número
tão grande e tão
diferente dos outros.
Em estatística, chamam este número
de "outlier" (um número anômalo).
Um número que, digamos, se
falamos sobre preços médios
de casas, talvez todas as casas da
cidade custem 100.000 e, em seguida,
há uma casa que
custa 1 trilhão.
E então, se alguém lhe disser
que o preço médio da casa é,
sei lá, de 1 milhão, vocês
podem ter uma percepção muito errada
da cidade.
Mas a mediana do preço da casa
seria de 100.000 e vocês podem
ter uma noção melhor do tipo
de casas que existem nesta cidade.
Assim, esta mediana,
talvez, dê a vocês uma melhor
noção sobre como os números
deste conjunto são.
Porque a média aritmética
foi desviada por isso, que
os estatísticos chamam de
um "outlier".
E ser capaz de dizer o que
um outlier é, é uma
daquelas coisas que um
estatístico dirá:
"Eu sei o que é quando
encontro um."
Não há realmente uma definição
formal para isso, mas ele tende
a ser um número que realmente
chama atenção e, às vezes
é devido, você sabe como é, um
erro de medição ou algo assim.
E então, finalmente, a moda.
Qual é o número mais comum
neste conjunto?
Bem, há cinco 3's e
há um 100.
Assim, o número mais comum
é, mais uma vez, o 3.
Portanto, neste caso, quando você tem
este outlier, a mediana e
a moda tendem a ser, vocês sabem,
talvez sejam um pouco melhor
para dar uma melhor
indicação sobre o que esses
números representam.
Talvez esta fosse apenas uma
medição errada.
Mas eu não sei, nós
na verdade, não sabemos
o que estes números representam.
Se estes são os preços das casas,
eu diria que esses são
provavelmente medidas mais
indicativas do que custam
as casas nesta área.
Mas se isso é outra coisa,
se isto é a pontuação em um teste,
talvez, vocês sabem, talvez haja
um garoto na classe - uma em
seis crianças que foi, realmente,
muito muito bem e todos
os outros não estudaram.
E este é mais um indicativo
de como os alunos
se saem, na média.
Enfim, termino agora de falar
sobre tudo isso.
E encorajo vocês a brincar
com um monte de números e
com estes conceitos por conta
própria.
No vídeo a seguir, vamos
explorar mais a estatística
descritiva.
Em vez de falar sobre
tendência central, vamos falar
sobre como separar coisas que
estão longe da
tendência central.
Nos vemos no próximo vídeo.