0:00:00.990,0:00:03.270 Bienvenidos a la lista de reproducción de estadística. 0:00:03.270,0:00:06.380 Algo que he querido hacer por un tiempo. 0:00:06.380,0:00:08.710 De todos modos, quiero empezar con lo más grueso y 0:00:08.710,0:00:12.220 Trataré de hacer la mayor cantidad de ejemplos posibles y espero 0:00:12.220,0:00:14.990 que te pueda dar una idea de lo que trata la estadística. 0:00:14.990,0:00:16.850 Y, realmente, trataré de empezar en caso de que no estés 0:00:16.850,0:00:18.550 familiarizado con el tema-- sin embargo, pienso que muchas personas tienen una 0:00:18.550,0:00:20.660 idea de lo que significa la estadística. 0:00:22.414,0:00:27.169 Y esencialmente -- bueno, en términos bien generales es como 0:00:27.169,0:00:28.590 envolver tu cabeza con datos (analizar datos). 0:00:28.590,0:00:30.540 Y puede ser clasificado de una manera general. 0:00:30.540,0:00:32.640 Bueno, hay quizás tres categorías. 0:00:32.640,0:00:35.330 Tienes la estadística descriptiva. 0:00:35.330,0:00:39.150 Digamos que tienes muchos datos y quieres explicárselo a alguien 0:00:39.150,0:00:41.480 sin darles todos los datos. 0:00:41.480,0:00:45.360 Quizás puedes encontrar números indicativos que 0:00:45.360,0:00:47.560 de una manera representan todos los datos sin tener que 0:00:47.560,0:00:48.540 revisar todos los datos. 0:00:48.540,0:00:50.370 Eso sería estadística descriptiva. 0:00:50.370,0:00:51.510 También hay predictiva. 0:00:51.510,0:00:53.110 Bueno, intentaré agruparlos todos juntos. 0:00:53.110,0:00:55.110 Hay estadística inferencial. 0:00:58.310,0:01:00.908 Y aquí es cuando utilizas los datos para hacer esencialmente 0:01:00.920,0:01:02.200 conclusiones sobre las cosas. 0:01:02.200,0:01:06.500 Digamos entonces que has muestreado algunos datos a partir de una población -- 0:01:06.500,0:01:08.890 y hablaremos mucho sobre muestras versus poblaciones, pero 0:01:08.890,0:01:11.390 Pienso que tienes una idea básica de lo que es,  ¿Verdad? 0:01:11.390,0:01:13.800 Si yo encuesto a tres personas que van a votar por un 0:01:13.800,0:01:16.500 presidente, claramente no he encuestado a la población entera. 0:01:16.500,0:01:18.160 He encuestado a una muestra. 0:01:18.160,0:01:21.780 Pero de qué la estadística inferencial trata es, si podemos hacer 0:01:21.780,0:01:24.890 un poco de matemática en las muestras, quizás podemos hacer inferencias o 0:01:24.890,0:01:27.740 conclusiones sobre la población en su totalidad. 0:01:27.740,0:01:29.760 Bueno, de todos modos, eso es el gran panorama de que 0:01:29.760,0:01:30.800 consiste la estadística. 0:01:30.800,0:01:33.620 Vamos a entrar a lo grueso y comenzaremos 0:01:33.620,0:01:34.746 con la descriptiva. 0:01:37.931,0:01:41.012 Entonces lo primero que, no sé, que yo quisiera 0:01:41.040,0:01:44.330 hacer o creo que la mayoría quisiera hacer cuando les 0:01:44.330,0:01:47.320 dan un conjunto completo de números y les dicen que los describan. 0:01:47.320,0:01:51.030 Bueno, quizás yo puedo utilizar un número que es el más 0:01:51.030,0:01:54.430 indicativo de todos los números en el conjunto. 0:01:54.430,0:01:57.092 O algún número que representa, más o menos, la tendencia central 0:01:57.092,0:01:59.900 -- ésta es una palabra que verás mucho en los libros de estadística. 0:01:59.900,0:02:03.040 La tendencia central de un conjunto de números. 0:02:07.040,0:02:09.375 Y esto es también llamado el promedio. 0:02:09.375,0:02:11.780 Y seré un poco más exacto aquí de lo que normalmente soy 0:02:11.780,0:02:16.060 con la palabra "promedio". Cuando hablamos de promedio en este contexto, 0:02:16.060,0:02:20.090 significa simplemente que el promedio es un número que de alguna manera 0:02:20.090,0:02:22.640 nos da una idea de la tendencia central. 0:02:22.640,0:02:25.430 o tal vez es un número que es el más representativo del conjunto 0:02:25.430,0:02:27.030 Y yo sé que por el momento suena abstracto pero 0:02:27.030,0:02:28.870 hagamos un par de ejemplos. 0:02:28.870,0:02:31.850 Hay un sinnúmero de maneras en las que uno puede medir 0:02:31.850,0:02:35.200 la tendencia central o el promedio de un conjunto de números 0:02:35.200,0:02:37.950 y probablemente los has visto antes. 0:02:37.950,0:02:40.534 Son conocidos como la "media" 0:02:40.534,0:02:42.960 y en realidad, hay varios tipos de medias pero vamos a utilizar 0:02:42.960,0:02:44.040 la media aritmética 0:02:48.260,0:02:53.810 Luego cuando veamos retornos de inversiones veremos media geométrica y tal vez veamos la media armónica 0:02:53.810,0:02:55.040 algún día 0:02:55.040,0:03:02.640 Entonces tenemos la media, la mediana y la moda 0:03:02.640,0:03:07.050 Y en estadística, todos estos conceptos pueden 0:03:07.050,0:03:10.620 ser representativo de un conjunto de datos o una población de tendencia central 0:03:10.620,0:03:12.650 o una muestra de tendencia central 0:03:12.650,0:03:15.590 Y en conjunto, pueden llamarse 0:03:15.590,0:03:17.070 tipos de promedio 0:03:17.070,0:03:18.520 Y creo que cuando veamos ejemplos, va a 0:03:18.520,0:03:19.470 tener un poquito más de sentido 0:03:19.470,0:03:23.440 En el día a día, cuando la gente habla de promedios, y considero 0:03:23.440,0:03:26.100 que en algún punto de sus vidas todos hemos calculado un promedio, la gente, 0:03:26.100,0:03:28.710 por lo general, se refiere a la media aritmética. 0:03:28.710,0:03:30.320 Asi que cuando alguien dice "Tomemos el promedio de 0:03:30.320,0:03:32.530 estos números", y ellos esperan que hagas algo, ellos quieren 0:03:32.530,0:03:34.470 que tu calcules la media aritmética. 0:03:34.470,0:03:36.490 No quieren que obtengas la mediana o la moda. 0:03:36.490,0:03:38.780 Pero antes de continuar, les voy a explicar 0:03:38.780,0:03:41.110 que significan estos conceptos. 0:03:41.110,0:03:43.230 Inventemos una serie de números 0:03:43.230,0:03:45.630 Asumamos que tengo el número 1 0:03:45.630,0:03:50.220 Y digamos que tengo otro uno, un dos y un tres 0:03:50.220,0:03:54.495 Y digamos que tengo un cuatro 0:03:55.095,0:03:56.170 Eso es suficiente 0:03:56.170,0:03:58.370 Solo queremos un ejemplo simple 0:03:58.370,0:04:02.650 Así que la media o la media aritmética es probablemente 0:04:02.650,0:04:05.710 el método con el que estás más familiarizado especialmente cuando la gente habla de promedios 0:04:05.710,0:04:07.600 Y básicamente, se suman todos los números y 0:04:07.600,0:04:09.160 la suma se divide por la cantidad de números que hay 0:04:09.160,0:04:16.290 En este caso, sería 1 + 1 + 2 + 3 + 4 0:04:16.290,0:04:19.420 y vas a dividir por uno, dos, tres 0:04:19.420,0:04:21.020 cuatro, cinco números. 0:04:21.020,0:04:21.540 Y eso es? 0:04:21.540,0:04:23.470 1 más 1 es dos 0:04:23.470,0:04:25.600 2 más 2 es cuatro 0:04:25.600,0:04:27.640 4 más 3 es 7 0:04:27.640,0:04:29.500 7 más 4 es 11 0:04:29.500,0:04:32.550 así que tenemos 11 / 5 0:04:32.550,0:04:33.040 Y cuánto es? 0:04:33.040,0:04:34.410 Eso es igual a 2 1/5 0:04:34.410,0:04:38.320 y eso es igual a 2.2 0:04:38.320,0:04:39.560 Y si alguien te dice, "Ey, 0:04:39.560,0:04:41.060 ese número es representativo con respecto 0:04:41.060,0:04:42.490 al conjunto. 0:04:42.490,0:04:44.680 Ese es el número del cual todos los otros números 0:04:44.680,0:04:47.390 están más cerca. O, 2.2 representa la 0:04:47.390,0:04:49.140 tendencia central de este conjunto. 0:04:49.140,0:04:51.400 y en el día a día, eso sería el promedio. 0:04:51.400,0:04:53.450 Pero si somos más específicos, esto 0:04:53.450,0:04:55.410 se conoce como la media aritmética de este conjunto de números 0:04:55.410,0:04:56.740 Y puedes ver que este número los representa 0:04:56.740,0:04:59.210 Si no te hubiese dado la lista de 5 números, yo 0:04:59.210,0:05:01.030 podría decir, "Oye, tengo un conjunto de cinco números y 0:05:01.030,0:05:03.680 su media es 2.2". Te dice algo sobre el conjunto de números 0:05:03.680,0:05:05.900 y por lo menos sobre cómo y dónde están los números. 0:05:05.900,0:05:08.510 Hablaremos un poco más sobre como saber la distancia entre 0:05:08.510,0:05:12.500 los números y su media, en el siguiente video. 0:05:12.500,0:05:13.840 Así que esa es una medida. 0:05:13.840,0:05:17.150 Otra medida, en lugar de encontrar el promedio de esta manera, 0:05:17.150,0:05:19.510 podemos encontrar el promedio si ponemos los números en orden 0:05:19.510,0:05:20.460 Lo que ya hice 0:05:20.460,0:05:23.340 Así que los voy a escribir en orden otra vez 0:05:23.340,0:05:26.810 1,1,2,3,4 0:05:26.810,0:05:28.490 Y tomas el número que está en la mitad. 0:05:28.490,0:05:31.790 asi que tenemos, uno, dos, tres, cuatro, cinco números 0:05:31.790,0:05:34.010 y este es el que está justo en la mitad. 0:05:34.010,0:05:34.940 El número del medio es 2. 0:05:34.940,0:05:37.240 Hay dos números que son mayores que dos y 0:05:37.240,0:05:38.610 dos números que son menores que dos. 0:05:38.610,0:05:39.720 Y esto es la mediana. 0:05:39.720,0:05:41.560 en realidad, casi no hay nada que calcular 0:05:41.560,0:05:43.440 Básicamente tienes que poner los números en orden 0:05:43.440,0:05:45.620 Y luego hallas el número con el que tienes 0:05:45.620,0:05:48.260 igual cantidad de números mayores o menores 0:05:48.260,0:05:51.430 Así que la mediana de este conjunto es 2. 0:05:51.430,0:05:53.010 Y como puedes ver, está bastante 0:05:53.010,0:05:54.320 cerca de la media. 0:05:54.320,0:05:56.020 Pero no hay una sola respuesta correcta. 0:05:56.020,0:05:58.550 Una medida no es mejor que la otra 0:05:58.550,0:06:01.890 Simplemente son métodos diferentes de medir el promedio 0:06:01.890,0:06:05.020 Así que aquí está la mediana 0:06:05.020,0:06:06.980 Y yo sé lo que están pensando, "Bueno, " 0:06:06.980,0:06:08.640 "es fácil cuando uno tiene cinco números. 0:06:08.640,0:06:12.160 Pero qué pasa si tenemos seis números?" Qué pasaría si fuese así? 0:06:12.160,0:06:14.260 ¿Qué pasa si este fuera nuestro conjunto de números? 0:06:14.260,0:06:19.880 1, 1, 2, 3, y añadamos otro 4 0:06:19.880,0:06:21.660 ahora no hay un número en la mitad, verdad? 0:06:21.660,0:06:24.870 2 no está en la mitad porque tenemos 2 números 0:06:24.870,0:06:26.600 menores y 3 mayores 0:06:26.600,0:06:28.820 Y 3, tampoco está en la mitad porque hay 0:06:28.820,0:06:31.530 2 números mayores y 3 que 0:06:31.530,0:06:32.550 son más pequeños. 0:06:32.550,0:06:33.990 así que no hay un número en la mitad. 0:06:33.990,0:06:36.390 Cuando tienes un conjunto con un número par de elementos y te dicen 0:06:36.390,0:06:38.500 que tienes que calcular la mediana, lo que haces es 0:06:38.500,0:06:43.750 tomar los dos números del medio y calcular la media aritmética 0:06:43.750,0:06:45.050 de esos dos números. 0:06:45.050,0:06:50.770 Así que en este caso, la mediana sería 2.5 0:06:50.770,0:06:51.730 Eso parece justo... 0:06:51.730,0:06:54.020 pero pongamos esto a un lado porque quiero comparar 0:06:54.020,0:06:56.680 mediana, media y moda para el mismo 0:06:56.680,0:06:57.620 grupo de números 0:06:57.620,0:07:00.160 Pero es bueno entender esto porque a veces 0:07:00.160,0:07:01.340 puede ser un poco confuso 0:07:01.340,0:07:03.760 todos estos ejemplos son definiciones 0:07:03.760,0:07:05.930 Son distintas herramientas matemáticas para 0:07:05.930,0:07:08.470 lograr entender los números 0:07:08.470,0:07:11.720 No es que un día alguien vió estas fórmulas 0:07:11.720,0:07:13.660 en la cara del sol y dijo " oh, eso es parte del 0:07:13.660,0:07:16.980 universo, así es cómo se deben calcular promedios" 0:07:16.980,0:07:20.380 Estas son construcciones humanas que nos ayudan a decifrar 0:07:20.380,0:07:22.110 cantidades grandes de data. 0:07:22.110,0:07:24.670 Este ejemplo no tiene mucho datos, pero si en vez de 5 números, 0:07:24.670,0:07:26.760 tuviéramos 5 milones de números , podrían imaginarse que 0:07:26.760,0:07:28.780 no pensarían en cada número individualmente. 0:07:28.780,0:07:31.640 De cualquier manera, antes de seguir, déjenme decirles 0:07:31.640,0:07:33.410 qué es la moda 0:07:33.410,0:07:36.200 y la moda hasta cierto grado , es la medida que la mayoría 0:07:36.200,0:07:39.650 de personas olvidan o que no aprenden y cuando la ven 0:07:39.650,0:07:41.930 en un examen, se confunden porque la consideran 0:07:41.930,0:07:45.420 un término muy avanzado, pero de cierta manera es la más facil 0:07:45.420,0:07:49.450 de todas las medidas de tendencia central o de promedio 0:07:49.450,0:07:53.810 La moda es esencialmente el número más común en un conjunto 0:07:53.824,0:07:55.904 En este ejemplo tenemos 2 veces 1 0:07:55.934,0:07:57.924 1 vez el resto de números, verdad? 0:07:57.924,0:07:59.514 Así que la moda aquí es 1. 0:07:59.514,0:08:02.844 Entonces, la moda es el número más común 0:08:02.844,0:08:04.804 Y podrías decir: "Dime, Sal, ¿qué pasa 0:08:04.804,0:08:05.554 si éste fuera nuestro conjunto? 0:08:05.558,0:08:11.408 1, 1, 2, 3, 4, 4" Aquí tengo 2 veces 1 y 2 veces 4 0:08:11.408,0:08:14.038 Y aquí la moda se complica un poco porque 0:08:14.038,0:08:18.038 cualquier de las dos puede ser una respuesta decente para la moda 0:08:18.038,0:08:19.918 Podrías decir que la moda es 1 o 0:08:19.918,0:08:23.668 la moda es 4, lo cual se vuelve ambiguo 0:08:23.668,0:08:24.938 y lo que quieres es claridad de 0:08:24.938,0:08:25.878 la persona que te está preguntando 0:08:25.878,0:08:28.198 En los exámenes cuando te pregunten 0:08:28.198,0:08:29.518 no habrá esta ambiguedad 0:08:29.518,0:08:33.028 Habrá un número más común en el grupo. 0:08:33.028,0:08:35.591 Bueno, entonces ¿por qué no era una de 0:08:35.591,0:08:36.801 esas correcta? 0:08:36.801,0:08:38.281 Tu sabes para que aprendimos promedios 0:08:38.281,0:08:40.231 ¿por qué no usamos promedios? 0:08:40.231,0:08:43.351 O por qué no usamos la media aritmética todo el tiempo? 0:08:43.351,0:08:44.921 ¿De qué sirve la mediana y la moda? 0:08:44.921,0:08:48.921 Intentaré hacer un ejemplo y veré si 0:08:48.921,0:08:50.301 si es que les parece correcto 0:08:50.301,0:08:52.181 y luego pueden pensar un poco más 0:08:52.181,0:08:54.151 Dígamos que tengo este grupo de números 0:08:54.151,0:09:04.521 3, 3, 3, 3, 3, y, no sé, 100. 0:09:04.521,0:09:09.221 Así que, ¿cuál es la media aritmética aquí? 0:09:09.221,0:09:12.131 Tengo 1, 2, 3, 4...cinco veces 3 y 100 0:09:12.131,0:09:17.514 Así que sería 115 dividido entre 6, verdad? 0:09:17.514,0:09:20.014 Porque tengo 1, 2, 3, 4, 5, 6 números 0:09:20.014,0:09:22.174 115 es sólo la suma de todos esos. 0:09:22.174,0:09:27.514 Así que eso es igual a - ¿cuántos 6 hay en 115? 0:09:27.514,0:09:28.844 sólo hay un número 6 0:09:28.844,0:09:29.934 1 por 6 es 6 0:09:29.934,0:09:32.174 hay 9 veces 55 0:09:32.174,0:09:34.444 9 por 6 es 54 0:09:34.444,0:09:38.664 entonces, es igual a 19 1/6 0:09:38.673,0:09:39.233 Listo 0:09:39.233,0:09:40.583 Acabo de agregar todos los números y dividirlos por 0:09:40.583,0:09:42.303 la cantidad de números que hay 0:09:42.303,0:09:44.983 Pero mi pregunta es, es esto representativo 0:09:44.983,0:09:45.633 del grupo? 0:09:45.633,0:09:48.193 Tengo muchos 3 y luego tengo 100 de la nada 0:09:48.193,0:09:52.203 y decimos que la tendencia central es 19 1/6 0:09:52.203,0:09:53.713 y 19 1/6 no parece ser muy indicativo 0:09:53.713,0:09:54.353 del grupo. 0:09:54.353,0:09:56.053 Bueno, quizás si es, dependiendo de la aplicación, pero 0:09:56.053,0:09:57.943 parece no serlo, verdad? 0:09:57.943,0:10:00.073 Mi intuición sería que la tendencia central 0:10:00.073,0:10:03.023 es cercana a 3 ya que hay varios 3 0:10:03.023,0:10:06.843 Y que nos diría la mediana? 0:10:06.843,0:10:09.343 Ya puse estos números en orden 0:10:09.343,0:10:11.443 Si está en desorden, los pondrías 0:10:11.443,0:10:13.623 en este orden y dirías cuál el número del medio? 0:10:13.623,0:10:16.353 Veamos, los 2 números del medio, como tengo 0:10:16.353,0:10:18.703 un número par, son 3 y 3 0:10:18.703,0:10:20.293 Así que si tomo el promedio de ambos -- 0:10:20.293,0:10:22.073 o en palabras más correctas -- si 0:10:22.073,0:10:26.973 tomo la media aritmética de 3 y 3, tengo 3 0:10:26.973,0:10:29.563 Y puede ser una mejor medida de la 0:10:29.563,0:10:34.583 tendencia central o del promedio de esta lista de números, correcto? 0:10:34.583,0:10:38.583 Esencialmente, al sacar la mediana, no me vi 0:10:38.583,0:10:40.643 muy afectado por el número grande que es 0:10:40.643,0:10:42.163 muy diferente de los otros. 0:10:42.163,0:10:44.173 En estadística lo llaman un valor atípico 0:10:44.173,0:10:47.223 Un número que, si habláramos del promedio de precios 0:10:47.223,0:10:51.673 de casas, quizás cada casa en la ciudad cueste $100,000 y 0:10:51.673,0:10:54.063 hay una que cuesta $1 trillón 0:10:54.063,0:10:56.603 Y si alguien te dijera que el promedio de precios de casas es 0:10:56.603,0:10:58.283 1 millón, entonces tendrías una 0:10:58.283,0:10:59.913 percepción equivocada de la ciudad 0:10:59.913,0:11:03.393 Pero la mediana sería $100,000 y eso 0:11:03.393,0:11:06.363 te da un mejor idea de cómo son las casas en esa ciudad 0:11:06.363,0:11:08.723 De la misma forma, esta mediana, te da una 0:11:08.723,0:11:12.113 mejor idea de cómo son los números en la lista. 0:11:12.113,0:11:15.513 Porque la media aritmética fue afectada por 0:11:15.513,0:11:17.683 lo que llamamos un valor atípico 0:11:17.683,0:11:19.823 Y poder saber cuál es el valor atípico es 0:11:19.823,0:11:21.953 una de esas cosas que los estadistas dirían 0:11:21.953,0:11:23.303 que los reconocen cuando los ven 0:11:23.303,0:11:25.333 No hay una definición formal para el valor 0:11:25.333,0:11:27.793 pero tiende a ser un número que sobresale 0:11:27.793,0:11:31.303 y a veces se debe a un error en las medidas 0:11:31.303,0:11:32.863 Y finalmente, la moda. 0:11:32.863,0:11:35.293 Cuál es el número más común en la lista? 0:11:35.293,0:11:38.653 Hay 5 veces 3 y hay 1 100. 0:11:38.653,0:11:41.533 Así que el número más común es, nuevamente, 3 0:11:41.533,0:11:45.073 Así que en este caso, con el valor atípico, la mediana y 0:11:45.073,0:11:47.493 la moda son, quizás, mejores para 0:11:47.493,0:11:50.393 darte una indicación de que lo que 0:11:50.393,0:11:51.933 estos números representan 0:11:51.933,0:11:53.443 Quizás esto fue un error de medida. 0:11:53.443,0:11:54.533 Pero no sé, no sabemos 0:11:54.533,0:11:55.723 lo que estos representan 0:11:55.723,0:11:56.983 Si son precios de casas, entonces diría que 0:11:56.983,0:12:00.313 son medidas más indicativas de lo que 0:12:00.313,0:12:03.143 las casas en esa área cuestan. 0:12:03.143,0:12:06.023 Pero si son otra cosa, como notas de un examen, 0:12:06.023,0:12:08.003 entonces diría que hay un niño en la clase 0:12:08.003,0:12:09.873 1 de 6 al que le fue muy bien y el resto 0:12:09.873,0:12:10.973 no estudió. 0:12:10.973,0:12:13.093 Y esto es más indicativo de como los 0:12:13.093,0:12:14.963 estudiantes de ese nivel les va en promedio 0:12:14.963,0:12:17.193 Bueno, ya terminé de hablar de este tema. 0:12:17.193,0:12:20.283 Y les invito a que jueguen con muchos números y 0:12:20.283,0:12:21.923 con los conceptos ustedes mismos. 0:12:21.923,0:12:24.553 En el siguiente video, exploraremos más sobre 0:12:24.553,0:12:25.743 estadística descriptiva. 0:12:25.743,0:12:27.423 En vez de hablar sobre la tendencia central 0:12:27.423,0:12:30.133 hablaremos sobre que tan lejos están las variables 0:12:30.133,0:12:31.250 de la tendencia central 0:12:31.250,0:12:34.140 Nos vemos en el siguiente video