0:00:00.990,0:00:03.270 ยินดีต้อนรับสู่รายการวิชาสถิติครับ 0:00:03.270,0:00:06.380 มันคือสิ่งที่ผมอยากทำมาสักพักแล้ว 0:00:06.380,0:00:08.710 เอาล่ะ, ผมแค่อยากเข้าถึงเนื้อหา 0:00:08.710,0:00:12.220 และผมพยายามทำตัวอย่างให้มากที่สุด หวังว่า 0:00:12.220,0:00:14.990 จะให้คุณได้รู้สึกว่าสถิติมันเกี่ยวกับอะไร 0:00:14.990,0:00:16.850 ที่จริง, เพื่อเริ่มต้น หากคุณไม่คุ้น 0:00:16.850,0:00:18.550 กับสถิติ -- แม้ว่า, ผมคิดว่าหลายคน 0:00:18.550,0:00:20.660 น่าจะมีสัญชาตญาณบ้างว่าสถิติคืออะไร 0:00:22.414,0:00:27.169 และที่สุดแล้ว -- โดยทั่วไป มันก็คือ 0:00:27.169,0:00:28.590 การเข้าใจข้อมูล 0:00:28.590,0:00:30.540 และมันแบ่งเป็นประเภทได้กว้างๆ 0:00:30.540,0:00:32.640 มันมีอยู่ 3 ประเภทค 0:00:32.640,0:00:35.330 คุณมีแบบพรรณนา (descriptive) 0:00:35.330,0:00:39.150 สมมุติว่าคุณมีข้อมูลมากมาย แล้วคุณอยากบอกใครสักคน 0:00:39.150,0:00:41.480 เกี่ยวกับมันโดยไม่ได้บอกข้อมูลทั้งหมด 0:00:41.480,0:00:45.360 บางทีคุณอาจต้องการตัวเลขบ่งชี้ไม่กี่ตัว 0:00:45.360,0:00:47.560 ที่แทนข้อมูลทั้งหมดโดยไม่ต้อง 0:00:47.560,0:00:48.540 บอกข้อมูลทั้งหมดออกไป 0:00:48.540,0:00:50.370 นั่นคือสถิติเชิงพรรณนา 0:00:50.370,0:00:51.510 มันยังมีเชิงทำนาย (predictive) 0:00:51.510,0:00:53.110 ผมจะเริ่มพวกมันเข้าด้วยกันนะ 0:00:53.110,0:00:55.110 มันมีสถิติเชิงอนุมาน (inferential statistics) 0:00:58.310,0:01:00.908 นี่คือตอนที่คุณใช้ข้อมูล 0:01:00.920,0:01:02.200 เพื่อสรุปสิ่งต่างๆ 0:01:02.200,0:01:06.500 สมมุติว่าคุณสุ่มตัวอย่างข้อมูลจากประชากร -- 0:01:06.500,0:01:08.890 และเราจะพูดถึงกลุ่มตัวอย่าง กับประชากร บ่อยๆ แต่ 0:01:08.890,0:01:11.390 ผมว่าคุณคงพอเข้าใจว่ามันคืออะไร, จริงไหม? 0:01:11.390,0:01:13.800 ผมสำรวจคน 3 คนที่กำลังลงคะแนน 0:01:13.800,0:01:16.500 เลือกประธานาธิบดี, แน่นอนผมไม่ได้สำรวจประชากรทั้งหมด 0:01:16.500,0:01:18.160 ผมสำรวจแค่กลุ่มตัวอย่าง 0:01:18.160,0:01:21.780 แต่สิ่งที่สถิติเชิงอนุมานทำ ก็คือ ถ้าเรา 0:01:21.780,0:01:24.890 คิดเลขจากกลุ่มตัวอย่าง, บางทีเราสามารถอนุมาน 0:01:24.890,0:01:27.740 หรือสรุปเกี่ยวกับประชากรทั้งหมด 0:01:27.740,0:01:29.760 ทีนี้, เอาล่ะ, นั่นคือภาพกว้างของ 0:01:29.760,0:01:30.800 สถิติ 0:01:30.800,0:01:33.620 ลองเข้าไปดูเนื้อในกัน เราจะเริ่ม 0:01:33.620,0:01:34.746 ต้นด้วยเชิงพรรณนา 0:01:37.931,0:01:41.012 อย่างแรกคือว่า, ไม่รู้, ผมอยากทำ 0:01:41.040,0:01:44.330 หรือผมว่า คนส่วนใหญ่อยากทำ เวลาเขา 0:01:44.330,0:01:47.320 ได้ข้อมูลชุดใหญ่ แล้วมีคนบอกให้บรรยายมัน 0:01:47.320,0:01:51.030 บางที ผมควรเลือกตัวเลขขึ้นมา ที่ 0:01:51.030,0:01:54.430 เป็นตัวแทนตัวเลขทั้งหมดในชุด 0:01:54.430,0:01:57.092 หรือตัวเลขที่แทน, ประมาณว่า, แนวโน้มของศูนย์กลาง 0:01:57.092,0:01:59.900 -- นี่คือคำที่คุณจะพบได้บ่อยในหนังสือสถิติ 0:01:59.900,0:02:03.040 แนวโน้มเข้าสู่ศูนย์กลางของชุดตัวเลข 0:02:07.040,0:02:09.375 นี่ยังเรียกว่า ค่าเฉลี่ย ได้ด้วย 0:02:09.375,0:02:11.780 และผมจะพูดเจาะจงกว่าที่ผม 0:02:11.780,0:02:16.060 พูดคำว่า "เฉลี่ย" โดยทั่วไป. เวลาผมพูดถึงมันในบริบทนี้ 0:02:16.060,0:02:20.090 มันหมายความว่า ค่าเฉลี่ย เป็นตัวเลข 0:02:20.090,0:02:22.640 บอกเราถึงแนวโน้มเข้าสู่ศูนย์กลาง 0:02:22.640,0:02:25.430 หรือบางที คือตัวเลขที่เป็นตัวแทนของข้อมูล 0:02:25.430,0:02:27.030 และผมรู้ว่ามันฟังดูเป็นนามธรรม แต่ 0:02:27.030,0:02:28.870 ลองทำตัวอย่างกันหน่อย 0:02:28.870,0:02:31.850 มันมีวิธีหลายอย่างที่คุณสามารถวัด 0:02:31.850,0:02:35.200 แนวโน้มเข้าสู่ศูนย์กลาง หรือค่าเฉลี่ยของเซตจำนวนได้ 0:02:35.200,0:02:37.950 คุณอาจเคยเห็นมาก่อนแล้ว 0:02:37.950,0:02:40.534 พวกมันคือค่าเฉลี่ย 0:02:40.534,0:02:42.960 ที่จรริง, มันมีค่าเฉลี่ยหลายประเภท, แต่เราจะ 0:02:42.960,0:02:44.040 ใช้แค่ค่าเฉลี่ยเลขคณิต 0:02:50.660,0:02:53.810 ค่าเฉลี่ยเรขาคณิต และบางทีเราจะพูดถึง 0:02:53.810,0:02:55.040 ค่าเฉลี่ยฮาร์มอนิกสักวันหนึ่ง 0:02:55.040,0:03:02.640 มันมีค่าเฉลี่ย, ค่ามัธยฐาน และฐานนิยม 0:03:02.640,0:03:07.050 และถ้าพูดในแง่สถิติแล้ว, พวกนี้ทั้งหมดสามารถ 0:03:07.050,0:03:10.620 แทนชุดข้อมูล หรือแนวโน้มศูนย์กลางของประชากร 0:03:10.620,0:03:12.650 หรือแนวโน้มศูนย์กลางของกลุ่มตัวอย่างได้ 0:03:12.650,0:03:15.590 และพวกมันรวมกันแล้ว -- พวกมันทั้งหมด 0:03:15.590,0:03:17.070 เป็นรูปของค่ากลางอย่างหนึ่ง 0:03:17.070,0:03:18.520 ผมว่าเวลาเราเห็นตัวอย่าง, เราคง 0:03:18.520,0:03:19.470 จะเข้าใจมากขึ้น 0:03:19.470,0:03:23.440 ถ้าพูดถึงในชีวิตประจำวัน, เวลาคนพูดถึงค่าเฉลี่ย, ผมว่า 0:03:23.440,0:03:26.100 คุณต้องเคยคำนวณค่าเฉลี่ยครั้งหนึ่งในชีวิตแล้ว, พวกมัน 0:03:26.100,0:03:28.710 มักเป็นค่าเฉลี่ยเลขคณิต 0:03:28.710,0:03:30.320 โดยทั่วไป เวลามีคนบอกว่า "ลองหาค่าเฉลี่ย 0:03:30.320,0:03:32.530 ของเลขพวกนี้ดู" พวกเขามักคาดหวังให้คุณ, เขา 0:03:32.530,0:03:34.470 อยากให้คุณหาค่าเฉลี่ยเลขคณิต 0:03:34.470,0:03:36.490 เขาไม่อยากให้คุณหาค่ามัธยฐานหรือฐานนิยม 0:03:36.490,0:03:38.780 แต่ก่อนที่เราไปต่อ, ลองหาก่อนว่า 0:03:38.780,0:03:41.110 พวกนี้คืออะไร 0:03:41.110,0:03:43.230 ขอผมตั้งชุดตัวเลขขึ้นมาก่อนนะ 0:03:43.230,0:03:45.630 สมมุติว่าผมมีเลข 1 0:03:45.630,0:03:50.220 สมมุติว่าผมีเลข 1 อีกตัว, 2, 3 0:03:50.220,0:03:52.885 สมมุติว่าผมมี 4 0:03:52.885,0:03:55.410 ดีแล้ว 0:03:56.170,0:03:58.370 เราอยากได้ตัวอย่างง่ายๆ 0:03:58.370,0:04:02.650 ค่าเฉลี่ย หรือค่าเฉลี่ยเลขคณิต อาจเป็นสิ่งที่คุณ 0:04:02.650,0:04:05.710 คุ้นเคยที่สุดเวลาคนเขาพูดถึงค่าเฉลี่ย 0:04:05.710,0:04:07.600 มันก็คือ -- คุณบวกเลขทั้งหมดเข้า แล้วคุณ 0:04:07.600,0:04:09.160 หารด้วยจำนวนตัวเลขที่มี 0:04:09.160,0:04:16.290 ในกรณีนี้, มันก็คือ 1 บวก 1 บวก 2 บวก 3 บวก 4 0:04:16.290,0:04:19.420 แล้วคุณก็หารด้วย 1, 2, 3, 0:04:19.420,0:04:21.020 4, 5 0:04:21.020,0:04:21.540 ได้อะไร? 0:04:21.540,0:04:23.470 1 บวก 1 เป็น 2 0:04:23.470,0:04:25.600 2 บวก 2 เป็น 4 0:04:25.600,0:04:27.640 4 บวก 3 เป็น 7 0:04:27.640,0:04:29.500 7 บวก 4 เป็น 22 0:04:29.500,0:04:32.550 นี่จึงเท่ากับ 11/5 0:04:32.550,0:04:33.040 นั่นคืออะไร? 0:04:33.040,0:04:34.410 มันคือ 2 1/5 หรือเปล่า? 0:04:34.410,0:04:38.320 มันเท่ากับ 2.2 0:04:38.320,0:04:39.560 แล้วมึคนบอกว่า "เฮ้, รู้ไหม, 0:04:39.560,0:04:41.060 นี่คือตัวแทนที่ดีของ 0:04:41.060,0:04:42.490 ชุดข้อมูลนี้เลย 0:04:42.490,0:04:44.680 นั่นคือตัวเลขที่เลขพวกนี้ทุกตัวอยู่ใกล้ 0:04:44.680,0:04:47.390 จะว่างั้นก็ได้" หรือ 2.2 แทนแนวโน้ม 0:04:47.390,0:04:49.140 ศูนย์กลางของชุดข้อมูลนี้ 0:04:49.140,0:04:51.400 พูดโดยทั่วไปแล้ว, นั่นคือค่าเฉลี่ย 0:04:51.400,0:04:53.450 แต่ถ้าเราอาจระบุให้ชัด, นี่ 0:04:53.450,0:04:55.410 คือค่าเฉลี่ยเลขคณิตของชุดตัวเลขนี้ 0:04:55.410,0:04:56.740 แล้วคุณเห็นว่ามันเป็นตัวแทนข้อมูล 0:04:56.740,0:04:59.210 ถ้าผมไม่อยากให้ชุดตัวเลข 5 ตัวนี้, ผม 0:04:59.210,0:05:01.030 ก็บอกว่า "อืม, เธอก็รู้, ฉันมีชุดตัวเลข 5 ตัว และ 0:05:01.030,0:05:03.680 มันมีค่าเฉลี่ยเท่ากับ 2.2" นี่บอกคุณนิดหน่อยว่า 0:05:03.680,0:05:05.900 อย่างน้อย, คุณก็รู้, ว่าตัวเลขพวกนี้อยู่แถวไหน 0:05:05.900,0:05:08.510 เราจะพูดถึงต่อไปว่า คุณจะรู้ว่า 0:05:08.510,0:05:12.500 เลขพวกนั้นห่าาจากค่าเฉลี่ยแค่ไหนในวิดีโอต่อไป 0:05:12.500,0:05:13.840 นั่นคือวิธีวัดอย่างหนึ่ง 0:05:13.840,0:05:17.150 วิธีวัดอีกอย่างหนึ่ง, แทนที่จะเฉลี่ยแบบนี้, คุณ 0:05:17.150,0:05:19.510 สามารถหาค่าเฉลี่ยได้ด้วยการเรียงลำดับเลข, 0:05:19.510,0:05:20.460 ซึ่งผมเรียงไว้แล้ว 0:05:20.460,0:05:23.340 งั้นลองเขียนมันตามลำดับอีกครั้งหนึ่ง 0:05:23.340,0:05:26.810 1, 1, 2, 3, 4 0:05:26.810,0:05:28.490 แล้วคุณเอาเลขตรงกลางมา 0:05:28.490,0:05:31.790 ลองดู, มันมีเลข 1, 2, 3, 4, 5 ตัว 0:05:31.790,0:05:34.010 เลขตัวกลางจะอยู่ตรงนี้, จริงไหม? 0:05:34.010,0:05:34.940 เลขตรงกลางคือ 2 0:05:34.940,0:05:37.240 มันมีเลขสองตัวมากกว่า 2 และมี 0:05:37.240,0:05:38.610 เลขสองตัวน้อยกว่า 2 0:05:38.610,0:05:39.720 และนี่เรียกว่ามัธยฐาน (median) 0:05:39.720,0:05:41.560 มันใช้การคำนวณน้อยมาก 0:05:41.560,0:05:43.440 คุณแค่ต้องเรียงเลขแค่นั้น 0:05:43.440,0:05:45.620 แล้วคุณหาเลขอะไรก็ตาม ที่มีจำนวนตัวเลขซึ่งมากกว่า 0:05:45.620,0:05:48.260 เท่ากับจำนวนตัวเลขซึ่งน้อยกว่า 0:05:48.260,0:05:51.430 ดังนั้นมัธยฐานของเลขชุดนี้คือ 2 0:05:51.430,0:05:53.010 และคุณเห็นว่า, ผมหมายถึงว่า, มัน 0:05:53.010,0:05:54.320 ใกล้กับค่าเฉลี่ยมาก 0:05:54.320,0:05:56.020 และมันไม่มีคำตอบที่ถูกต้อง 0:05:56.020,0:05:58.550 ไม่มีค่าเฉลี่ยไหนดีกว่าอีกอัน 0:05:58.550,0:06:01.890 พวกนั้นเป็แค่วิธีวัดค่ากลางแบบต่างๆ 0:06:01.890,0:06:05.020 ตรงนี้มันคือมัธยฐาน 0:06:05.020,0:06:06.980 และผมรู้ว่าคุณอาจคิดว่า "อืม, มันก็ง่าย 0:06:06.980,0:06:08.640 ถ้าเรามีเลข 5 ตัว 0:06:08.640,0:06:12.160 แต่ถ้าเรามีเลข 6 ตัวล่ะ?" ถ้าเกิดมันเป็นแบบนี้? 0:06:12.160,0:06:14.260 ถ้าเกิดนี่คือชุดตัวเลขของเราล่ะ? 0:06:14.260,0:06:19.880 1, 1, 2, 3 ลองเพิ่ม 4 เข้าไปอีกตัว 0:06:19.880,0:06:21.660 ทีนี้, มันไม่มีเลขตรงกลาง, จริงไหม? 0:06:21.660,0:06:24.870 ผมหมายความว่า 2 ไม่มีอยู่ตรงกลาง เพราะมีเลข 2 ตัวที่น้อยกว่า 0:06:24.870,0:06:26.600 และมีเลข 3 ตัวที่มากกว่า 0:06:26.600,0:06:28.820 แล้ว 3 ก็ไม่ใช่เลขกลาง เพราะมันมีเลข 3 ตัวที่ 0:06:28.820,0:06:31.530 มากกว่า -- ขอโทษที มันมี 2 ตัวที่มากกว่า 0:06:31.530,0:06:32.550 และ 3 ตัวที่น้อยกว่า 0:06:32.550,0:06:33.990 มันจึงไม่มีเลขตรงกลาง 0:06:33.990,0:06:36.390 เมื่อคุณชุดที่มีตัวเลขเป็นจำนวนคู่ และมีคนบอก 0:06:36.390,0:06:38.500 ให้คุณหาค่ามัธยฐาน, สิ่งที่คุณทำคือคุณหาเลขตรงกลาง 0:06:38.500,0:06:43.750 สองตัว แล้วคุณหาค่าเฉลี่ยเลขคณิต 0:06:43.750,0:06:45.050 ของเลขสองตัวนั้น 0:06:45.050,0:06:50.770 ในกรณีนี้ เซตนนี้, มัธยฐานจะเป็น 2.5 0:06:50.770,0:06:51.730 ใช้ได้ 0:06:51.730,0:06:54.020 ลองเก็บนี้ไว้ก่อน เพราะผมอยากเปรียบเทียบ 0:06:54.020,0:06:56.680 ค่ามัธยฐาน ค่าเฉลี่ย และฐานนิยม 0:06:56.680,0:06:57.620 ของเลขชุดเดียวกัน 0:06:57.620,0:07:00.160 แต่มันเป็นเรื่องรู้ไว้ก็ดี เพราะบางครั้ง 0:07:00.160,0:07:01.340 มันก็ทำใหัสับสนได้ 0:07:01.340,0:07:03.760 เจ้านิยามพวกนี้ 0:07:03.760,0:07:05.930 นี่คือเครื่องมือทางคณิตศาสตร์ 0:07:05.930,0:07:08.470 ที่ช่วยเรามองตัวเลขพวกนี้ 0:07:08.470,0:07:11.720 มันไม่ใช่ว่า วันหนึ่งมีคนเห็นสูตรพวกนี้ 0:07:11.720,0:07:13.660 บนดวงอาทิตย์ แล้วบอกว่า "โอ้, จักรวาล 0:07:13.660,0:07:16.980 บอกเราว่าค่าเฉลี่ยควรคิดแบบนี้" 0:07:16.980,0:07:20.380 พวกนี้คือสิ่งที่มนุษย์สร้างขึ้นเพื่อเข้าใจ 0:07:20.380,0:07:22.110 ข้อมูลขนาดใหญ่ 0:07:22.110,0:07:24.670 นี่ไม่ใช่ข้อมูลขนาดใหญ่, แต่แทนที่จะเป็นเลขห้าตัว, ถ้า 0:07:24.670,0:07:26.760 เรามีตัวเลข 5 ล้านตัว, คุณคงนึกออกว่าคุณคง 0:07:26.760,0:07:28.780 ไม่อยากคิดถึงเลขไปทีละตัวแน่ๆ 0:07:28.780,0:07:31.640 เอาล่ะ, ก่อนที่ผมจะพูดมากไป, ขอผมบอกคุณก่อน 0:07:31.640,0:07:33.410 ว่าฐานนิยมคืออะไร 0:07:33.410,0:07:36.200 ฐานนิยม ที่จริงแล้ว, เป็นอันที่ผมว่า 0:07:36.200,0:07:39.650 คนส่วนใหญ่มักลืม หรือไม่เคยเรียน หรือเวลาเขาเจอมัน 0:07:39.650,0:07:41.930 ในข้อสอบ, มันมักทำให้งง, คนพวกนี้บอกว่า "โอ้, 0:07:41.930,0:07:45.420 มันฟังดูยากมาก" แต่ในแง่หนึ่ง, มันเป็นตัววัด 0:07:45.420,0:07:49.450 แนวโน้มของศูนย์กลาง หรือค่ากลางที่ง่ายที่สุดอันหนึ่ง 0:07:49.450,0:07:53.810 ฐานนิยมก็แค่ตัวเลขที่ปรากฏมากที่สุดในชุด 0:07:53.810,0:07:56.220 ในตัวอย่างนี้, มันมี 1 สองตัวและอย่างอื่นอย่างละ 0:07:56.220,0:07:57.510 หนึ่งตัว, จริงไหม? 0:07:57.510,0:08:00.230 ฐานนิยมตรงนี้จึงเป็น 1 0:08:00.230,0:08:02.840 ฐานนิยมคือเลขที่มีมากที่สุด 0:08:02.840,0:08:04.890 แล้วคุณอาจถามว่า "โว้ เฮ้ ซาล, 0:08:04.890,0:08:05.880 แล้วถ้านี่คือชุดข้อมูลเราล่ะ? 0:08:05.880,0:08:11.620 1, 1, 2, 3, 4, 4" ตรงนี้ผมมี 1 สองตัว และผมมี 4 สองตัว 0:08:11.620,0:08:14.040 และนี่คือที่ที่ฐานนิยมเริ่มไม่ตรงไปตรงมา เพราะ 0:08:14.040,0:08:17.810 ตัวใดตัวหนึ่งล้วนเป็นฐานนิยมได้ 0:08:17.810,0:08:20.270 คุณอาจบอกว่าฐานนิยมของข้อมูลนี้ คือ 1 หรือ 0:08:20.270,0:08:23.135 ฐานนิยมของอันนี้คือ 4 แล้วมันก็เริ่มกำกวม 0:08:23.135,0:08:24.840 และคุณอาจถาม 0:08:24.840,0:08:25.790 คนที่ถามคุณอีกทีเพื่อความชัดเจน 0:08:25.790,0:08:28.510 ส่วนใหญ่ในข้อสอบ เวลาเขาถามคุณ, มันมัก 0:08:28.510,0:08:29.190 ไม่มีความกำกวมอย่างนี้ 0:08:29.190,0:08:33.164 มันจะมีตัวเลขในชุดที่ปรากฎบ่อยที่สุดเสมอ 0:08:33.164,0:08:35.950 ทีนี้, คุณอาจสงสัยว่า, โอ้, คุณก็รู้, ทำไมอันเดียว 0:08:35.950,0:08:36.900 ถึงไม่ดีพอ? 0:08:36.900,0:08:38.490 คุณก็รู้ ทำไมเราถึงเรียนค่าเฉลี่ย, ทำไมเราไม่ 0:08:38.490,0:08:40.270 ใช่แต่ค่าเฉลี่ย? 0:08:40.270,0:08:43.220 หรือทำไมเราถึงไม่ใช่ค่าเฉลี่ยเลขคณิตตลอด? 0:08:43.220,0:08:45.080 แล้วมัธยฐานกับฐานนิยมมีดีอะไร? 0:08:45.080,0:08:47.890 ทีนี้, ผมจะพยายามยกตัวอย่าง แล้วให้คุณดูว่า 0:08:47.890,0:08:50.710 มันช่วยให้คุณเห็นอะไรบ้าง 0:08:50.710,0:08:52.020 แล้วคุณค่อยคิดต่อไป 0:08:52.020,0:08:53.950 สมมุติว่า ผมมีชุดตัวเลข 0:08:53.950,0:09:04.350 3, 3, 3, 3, 3 และ, ไม่รู้สิ 100 0:09:04.350,0:09:08.960 ค่าเฉลี่ยเลขคณิตตรงนี้คือะไร? 0:09:08.960,0:09:12.070 ผมมี 1, 2, 3, 4, 5 มี 3 ทั้งหมด 5 ตัว, กับ 100 0:09:12.070,0:09:17.350 นี่ก็คือ 115 หารด้วย 6, จริงไหม? 0:09:17.350,0:09:20.090 ผมมีเลข 1, 2, 3, 4, 5, 6 ตัว 0:09:20.090,0:09:21.990 115 ก็แค่ผลบวกทั้งหมดของมัน 0:09:21.990,0:09:27.270 นั่นจึงเท่ากับ -- 6 หาร 115 ได้กี่ครั้ง? 0:09:27.270,0:09:28.600 6 ไปหารมันได้ 1 ครั้ง 0:09:28.600,0:09:30.520 1 คูณ 6 ได้ 6 0:09:30.520,0:09:32.320 55 หารได้ 9 ครั้ง 0:09:32.320,0:09:34.370 9 คูณ 6 เป็น 54 0:09:34.370,0:09:35.950 มันจึงเท่ากับ 19 1/6 0:09:37.210,0:09:38.470 ใช้ได้ 0:09:39.140,0:09:40.610 ผมแค่บวกเลขทั้งหมด แล้วหารด้วย 0:09:40.610,0:09:42.150 จำนวนที่มี 0:09:42.150,0:09:44.840 แต่คำถามของผมคือว่า, นี่คือตัวแทน 0:09:44.840,0:09:45.560 ของข้อมูลที่ดีหรือเปล่า? 0:09:45.560,0:09:47.740 ผมหมายความว่า, ผมมีเลข 3 เต็มไปหมด แล้วผมมี 100 0:09:47.740,0:09:51.270 ในทันใด, เรากำลังบอกว่าแนวโน้มสู่ศูนย์กลาง คือ 19 1/6 0:09:51.270,0:09:53.610 ผมหมายความว่า 19 1/6 ไม่ได้บ่งชี้ 0:09:53.610,0:09:54.080 ถึงชุดตัวเลขเท่าไหร่ 0:09:54.080,0:09:56.390 ผมหมายความว่า, บางที, มันขึ้นอยู่กับการนำไปใช้, แต่มันดู 0:09:56.390,0:09:57.850 เลยออกไป, จริงไหม? 0:09:57.850,0:09:59.800 ผมหมายถึงว่า, สัญชาตญาณผมบอกว่า แนวโน้มของศูนย์กลาง 0:09:59.800,0:10:02.660 ควรอยู่ใกล้ 3 เพราะมันมี 3 เป็นจำนวนมาก 0:10:02.660,0:10:06.770 แล้วมัธยฐานบอกเราว่าอะไร? 0:10:06.770,0:10:09.720 ผมเขียนเลขนี้เป็นลำดับอยู่แล้ว, จริงไหม? 0:10:09.720,0:10:11.375 ถ้าผมให้เลขคุณมาเป็นลำดับ, คุณอยากใส่มัน 0:10:11.375,0:10:13.480 ตามลำดับ แล้วคุณถามว่าเลขตรงกลางคืออะไร? 0:10:13.480,0:10:16.375 ลองดู, มีเลขตรงกลางสองตัว, เนื่องจาก 0:10:16.375,0:10:18.410 เป็นจำนวนคู่, ได้ 3 กับ 3 0:10:18.410,0:10:20.890 ถ้าผมหาค่าเฉลี่ยของ 3 กับ 3 -- หรือผมควร 0:10:20.890,0:10:21.820 ใช้คำให้เจาะจงกว่านี้ 0:10:21.820,0:10:26.800 ถ้าผมหาค่าเฉลี่ยเลขคณิตของ 3 กับ 3, ผมจะได้ 3 0:10:26.800,0:10:30.390 นี่คือวิธีการวัดแนวโน้ม 0:10:30.390,0:10:34.400 ของศูนย์กลางหรือค่าเฉลี่ยชุดตัวเลขที่ดีกว่า, จริงไหม? 0:10:34.400,0:10:38.120 ที่สุดแล้ว, สิ่งที่มันทำ เวลาหามัธยฐาน, คือมันไม่ได้ 0:10:38.120,0:10:40.720 ผลกระทบจากเลขที่มีค่ามาก 0:10:40.720,0:10:42.080 ซึ่งต่างจากตัวอื่นอยู่มาก 0:10:42.080,0:10:43.765 ในสถิติ เราเรียกมันว่า ค่าผิดปกติ (outlier) 0:10:43.765,0:10:47.010 ตัวเลขที่, คุณก็รู้, ถ้าคุณพูดถึงค่าเฉลี่ย 0:10:47.010,0:10:51.580 ราคาบ้าน, บางทีบ้านทุกหลังในเมืองราคา $100,000 แล้ว 0:10:51.580,0:10:54.140 มันมีบ้านหลังหนึ่งราคา $1 ล้านล้าน 0:10:54.140,0:10:56.120 แล้วถ้ามีคนถามคุณว่าราคาบ้านโดยเฉลี่ยเป็นเท่าไหร่, ผม 0:10:56.120,0:10:58.440 ไม่รู้สิ, $1 ล้านเหรียญ, คุณอาจเข้าใจ 0:10:58.440,0:10:59.760 ภาพของเมืองนั้นผิดไป 0:10:59.760,0:11:03.640 แต่มัธยฐานของราคาบ้านอาจเป็น $100,000 แล้วคุณ 0:11:03.640,0:11:06.440 ก็เข้าใจได้ดีขึ้นว่า ราคาบ้านในเมืองเป็นอย่างไรกันแน่ 0:11:06.440,0:11:08.720 เช่นเดียวกัน, ค่ามัธยฐานนี่, ช่วยให้คุณเข้าใจ 0:11:08.720,0:11:11.820 ว่าตัวเลขในเซตเป็นอย่างไร 0:11:11.820,0:11:15.550 เพราะค่าเฉลี่ยเลขคณิตนั้นบิดเบี้ยวได้, จากสิ่ง 0:11:15.550,0:11:18.030 ที่เขาเรียกกันว่า ค่าผิดปกติ 0:11:18.030,0:11:19.990 และการระบุค่าผิดปกตินี้, มันเป็น 0:11:19.990,0:11:22.130 หนึ่งในเรื่องที่นักสถิติจะบอกว่า, อืม, 0:11:22.130,0:11:23.110 เห็นแล้วก็จะรู้เอง 0:11:23.110,0:11:25.450 มันไม่มีนิยามชัดเจน แต่มันมัก 0:11:25.450,0:11:28.290 จะเป็นตัวเลขที่โดดออกมา และบางครั้ง 0:11:28.290,0:11:31.190 มันมาจาก, คุณก็รู้, ความผิดพลาดจากกรวัดหรืออะไรพวกนั้น 0:11:31.190,0:11:33.020 แล้วสุดท้าย, ค่าฐานนิยม 0:11:33.020,0:11:35.310 เลขที่มีมากที่สุดในชุดนี้คืออะไร? 0:11:35.310,0:11:38.590 มันมี 3 ห้าตัว, แล้วก็มี 100 0:11:38.590,0:11:41.440 ดังนั้นเลขที่ปรากฏมากสุด, เหมือนเดิม, มันคือ 3 0:11:41.440,0:11:44.905 ในกรรีนี้, เวลาคุณมีค่าผิดปกติ, มัธยฐานกับ 0:11:44.905,0:11:46.700 ฐานนิยมมักจะเป็น, คุณก็รู้, บางทีมัน 0:11:46.700,0:11:50.650 ช่วยบอกนิดหน่อยว่า 0:11:50.650,0:11:51.650 ตัวนี้เหล่านี้แทนอะไร 0:11:51.650,0:11:53.220 บางทีนี่อาจเป็นความผิดพลาดจากการวัด 0:11:53.220,0:11:54.370 แต่ผมไม่รู้, เรายังไม่รู้ 0:11:54.370,0:11:55.250 ว่าพวกมันแทนอะไร 0:11:55.250,0:11:57.530 ถ้านี่คือราคาบ้าน, ผมอาจบอกว่า พวกนี้ 0:11:57.530,0:12:00.700 เป็นตัววัดว่าราคาบ้านหลังหนึ่ง 0:12:00.700,0:12:03.050 ในพื้นที่นั้นราคาเท่าไหร่ 0:12:03.050,0:12:05.520 แต่ถ้านี่เป็นอย่างอื่น, ถ้านี่เป็นคะแนนสอบ, 0:12:05.520,0:12:07.850 บางที, คุณก็รู้, บางทีมีเด็กคนหนึ่งในห้อง -- 0:12:07.850,0:12:09.750 คนหนึ่งใน 6 คน, ทำได้ดีมาก และคนที่เหลือ 0:12:09.750,0:12:10.410 ไม่ได้เรียนเลย 0:12:10.410,0:12:13.680 นี่เป็นตัวบอก, ว่านักเรียน 0:12:13.680,0:12:14.680 ในชั้นทำได้ดีแค่ไหนโดยเฉลี่ย 0:12:14.680,0:12:17.830 เอาล่ะ, ผมพูดจบแล้ว 0:12:17.830,0:12:20.430 และผมแนะนำให้คุณลองเล่นกับตัวเลขเยอะๆ แล้ว 0:12:20.430,0:12:21.460 คิดตามหลักการด้วยตัวเอง 0:12:21.460,0:12:24.960 ในวิดีโอหน้า, เราจะมาสำรวจสถิติ 0:12:24.960,0:12:25.480 แบบพรรรณนากันต่อ 0:12:25.480,0:12:27.510 แทนที่จะพูดถึงแนวโน้มสู่ศูนย์กลาง, เราะจะพูด 0:12:27.510,0:12:30.410 ถึงว่า ข้อมูลกระจายตัวห่างจากแนวโน้ม 0:12:30.410,0:12:31.520 ของศูนย์กลางแค่ไหน 0:12:31.520,0:12:33.370 แล้วพบกันใหม่ในวิดีโอหน้าครับ