-
ยินดีต้อนรับสู่รายการวิชาสถิติครับ
-
มันคือสิ่งที่ผมอยากทำมาสักพักแล้ว
-
เอาล่ะ, ผมแค่อยากเข้าถึงเนื้อหา
-
และผมพยายามทำตัวอย่างให้มากที่สุด หวังว่า
-
จะให้คุณได้รู้สึกว่าสถิติมันเกี่ยวกับอะไร
-
ที่จริง, เพื่อเริ่มต้น หากคุณไม่คุ้น
-
กับสถิติ -- แม้ว่า, ผมคิดว่าหลายคน
-
น่าจะมีสัญชาตญาณบ้างว่าสถิติคืออะไร
-
และที่สุดแล้ว -- โดยทั่วไป มันก็คือ
-
การเข้าใจข้อมูล
-
และมันแบ่งเป็นประเภทได้กว้างๆ
-
มันมีอยู่ 3 ประเภทค
-
คุณมีแบบพรรณนา (descriptive)
-
สมมุติว่าคุณมีข้อมูลมากมาย แล้วคุณอยากบอกใครสักคน
-
เกี่ยวกับมันโดยไม่ได้บอกข้อมูลทั้งหมด
-
บางทีคุณอาจต้องการตัวเลขบ่งชี้ไม่กี่ตัว
-
ที่แทนข้อมูลทั้งหมดโดยไม่ต้อง
-
บอกข้อมูลทั้งหมดออกไป
-
นั่นคือสถิติเชิงพรรณนา
-
มันยังมีเชิงทำนาย (predictive)
-
ผมจะเริ่มพวกมันเข้าด้วยกันนะ
-
มันมีสถิติเชิงอนุมาน (inferential statistics)
-
นี่คือตอนที่คุณใช้ข้อมูล
-
เพื่อสรุปสิ่งต่างๆ
-
สมมุติว่าคุณสุ่มตัวอย่างข้อมูลจากประชากร --
-
และเราจะพูดถึงกลุ่มตัวอย่าง กับประชากร บ่อยๆ แต่
-
ผมว่าคุณคงพอเข้าใจว่ามันคืออะไร, จริงไหม?
-
ผมสำรวจคน 3 คนที่กำลังลงคะแนน
-
เลือกประธานาธิบดี, แน่นอนผมไม่ได้สำรวจประชากรทั้งหมด
-
ผมสำรวจแค่กลุ่มตัวอย่าง
-
แต่สิ่งที่สถิติเชิงอนุมานทำ ก็คือ ถ้าเรา
-
คิดเลขจากกลุ่มตัวอย่าง, บางทีเราสามารถอนุมาน
-
หรือสรุปเกี่ยวกับประชากรทั้งหมด
-
ทีนี้, เอาล่ะ, นั่นคือภาพกว้างของ
-
สถิติ
-
ลองเข้าไปดูเนื้อในกัน เราจะเริ่ม
-
ต้นด้วยเชิงพรรณนา
-
อย่างแรกคือว่า, ไม่รู้, ผมอยากทำ
-
หรือผมว่า คนส่วนใหญ่อยากทำ เวลาเขา
-
ได้ข้อมูลชุดใหญ่ แล้วมีคนบอกให้บรรยายมัน
-
บางที ผมควรเลือกตัวเลขขึ้นมา ที่
-
เป็นตัวแทนตัวเลขทั้งหมดในชุด
-
หรือตัวเลขที่แทน, ประมาณว่า, แนวโน้มของศูนย์กลาง
-
-- นี่คือคำที่คุณจะพบได้บ่อยในหนังสือสถิติ
-
แนวโน้มเข้าสู่ศูนย์กลางของชุดตัวเลข
-
นี่ยังเรียกว่า ค่าเฉลี่ย ได้ด้วย
-
และผมจะพูดเจาะจงกว่าที่ผม
-
พูดคำว่า "เฉลี่ย" โดยทั่วไป. เวลาผมพูดถึงมันในบริบทนี้
-
มันหมายความว่า ค่าเฉลี่ย เป็นตัวเลข
-
บอกเราถึงแนวโน้มเข้าสู่ศูนย์กลาง
-
หรือบางที คือตัวเลขที่เป็นตัวแทนของข้อมูล
-
และผมรู้ว่ามันฟังดูเป็นนามธรรม แต่
-
ลองทำตัวอย่างกันหน่อย
-
มันมีวิธีหลายอย่างที่คุณสามารถวัด
-
แนวโน้มเข้าสู่ศูนย์กลาง หรือค่าเฉลี่ยของเซตจำนวนได้
-
คุณอาจเคยเห็นมาก่อนแล้ว
-
พวกมันคือค่าเฉลี่ย
-
ที่จรริง, มันมีค่าเฉลี่ยหลายประเภท, แต่เราจะ
-
ใช้แค่ค่าเฉลี่ยเลขคณิต
-
ค่าเฉลี่ยเรขาคณิต และบางทีเราจะพูดถึง
-
ค่าเฉลี่ยฮาร์มอนิกสักวันหนึ่ง
-
มันมีค่าเฉลี่ย, ค่ามัธยฐาน และฐานนิยม
-
และถ้าพูดในแง่สถิติแล้ว, พวกนี้ทั้งหมดสามารถ
-
แทนชุดข้อมูล หรือแนวโน้มศูนย์กลางของประชากร
-
หรือแนวโน้มศูนย์กลางของกลุ่มตัวอย่างได้
-
และพวกมันรวมกันแล้ว -- พวกมันทั้งหมด
-
เป็นรูปของค่ากลางอย่างหนึ่ง
-
ผมว่าเวลาเราเห็นตัวอย่าง, เราคง
-
จะเข้าใจมากขึ้น
-
ถ้าพูดถึงในชีวิตประจำวัน, เวลาคนพูดถึงค่าเฉลี่ย, ผมว่า
-
คุณต้องเคยคำนวณค่าเฉลี่ยครั้งหนึ่งในชีวิตแล้ว, พวกมัน
-
มักเป็นค่าเฉลี่ยเลขคณิต
-
โดยทั่วไป เวลามีคนบอกว่า "ลองหาค่าเฉลี่ย
-
ของเลขพวกนี้ดู" พวกเขามักคาดหวังให้คุณ, เขา
-
อยากให้คุณหาค่าเฉลี่ยเลขคณิต
-
เขาไม่อยากให้คุณหาค่ามัธยฐานหรือฐานนิยม
-
แต่ก่อนที่เราไปต่อ, ลองหาก่อนว่า
-
พวกนี้คืออะไร
-
ขอผมตั้งชุดตัวเลขขึ้นมาก่อนนะ
-
สมมุติว่าผมมีเลข 1
-
สมมุติว่าผมีเลข 1 อีกตัว, 2, 3
-
สมมุติว่าผมมี 4
-
ดีแล้ว
-
เราอยากได้ตัวอย่างง่ายๆ
-
ค่าเฉลี่ย หรือค่าเฉลี่ยเลขคณิต อาจเป็นสิ่งที่คุณ
-
คุ้นเคยที่สุดเวลาคนเขาพูดถึงค่าเฉลี่ย
-
มันก็คือ -- คุณบวกเลขทั้งหมดเข้า แล้วคุณ
-
หารด้วยจำนวนตัวเลขที่มี
-
ในกรณีนี้, มันก็คือ 1 บวก 1 บวก 2 บวก 3 บวก 4
-
แล้วคุณก็หารด้วย 1, 2, 3,
-
4, 5
-
ได้อะไร?
-
1 บวก 1 เป็น 2
-
2 บวก 2 เป็น 4
-
4 บวก 3 เป็น 7
-
7 บวก 4 เป็น 22
-
นี่จึงเท่ากับ 11/5
-
นั่นคืออะไร?
-
มันคือ 2 1/5 หรือเปล่า?
-
มันเท่ากับ 2.2
-
แล้วมึคนบอกว่า "เฮ้, รู้ไหม,
-
นี่คือตัวแทนที่ดีของ
-
ชุดข้อมูลนี้เลย
-
นั่นคือตัวเลขที่เลขพวกนี้ทุกตัวอยู่ใกล้
-
จะว่างั้นก็ได้" หรือ 2.2 แทนแนวโน้ม
-
ศูนย์กลางของชุดข้อมูลนี้
-
พูดโดยทั่วไปแล้ว, นั่นคือค่าเฉลี่ย
-
แต่ถ้าเราอาจระบุให้ชัด, นี่
-
คือค่าเฉลี่ยเลขคณิตของชุดตัวเลขนี้
-
แล้วคุณเห็นว่ามันเป็นตัวแทนข้อมูล
-
ถ้าผมไม่อยากให้ชุดตัวเลข 5 ตัวนี้, ผม
-
ก็บอกว่า "อืม, เธอก็รู้, ฉันมีชุดตัวเลข 5 ตัว และ
-
มันมีค่าเฉลี่ยเท่ากับ 2.2" นี่บอกคุณนิดหน่อยว่า
-
อย่างน้อย, คุณก็รู้, ว่าตัวเลขพวกนี้อยู่แถวไหน
-
เราจะพูดถึงต่อไปว่า คุณจะรู้ว่า
-
เลขพวกนั้นห่าาจากค่าเฉลี่ยแค่ไหนในวิดีโอต่อไป
-
นั่นคือวิธีวัดอย่างหนึ่ง
-
วิธีวัดอีกอย่างหนึ่ง, แทนที่จะเฉลี่ยแบบนี้, คุณ
-
สามารถหาค่าเฉลี่ยได้ด้วยการเรียงลำดับเลข,
-
ซึ่งผมเรียงไว้แล้ว
-
งั้นลองเขียนมันตามลำดับอีกครั้งหนึ่ง
-
1, 1, 2, 3, 4
-
แล้วคุณเอาเลขตรงกลางมา
-
ลองดู, มันมีเลข 1, 2, 3, 4, 5 ตัว
-
เลขตัวกลางจะอยู่ตรงนี้, จริงไหม?
-
เลขตรงกลางคือ 2
-
มันมีเลขสองตัวมากกว่า 2 และมี
-
เลขสองตัวน้อยกว่า 2
-
และนี่เรียกว่ามัธยฐาน (median)
-
มันใช้การคำนวณน้อยมาก
-
คุณแค่ต้องเรียงเลขแค่นั้น
-
แล้วคุณหาเลขอะไรก็ตาม ที่มีจำนวนตัวเลขซึ่งมากกว่า
-
เท่ากับจำนวนตัวเลขซึ่งน้อยกว่า
-
ดังนั้นมัธยฐานของเลขชุดนี้คือ 2
-
และคุณเห็นว่า, ผมหมายถึงว่า, มัน
-
ใกล้กับค่าเฉลี่ยมาก
-
และมันไม่มีคำตอบที่ถูกต้อง
-
ไม่มีค่าเฉลี่ยไหนดีกว่าอีกอัน
-
พวกนั้นเป็แค่วิธีวัดค่ากลางแบบต่างๆ
-
ตรงนี้มันคือมัธยฐาน
-
และผมรู้ว่าคุณอาจคิดว่า "อืม, มันก็ง่าย
-
ถ้าเรามีเลข 5 ตัว
-
แต่ถ้าเรามีเลข 6 ตัวล่ะ?" ถ้าเกิดมันเป็นแบบนี้?
-
ถ้าเกิดนี่คือชุดตัวเลขของเราล่ะ?
-
1, 1, 2, 3 ลองเพิ่ม 4 เข้าไปอีกตัว
-
ทีนี้, มันไม่มีเลขตรงกลาง, จริงไหม?
-
ผมหมายความว่า 2 ไม่มีอยู่ตรงกลาง เพราะมีเลข 2 ตัวที่น้อยกว่า
-
และมีเลข 3 ตัวที่มากกว่า
-
แล้ว 3 ก็ไม่ใช่เลขกลาง เพราะมันมีเลข 3 ตัวที่
-
มากกว่า -- ขอโทษที มันมี 2 ตัวที่มากกว่า
-
และ 3 ตัวที่น้อยกว่า
-
มันจึงไม่มีเลขตรงกลาง
-
เมื่อคุณชุดที่มีตัวเลขเป็นจำนวนคู่ และมีคนบอก
-
ให้คุณหาค่ามัธยฐาน, สิ่งที่คุณทำคือคุณหาเลขตรงกลาง
-
สองตัว แล้วคุณหาค่าเฉลี่ยเลขคณิต
-
ของเลขสองตัวนั้น
-
ในกรณีนี้ เซตนนี้, มัธยฐานจะเป็น 2.5
-
ใช้ได้
-
ลองเก็บนี้ไว้ก่อน เพราะผมอยากเปรียบเทียบ
-
ค่ามัธยฐาน ค่าเฉลี่ย และฐานนิยม
-
ของเลขชุดเดียวกัน
-
แต่มันเป็นเรื่องรู้ไว้ก็ดี เพราะบางครั้ง
-
มันก็ทำใหัสับสนได้
-
เจ้านิยามพวกนี้
-
นี่คือเครื่องมือทางคณิตศาสตร์
-
ที่ช่วยเรามองตัวเลขพวกนี้
-
มันไม่ใช่ว่า วันหนึ่งมีคนเห็นสูตรพวกนี้
-
บนดวงอาทิตย์ แล้วบอกว่า "โอ้, จักรวาล
-
บอกเราว่าค่าเฉลี่ยควรคิดแบบนี้"
-
พวกนี้คือสิ่งที่มนุษย์สร้างขึ้นเพื่อเข้าใจ
-
ข้อมูลขนาดใหญ่
-
นี่ไม่ใช่ข้อมูลขนาดใหญ่, แต่แทนที่จะเป็นเลขห้าตัว, ถ้า
-
เรามีตัวเลข 5 ล้านตัว, คุณคงนึกออกว่าคุณคง
-
ไม่อยากคิดถึงเลขไปทีละตัวแน่ๆ
-
เอาล่ะ, ก่อนที่ผมจะพูดมากไป, ขอผมบอกคุณก่อน
-
ว่าฐานนิยมคืออะไร
-
ฐานนิยม ที่จริงแล้ว, เป็นอันที่ผมว่า
-
คนส่วนใหญ่มักลืม หรือไม่เคยเรียน หรือเวลาเขาเจอมัน
-
ในข้อสอบ, มันมักทำให้งง, คนพวกนี้บอกว่า "โอ้,
-
มันฟังดูยากมาก" แต่ในแง่หนึ่ง, มันเป็นตัววัด
-
แนวโน้มของศูนย์กลาง หรือค่ากลางที่ง่ายที่สุดอันหนึ่ง
-
ฐานนิยมก็แค่ตัวเลขที่ปรากฏมากที่สุดในชุด
-
ในตัวอย่างนี้, มันมี 1 สองตัวและอย่างอื่นอย่างละ
-
หนึ่งตัว, จริงไหม?
-
ฐานนิยมตรงนี้จึงเป็น 1
-
ฐานนิยมคือเลขที่มีมากที่สุด
-
แล้วคุณอาจถามว่า "โว้ เฮ้ ซาล,
-
แล้วถ้านี่คือชุดข้อมูลเราล่ะ?
-
1, 1, 2, 3, 4, 4" ตรงนี้ผมมี 1 สองตัว และผมมี 4 สองตัว
-
และนี่คือที่ที่ฐานนิยมเริ่มไม่ตรงไปตรงมา เพราะ
-
ตัวใดตัวหนึ่งล้วนเป็นฐานนิยมได้
-
คุณอาจบอกว่าฐานนิยมของข้อมูลนี้ คือ 1 หรือ
-
ฐานนิยมของอันนี้คือ 4 แล้วมันก็เริ่มกำกวม
-
และคุณอาจถาม
-
คนที่ถามคุณอีกทีเพื่อความชัดเจน
-
ส่วนใหญ่ในข้อสอบ เวลาเขาถามคุณ, มันมัก
-
ไม่มีความกำกวมอย่างนี้
-
มันจะมีตัวเลขในชุดที่ปรากฎบ่อยที่สุดเสมอ
-
ทีนี้, คุณอาจสงสัยว่า, โอ้, คุณก็รู้, ทำไมอันเดียว
-
ถึงไม่ดีพอ?
-
คุณก็รู้ ทำไมเราถึงเรียนค่าเฉลี่ย, ทำไมเราไม่
-
ใช่แต่ค่าเฉลี่ย?
-
หรือทำไมเราถึงไม่ใช่ค่าเฉลี่ยเลขคณิตตลอด?
-
แล้วมัธยฐานกับฐานนิยมมีดีอะไร?
-
ทีนี้, ผมจะพยายามยกตัวอย่าง แล้วให้คุณดูว่า
-
มันช่วยให้คุณเห็นอะไรบ้าง
-
แล้วคุณค่อยคิดต่อไป
-
สมมุติว่า ผมมีชุดตัวเลข
-
3, 3, 3, 3, 3 และ, ไม่รู้สิ 100
-
ค่าเฉลี่ยเลขคณิตตรงนี้คือะไร?
-
ผมมี 1, 2, 3, 4, 5 มี 3 ทั้งหมด 5 ตัว, กับ 100
-
นี่ก็คือ 115 หารด้วย 6, จริงไหม?
-
ผมมีเลข 1, 2, 3, 4, 5, 6 ตัว
-
115 ก็แค่ผลบวกทั้งหมดของมัน
-
นั่นจึงเท่ากับ -- 6 หาร 115 ได้กี่ครั้ง?
-
6 ไปหารมันได้ 1 ครั้ง
-
1 คูณ 6 ได้ 6
-
55 หารได้ 9 ครั้ง
-
9 คูณ 6 เป็น 54
-
มันจึงเท่ากับ 19 1/6
-
ใช้ได้
-
ผมแค่บวกเลขทั้งหมด แล้วหารด้วย
-
จำนวนที่มี
-
แต่คำถามของผมคือว่า, นี่คือตัวแทน
-
ของข้อมูลที่ดีหรือเปล่า?
-
ผมหมายความว่า, ผมมีเลข 3 เต็มไปหมด แล้วผมมี 100
-
ในทันใด, เรากำลังบอกว่าแนวโน้มสู่ศูนย์กลาง คือ 19 1/6
-
ผมหมายความว่า 19 1/6 ไม่ได้บ่งชี้
-
ถึงชุดตัวเลขเท่าไหร่
-
ผมหมายความว่า, บางที, มันขึ้นอยู่กับการนำไปใช้, แต่มันดู
-
เลยออกไป, จริงไหม?
-
ผมหมายถึงว่า, สัญชาตญาณผมบอกว่า แนวโน้มของศูนย์กลาง
-
ควรอยู่ใกล้ 3 เพราะมันมี 3 เป็นจำนวนมาก
-
แล้วมัธยฐานบอกเราว่าอะไร?
-
ผมเขียนเลขนี้เป็นลำดับอยู่แล้ว, จริงไหม?
-
ถ้าผมให้เลขคุณมาเป็นลำดับ, คุณอยากใส่มัน
-
ตามลำดับ แล้วคุณถามว่าเลขตรงกลางคืออะไร?
-
ลองดู, มีเลขตรงกลางสองตัว, เนื่องจาก
-
เป็นจำนวนคู่, ได้ 3 กับ 3
-
ถ้าผมหาค่าเฉลี่ยของ 3 กับ 3 -- หรือผมควร
-
ใช้คำให้เจาะจงกว่านี้
-
ถ้าผมหาค่าเฉลี่ยเลขคณิตของ 3 กับ 3, ผมจะได้ 3
-
นี่คือวิธีการวัดแนวโน้ม
-
ของศูนย์กลางหรือค่าเฉลี่ยชุดตัวเลขที่ดีกว่า, จริงไหม?
-
ที่สุดแล้ว, สิ่งที่มันทำ เวลาหามัธยฐาน, คือมันไม่ได้
-
ผลกระทบจากเลขที่มีค่ามาก
-
ซึ่งต่างจากตัวอื่นอยู่มาก
-
ในสถิติ เราเรียกมันว่า ค่าผิดปกติ (outlier)
-
ตัวเลขที่, คุณก็รู้, ถ้าคุณพูดถึงค่าเฉลี่ย
-
ราคาบ้าน, บางทีบ้านทุกหลังในเมืองราคา $100,000 แล้ว
-
มันมีบ้านหลังหนึ่งราคา $1 ล้านล้าน
-
แล้วถ้ามีคนถามคุณว่าราคาบ้านโดยเฉลี่ยเป็นเท่าไหร่, ผม
-
ไม่รู้สิ, $1 ล้านเหรียญ, คุณอาจเข้าใจ
-
ภาพของเมืองนั้นผิดไป
-
แต่มัธยฐานของราคาบ้านอาจเป็น $100,000 แล้วคุณ
-
ก็เข้าใจได้ดีขึ้นว่า ราคาบ้านในเมืองเป็นอย่างไรกันแน่
-
เช่นเดียวกัน, ค่ามัธยฐานนี่, ช่วยให้คุณเข้าใจ
-
ว่าตัวเลขในเซตเป็นอย่างไร
-
เพราะค่าเฉลี่ยเลขคณิตนั้นบิดเบี้ยวได้, จากสิ่ง
-
ที่เขาเรียกกันว่า ค่าผิดปกติ
-
และการระบุค่าผิดปกตินี้, มันเป็น
-
หนึ่งในเรื่องที่นักสถิติจะบอกว่า, อืม,
-
เห็นแล้วก็จะรู้เอง
-
มันไม่มีนิยามชัดเจน แต่มันมัก
-
จะเป็นตัวเลขที่โดดออกมา และบางครั้ง
-
มันมาจาก, คุณก็รู้, ความผิดพลาดจากกรวัดหรืออะไรพวกนั้น
-
แล้วสุดท้าย, ค่าฐานนิยม
-
เลขที่มีมากที่สุดในชุดนี้คืออะไร?
-
มันมี 3 ห้าตัว, แล้วก็มี 100
-
ดังนั้นเลขที่ปรากฏมากสุด, เหมือนเดิม, มันคือ 3
-
ในกรรีนี้, เวลาคุณมีค่าผิดปกติ, มัธยฐานกับ
-
ฐานนิยมมักจะเป็น, คุณก็รู้, บางทีมัน
-
ช่วยบอกนิดหน่อยว่า
-
ตัวนี้เหล่านี้แทนอะไร
-
บางทีนี่อาจเป็นความผิดพลาดจากการวัด
-
แต่ผมไม่รู้, เรายังไม่รู้
-
ว่าพวกมันแทนอะไร
-
ถ้านี่คือราคาบ้าน, ผมอาจบอกว่า พวกนี้
-
เป็นตัววัดว่าราคาบ้านหลังหนึ่ง
-
ในพื้นที่นั้นราคาเท่าไหร่
-
แต่ถ้านี่เป็นอย่างอื่น, ถ้านี่เป็นคะแนนสอบ,
-
บางที, คุณก็รู้, บางทีมีเด็กคนหนึ่งในห้อง --
-
คนหนึ่งใน 6 คน, ทำได้ดีมาก และคนที่เหลือ
-
ไม่ได้เรียนเลย
-
นี่เป็นตัวบอก, ว่านักเรียน
-
ในชั้นทำได้ดีแค่ไหนโดยเฉลี่ย
-
เอาล่ะ, ผมพูดจบแล้ว
-
และผมแนะนำให้คุณลองเล่นกับตัวเลขเยอะๆ แล้ว
-
คิดตามหลักการด้วยตัวเอง
-
ในวิดีโอหน้า, เราจะมาสำรวจสถิติ
-
แบบพรรรณนากันต่อ
-
แทนที่จะพูดถึงแนวโน้มสู่ศูนย์กลาง, เราะจะพูด
-
ถึงว่า ข้อมูลกระจายตัวห่างจากแนวโน้ม
-
ของศูนย์กลางแค่ไหน
-
แล้วพบกันใหม่ในวิดีโอหน้าครับ