-
Ласкаво просимо до відеозапису про
статистику.
-
Це те, що я намагався зробити деякий час.
-
Отож хай там як, я просто прагну
дістатися прямісінько до суті цього
-
і я намагатимусь зробити якомога більше
прикладів та сподіваюся
-
надати вам розуміння того що ж
таке статистика.
-
І насправді просто заради
певного початку на випадок
-
якщо ви не знайомі з цим... проте, я гадаю
більшість людей
-
має інтуїтивне відчуття того,
що ж таке статистика.
-
І, по суті... ну, у дуже загальних рисах
-
ми попрацюємо з
певного роду даними.
-
І статистика має дуже
розлогі визначення.
-
При цьому є три категорії.
-
Маємо описову статистику.
-
Скажімо, ми маємо багацько даних і нам
треба щось сказати
-
про них без залучення цілковито
усіх цих даних.
-
Можливо, ми зможемо знайти певні
показові числа, які
-
якимось чином уособлюють в собі усі
ці дані без необхідності
-
використання
усіх цих даних.
-
Це можна б було назвати
описовою статистикою.
-
При цьому існує
також і прогнозування.
-
І погрупую їх разом.
-
При цьому існує підсумкова статистика.
-
І це тоді, коли ви використовуєте
дані аби, по суті, зробити
-
висновки про певні речі.
-
Скажімо, ви обрали вибірку певних даних
з загальної сукупності...
-
і ми багато говоритимемо про вибірки
супроти загальних сукупностей,
-
але я гадаю ви повинні мати принаймні
загальне розуміння того що ж це таке?
-
Якщо я досліджую трьох людей, які
збираються голосувати
-
за президента, то зрозуміло, що я не досліджую
цілковито усю загальну сукупність.
-
Я досліджую вибірку.
-
Але про що ж тоді підсумкова статистика:
якщо ми в змозі зробити
-
певні підрахунки з даними вибірки, то,
можливо, ми в змозі й зробити підсумки
-
або висновки щодо загальної сукупності
загалом.
-
Ну, хай там як, це лише
загальна картина того,
-
що ж таке статистика.
-
Нумо просто дістанемося суті її і
почнемо ми
-
з описової статистики.
-
Отож, найпершою річчю яку, я не знаю,
яку я міг би забажати
-
зробити або більшість людей могла б
забажати зробити, коли їм
-
надано цілу множину чисел і сказано
описати її.
-
Можливо, я в змозі знайти певні числа, які
-
є найбільш показовими з усіх цих чисел
даної множини.
-
Або ж певні числа, які виявляють певного
роду загальну схильність,
-
ці слова ви бачитимете у багатьох
підручниках по статистиці.
-
Загальна схильність числової множини.
-
І це також називається середньою
величиною.
-
І я буду трохи більш влучним тут щодо
того, коли зазвичай
-
я використовую слова "середня величина".
Коли ми говоримо про це у даному контексті,
-
то я маю на увазі, що середня величина
це лише число, яке якимось чином
-
надає нам розуміння даної загальної
схильності.
-
Або ж, можливо, це число, що є найбільш
кращим уособленням множини.
-
І я знаю, що це усе звучить
дуже абстрактно,
-
але нумо зробимо двійко прикладів.
-
Отже, існує низка способів, якими можна
насправді виміряти
-
дану загальну схильність або ж середню
величину даної числової множини.
-
І ви, ймовірно, вже бачили це раніше.
-
Це середнє значення.
-
І насправді існують різні типи
середнього значення, але ми
-
матимемо справу лише з середнім
арифметичним значенням.
-
Середнє геометричне і середнє гармонійне
значення можливо ми
-
й розглянемо колись.
-
При цьому є середнє значення,
медіана та мода.
-
І кажучи мовою статистики,
це усе певного роду
-
уособлення множини даних або загальної
схильності загальної сукупності
-
або загальної схильності вибірки.
-
І усі вони колективно... усі вони
можуть бути
-
формою середньої величини.
-
І я вважаю, коли ми
побачимо приклади,
-
то усе стане
трохи зрозумілішим.
-
У побуті, коли люди ведуть мову про
середню величину, я гадаю
-
ви вже підраховували середні
величини, то вони
-
зазвичай говорять про середнє
арифметичне значення.
-
Отож, зазвичай, коли хтось каже: "Нумо
знайдемо середню
-
величину цих чисел." То такі люди очікують
що ви зробите щось,
-
щоб з’ясувати для них дане середньо
арифметичне значення.
-
Вони не бажають аби ви з’ясовували
медіану чи моду.
-
Але перш ніж ми просунемося далі,
нумо з’ясуймо, що
-
означають ці речі.
-
Давайте оберемо числову множину.
-
Скажімо, маємо число 1.
-
Скажімо маємо ще одне 1, 2, 3.
-
Маємо 4.
-
Цього цілком досить.
-
Нам потрібен простий приклад.
-
Отож, середнє значення або арифметичне
середнє значення це ймовірно те, що
-
найбільш вам відомо, якщо люди говорять
про середню величину.
-
І це по суті... ви додаєте усі ці числа і
-
ділите на кількість даних чисел.
-
У даному випадку, це буде 1 плюс 1
плюс 2 плюс 3 плюс 4.
-
І вам треба буде поділити на 1,2,3,
-
4, 5 чисел.
-
Це що?
-
1 плюс 1 це 2.
-
2 плюс 2 це 4.
-
4 плюс 3 це 7.
-
7 плюс 4 це 11.
-
Отож, це дорівнює 11/5.
-
А це що?
-
Це ж 2 1/5?
-
Отже, це дорівнює 2,2.
-
І хтось може сказати: "Агов, знаєте.
-
Це доволі гарне показне
-
число для цієї множини.
-
Це число, до якого усі ці числа певним
чином тримаються
-
якнайближче." Або ж 2,2 уособлює собою
дану загальну
-
схильність цієї множини.
-
Кажучи простою мовою, це й буде нашою
середньою величиною.
-
Але якщо казати конкретніше, то
-
це наше середньо арифметичне значення
даної числової множини.
-
І ви бачите, що це певного роду її
уособлення.
-
Якщо б я не бажав надавати вам цей
перелік з п’яти чисел, то
-
я б міг сказати: "Я маю множину з п’яти
чисел
-
і їх середнє значення дорівнює 2,2." Це
певним чином повідомляє вам
-
принаймні де знаходяться ці числа.
-
Ми ще поговоримо про те як нам дізнатися
наскільки далеко
-
дані числа знаходяться від середнього
значення у наступному відео.
-
Отож, це одне із вимірювань.
-
Іншим вимірюванням є, замість знаходження
таким чином середньої величини,
-
знаходження середньої величини шляхом
впорядкування цих чисел,
-
що я насправді вже й зробив.
-
Отож, нумо запишемо їх
тут упорядковано знову.
-
1, 1, 2, 3, 4.
-
І ви просто берете
дане середнє число.
-
Отже, поглянемо, це один, два, три,
чотири, п’ять чисел.
-
Середнє число буде прямо тут,
правильно?
-
Середнє число це 2.
-
Ці два числа більші
за 2, а ці два
-
числа менші за 2.
-
І це називається медіаною.
-
Тут насправді дуже
мало обчислень.
-
Вам треба, по суті, лише
впорядкувати ці числа.
-
А тоді ви знаходите будь-яке
число, яке має
-
рівну кількість більших та
менших за себе чисел.
-
Отож, медіаною даної множини є 2.
-
І ви бачите, що це насправді дуже
-
близько до даного
середнього значення.
-
І тут немає жодної
правильної відповіді.
-
Жодне з цих не є найкращою відповіддю
для середньої величини.
-
Це лише різні способи вимірювання
середньої величини.
-
Отож, це наша медіана.
-
І я знаю, що ви могли б
подумати: "Ну, це було
-
доволі легко,
коли ми мали п’ять чисел.
-
Що якщо ми матимемо шість чисел?"
Що якщо це було б таким?
-
Що якщо це була б
наша числова множина?
-
1, 1, 2, 3 і, скажімо, додамо ще одну 4.
-
Отож, тепер тут немає жодного середнього
числа, правильно?
-
Я маю на увазі, що 2 вже не середнє число,
оскільки, є два менших
-
і три більших за нього.
-
І 3 також не є середнім числом, оскільки
є три більших
-
і... вибачте, два більших і три
-
менших за трійку числа.
-
Отож, це не середнє число.
-
Коли ви маєте множину з парною
кількістю чисел і хтось каже
-
вам з’ясувати дану медіану, то все що вам
треба зробити
-
так це узяти дані два середні числа і
знайти середньо арифметичне
-
значення цих двох чисел.
-
У даному випадку, для цієї множини
медіаною буде 2,5.
-
Цілком правильно.
-
Але нумо приберемо це вбік, оскільки я
бажаю порівняти
-
дані медіану, середнє значення і моди для
-
однієї й тієї ж множини чисел.
-
Це потрібно знати, оскільки іноді це
-
може трохи спантеличувати.
-
І це усе є визначеннями.
-
Це певного роду математичні знаряддя
для утримання
-
у наших головах чисел.
-
Це ж не так, що одного дня хтось поглянув
на одну з цих формул
-
і сказав: "О, та це ж частина загальної
-
сукупності і ось як треба обчислювати
середню величину."
-
Це усе було розроблено людиною аби
певним чином тримати у наших головах
-
великі множини даних.
-
Це не велика множина даних,
вона складається лише з п’яти чисел,
-
якщо б ми мали 5 мільйонів чисел, то
ви уявляєте наскільки складно
-
було б думати окремо про кожне з даних
чисел особисто.
-
Хай там як, перш ніж я розповім
більше про це, я поясню
-
вам що таке мода.
-
І мода до певної міри, це одна з тих речей
про яку люди,
-
ймовірно, найчастіше забувають або ніколи
не вчать і коли вони бачать її на
-
іспиті, то це спантеличує їх, оскільки
вони думають:
-
"О, це звучить дуже складно." Але певним
чином, це найлегший
-
з усіх вимірів загальної схильності або
середньої величини.
-
Мода - це, по суті, число, яке найчастіше
трапляється у множині.
-
Отож, у даному прикладі, є дві одиниці,
а усе решта
-
лише трапляється лише
раз, правильно?
-
Отож, даною модою є 1.
-
Отже, мода це число, що трапляється
найчастіше.
-
А тоді ви могли б сказати: "Агов, Сале, а
-
якщо б це було нашою множиною?
-
1, 1, 2, 3, 4, 4." Тут ми маємо дві 1
і дві 4.
-
І саме у таких випадках, мода стає дещо
складнішою, оскільки
-
кожне з цих чисел (1 та 4) може бути
доречною відповіддю для моди.
-
Ви могли б насправді сказати, що даною
модою є 1 або
-
даною модою є 4, а це має певну
двозначність.
-
І ви ймовірно забажаєте
певної ясності
-
від тої людини, що запитує вас.
-
У більшості випадків на тесті, коли вас
запитують про таке, то
-
при цьому не буде
такої двозначності.
-
При цьому у даній множині буде число, яке
трапляється найчастіше.
-
То чому ж одного з цих чисел
-
не буде достатньо?
-
Ми ж бо знаємо що
таке середнє величина,
-
то чому б нам просто не використати
тут середню величину?
-
Або чому б нам постійно не використовувати
середнє арифметичне значення?
-
Нащо потрібні медіана і мода?
-
Я спробую зробити один приклад цього
і подивимося чи
-
це наштовхне вас на правильну відповідь.
-
І тоді вам це стане трохи більш
зрозумілим.
-
Скажімо, я маю таку числову множину.
-
3, 3, 3, 3, 3 і число 100.
-
Отже, чому дорівнює середнє арифметичне
значення у цьому випадку?
-
Я маю одну, дві,три, чотири,
п’ять трійок і 100.
-
Отож, це буде 115 поділити
на 6, правильно?
-
Я маю 1, 2, 3, 4, 5, 6 чисел.
-
115 це просто сума усіх їх.
-
Отож, це дорівнює... Скільки разів 6
міститься у 115?
-
6 один раз.
-
1 помножити на 6 це 6.
-
У 55 шістка міститься 9 разів.
-
9 помножити на 6 дорівнює 54.
-
Отож, це дорівнює 19 1/6.
-
Цілком правильно.
-
Я просто додав усі ці числа та
-
поділив на їх кількість.
-
Але наше питання полягає у тому чи
насправді це є уособленням
-
цієї множини?
-
Я маю на увазі, я маю декілька 3ок, а
тоді зненацька отримую 100,
-
і ми сказали, що дана загальна схильність
дорівнює 19 1/6.
-
І, я маю на увазі, що 19 1/6 не видається
насправді показовим
-
для цієї множини.
-
Я маю на увазі можливо й є, залежно від
вашого застосування цього, але
-
чи не виглядає
це трохи не так?
-
Я маю на увазі, що моя інтуїція підказує,
що дана загальна схильність
-
це дещо ближче до 3, оскільки тут
багацько трійок.
-
Отож, що нам має повідомляти дана
медіана?
-
Я вже розмістив ці числа впорядковано,
правильно?
-
Якщо б я безладно
надав їх вам, то ви б
-
впорядкували їх таким чином, і запитали б
чому дорівнює дане середнє число?
-
Погляньмо, маємо два середні числа,
оскільки маємо
-
парну кількість чисел, це 3 і 3.
-
Отож, якщо я знайду середню величину
3 і 3... або ж я маю
-
бути більш конкретним у висловах.
-
Якщо я знайду середнє арифметичне
значення 3 і 3, то отримаю 3.
-
І це, можливо, краще вимірювання для
даної загальної
-
схильності або середньої величини даної
числової множини, правильно?
-
По суті, що нам дало знаходження даної
медіани так це те, що я не мав
-
значного впливу від цього насправді
набагато більшого числа,
-
що дуже різниться від інших.
-
У статистиці такі числа
називають викидами в даних.
-
Наприклад, якщо вести мову про середню
вартість будинку,
-
то, можливо, більшість будинків у місті
коштує 100.000,а тоді
-
з’являється один будинок, що коштує
1 трильйон.
-
А тоді якщо хтось скаже вам, що
середньою ціною будинку був
-
1 мільйон, то ви можете отримати дуже
хибне
-
уявлення про ціни
у цьому місті.
-
Але даною медіаною ціни на будинок буде
100.000 і ви отримаєте
-
краще розуміння того скільки коштують
будинки у даному місті.
-
Схожим чином, ця медіана,можливо,
дає вам краще
-
розуміння того, які числа є у даній
множині.
-
Оскільки, дане середнє арифметичне
значення викривляється через те, що
-
називається викидом в даних.
-
І цей викид це така річ, про яку
-
статистики можуть сказати:
-
"Я його відразу ж впізнаю, коли він
з’явиться."
-
Це насправді не є офіційним визначенням
для цього, але викид тяжіє
-
до того аби бути числом, яке насправді
дуже відрізняється від решти і
-
іноді це призводить до помилок у
підрахунках і т.п.
-
І тепер зрештою, мода.
-
Яке ж число найчастіше трапляється у цій
множині?
-
Маємо п’ять 3ок і одне 100.
-
Отож числом, що трапляється найчастіше
є, знову ж таки, 3.
-
У даному випадку, коли ви маєте
такий викид, дана медіана і
-
мода тяжіють бути, ви знаєте, можливо
трохи кращими
-
показниками того, що
-
уособлюють собою
дані числа.
-
Можливо, це була лише
помилка у вимірюваннях.
-
Але я не знаю,
ми насправді
-
не знаємо, що
це уособлює собою.
-
Якщо це є цінами на будинки, тоді я
закладаюсь, що це є
-
ймовірно, більш показовими вимірами
того, скільки
-
коштують будинки у цій місцевості.
-
Але якщо це щось інше, якщо це бали
на іспиті,
-
можливо є якийсь учень у даному класі..
один з цих
-
шести дітей, що впорався дуже, дуже
добре із тестом,
-
а усі інші не вивчили цього.
-
І це є більш показовим
щодо того, яким є
-
рівень учнів у середньому.
-
Хай там як, годі вже про це.
-
Я волів би аби ви побавилися з більшою
кількістю чисел і
-
зробили б власні висновки з цього.
-
У наступному відео ми будемо мати справу
з ще більшою кількістю описової
-
статистики.
-
Замість того аби розмовляти про загальну
схильність, ми
-
поговоримо про віддаленість речей від
даної
-
загальної схильності.
-
Побачимося у наступному відео.