Ласкаво просимо до відеозапису про статистику. Це те, що я намагався зробити деякий час. Отож хай там як, я просто прагну дістатися прямісінько до суті цього і я намагатимусь зробити якомога більше прикладів та сподіваюся надати вам розуміння того що ж таке статистика. І насправді просто заради певного початку на випадок якщо ви не знайомі з цим... проте, я гадаю більшість людей має інтуїтивне відчуття того, що ж таке статистика. І, по суті... ну, у дуже загальних рисах ми попрацюємо з певного роду даними. І статистика має дуже розлогі визначення. При цьому є три категорії. Маємо описову статистику. Скажімо, ми маємо багацько даних і нам треба щось сказати про них без залучення цілковито усіх цих даних. Можливо, ми зможемо знайти певні показові числа, які якимось чином уособлюють в собі усі ці дані без необхідності використання усіх цих даних. Це можна б було назвати описовою статистикою. При цьому існує також і прогнозування. І погрупую їх разом. При цьому існує підсумкова статистика. І це тоді, коли ви використовуєте дані аби, по суті, зробити висновки про певні речі. Скажімо, ви обрали вибірку певних даних з загальної сукупності... і ми багато говоритимемо про вибірки супроти загальних сукупностей, але я гадаю ви повинні мати принаймні загальне розуміння того що ж це таке? Якщо я досліджую трьох людей, які збираються голосувати за президента, то зрозуміло, що я не досліджую цілковито усю загальну сукупність. Я досліджую вибірку. Але про що ж тоді підсумкова статистика: якщо ми в змозі зробити певні підрахунки з даними вибірки, то, можливо, ми в змозі й зробити підсумки або висновки щодо загальної сукупності загалом. Ну, хай там як, це лише загальна картина того, що ж таке статистика. Нумо просто дістанемося суті її і почнемо ми з описової статистики. Отож, найпершою річчю яку, я не знаю, яку я міг би забажати зробити або більшість людей могла б забажати зробити, коли їм надано цілу множину чисел і сказано описати її. Можливо, я в змозі знайти певні числа, які є найбільш показовими з усіх цих чисел даної множини. Або ж певні числа, які виявляють певного роду загальну схильність, ці слова ви бачитимете у багатьох підручниках по статистиці. Загальна схильність числової множини. І це також називається середньою величиною. І я буду трохи більш влучним тут щодо того, коли зазвичай я використовую слова "середня величина". Коли ми говоримо про це у даному контексті, то я маю на увазі, що середня величина це лише число, яке якимось чином надає нам розуміння даної загальної схильності. Або ж, можливо, це число, що є найбільш кращим уособленням множини. І я знаю, що це усе звучить дуже абстрактно, але нумо зробимо двійко прикладів. Отже, існує низка способів, якими можна насправді виміряти дану загальну схильність або ж середню величину даної числової множини. І ви, ймовірно, вже бачили це раніше. Це середнє значення. І насправді існують різні типи середнього значення, але ми матимемо справу лише з середнім арифметичним значенням. Середнє геометричне і середнє гармонійне значення можливо ми й розглянемо колись. При цьому є середнє значення, медіана та мода. І кажучи мовою статистики, це усе певного роду уособлення множини даних або загальної схильності загальної сукупності або загальної схильності вибірки. І усі вони колективно... усі вони можуть бути формою середньої величини. І я вважаю, коли ми побачимо приклади, то усе стане трохи зрозумілішим. У побуті, коли люди ведуть мову про середню величину, я гадаю ви вже підраховували середні величини, то вони зазвичай говорять про середнє арифметичне значення. Отож, зазвичай, коли хтось каже: "Нумо знайдемо середню величину цих чисел." То такі люди очікують що ви зробите щось, щоб з’ясувати для них дане середньо арифметичне значення. Вони не бажають аби ви з’ясовували медіану чи моду. Але перш ніж ми просунемося далі, нумо з’ясуймо, що означають ці речі. Давайте оберемо числову множину. Скажімо, маємо число 1. Скажімо маємо ще одне 1, 2, 3. Маємо 4. Цього цілком досить. Нам потрібен простий приклад. Отож, середнє значення або арифметичне середнє значення це ймовірно те, що найбільш вам відомо, якщо люди говорять про середню величину. І це по суті... ви додаєте усі ці числа і ділите на кількість даних чисел. У даному випадку, це буде 1 плюс 1 плюс 2 плюс 3 плюс 4. І вам треба буде поділити на 1,2,3, 4, 5 чисел. Це що? 1 плюс 1 це 2. 2 плюс 2 це 4. 4 плюс 3 це 7. 7 плюс 4 це 11. Отож, це дорівнює 11/5. А це що? Це ж 2 1/5? Отже, це дорівнює 2,2. І хтось може сказати: "Агов, знаєте. Це доволі гарне показне число для цієї множини. Це число, до якого усі ці числа певним чином тримаються якнайближче." Або ж 2,2 уособлює собою дану загальну схильність цієї множини. Кажучи простою мовою, це й буде нашою середньою величиною. Але якщо казати конкретніше, то це наше середньо арифметичне значення даної числової множини. І ви бачите, що це певного роду її уособлення. Якщо б я не бажав надавати вам цей перелік з п’яти чисел, то я б міг сказати: "Я маю множину з п’яти чисел і їх середнє значення дорівнює 2,2." Це певним чином повідомляє вам принаймні де знаходяться ці числа. Ми ще поговоримо про те як нам дізнатися наскільки далеко дані числа знаходяться від середнього значення у наступному відео. Отож, це одне із вимірювань. Іншим вимірюванням є, замість знаходження таким чином середньої величини, знаходження середньої величини шляхом впорядкування цих чисел, що я насправді вже й зробив. Отож, нумо запишемо їх тут упорядковано знову. 1, 1, 2, 3, 4. І ви просто берете дане середнє число. Отже, поглянемо, це один, два, три, чотири, п’ять чисел. Середнє число буде прямо тут, правильно? Середнє число це 2. Ці два числа більші за 2, а ці два числа менші за 2. І це називається медіаною. Тут насправді дуже мало обчислень. Вам треба, по суті, лише впорядкувати ці числа. А тоді ви знаходите будь-яке число, яке має рівну кількість більших та менших за себе чисел. Отож, медіаною даної множини є 2. І ви бачите, що це насправді дуже близько до даного середнього значення. І тут немає жодної правильної відповіді. Жодне з цих не є найкращою відповіддю для середньої величини. Це лише різні способи вимірювання середньої величини. Отож, це наша медіана. І я знаю, що ви могли б подумати: "Ну, це було доволі легко, коли ми мали п’ять чисел. Що якщо ми матимемо шість чисел?" Що якщо це було б таким? Що якщо це була б наша числова множина? 1, 1, 2, 3 і, скажімо, додамо ще одну 4. Отож, тепер тут немає жодного середнього числа, правильно? Я маю на увазі, що 2 вже не середнє число, оскільки, є два менших і три більших за нього. І 3 також не є середнім числом, оскільки є три більших і... вибачте, два більших і три менших за трійку числа. Отож, це не середнє число. Коли ви маєте множину з парною кількістю чисел і хтось каже вам з’ясувати дану медіану, то все що вам треба зробити так це узяти дані два середні числа і знайти середньо арифметичне значення цих двох чисел. У даному випадку, для цієї множини медіаною буде 2,5. Цілком правильно. Але нумо приберемо це вбік, оскільки я бажаю порівняти дані медіану, середнє значення і моди для однієї й тієї ж множини чисел. Це потрібно знати, оскільки іноді це може трохи спантеличувати. І це усе є визначеннями. Це певного роду математичні знаряддя для утримання у наших головах чисел. Це ж не так, що одного дня хтось поглянув на одну з цих формул і сказав: "О, та це ж частина загальної сукупності і ось як треба обчислювати середню величину." Це усе було розроблено людиною аби певним чином тримати у наших головах великі множини даних. Це не велика множина даних, вона складається лише з п’яти чисел, якщо б ми мали 5 мільйонів чисел, то ви уявляєте наскільки складно було б думати окремо про кожне з даних чисел особисто. Хай там як, перш ніж я розповім більше про це, я поясню вам що таке мода. І мода до певної міри, це одна з тих речей про яку люди, ймовірно, найчастіше забувають або ніколи не вчать і коли вони бачать її на іспиті, то це спантеличує їх, оскільки вони думають: "О, це звучить дуже складно." Але певним чином, це найлегший з усіх вимірів загальної схильності або середньої величини. Мода - це, по суті, число, яке найчастіше трапляється у множині. Отож, у даному прикладі, є дві одиниці, а усе решта лише трапляється лише раз, правильно? Отож, даною модою є 1. Отже, мода це число, що трапляється найчастіше. А тоді ви могли б сказати: "Агов, Сале, а якщо б це було нашою множиною? 1, 1, 2, 3, 4, 4." Тут ми маємо дві 1 і дві 4. І саме у таких випадках, мода стає дещо складнішою, оскільки кожне з цих чисел (1 та 4) може бути доречною відповіддю для моди. Ви могли б насправді сказати, що даною модою є 1 або даною модою є 4, а це має певну двозначність. І ви ймовірно забажаєте певної ясності від тої людини, що запитує вас. У більшості випадків на тесті, коли вас запитують про таке, то при цьому не буде такої двозначності. При цьому у даній множині буде число, яке трапляється найчастіше. То чому ж одного з цих чисел не буде достатньо? Ми ж бо знаємо що таке середнє величина, то чому б нам просто не використати тут середню величину? Або чому б нам постійно не використовувати середнє арифметичне значення? Нащо потрібні медіана і мода? Я спробую зробити один приклад цього і подивимося чи це наштовхне вас на правильну відповідь. І тоді вам це стане трохи більш зрозумілим. Скажімо, я маю таку числову множину. 3, 3, 3, 3, 3 і число 100. Отже, чому дорівнює середнє арифметичне значення у цьому випадку? Я маю одну, дві,три, чотири, п’ять трійок і 100. Отож, це буде 115 поділити на 6, правильно? Я маю 1, 2, 3, 4, 5, 6 чисел. 115 це просто сума усіх їх. Отож, це дорівнює... Скільки разів 6 міститься у 115? 6 один раз. 1 помножити на 6 це 6. У 55 шістка міститься 9 разів. 9 помножити на 6 дорівнює 54. Отож, це дорівнює 19 1/6. Цілком правильно. Я просто додав усі ці числа та поділив на їх кількість. Але наше питання полягає у тому чи насправді це є уособленням цієї множини? Я маю на увазі, я маю декілька 3ок, а тоді зненацька отримую 100, і ми сказали, що дана загальна схильність дорівнює 19 1/6. І, я маю на увазі, що 19 1/6 не видається насправді показовим для цієї множини. Я маю на увазі можливо й є, залежно від вашого застосування цього, але чи не виглядає це трохи не так? Я маю на увазі, що моя інтуїція підказує, що дана загальна схильність це дещо ближче до 3, оскільки тут багацько трійок. Отож, що нам має повідомляти дана медіана? Я вже розмістив ці числа впорядковано, правильно? Якщо б я безладно надав їх вам, то ви б впорядкували їх таким чином, і запитали б чому дорівнює дане середнє число? Погляньмо, маємо два середні числа, оскільки маємо парну кількість чисел, це 3 і 3. Отож, якщо я знайду середню величину 3 і 3... або ж я маю бути більш конкретним у висловах. Якщо я знайду середнє арифметичне значення 3 і 3, то отримаю 3. І це, можливо, краще вимірювання для даної загальної схильності або середньої величини даної числової множини, правильно? По суті, що нам дало знаходження даної медіани так це те, що я не мав значного впливу від цього насправді набагато більшого числа, що дуже різниться від інших. У статистиці такі числа називають викидами в даних. Наприклад, якщо вести мову про середню вартість будинку, то, можливо, більшість будинків у місті коштує 100.000,а тоді з’являється один будинок, що коштує 1 трильйон. А тоді якщо хтось скаже вам, що середньою ціною будинку був 1 мільйон, то ви можете отримати дуже хибне уявлення про ціни у цьому місті. Але даною медіаною ціни на будинок буде 100.000 і ви отримаєте краще розуміння того скільки коштують будинки у даному місті. Схожим чином, ця медіана,можливо, дає вам краще розуміння того, які числа є у даній множині. Оскільки, дане середнє арифметичне значення викривляється через те, що називається викидом в даних. І цей викид це така річ, про яку статистики можуть сказати: "Я його відразу ж впізнаю, коли він з’явиться." Це насправді не є офіційним визначенням для цього, але викид тяжіє до того аби бути числом, яке насправді дуже відрізняється від решти і іноді це призводить до помилок у підрахунках і т.п. І тепер зрештою, мода. Яке ж число найчастіше трапляється у цій множині? Маємо п’ять 3ок і одне 100. Отож числом, що трапляється найчастіше є, знову ж таки, 3. У даному випадку, коли ви маєте такий викид, дана медіана і мода тяжіють бути, ви знаєте, можливо трохи кращими показниками того, що уособлюють собою дані числа. Можливо, це була лише помилка у вимірюваннях. Але я не знаю, ми насправді не знаємо, що це уособлює собою. Якщо це є цінами на будинки, тоді я закладаюсь, що це є ймовірно, більш показовими вимірами того, скільки коштують будинки у цій місцевості. Але якщо це щось інше, якщо це бали на іспиті, можливо є якийсь учень у даному класі.. один з цих шести дітей, що впорався дуже, дуже добре із тестом, а усі інші не вивчили цього. І це є більш показовим щодо того, яким є рівень учнів у середньому. Хай там як, годі вже про це. Я волів би аби ви побавилися з більшою кількістю чисел і зробили б власні висновки з цього. У наступному відео ми будемо мати справу з ще більшою кількістю описової статистики. Замість того аби розмовляти про загальну схильність, ми поговоримо про віддаленість речей від даної загальної схильності. Побачимося у наступному відео.