1 00:00:00,954 --> 00:00:04,537 我同事和我對移動的點 背後的科學非常著迷。 2 00:00:04,927 --> 00:00:06,077 這些點是什麼? 3 00:00:06,101 --> 00:00:07,388 是我們每一個人。 4 00:00:07,412 --> 00:00:10,501 我們在家、在辦公室裡走動, 5 00:00:10,501 --> 00:00:14,587 在整個城市裡、 甚至世界各地旅遊和購物。 6 00:00:14,958 --> 00:00:18,627 我們若能夠瞭解這些動作, 不是很棒嗎? 7 00:00:18,918 --> 00:00:21,808 如果能從中找出模式、 意義和背後意涵的話。 8 00:00:22,259 --> 00:00:23,494 而我們有幸 9 00:00:23,494 --> 00:00:28,565 活在一個擷取自身資訊 非常容易的時代, 10 00:00:28,807 --> 00:00:32,470 無論透過感應器、影片或應用程式, 11 00:00:32,494 --> 00:00:35,303 我們都能非常精細地追蹤自己的動作。 12 00:00:36,092 --> 00:00:41,124 然後我們發現,最適合 獲取動作資訊的一個地方, 13 00:00:41,148 --> 00:00:42,356 就是運動場。 14 00:00:42,682 --> 00:00:48,015 無論是籃球、棒球、橄欖球或足球, 15 00:00:48,039 --> 00:00:51,975 我們都能在場館裡、甚至球員身上 安裝儀器,追蹤他們的動作 -- 16 00:00:51,975 --> 00:00:53,778 每個瞬間的動作。 17 00:00:53,802 --> 00:00:58,184 所以我們要做的 就是把運動員變成── 18 00:00:58,208 --> 00:01:00,167 你們大概已經猜到了── 19 00:01:00,191 --> 00:01:01,587 移動的點。 20 00:01:01,946 --> 00:01:06,880 我們收集了海量的移動的點, 但就像大部分的原始數據一樣, 21 00:01:06,904 --> 00:01:09,406 它們不易處理、也不甚有趣。 22 00:01:09,430 --> 00:01:13,199 但藏在數據裡的是,舉例來說, 籃球教練想知道的事。 23 00:01:13,223 --> 00:01:17,963 而問題是他們無法得知這些事, 因為他們得看著每一秒鐘的比賽, 24 00:01:17,963 --> 00:01:19,646 記住內容並處理它。 25 00:01:19,804 --> 00:01:21,734 沒有任何人能做到這件事, 26 00:01:21,758 --> 00:01:23,068 但機器可以。 27 00:01:23,661 --> 00:01:27,071 問題是,機器無法從 教練的角度觀看比賽, 28 00:01:27,363 --> 00:01:29,944 至少在此之前,它們都做不到。 29 00:01:30,228 --> 00:01:32,331 所以我們教會了機器看些什麼呢? 30 00:01:33,569 --> 00:01:35,356 從簡單的開始。 31 00:01:35,380 --> 00:01:39,179 我們教它判斷傳球、 投籃、搶籃板等動作, 32 00:01:39,203 --> 00:01:41,744 一些大部分普通球迷都知道的事。 33 00:01:41,768 --> 00:01:44,600 然後我們進入稍微複雜一點的動作, 34 00:01:44,624 --> 00:01:49,212 像是低位單打、擋切和清空單打。 35 00:01:49,377 --> 00:01:52,920 如果你不知道這些動作,沒關係。 打球的人大概都清楚。 36 00:01:53,560 --> 00:01:58,900 接著,我們到達今天的地步, 機器已經可以讀出複雜的動作, 37 00:01:58,924 --> 00:02:01,997 例如:向下掩護和無球掩護(wide pin), 38 00:02:02,021 --> 00:02:04,747 一些基本上是專業人士才懂的動作。 39 00:02:04,771 --> 00:02:09,159 我們教會了機器 用教練的角度來看比賽。 40 00:02:10,009 --> 00:02:11,866 我們是怎麼做到的? 41 00:02:12,511 --> 00:02:15,629 如果我請教練形容 某個動作,例如擋切, 42 00:02:15,653 --> 00:02:17,293 他們會給我一段敘述, 43 00:02:17,317 --> 00:02:20,483 如果我把這個敘述寫成 一個演算法,大概會慘不忍睹。 44 00:02:21,026 --> 00:02:25,304 擋切在籃球中,恰如 四個球員之間的舞蹈, 45 00:02:25,328 --> 00:02:27,240 兩個進攻方、兩個防守方。 46 00:02:27,486 --> 00:02:29,104 大概是這樣的過程: 47 00:02:29,128 --> 00:02:31,661 有一個未持球的進攻球員 48 00:02:31,685 --> 00:02:34,894 他跑到持球球員的旁邊幫他掩護, 49 00:02:34,918 --> 00:02:36,175 在原地稍作停留, 50 00:02:36,199 --> 00:02:39,516 然後他們都移動,事情就發生了 ——嗒啦——這就是擋拆。 51 00:02:39,540 --> 00:02:41,755 (笑聲) 52 00:02:41,779 --> 00:02:44,287 剛剛我示範了一個差勁的演算法。 53 00:02:44,913 --> 00:02:49,117 如果擋人那名球員──我們稱掩護者── 54 00:02:49,278 --> 00:02:52,150 慢慢靠近,但他並未停留, 55 00:02:52,174 --> 00:02:53,939 這可能就不是擋切。 56 00:02:54,560 --> 00:02:58,505 或是他有停留,但距離不夠近, 57 00:02:58,529 --> 00:03:00,290 這可能也不是擋切。 58 00:03:00,642 --> 00:03:03,879 或是他慢慢靠近、也確實停留, 59 00:03:03,903 --> 00:03:07,227 但這發生在籃下,可能也不是擋切。 60 00:03:07,462 --> 00:03:09,580 也可能我判斷錯誤,這些全都是擋切。 61 00:03:09,580 --> 00:03:14,578 這一切取決於精確的 時機、距離和位置, 62 00:03:14,602 --> 00:03:16,097 這也正是困難的地方。 63 00:03:16,579 --> 00:03:21,523 很幸運地,透過機器學習技術, 我們得以用超越自己的能力, 64 00:03:21,547 --> 00:03:23,290 來描述我們知道的事情。 65 00:03:23,314 --> 00:03:25,594 如何做到這個技術?舉個例。 66 00:03:25,759 --> 00:03:28,589 我們跑到機器面前說:「早安,機器。 67 00:03:29,077 --> 00:03:32,436 這裡有些擋切的例子, 也有些不是的例子。 68 00:03:32,720 --> 00:03:34,972 請找出區分它們的方式。」 69 00:03:35,076 --> 00:03:38,783 而一切的關鍵在於找到 可以進行區別的特徵。 70 00:03:38,807 --> 00:03:40,400 如果我要教它區分 71 00:03:40,400 --> 00:03:41,685 蘋果和橘子的差異, 72 00:03:41,685 --> 00:03:44,344 我可能會說: 「不妨用顏色或形狀來區分?」 73 00:03:44,344 --> 00:03:47,687 而我們要解決的問題是, 類似這樣的特徵是什麼? 74 00:03:47,711 --> 00:03:52,508 哪些是能讓電腦判讀這些移動的點時, 能暢行無阻的重要特徵? 75 00:03:52,508 --> 00:03:56,572 所以搞清楚每件事情的關聯── 包含相對和絕對位置、 76 00:03:56,572 --> 00:03:59,261 距離、時機、速率── 77 00:03:59,440 --> 00:04:04,368 絕對是研究這些移動的點的重要關鍵, 或者用我們喜歡的稱呼方式: 78 00:04:04,392 --> 00:04:07,736 「時空模式識別」這樣的學術用語。 79 00:04:07,925 --> 00:04:10,823 因為最重要的是, 必須讓它聽起來很難, 80 00:04:10,847 --> 00:04:12,125 因為它真的很難。 81 00:04:12,410 --> 00:04:15,551 重要的是,對NBA教練來說, 他們想知道的 82 00:04:15,575 --> 00:04:17,497 不是擋切是否發生, 83 00:04:17,521 --> 00:04:19,597 而是擋切是怎麼發生的。 84 00:04:19,621 --> 00:04:22,607 為什麼這對他們如此重要? 這裡有一些發現。 85 00:04:22,631 --> 00:04:24,402 原來在現代籃球中, 86 00:04:24,426 --> 00:04:26,965 擋切可能就是最重要的戰術。 87 00:04:27,065 --> 00:04:28,979 知道如何執行、如何防守擋切, 88 00:04:28,979 --> 00:04:32,379 基本上是大部分比賽輸贏的關鍵。 89 00:04:32,403 --> 00:04:36,204 所以結果是,擋切這種舞步變化多端, 90 00:04:36,228 --> 00:04:39,876 真正重要的是要辨別這些變化, 91 00:04:39,900 --> 00:04:42,899 所以我們需要有非常完善的演算法。 92 00:04:43,228 --> 00:04:44,218 這裡有個例子。 93 00:04:44,218 --> 00:04:46,041 兩個進攻球員和兩個防守球員 94 00:04:46,041 --> 00:04:47,947 準備進行擋切的攻防, 95 00:04:47,947 --> 00:04:51,690 持球者可以選擇利用或拒絕擋切, 96 00:04:52,086 --> 00:04:55,087 他的隊友則可以選擇切入或後撤。 97 00:04:55,111 --> 00:04:58,097 防守持球者的球員可選擇 從前繞開、或從後繞開。 98 00:04:58,121 --> 00:05:02,686 他的隊友可選擇上前補防、 隨球盯人或向後消極防守, 99 00:05:02,710 --> 00:05:05,328 他們也可以選擇換防或夾擊。 100 00:05:05,352 --> 00:05:08,011 一開始我並不知道大部分的動作, 101 00:05:08,035 --> 00:05:11,955 覺得如果大家能照那些箭頭 的方向移動就太棒了, 102 00:05:11,979 --> 00:05:15,647 這會讓我們的生活更加容易; 但我們的動作往往非常雜亂。 103 00:05:15,647 --> 00:05:20,745 人的動作有大量扭動,要在精準度和完整度上 104 00:05:20,745 --> 00:05:24,748 精確辨識這些變化,是相當困難的, 105 00:05:24,774 --> 00:05:28,392 因為唯有如此, 才能取得專業教練的信任。 106 00:05:28,416 --> 00:05:31,230 而儘管找到這些正確的 時空特徵困難重重, 107 00:05:31,230 --> 00:05:32,958 我們還是做到了。 108 00:05:32,958 --> 00:05:37,245 教練們信任我們機器 辨識這些變化的能力。 109 00:05:37,478 --> 00:05:42,671 我們已經達到,今年幾乎每一個 爭奪NBA冠軍的隊伍 110 00:05:42,682 --> 00:05:47,090 都在使用我們的軟體, 安裝在可以讀懂籃球場上 111 00:05:47,114 --> 00:05:48,748 移動的點的機器裡。 112 00:05:49,872 --> 00:05:55,025 不只如此,這些隊伍也根據 我們的建議改變一些戰術, 113 00:05:55,049 --> 00:05:58,401 幫助他們贏了一些很重要的比賽, 114 00:05:58,425 --> 00:06:01,581 這令人感到非常興奮, 因為我們讓這些在聯盟裡 115 00:06:01,581 --> 00:06:05,248 打滾了30年的教練, 願意聽一台機器的建議。 116 00:06:05,874 --> 00:06:08,254 不只擋切戰術,更讓我們興奮的是, 117 00:06:08,254 --> 00:06:10,114 我們的電腦從簡單的開始, 118 00:06:10,114 --> 00:06:12,092 學會越來越複雜的動作, 119 00:06:12,092 --> 00:06:14,047 現在它已經有豐富的知識。 120 00:06:14,047 --> 00:06:17,412 老實說,它懂得已經比我多了, 121 00:06:17,436 --> 00:06:21,151 但由於比我聰明也沒什麼特別的, 122 00:06:21,175 --> 00:06:24,819 我們更想知道, 機器有可能懂得比教練還多嗎? 123 00:06:24,843 --> 00:06:26,898 可能懂得比人類還多嗎? 124 00:06:26,922 --> 00:06:28,667 結果答案是:可以。 125 00:06:28,691 --> 00:06:31,248 教練都希望球員掌握好的投籃時機, 126 00:06:31,272 --> 00:06:32,437 如果離籃框很近, 127 00:06:32,437 --> 00:06:34,527 旁邊沒人防守,就是好的投籃時機。 128 00:06:34,527 --> 00:06:39,077 如果我離籃框很遠,又被防守者包圍, 通常就是很差的投籃時機。 129 00:06:39,101 --> 00:06:43,977 但我們從來無法從量化數據得知, 「好」有多好、「差」有多差。 130 00:06:44,209 --> 00:06:45,359 但現在不同了。 131 00:06:45,771 --> 00:06:48,829 所以我們可以,同樣地, 利用時空特徵條件, 132 00:06:48,853 --> 00:06:50,227 檢視每一次投籃。 133 00:06:50,251 --> 00:06:53,256 我們可以得知:投籃位置在哪? 和籃框的角度是幾度? 134 00:06:53,280 --> 00:06:56,042 防守者站在哪裡?距離多少? 135 00:06:56,066 --> 00:06:57,397 角度多大? 136 00:06:57,421 --> 00:07:00,398 防守者不只一個時, 我們可以觀察球員如何移動 137 00:07:00,422 --> 00:07:01,855 來預測投籃類型。 138 00:07:01,879 --> 00:07:05,953 我們可以觀察速率,建立一個可以預測 139 00:07:05,977 --> 00:07:10,029 在此情況下的命中率模型。 140 00:07:10,188 --> 00:07:11,688 為什麼這很重要? 141 00:07:12,102 --> 00:07:14,905 我們可以將投籃 142 00:07:14,929 --> 00:07:17,609 這種過去的單一行為,轉化為兩件事: 143 00:07:17,633 --> 00:07:20,824 投籃動作本身的品質,和投籃者的品質。 144 00:07:21,680 --> 00:07:24,942 這裡有一張泡泡圖, 沒有泡泡圖還像TED嗎? 145 00:07:24,966 --> 00:07:25,980 (笑聲) 146 00:07:26,004 --> 00:07:27,315 這些都是NBA球員。 147 00:07:27,339 --> 00:07:30,459 泡泡大小代表球員體型大小, 顏色代表他打的位置。 148 00:07:30,483 --> 00:07:32,615 X軸是進球的機率, 149 00:07:32,639 --> 00:07:34,592 左邊的球員做了許多勉強的投籃動作, 150 00:07:34,616 --> 00:07:36,845 右邊的球員在有空檔時才會出手。 151 00:07:37,194 --> 00:07:39,251 Y軸是球員的投籃能力, 152 00:07:39,275 --> 00:07:41,837 擅長投籃的球員在上方, 不擅長的在下方。 153 00:07:41,861 --> 00:07:43,621 舉例來說,如果有個球員, 154 00:07:43,621 --> 00:07:45,718 平均命中率大約47%, 155 00:07:45,718 --> 00:07:47,347 這是過去所有你知道的資訊。 156 00:07:47,347 --> 00:07:51,029 但今天,我能告訴你以 這個球員出手投籃的狀況, 157 00:07:51,029 --> 00:07:54,180 NBA球員的平均命中率是49%, 158 00:07:54,204 --> 00:07:55,888 他比平均低了2%。 159 00:07:56,266 --> 00:08:00,781 這之所以重要,是因為 有這麼多47%命中率的球員。 160 00:08:01,714 --> 00:08:04,263 重點就是要搞清楚, 161 00:08:04,287 --> 00:08:08,243 如果你要用100美金 簽下一個47%的球員, 162 00:08:08,267 --> 00:08:11,322 應該要找能投得準但出手時機不佳的, 163 00:08:11,346 --> 00:08:13,743 還是不那麼準但出手時機很好的球員。 164 00:08:15,130 --> 00:08:18,463 機器的理解力不只改變了 我們對球員的看法, 165 00:08:18,487 --> 00:08:20,345 也改變了我們對比賽的看法。 166 00:08:20,369 --> 00:08:24,124 兩年前在NBA總冠軍系列戰, 有一場非常刺激的比賽。 167 00:08:24,148 --> 00:08:27,355 邁阿密熱火隊落後3分, 時間還剩20秒。 168 00:08:27,379 --> 00:08:29,404 他們即將把冠軍拱手讓人。 169 00:08:29,428 --> 00:08:32,769 一位叫勒布朗·詹姆士的先生 出手一顆三分球企圖追平比賽, 170 00:08:32,793 --> 00:08:33,991 球沒進。 171 00:08:34,015 --> 00:08:35,852 他的隊友克里斯·波許搶到籃板, 172 00:08:35,876 --> 00:08:37,759 傳給另一位隊友雷·艾倫。 173 00:08:37,759 --> 00:08:39,978 他命中了一顆三分球, 將比賽帶入延長賽, 174 00:08:40,002 --> 00:08:42,098 最後他們贏了比賽,拿到冠軍。 175 00:08:42,122 --> 00:08:44,566 這是籃球場上最刺激的球賽之一。 176 00:08:45,438 --> 00:08:49,743 而因為我們可以得知每一個球員 在每一秒鐘投進的機率, 177 00:08:49,743 --> 00:08:52,103 以及每一秒鐘他們搶到籃板的機率, 178 00:08:52,103 --> 00:08:56,526 讓我們得以用前所未有的方式 窺見這個時刻的全貌。 179 00:08:57,618 --> 00:09:00,286 很可惜,現在我無法播放那段影片, 180 00:09:00,310 --> 00:09:04,803 但為了各位,我們重建了那個時刻, 181 00:09:04,827 --> 00:09:07,163 就在大約三週前 我們每週例行的籃球比賽裡。 182 00:09:07,279 --> 00:09:09,446 (笑聲) 183 00:09:09,573 --> 00:09:12,983 我們也重建了讓我們窺見 比賽全貌的追蹤數據。 184 00:09:13,199 --> 00:09:17,454 所以,這就是我們, 在洛杉磯的中國城, 185 00:09:17,478 --> 00:09:19,042 我們每週都在這個公園比賽。 186 00:09:19,066 --> 00:09:21,297 我們正在重建雷·艾倫的經典時刻, 187 00:09:21,321 --> 00:09:23,550 以及所有相關的追蹤數據。 188 00:09:24,772 --> 00:09:26,289 這就是那經典的一球。 189 00:09:26,313 --> 00:09:28,829 我將和各位展示那個時刻, 190 00:09:28,853 --> 00:09:31,440 以及那個時刻背後的一切。 191 00:09:31,464 --> 00:09:35,194 唯一的不同是,表演者是我們, 不是那些職業球員。 192 00:09:35,218 --> 00:09:37,836 還有是我在播報,不是職業播報員, 193 00:09:37,860 --> 00:09:39,337 所以請大家見諒。 194 00:09:41,153 --> 00:09:42,303 邁阿密熱火。 195 00:09:42,671 --> 00:09:43,821 3分落後。 196 00:09:44,107 --> 00:09:45,257 剩下20秒。 197 00:09:47,385 --> 00:09:48,583 傑夫帶球過來。 198 00:09:50,656 --> 00:09:52,191 喬許接到了球,三分出手! 199 00:09:52,631 --> 00:09:54,480 [計算命中率] 200 00:09:55,278 --> 00:09:56,428 [投籃品質] 201 00:09:57,048 --> 00:09:58,833 [籃板機率] 202 00:10:00,373 --> 00:10:01,546 球沒進! 203 00:10:01,570 --> 00:10:03,016 [籃板機率] 204 00:10:03,777 --> 00:10:05,033 諾爾搶到籃板。 205 00:10:05,057 --> 00:10:06,207 向後傳給朵莉雅。 206 00:10:06,509 --> 00:10:09,874 [投籃品質] 207 00:10:10,676 --> 00:10:12,296 她三分出手... 球進! 208 00:10:12,320 --> 00:10:14,517 追平比賽,剩下5秒! 209 00:10:14,880 --> 00:10:16,498 觀眾陷入瘋狂。 210 00:10:16,522 --> 00:10:18,181 (笑聲) 211 00:10:18,205 --> 00:10:19,752 事情大概就是這樣發生的。 212 00:10:19,776 --> 00:10:20,927 (掌聲) 213 00:10:20,951 --> 00:10:22,126 大概啦。 214 00:10:22,150 --> 00:10:23,681 (掌聲) 215 00:10:24,121 --> 00:10:29,605 這個時刻發生在NBA 賽場上的機率大約是9%, 216 00:10:29,629 --> 00:10:31,890 我們能算出這件事 和其他許多事的機率。 217 00:10:31,914 --> 00:10:35,405 我絕對不會告訴各位 我們試了幾次才成功。 218 00:10:35,429 --> 00:10:37,176 (笑聲) 219 00:10:37,200 --> 00:10:39,072 好啦,告訴你們,四次。 220 00:10:39,096 --> 00:10:40,097 (笑聲) 221 00:10:40,121 --> 00:10:41,286 幹得不錯,朵莉雅。 222 00:10:41,647 --> 00:10:45,910 但重要的並不是這則影片, 223 00:10:45,934 --> 00:10:50,502 也不是它對NBA每場比賽 每一秒鐘的意涵。 224 00:10:50,639 --> 00:10:54,568 重要的是,不是只有職業球隊 才能追蹤人的動作, 225 00:10:55,083 --> 00:10:58,740 也不是只有職業球員 才需要這些動作背後的意涵。 226 00:10:58,764 --> 00:11:02,622 事實上,它也不是只能應用在運動場上, 因為我們隨時都不斷地在各地移動。 227 00:11:03,654 --> 00:11:06,023 我們在家裡移動、 228 00:11:09,358 --> 00:11:10,633 在辦公室裡移動、 229 00:11:12,238 --> 00:11:14,928 購物和旅遊、 230 00:11:17,318 --> 00:11:18,781 穿梭在我們的城市裡 231 00:11:20,065 --> 00:11:21,683 以及全世界。 232 00:11:23,270 --> 00:11:25,565 我們可以知道什麼?可以學到什麼? 233 00:11:25,589 --> 00:11:27,894 或許,除了辨識擋切戰術之外, 234 00:11:27,918 --> 00:11:30,928 機器還能辨識出感動時刻,讓我知道 235 00:11:30,952 --> 00:11:33,011 我女兒何時踏出她的第一步。 236 00:11:33,035 --> 00:11:35,571 這真的是每一秒鐘都可能發生的事。 237 00:11:36,140 --> 00:11:39,837 或許我們能夠學會更善加 利用建築物、做更好的都市規劃。 238 00:11:40,362 --> 00:11:44,535 我相信藉由移動的點的科學進步, 239 00:11:44,559 --> 00:11:48,202 我們將能更好地移動、更聰明地移動, 並真正向未來移動。 240 00:11:48,607 --> 00:11:49,796 非常感謝各位。 241 00:11:49,820 --> 00:11:54,865 (掌聲)