1 00:00:00,954 --> 00:00:04,537 私と研究仲間は 動く点の科学に魅せられています 2 00:00:04,927 --> 00:00:06,101 これらの点は何でしょう? 3 00:00:06,101 --> 00:00:07,412 全て我々自身です 4 00:00:07,412 --> 00:00:12,521 我々は家の中 事務所の中を動き回り 街や世界中で 5 00:00:12,521 --> 00:00:14,587 買物や旅行をしています 6 00:00:14,958 --> 00:00:18,918 こんな動きを全て理解できたら 素晴らしいと思いませんか? 7 00:00:18,918 --> 00:00:21,808 ここにパターン、意味を見出し 洞察することができたら? 8 00:00:22,259 --> 00:00:24,068 幸運なことにも 我々は 9 00:00:24,068 --> 00:00:28,807 自分達自身の情報を実に上手く 取得できる時代に生きています 10 00:00:28,807 --> 00:00:32,494 それがセンサー、ビデオ または アプリであろうとも 11 00:00:32,494 --> 00:00:35,303 見事なほど詳細に 動きを追跡することができます 12 00:00:36,092 --> 00:00:41,148 そんな動きを得るのに最適なのが 13 00:00:41,148 --> 00:00:42,682 スポーツです 14 00:00:42,682 --> 00:00:48,039 バスケ、野球、サッカーやフットサルであれ 15 00:00:48,039 --> 00:00:52,465 競技場に装置を取り付け 選手の動きを1秒にも満たない間隔で 16 00:00:52,465 --> 00:00:53,802 撮影し追跡します 17 00:00:53,802 --> 00:00:58,208 そう 我々がやっていることは スポーツ選手を 18 00:00:58,208 --> 00:01:00,191 -皆さんがご想像されるとおり- 19 00:01:00,191 --> 00:01:01,587 動く点へと変換することです 20 00:01:01,946 --> 00:01:06,904 他の生データと同様に 膨大な数の動く点を取得します 21 00:01:06,904 --> 00:01:09,430 取り扱いは面倒で 面白い作業ではありません 22 00:01:09,430 --> 00:01:13,223 でも選手の動きには 例えばバスケのコーチが 知りたいものが含まれています 23 00:01:13,223 --> 00:01:17,057 問題はコーチが 各ゲームを逐次観察し それを記憶し分析することが 24 00:01:17,057 --> 00:01:19,804 不可能であるということです 25 00:01:19,804 --> 00:01:21,758 1人の人間には不可能であっても 26 00:01:21,758 --> 00:01:23,661 機械になら出来ます 27 00:01:23,661 --> 00:01:27,363 問題は機械がコーチの様な視点を持って ゲームを見ることができないことです 28 00:01:27,363 --> 00:01:29,624 いや 少なくとも今までは不可能でした 29 00:01:30,228 --> 00:01:32,331 では我々は機械に 何を学習させたのでしょう? 30 00:01:33,569 --> 00:01:35,380 単純な方法で始めました 31 00:01:35,380 --> 00:01:39,203 パス、シュートやリバウンドを 教えました 32 00:01:39,203 --> 00:01:41,768 バスケファンならご存知ですよね? 33 00:01:41,768 --> 00:01:44,624 次にもう少しだけ複雑なことに 取り組みました 34 00:01:44,624 --> 00:01:49,377 ポストアップ、ピックアンドロールや アイソレーションなどです 35 00:01:49,377 --> 00:01:52,920 選手なら大抵知っていることですが ご存じなくても問題ありません 36 00:01:53,560 --> 00:01:58,924 そして 今では機械はダウン・スクリーンや 37 00:01:58,924 --> 00:02:02,021 ワイド・ピンといったプレイも 把握できるようになりました 38 00:02:02,021 --> 00:02:04,771 基本的に プロだけが知っているプレイです 39 00:02:04,771 --> 00:02:09,157 機械にはコーチの視点で見るように 学習させました 40 00:02:10,008 --> 00:02:11,866 どうやって出来たのでしょう? 41 00:02:12,511 --> 00:02:15,653 コーチにピックアンドロールについて 説明を求めれば 42 00:02:15,653 --> 00:02:17,317 解説してくれたことでしょうが 43 00:02:17,317 --> 00:02:20,173 それをアルゴリズムに組込むのは 至難の業です 44 00:02:21,026 --> 00:02:25,328 ピックアンドロールとは 4人で行う2対2の攻防戦での 45 00:02:25,328 --> 00:02:27,486 こういったダンスのような動きです 46 00:02:27,486 --> 00:02:29,128 このように動いていきます 47 00:02:29,128 --> 00:02:31,685 スクリナー(ディフェンスをガードする選手)が 48 00:02:31,685 --> 00:02:34,918 ボールマンのディフェンスの横に行き 49 00:02:34,918 --> 00:02:36,199 ずっとガードするのです 50 00:02:36,199 --> 00:02:39,540 そして2人が動き こうなります ジャーン! これがピックアンドロールです 51 00:02:39,540 --> 00:02:41,779 (笑) 52 00:02:41,779 --> 00:02:44,287 アルゴリズム化が困難な例です 53 00:02:44,913 --> 00:02:49,278 スクリナーが邪魔をするのですが 54 00:02:49,278 --> 00:02:52,174 近づいても 停止しなければ 55 00:02:52,174 --> 00:02:53,939 おそらくピックアンドロールでは ありません 56 00:02:54,560 --> 00:02:58,529 逆に 停止しても 十分に近づかなければ 57 00:02:58,529 --> 00:03:00,290 ピックアンドロールとは ならないでしょう 58 00:03:00,642 --> 00:03:03,903 近づいて停止しても 59 00:03:03,903 --> 00:03:07,462 リングの下では ピックアンドロールにはならないでしょう 60 00:03:07,462 --> 00:03:10,010 私の間違いで何れも ピックアンドロールかもしれません 61 00:03:10,010 --> 00:03:14,602 正確なタイミング、距離と場所に 依存するので 62 00:03:14,602 --> 00:03:16,097 判断を難しくしています 63 00:03:16,579 --> 00:03:21,547 幸いにも機械学習では 我々が知っていることの記述を 64 00:03:21,547 --> 00:03:23,314 我々の限界以上にこなします 65 00:03:23,314 --> 00:03:25,759 どのように? 例をお見せしましょう 66 00:03:25,759 --> 00:03:28,589 機械に向かって言います 「おはよう 機械君 67 00:03:29,077 --> 00:03:32,720 ここにピックアンドロールと そうでないものが あるんだ 68 00:03:32,720 --> 00:03:35,076 違いを見分けてごらん」 69 00:03:35,076 --> 00:03:38,807 この問題を解く鍵は 判別を可能とする特徴を捉えることです 70 00:03:38,807 --> 00:03:40,940 りんごとみかんの違いを 71 00:03:40,940 --> 00:03:42,345 学習させるならば 72 00:03:42,345 --> 00:03:44,744 「色と形に注目してみたら?」 と言うことでしょう 73 00:03:44,744 --> 00:03:47,711 我々が解決すべき問題は 違いが何かということです 74 00:03:47,711 --> 00:03:48,982 コンピューターが 75 00:03:48,982 --> 00:03:52,505 動く点を追跡する時に 鍵となる特徴とは何でしょうか? 76 00:03:52,505 --> 00:03:57,352 相対的 絶対的な位置、距離、タイミング それに速度といった 77 00:03:57,352 --> 00:03:59,440 全ての情報を把握すること 78 00:03:59,440 --> 00:04:04,392 それこそが 動く点の科学の神髄です 79 00:04:04,392 --> 00:04:07,925 「時空パターン認識」という専門用語を 使うのが適切です 80 00:04:07,925 --> 00:04:10,847 初めての言葉ですから 舌を噛むかもしれません 81 00:04:10,847 --> 00:04:12,410 こんな言葉ですから 82 00:04:12,410 --> 00:04:15,575 ポイントはNBAのコーチにとっての関心は ピックアンドロールが 83 00:04:15,575 --> 00:04:17,521 あったかどうかでは無く どのようにして 84 00:04:17,521 --> 00:04:19,620 そのプレイが起きたかということです 85 00:04:19,620 --> 00:04:22,631 なぜ 重要なのでしょう? 少し掘り下げてみましょう 86 00:04:22,631 --> 00:04:24,426 現代のバスケットボールでは 87 00:04:24,426 --> 00:04:27,065 ピックアンドロールは おそらく最も重要なプレイです 88 00:04:27,065 --> 00:04:29,709 どうやって仕掛け これをどうディフェンスするのかで 89 00:04:29,709 --> 00:04:32,403 基本的に多くのゲームで勝敗を左右します 90 00:04:32,403 --> 00:04:36,228 だから この動きには 様々なバリエーションがあり 91 00:04:36,228 --> 00:04:39,900 バリエーションを理解することが とても重要です 92 00:04:39,900 --> 00:04:42,429 ですから この装置がとても重宝します 93 00:04:43,228 --> 00:04:44,428 例をお見せします 94 00:04:44,428 --> 00:04:46,831 2対2の攻防戦で 95 00:04:46,831 --> 00:04:49,007 ピックアンドロールをしようとしています 96 00:04:49,007 --> 00:04:52,086 ボールマンの動きには テイクとリジェクトがあり 97 00:04:52,086 --> 00:04:55,111 スクリナーには ロールとポップがあります 98 00:04:55,111 --> 00:04:58,121 一方ボールマンのディフェンスは オーバーかアンダーをし 99 00:04:58,121 --> 00:05:02,710 スクリナーのディフェンスは ショウかアップツータッチかソフトをします 100 00:05:02,710 --> 00:05:05,352 またディフェンスが一緒になって スイッチやブリッズをします 101 00:05:05,352 --> 00:05:08,035 始めの頃は こういったことについて 知りませんでした 102 00:05:08,035 --> 00:05:11,979 このような矢印通りに動いてくれれば簡単で 103 00:05:11,979 --> 00:05:16,047 理解しやすいことでしょう でも実際の動きはとても複雑です 104 00:05:16,047 --> 00:05:21,555 選手はくねくねと複雑に動くので プレイのバリエーションを 105 00:05:21,555 --> 00:05:22,882 正確に把握すること- 106 00:05:22,882 --> 00:05:24,774 精度良く プレイを再現することは困難です 107 00:05:24,774 --> 00:05:28,416 だから コーチは人間の判断力を 信用することになります 108 00:05:28,416 --> 00:05:31,820 時空パターン認識には このような困難がありますが 109 00:05:31,820 --> 00:05:33,294 我々は解析に成功しました 110 00:05:33,318 --> 00:05:37,478 コーチたちは我々の機械の プレイ認識能力を信頼しています 111 00:05:37,478 --> 00:05:41,035 今年に至っては NBAリーグの 112 00:05:41,035 --> 00:05:42,682 ほぼ全てのチームが 113 00:05:42,682 --> 00:05:47,114 バスケットボールの動く点を 追跡する機械に搭載された 114 00:05:47,114 --> 00:05:49,872 ソフトを利用しています 115 00:05:49,872 --> 00:05:55,049 それだけでなく とても大切な試合に勝利するための 116 00:05:55,049 --> 00:05:58,425 戦略変更を 我々はアドバイスすることができました 117 00:05:58,425 --> 00:06:02,181 これはとてもワクワクすることです 30年もの間 リーグに在籍してきた 118 00:06:02,181 --> 00:06:05,248 コーチたちが 機械による アドバイスを受け入れるのですから 119 00:06:05,874 --> 00:06:08,804 ピックアンドロールを超えたことも 素晴らしことです 120 00:06:08,804 --> 00:06:10,904 コンピューターは 簡単なことから始め 121 00:06:10,904 --> 00:06:12,992 もっともっと複雑なことを学習し 122 00:06:12,992 --> 00:06:14,577 今や多くの事を把握しています 123 00:06:14,577 --> 00:06:17,436 正直言えば 私自身は 学習内容を殆ど理解していませんが 124 00:06:17,436 --> 00:06:21,175 私より賢いなんて 特別なことではありません 125 00:06:21,175 --> 00:06:24,843 こう思ったことがあります 機械はコーチを超えられるか? 126 00:06:24,843 --> 00:06:26,922 人間以上に知り得るか? 127 00:06:26,922 --> 00:06:28,691 今や その答えは「イエス」です 128 00:06:28,691 --> 00:06:31,272 コーチはシュートを上手く放つ 選手を欲しがります 129 00:06:31,272 --> 00:06:32,947 私がゴールの近くにいて 130 00:06:32,947 --> 00:06:35,137 近くに誰もいなければ シュートを決めやすく 131 00:06:35,137 --> 00:06:39,101 逆に ゴールから遠く 敵に囲まれていれば シュートを決めるのが難しくなります 132 00:06:39,101 --> 00:06:44,209 しかし シュートの良し悪しの程度を 定量的に判断できませんでした 133 00:06:44,209 --> 00:06:45,359 今までは です 134 00:06:45,771 --> 00:06:48,853 ここで時空パターン認識の 再登場です 135 00:06:48,853 --> 00:06:50,251 各シュートを分析しました 136 00:06:50,251 --> 00:06:53,280 調べることは「シュートの場所は? リングとの角度は? 137 00:06:53,280 --> 00:06:56,066 ディフェンスの位置は? その距離は? 138 00:06:56,066 --> 00:06:57,421 立っている角度は?」などです 139 00:06:57,421 --> 00:07:00,422 複数のディフェンダーがいる時も 選手の動きを追って 140 00:07:00,422 --> 00:07:01,879 シュートのタイプを予測できます 141 00:07:01,879 --> 00:07:05,977 選手の速度から このような状況下で 142 00:07:05,977 --> 00:07:10,188 どのようなシュートが放たれるかという 予測モデルを構築できます 143 00:07:10,188 --> 00:07:11,688 なぜ これが重要なのでしょう? 144 00:07:12,102 --> 00:07:14,929 シュートについて解析してみます 145 00:07:14,929 --> 00:07:17,633 かつては一元的なものでしたが 今は2つの因子に分解します 146 00:07:17,633 --> 00:07:20,284 シュートの質と シューターの質です 147 00:07:21,680 --> 00:07:24,966 このバブル・チャートをご覧ください TEDには不可欠ですよね? 148 00:07:24,966 --> 00:07:26,004 (笑) 149 00:07:26,004 --> 00:07:27,329 各点はNBAの選手です 150 00:07:27,329 --> 00:07:30,483 点の大きさは選手の大きさ 色はポジションを表しています 151 00:07:30,483 --> 00:07:32,639 横軸は シュートの成功可能性で 152 00:07:32,639 --> 00:07:34,616 左に行けば難易度が上がり 153 00:07:34,616 --> 00:07:37,194 右に行けば難易度が下がります 154 00:07:37,194 --> 00:07:39,275 縦軸は 選手のシュート能力です 155 00:07:39,275 --> 00:07:41,861 上に行くほど良い選手で 下の方は その逆です 156 00:07:41,861 --> 00:07:43,621 例えば 通常47%の確率で 157 00:07:43,621 --> 00:07:45,718 シュートを成功させる選手がいるとします 158 00:07:45,718 --> 00:07:47,345 以前なら これが情報の全てです 159 00:07:47,345 --> 00:07:52,219 でも今なら NBAの平均的な選手なら 49%の確率で成功させるシュートを 160 00:07:52,219 --> 00:07:54,204 この選手は2%低くさせると いうことができます 161 00:07:54,204 --> 00:07:55,888 この選手は2%低くさせると いうことができます 162 00:07:56,266 --> 00:08:00,781 47%といっても様々な組み合わせが あることが重要です 163 00:08:01,714 --> 00:08:04,287 47%の数字をたたき出す 164 00:08:04,287 --> 00:08:08,267 100億円プレイヤーの獲得を 考えるのならば 165 00:08:08,267 --> 00:08:11,346 難しいシュートを成功させる選手なのか シュートの質は低くても 166 00:08:11,346 --> 00:08:13,743 チャンスの高いシュートを放つ 選手なのかは重要な要素です 167 00:08:15,130 --> 00:08:18,487 機械学習では 選手の見方は変わりませんが 168 00:08:18,487 --> 00:08:20,369 試合の見方が変わります 169 00:08:20,369 --> 00:08:24,148 数年前NBAのファイナルで 大いに盛り上がった試合がありました 170 00:08:24,148 --> 00:08:27,379 3点を追うマイアミ 後り時間は20秒 171 00:08:27,379 --> 00:08:29,428 シリーズの敗北が目前でした 172 00:08:29,428 --> 00:08:32,793 レブロン・ジェームズという選手が 同点となる3点シュートを放つも 173 00:08:32,793 --> 00:08:34,015 外れました 174 00:08:34,015 --> 00:08:35,876 クリス・ボッシュ選手が リバウンドに入り 175 00:08:35,876 --> 00:08:38,058 レイ・アレン選手にパス そのアレン選手が 176 00:08:38,058 --> 00:08:40,001 3点シュートを沈め 延長戦に入りました 177 00:08:40,001 --> 00:08:42,121 結局試合に勝利し ファイナルを制しました 178 00:08:42,121 --> 00:08:44,566 史上 もっともエキサイティングな 試合の1つでした 179 00:08:45,438 --> 00:08:48,891 各選手の 各瞬間における 180 00:08:48,891 --> 00:08:50,103 シュート成功率や 181 00:08:50,103 --> 00:08:53,083 各瞬間にリバウンドを取る確率が分かると 182 00:08:53,083 --> 00:08:56,526 この場面を まったく新しい見方で 捉えられます 183 00:08:57,618 --> 00:09:00,310 残念ながらその時のビデオを お見せできませんが 184 00:09:00,310 --> 00:09:04,827 3週間ほど前に 我々がプレイしている週例の試合の時に 185 00:09:04,827 --> 00:09:07,279 皆さんのために そのプレイを再現しました 186 00:09:07,279 --> 00:09:09,573 (笑) 187 00:09:09,573 --> 00:09:13,199 分析を行った選手の動きを再現しました 188 00:09:13,199 --> 00:09:17,478 これは私たちです ここは毎週プレイしているロスアンジェルスの 189 00:09:17,478 --> 00:09:19,066 チャイナタウンにある公園です 190 00:09:19,066 --> 00:09:21,321 レイ・アランのあのプレイを 再現しています 191 00:09:21,321 --> 00:09:23,550 全てが あのプレイの 追跡データのとおりです 192 00:09:24,772 --> 00:09:26,313 そしてシュート 193 00:09:26,313 --> 00:09:28,853 その瞬間と解析結果を 194 00:09:28,853 --> 00:09:31,464 お見せします 195 00:09:31,464 --> 00:09:35,218 違いは プロの選手ではなく 私たちであり 196 00:09:35,218 --> 00:09:37,860 アナウンスもプロでなく私がしますので 197 00:09:37,860 --> 00:09:39,337 我慢してお付き合いください 198 00:09:41,153 --> 00:09:42,671 3点を追うマイアミ 199 00:09:42,671 --> 00:09:43,821 3点を追うマイアミ 200 00:09:44,107 --> 00:09:47,385 残り20秒 201 00:09:47,385 --> 00:09:48,583 ジェフのドリブル 202 00:09:50,656 --> 00:09:52,631 ジョシュにパスを回し 3点シュート 203 00:09:52,631 --> 00:09:54,480 [ シュート成功率を計算中 ] 204 00:09:55,278 --> 00:09:56,428 [ シュートの質 ] 205 00:09:57,048 --> 00:09:58,833 [ リバウンドの確率 ] 206 00:10:00,373 --> 00:10:01,570 失敗! 207 00:10:01,570 --> 00:10:03,016 [ リバウンドの確率 ] 208 00:10:03,777 --> 00:10:05,057 ノエルがリバウンドし 209 00:10:05,057 --> 00:10:06,509 ダリアにパス 210 00:10:06,509 --> 00:10:09,874 [ シュートの質 ] 211 00:10:10,676 --> 00:10:12,320 3点シュートが決まった! 212 00:10:12,320 --> 00:10:14,880 残り5秒で同点に 213 00:10:14,880 --> 00:10:16,522 観衆は大興奮 214 00:10:16,522 --> 00:10:18,205 (笑) 215 00:10:18,205 --> 00:10:19,776 こんな感じのプレイでした 216 00:10:19,776 --> 00:10:20,951 (拍手) 217 00:10:20,951 --> 00:10:22,150 だいたいこんな感じです 218 00:10:22,150 --> 00:10:23,681 (拍手) 219 00:10:24,121 --> 00:10:29,629 NBAだったら あれが成功する確率は 9%程度です 220 00:10:29,629 --> 00:10:31,914 そういったことを知ることができます 221 00:10:31,914 --> 00:10:35,429 このプレイの再現に 何回費やしたかは秘密です 222 00:10:35,429 --> 00:10:37,200 (笑) 223 00:10:37,200 --> 00:10:39,096 いいですよ お教えます! 4回でした 224 00:10:39,096 --> 00:10:40,121 (笑) 225 00:10:40,121 --> 00:10:41,286 ダリア お見事! 226 00:10:41,647 --> 00:10:45,934 しかし こんなビデオ映像や NBAの各試合の 227 00:10:45,934 --> 00:10:50,639 各瞬間の分析そのものが 重要だというのではなく 228 00:10:50,639 --> 00:10:54,568 動きを追跡するのに 専門家チームが必要ではなく 229 00:10:55,083 --> 00:10:58,764 動作を解析するのに 専門家である必要がないという事実です 230 00:10:58,764 --> 00:11:03,654 さらには スポーツに限る必要はありません 我々はいつでも どこでも動いています 231 00:11:03,654 --> 00:11:06,023 家の中でも 動いています 232 00:11:09,428 --> 00:11:10,633 オフィスでも 233 00:11:12,238 --> 00:11:14,928 買物したり 旅行したり 234 00:11:17,318 --> 00:11:18,571 街の中 235 00:11:20,065 --> 00:11:21,683 世界中を動き回っています 236 00:11:23,270 --> 00:11:25,589 何を知り 何を学べるでしょう? 237 00:11:25,589 --> 00:11:27,918 ピックアンドロールの代わりに 238 00:11:27,918 --> 00:11:30,952 機械はおそらく 私の娘が最初の一歩を歩み出すときに 239 00:11:30,952 --> 00:11:33,035 動きを捉え 私に知らせてくれることでしょう 240 00:11:33,035 --> 00:11:35,571 文字通り いつにでも起こりうることです 241 00:11:36,140 --> 00:11:39,837 建物や街のデザインを良くするのにも 利用できるでしょう 242 00:11:40,362 --> 00:11:44,559 動く点の科学を進歩させることによって 243 00:11:44,559 --> 00:11:48,202 より良いスマートな動きができるようになり 進歩するものと信じています 244 00:11:48,607 --> 00:11:49,820 どうも有難うございました 245 00:11:49,820 --> 00:11:54,865 (拍手)