Return to Video

我們應該拿這些大數據怎麼辦?

  • 0:01 - 0:04
    科技帶給我們很多美好的事物:
  • 0:04 - 0:07
    登陸月球、網路、
  • 0:07 - 0:09
    人類基因組定序。
  • 0:09 - 0:13
    但也挖掘出我們內心深處的許多恐懼。
  • 0:13 - 0:15
    大約 30 年前,
  • 0:15 - 0:18
    文化評論家尼爾.波茲曼寫了一本書,
  • 0:18 - 0:19
    叫做《娛樂至死》,
  • 0:19 - 0:22
    書中把這個現象說得很妙。
  • 0:22 - 0:24
    他是這樣說的:
  • 0:24 - 0:29
    比較歐威爾和赫胥黎的兩種反烏托邦,
  • 0:29 - 0:33
    他說,歐威爾擔心我們會成為
  • 0:33 - 0:35
    圈養的文化。
  • 0:35 - 0:39
    赫胥黎則擔心我們會成為庸俗的文化。
  • 0:39 - 0:43
    歐威爾擔心真相會被隱瞞,
  • 0:43 - 0:48
    赫胥黎則擔心我們會被瑣碎的汪洋吞沒。
  • 0:48 - 0:49
    簡單點說,
  • 0:49 - 0:52
    我們可以選擇「老大哥監視你」
  • 0:52 - 0:55
    或是「你監視老大哥」
  • 0:55 - 0:57
    (觀眾笑聲)
  • 0:57 - 0:59
    其實不必這樣,
  • 0:59 - 1:02
    我們不是被動地消費資料和科技,
  • 1:02 - 1:05
    我們可以決定科技在生活中扮演的角色,
  • 1:05 - 1:07
    和它對我們的意義。
  • 1:07 - 1:08
    但是要這麼做,
  • 1:08 - 1:11
    我們必須重視思考的方式,
  • 1:11 - 1:14
    不只重視編碼的方式。
  • 1:14 - 1:17
    我們必須問問題,難解的問題,
  • 1:17 - 1:19
    超越單純的算術,
  • 1:19 - 1:21
    試圖去了解。
  • 1:21 - 1:26
    我們不斷聽到世界上有多少資料,
  • 1:26 - 1:28
    但是談到大數據,
  • 1:28 - 1:30
    以及詮釋這些數據資料的挑戰,
  • 1:30 - 1:32
    光看數量是不夠的,
  • 1:32 - 1:35
    還必須關注資料成長的速度,
  • 1:35 - 1:37
    以及眾多不同的資料類型。
  • 1:37 - 1:40
    我略舉幾個例子:
  • 1:40 - 1:42
    圖像、
  • 1:42 - 1:46
    文字、
    [請稍候,直到你有用處的時候,謝謝。]
  • 1:46 - 1:48
    影片、
  • 1:48 - 1:50
    聲音。
  • 1:50 - 1:53
    這些不同資料類型的共通處在於
  • 1:53 - 1:55
    它們都是人建立的,
  • 1:55 - 1:58
    也都不能斷章取義來詮釋。
  • 1:58 - 2:00
    舉例,有一個資料科學家小組,
  • 2:00 - 2:02
    成員來自伊利諾大學芝加哥分校,
  • 2:02 - 2:05
    這小組叫做「衛生媒體合作實驗室」。
  • 2:05 - 2:08
    他們和美國疾病管制中心合作,
  • 2:08 - 2:09
    想要更了解
  • 2:09 - 2:12
    人們怎樣談論戒菸、
  • 2:12 - 2:15
    怎樣談論電子香煙,
  • 2:15 - 2:18
    以及怎樣一起幫助吸菸者戒菸。
  • 2:19 - 2:19
    有趣的是,
  • 2:19 - 2:23
    若要了解人們如何談論抽菸 smoking,
  • 2:23 - 2:27
    就要先了解人們說 smoking 是什麼意思。
  • 2:27 - 2:31
    在推特上大致分成四類:
  • 2:31 - 2:34
    第一類,抽菸;
  • 2:34 - 2:37
    第二類,抽大麻;
  • 2:37 - 2:40
    第三類,煙熏肋排;
  • 2:40 - 2:43
    第四類,嗆辣正妹;
  • 2:43 - 2:46
    (觀眾笑聲)
  • 2:46 - 2:49
    接著要思考,
  • 2:49 - 2:51
    人們怎麼談論電子香菸?
  • 2:51 - 2:54
    講法五花八門,
  • 2:54 - 2:56
    就像這張投影片所列的,
  • 2:56 - 2:59
    這種檢索非常複雜。
  • 2:59 - 3:01
    這提醒我們,
  • 3:01 - 3:04
    語言是人創造的,
  • 3:04 - 3:06
    而人是複雜、亂無章法的,
  • 3:06 - 3:09
    我們會用隱喻、俚語、行話,
  • 3:09 - 3:12
    無時無刻的製造,各式各樣的語言,
  • 3:12 - 3:15
    好不容易破解語言,就立刻又改變了。
  • 3:15 - 3:20
    那麼,疾管中心拍的這些戒菸文宣,
  • 3:20 - 3:24
    電視廣告裡,一名女子喉嚨破了大洞,
  • 3:24 - 3:27
    畫面驚悚嚇人,
  • 3:27 - 3:29
    這些廣告真的有效嗎?
  • 3:29 - 3:31
    真的讓人戒菸了嗎?
  • 3:31 - 3:35
    衛生媒體合作實驗室尊重其數據的限制,
  • 3:35 - 3:37
    但仍能做出結論,
  • 3:37 - 3:40
    認為這些廣告—也許你們看過,
  • 3:40 - 3:44
    成功地刺激人們開始反省,
  • 3:44 - 3:48
    可能影響未來的行為。
  • 3:48 - 3:52
    這個計畫讓我最欽佩、欣賞的地方是,
  • 3:52 - 3:57
    除了它是在解決人的實際需要以外,
  • 3:57 - 4:00
    同時它提供了絕佳的典範,
  • 4:00 - 4:05
    展現了人類面對瑣碎汪洋的勇氣。
  • 4:05 - 4:10
    所以,詮釋的挑戰不只因為資料龐大,
  • 4:10 - 4:14
    因為,老實說,歷史上有很多的例子顯示,
  • 4:14 - 4:17
    無論資料再少,我們向來很能把它搞砸。
  • 4:17 - 4:21
    大家可能記得,很多年前,
  • 4:21 - 4:24
    前總統雷根曾被痛罵,
  • 4:24 - 4:29
    因為他說,事實是愚笨的東西。
  • 4:29 - 4:31
    憑良心說,他只是一時口誤,
  • 4:31 - 4:34
    他其實是想引用約翰.亞當斯在
  • 4:34 - 4:37
    為因波士頓慘案受審的英軍辯護時說的:
  • 4:37 - 4:40
    事實是固執難拗、不容改變的。
  • 4:40 - 4:42
    但我其實認為,
  • 4:42 - 4:46
    這口誤可能湊巧講出幾分智慧,
  • 4:46 - 4:48
    因為事實確實很固執,
  • 4:48 - 4:51
    但是有時也真的很愚笨。
  • 4:51 - 4:53
    我要講一個自己的故事,
  • 4:53 - 4:57
    解釋為什麼這對我這麼重要。
  • 4:57 - 4:59
    我要先吸一口氣。
  • 4:59 - 5:02
    我兒子艾薩克兩歲的時候,
  • 5:02 - 5:04
    被診斷為自閉兒。
  • 5:04 - 5:07
    但他是個快樂、搞笑、
  • 5:07 - 5:09
    有愛心、喜歡親密的孩子,
  • 5:09 - 5:12
    但是他的發展評估測驗數據
  • 5:12 - 5:13
    檢視的是:
  • 5:13 - 5:16
    他當時會說幾個字?零個。
  • 5:17 - 5:19
    只靠手勢溝通,
  • 5:19 - 5:21
    眼神接觸也極少,
  • 5:21 - 5:23
    讓他的發展程度
  • 5:23 - 5:27
    被評為九個月大的嬰兒。
  • 5:27 - 5:30
    按照數據,診斷並沒有錯,
  • 5:30 - 5:33
    卻跟實際狀況有落差。
  • 5:33 - 5:37
    大概過了一年半,兒子快滿四歲,
  • 5:37 - 5:39
    有一天,我看到他坐在電腦前面,
  • 5:39 - 5:45
    在用 Google 搜尋女性的照片,
  • 5:45 - 5:48
    他把女性 (women) 拼成 "w-i-m-e-n"。
  • 5:48 - 5:51
    我的反應跟任何偏執妄想的父母一樣,
  • 5:51 - 5:53
    立刻開始按瀏覽器的「返回」按鈕,
  • 5:53 - 5:56
    看看他還搜尋過什麼。
  • 5:56 - 5:59
    結果發現他依序搜尋過:男性 (men)、
  • 5:59 - 6:02
    學校 (school)、公車 (bus)、
  • 6:02 - 6:06
    和電腦(錯拼成 cpyutr)。
  • 6:06 - 6:08
    我很吃驚,
  • 6:08 - 6:10
    因為我們根本不知道他會拼字,
  • 6:10 - 6:11
    更別說閱讀。
  • 6:11 - 6:14
    所以我問他:
    「艾薩克,你怎麼辦到的?」
  • 6:14 - 6:16
    他認真的看著我,說:
  • 6:16 - 6:20
    「在搜尋欄裡打字啊!」
  • 6:20 - 6:23
    他在教自己溝通,
  • 6:23 - 6:26
    只是我們都找錯方向了。
  • 6:26 - 6:28
    會發生這種情況,
  • 6:28 - 6:31
    是因為評量和分析太重視單一面向,
  • 6:31 - 6:34
    就像他的自閉症評量,
    單看口語表達,
  • 6:34 - 6:36
    而忽視其他要素,
  • 6:36 - 6:38
    例如,創造性地解決問題。
  • 6:39 - 6:42
    溝通對艾薩克來說很困難,
  • 6:42 - 6:44
    所以他找到了替代方法,
  • 6:44 - 6:47
    來找解答。
  • 6:47 - 6:48
    想想很有道理,
  • 6:48 - 6:53
    因為問問題是很複雜的過程,
  • 6:53 - 6:56
    但他只要在搜尋欄輸入一個字,
  • 6:56 - 6:59
    就成功了一大半。
  • 6:59 - 7:03
    於是這個小小的時刻
  • 7:03 - 7:05
    對我影響深遠,
  • 7:05 - 7:07
    對我們全家都是。
  • 7:07 - 7:10
    因為,這改變了我們的判斷標準,
  • 7:10 - 7:12
    用全新的眼光看待兒子的狀況,
  • 7:12 - 7:14
    比較不那麼擔憂,
  • 7:14 - 7:17
    轉而欣賞他解決問題的能力。
  • 7:17 - 7:20
    事實,真的是愚笨的。
  • 7:20 - 7:23
    事實也很容易被誤用,
  • 7:23 - 7:24
    不論是有心或無意。
  • 7:24 - 7:27
    我的朋友艾蜜莉.威靈漢是個科學家,
  • 7:27 - 7:30
    她不久前為《富比士》寫了一篇文章,
  • 7:30 - 7:34
    叫做〈 自閉症怪異印象十大排行榜〉,
  • 7:34 - 7:37
    內容挺可怕的:
  • 7:37 - 7:40
    「網路」,萬惡淵藪,對吧?
  • 7:40 - 7:43
    當然「媽媽」也上榜,
  • 7:43 - 7:44
    不言自明。
  • 7:44 - 7:46
    等等,還有,
  • 7:46 - 7:49
    這裡有一大類,都跟「媽媽」有關係,
  • 7:49 - 7:54
    你可以看到,原因很多、很有意思。
  • 7:54 - 7:56
    我最喜歡的是
  • 7:56 - 8:00
    「在高速公路附近受孕」。
  • 8:00 - 8:01
    最後一項很有趣,
  • 8:01 - 8:04
    因為「冰箱母親」這個封號
  • 8:04 - 8:08
    是自閉症原因最早的假說,
  • 8:08 - 8:11
    用來描述冷漠沒有愛心的母親。
  • 8:11 - 8:13
    現在,你可能會想:
  • 8:13 - 8:14
    「好了,蘇珊,我們懂了,
  • 8:14 - 8:16
    你可以對資料做任何詮釋。」
  • 8:16 - 8:19
    這也沒錯,
  • 8:19 - 8:21
    絕對正確。
  • 8:21 - 8:25
    但是挑戰在於,
  • 8:26 - 8:29
    我們自己有這個機會,
  • 8:29 - 8:31
    可以賦予資料意義,
  • 8:31 - 8:35
    因為老實說,資料不會自己產生意義。
  • 8:35 - 8:37
    我們才可以。
  • 8:37 - 8:40
    所以,身為商人、消費者、
  • 8:40 - 8:42
    病人、公民等等,
  • 8:42 - 8:45
    我想我們有責任
  • 8:45 - 8:47
    多花點時間
  • 8:47 - 8:50
    提升我們的批判性思考能力。
  • 8:50 - 8:51
    為什麼?
  • 8:51 - 8:56
    我們聽過很多次,
    因為在歷史的這一刻,
  • 8:56 - 9:00
    已經能用光速
    處理數十億 GB 的資料量,
  • 9:00 - 9:05
    可能更快速、更有效地
    做出錯誤的決定,
  • 9:05 - 9:09
    影響之大可能更甚以往。
  • 9:10 - 9:12
    這下好了,對吧?
  • 9:12 - 9:16
    所以,我們反而必須
  • 9:16 - 9:17
    多花時間
  • 9:17 - 9:20
    發展人文、
  • 9:20 - 9:23
    社會學和社會科學,
  • 9:23 - 9:26
    修辭、哲學、倫理,
  • 9:26 - 9:28
    因為這些知識
    構成我們的背景涵養,
  • 9:28 - 9:30
    對大數據非常重要,
  • 9:30 - 9:33
    也因為這能幫助我們更會思辨,
  • 9:33 - 9:36
    因為畢竟,
  • 9:36 - 9:39
    如果我能看出命題裡的問題,
  • 9:39 - 9:43
    那麼無論是
    用文字或數據表達都可以。
  • 9:43 - 9:46
    這表示,
  • 9:46 - 9:47
    要教育我們自己
  • 9:47 - 9:50
    去發覺各種確認的偏見
  • 9:50 - 9:52
    和謬誤的關聯,
  • 9:52 - 9:56
    並且能對赤裸裸的情感訴求保持警覺。
  • 9:56 - 9:58
    因為甲事之後發生了乙事,
  • 9:58 - 10:01
    並不代表
    甲事必定是乙事的肇因。
  • 10:01 - 10:03
    如果大家容我書呆一下,
  • 10:03 - 10:08
    羅馬人稱這現象為「後此謬誤」
    "post hoc ergo propter hoc",
  • 10:08 - 10:11
    後此,故因此。
  • 10:11 - 10:15
    這表示要質疑像人口統計這樣的方法。
  • 10:15 - 10:16
    為什麼?
  • 10:16 - 10:18
    因為這些都假設
    我們一定是某種人,
  • 10:18 - 10:21
    只憑我們的性別、年齡、居住地,
  • 10:21 - 10:24
    而忽視我們實際的思考和行為資料。
  • 10:24 - 10:26
    現在有了這些資料,
  • 10:26 - 10:29
    我們必須做好隱私權控管,
  • 10:29 - 10:33
    以及讓消費者自願參與。
  • 10:33 - 10:34
    再來,
  • 10:34 - 10:38
    我們必須很清楚我們的假設、
  • 10:38 - 10:41
    使用的方法,
  • 10:41 - 10:43
    以及我們對結果的信心。
  • 10:43 - 10:46
    就像我高中代數老師常說的:
  • 10:46 - 10:47
    「算給我看。
  • 10:47 - 10:51
    因為如果我不知道
    你做了哪些步驟,
  • 10:51 - 10:53
    就不知道哪些步驟你沒有做。
  • 10:53 - 10:55
    如果我不知道你問了哪些問題,
  • 10:55 - 10:58
    就不知道哪些問題你沒有問。」
  • 10:58 - 11:00
    這表示我們要問自己
  • 11:00 - 11:02
    最難的一個問題:
  • 11:02 - 11:05
    「數據資料真的有這樣說嗎?
  • 11:05 - 11:07
    還是這種結果讓我們覺得
  • 11:07 - 11:11
    比較成功和自在?」
  • 11:11 - 11:15
    衛生媒體合作實驗室在計畫結束時,
  • 11:15 - 11:19
    發現 87% 的推文
  • 11:19 - 11:23
    回應那些令人不安的戒菸廣告時,
  • 11:23 - 11:25
    表達了恐懼。
  • 11:25 - 11:26
    但是,
  • 11:26 - 11:30
    他們有說那些廣告讓人成功戒菸嗎?
  • 11:30 - 11:33
    沒有。這是科學,不是魔術。
  • 11:33 - 11:34
    所以,
  • 11:34 - 11:38
    如果想要釋放數據的力量,
  • 11:39 - 11:42
    我們不必盲目地踏進
  • 11:42 - 11:45
    歐威爾預見的極權主義未來,
  • 11:45 - 11:49
    或是赫胥黎的瑣碎世界,
  • 11:49 - 11:52
    或是兩者的可怕綜合體。
  • 11:52 - 11:54
    我們必須做的是,
  • 11:54 - 11:57
    重視批判性思考,
  • 11:57 - 12:01
    並且向衛生媒體合作室
    這樣的典範學習。
  • 12:01 - 12:04
    就像超級英雄電影常講的:
  • 12:04 - 12:06
    「讓我們把我們的力量用在正途。」
  • 12:06 - 12:07
    謝謝。
  • 12:07 - 12:10
    (觀眾掌聲)
Title:
我們應該拿這些大數據怎麼辦?
Speaker:
蘇珊‧艾特林格
Description:

你會因為某些數據,而覺得更自在、更成功嗎?那麼你的詮釋很可能有誤。在這個動人的演講,蘇珊‧艾特林格解釋為什麼擁有了更多資料,我們更要加強批判性思考能力。因為要超越單純的計算,達到真正的了解,是非常不容易的事。

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
12:23

Chinese, Traditional subtitles

Revisions Compare revisions