Return to Video

คอมพิวเตอร์เรียนรู้การมีความคิดสร้างสรรค์ได้อย่างไร

  • 0:01 - 0:04
    ผมเป็นหัวหน้าทีมที่กูเกิล
    ซึ่งทำงานเกี่ยวกับปัญญาประดิษฐ์
  • 0:04 - 0:09
    ซึ่งก็คือ สาขาหนึ่งทางวิศวกรรม
    ที่สร้างคอมพิวเตอร์ และอุปกรณ์ต่าง ๆ
  • 0:09 - 0:11
    ให้สามารถทำสิ่งที่สมองทำได้
  • 0:11 - 0:15
    และมันจึงทำให้พวกเรา
    รู้สึกสนใจสมองจริง ๆ
  • 0:15 - 0:16
    แล้วก็ประสาทวิทยาศาสตร์ด้วย
  • 0:16 - 0:20
    และโดยเฉพาะอย่างยิ่ง
    เราสนใจสิ่งที่สมองของพวกเราทำ
  • 0:20 - 0:24
    ที่ยังคงมีสมรรถนะเหนือกว่า
    คอมพิวเตอร์อย่างเทียบไม่ได้
  • 0:25 - 0:29
    ในอดีต หนึ่งในนั้นคือการรับรู้
  • 0:29 - 0:32
    กระบวนการที่ซึ่ง
    สิ่งต่าง ๆ ในโลกแห่งความเป็นจริง
  • 0:32 - 0:33
    อย่างเช่น เสียงและภาพ
  • 0:34 - 0:36
    สามารถแปรเปลี่ยน
    เป็นแนวคิดต่าง ๆ ในจิตใจ
  • 0:36 - 0:39
    นี่คือสิ่งสำคัญสำหรับสมองของพวกเรา
  • 0:39 - 0:41
    และมันยังค่อนข้างมีประโยชน์
    ต่อคอมพิวเตอร์อีกด้วย
  • 0:42 - 0:45
    อัลกอริธึมการรับรู้ของจักรกล
    อย่างเช่นที่ทีมของเราสร้างนั้น
  • 0:45 - 0:49
    เป็นอะไรที่ทำให้ภาพของคุณ
    สามารถถูกค้นหาได้บน Google Photos
  • 0:49 - 0:50
    ขึ้นอยู่กับว่าในภาพนั้นมีอะไรอยู่
  • 0:52 - 0:55
    อีกแง่มุมหนึ่งของการรับรู้
    ก็คือความคิดสร้างสรรค์
  • 0:55 - 0:58
    ซึ่งเป็นการเปลี่ยนแนวคิด
    ให้เป็นบางสิ่งที่เกิดขึ้นจริง
  • 0:58 - 1:02
    ช่วงปีที่ผ่านมา งานของพวกเรา
    เกี่ยวกับการรับรู้ของเครื่องจักร
  • 1:02 - 1:07
    จึงมีความเชื่อมโยงอย่างไม่คาดคิด
    กับโลกของความสร้างสรรค์ของเครื่องจักร
  • 1:07 - 1:08
    และศิลปะของเครื่องจักรอีกด้วย
  • 1:09 - 1:12
    ผมคิดว่าไมเคิลเเองเจลโล
    มีวิสัยทัศน์ที่เฉียบแหลม
  • 1:12 - 1:16
    ในเรื่องความสัมพันธ์ระหว่าง
    การรับรู้และความคิดสร้างสรรค์
  • 1:16 - 1:18
    นี่คือถ้อยคำที่โด่งดังของเขา
  • 1:18 - 1:21
    "ในหินทุกก้อนมีรูปปั้นอยู่ภายใน
  • 1:22 - 1:25
    และหน้าที่ของปฏิมากร
    ก็คือการค้นหามันให้เจอ"
  • 1:26 - 1:29
    ดังนั้น ผมคิดว่า
    สิ่งที่ไมเคิลเเองเจลโลหมายถึงก็คือ
  • 1:29 - 1:32
    เราสร้างสรรค์จากการรับรู้
  • 1:32 - 1:35
    และการรับรู้นั้นเอง
    ก็เป็นผลลัพธ์จากการจินตนาการ
  • 1:36 - 1:38
    และความคิดสร้างสรรค์
  • 1:39 - 1:43
    อวัยวะที่ทำทั้ง การคิด และ การรับรู้
    และการจินตนาการ
  • 1:43 - 1:44
    แน่นอน มันคือสมอง
  • 1:45 - 1:48
    และผมอยากที่จะเริ่มต้น
    ด้วยการพูดถึงประวัติศาสตร์คร่าว ๆ
  • 1:48 - 1:50
    เกี่ยวกับสิ่งที่พวกเรารู้เกี่ยวกับสมอง
  • 1:50 - 1:53
    เนื่องมันต่างจากหัวใจหรือลำไส้
  • 1:53 - 1:56
    เราไม่สามารถบอกอะไรได้มากนัก
    เกี่ยวกับสมองโดยแค่มองดูจากภายนอก
  • 1:56 - 1:58
    อย่างน้อยก็การมองด้วยตาเปล่า
  • 1:58 - 2:00
    นักกายวิภาคศาสตร์รุ่นบุกเบิกผู้ศึกษาสมอง
  • 2:00 - 2:04
    ได้ตั้งชื่อประหลาด ๆ ให้กับ
    เหล่าโครงสร้างภายนอก
  • 2:04 - 2:07
    เช่น ฮิปโปแคมปัส แปลว่า กุ้งจิ๋ว
  • 2:07 - 2:09
    แต่แน่นอนว่าสิ่งเหล่านั้น
    ไม่ได้บอกอะไรเรามากนัก
  • 2:09 - 2:12
    เกี่ยวกับสิ่งที่เกิดขึ้นจริง ๆ ภายในสมอง
  • 2:13 - 2:16
    ผมคิดว่าบุคคลแรกที่ได้พัฒนา
    ความเข้าใจอย่างลึกซึ้ง
  • 2:16 - 2:18
    ในสิ่งที่เกิดขึ้นจริง ๆ ในสมอง
  • 2:18 - 2:22
    ก็คือ ซานเตียโก รามอน อี กาฮาล
    นักประสาทกายวิภาคศาสตร์ชาวสเปน
  • 2:22 - 2:24
    ในศตวรรษที่ 19
  • 2:24 - 2:28
    เขาได้ใช้กล้องจุลทรรศน์และสีย้อมพิเศษ
  • 2:28 - 2:32
    ที่สามารถเลือกเติมเต็ม
    หรือแสดงผลแต่ละเซลล์ภายในสมอง
  • 2:32 - 2:34
    ที่ความคมชัดสูงได้
  • 2:34 - 2:37
    เพื่อที่จะให้เข้าใจถึงสัณฐานวิทยาของมัน
  • 2:38 - 2:41
    และนี่คือลักษณะภาพวาดของเขา
    ที่สร้างขึ้นจากเซลล์ประสาท
  • 2:41 - 2:42
    ในศตวรรษที่ 19
  • 2:42 - 2:44
    ภาพนี้สร้างขึ้นจากสมองนก
  • 2:44 - 2:47
    และคุณถึงเห็นความหลากหลาย
    ที่น่าเหลือเชื่อ ของเซลล์ประเภทต่าง ๆ
  • 2:47 - 2:51
    แม้แต่ทฤษฏีเซลล์เอง
    ก็ยังค่อนข้างใหม่ ณ จุดนี้
  • 2:51 - 2:52
    และโครงสร้างเหล่านี้
  • 2:52 - 2:54
    เซลล์เหล่านี้ที่มีการแตกแขนง
  • 2:54 - 2:57
    เหล่ากิ่งก้านที่สามารถแผ่ไป
    ได้ระยะไกลมาก ๆ
  • 2:57 - 2:58
    สิ่งนี้เป็นเรื่องใหม่มากในเวลานั้น
  • 2:59 - 3:02
    แน่นอนล่ะ มันทำให้นึกถึงสายไฟ
  • 3:02 - 3:05
    นั่นอาจจะเป็นเรื่องที่เห็นได้ชัด
    สำหรับบางคนในศตวรรษที่ 19
  • 3:05 - 3:10
    การปฏิวัติสายไฟและไฟฟ้าเพิ่งเริ่มเกิดขึ้น
  • 3:10 - 3:11
    แต่ในอีกหลายแง่
  • 3:11 - 3:14
    ภาพวาดจุลกายวิภาคศาสตร์เหล่านี้
    ของ รามอน อี กาฮาล อย่างภาพนี้
  • 3:15 - 3:17
    ในบางแง่มุม พวกเขาก็ยังคง
    ไม่สามารถเข้าใจได้ทุกอย่าง
  • 3:17 - 3:19
    มากกว่าศตวรรษที่ผ่านมา พวกเราก็ยังคง
  • 3:19 - 3:22
    พยายามทำงานที่ รามอน อี กาฮาล
    ได้เริ่มเอาไว้ให้สำเร็จ
  • 3:22 - 3:25
    นี่เป็นข้อมูลดิบ
    ที่ได้จากผู้ร่วมงานของเรา
  • 3:25 - 3:28
    ที่สถาบัน มักซ์ พลังค์
    ด้านประสาทวิทยาศาสตร์
  • 3:28 - 3:29
    และสิ่งที่ผู้ร่วมงานได้ทำ
  • 3:29 - 3:34
    คือถ่ายภาพเนื้อเยื่อสมองชิ้นเล็ก ๆ
  • 3:34 - 3:38
    ภาพตัวอย่างทั้งหมดที่แสดงนี้
    มีขนาดหนึ่งลูกบาศก์มิลลิเมตร
  • 3:38 - 3:40
    และสิ่งที่ผมกำลังแสดงให้คุณดูนี้
    คือชิ้นส่วนที่มีขนาดเล็กมาก ๆ
  • 3:40 - 3:43
    แถบทางฝั่งซ้าย
    มีขนาดประมาณหนึ่งไมครอน
  • 3:43 - 3:45
    โครงสร้างที่คุณเห็นคือไมโตคอนเดรีย
  • 3:45 - 3:47
    ที่มีขนาดเท่ากับแบคทีเรีย
  • 3:47 - 3:49
    และนี่คือภาพสไลด์ที่ต่อเนื่องกัน
  • 3:49 - 3:52
    ของก้อนเซลล์ที่เล็กจิ๋วนี้
  • 3:52 - 3:55
    แค่จะลองเทียบให้เห็นภาพนะครับ
  • 3:55 - 3:58
    เส้นผ่านศูนย์กลางเฉลี่ยของเส้นผม
    มีขนาด 100 ไมครอน
  • 3:58 - 4:01
    ดังนั้น เรากำลังมองดู
  • 4:01 - 4:02
    สิ่งที่เล็กกว่าเส้นผมมาก ๆ
  • 4:02 - 4:06
    และจากสไลด์ตามลำดับ
    กล้องจุลทรรศน์อิเล็กตรอนเหล่านี้
  • 4:06 - 4:11
    ทำให้สามารถเริ่มสร้างเซลล์ประสาท 3 มิติ
    ที่มีหน้าตาแบบนี้
  • 4:11 - 4:14
    ดังนั้น นี่ค่อนข้างจะมีรูปแบบ
    ที่เหมือนกับของ รามอน อิ กาฮาล
  • 4:14 - 4:16
    มีแค่บางเซลล์ประสาทที่ถูกทำให้สว่างขึ้น
  • 4:16 - 4:19
    เพราะไม่เช่นนั้นแล้ว
    เราอาจจะมองภาพอะไรไม่ออกเลย
  • 4:19 - 4:20
    มันคงดูหนาแน่นไปหมด
  • 4:20 - 4:21
    เต็มไปด้วยโครงสร้าง
  • 4:21 - 4:24
    ของเส้นสายการเชื่อมต่อกัน
    ของเซลล์ประสาทหนึ่งไปยังอีกเซลล์
  • 4:25 - 4:28
    รามอน อิ กาฮาล นั้นค่อนข้างจะ
    ล้ำยุคสมัยของเขา
  • 4:28 - 4:31
    และความก้าวหน้าในการทำความเข้าใจสมอง
  • 4:31 - 4:33
    ดำเนินไปอย่างช้า ๆ
    ในช่วงหลายทศวรรษถัดมา
  • 4:33 - 4:36
    แต่เรารู้ว่าเซลล์ประสาทใช้กระแสไฟฟ้า
  • 4:36 - 4:39
    และเมื่อถึงช่วงสงครามโลกครั้งที่ 2
    เทคโนโลยีของเราก็ก้าวหน้าเพียงพอ
  • 4:39 - 4:42
    ที่จะเริ่มทำการทดลองกระแสไฟ
    กับเซลล์ประสาทที่ยังมีชีวิตอยู่
  • 4:42 - 4:44
    เพื่อทำความเข้าใจให้มากขึ้น
    เกี่ยวกับการทำงานของเซลล์เหล่านั้น
  • 4:45 - 4:49
    นี่เป็นช่วงเวลาเดียว
    ที่คอมพิวเตอร์ได้ถูกประดิษฐ์ขึ้น
  • 4:49 - 4:52
    บนพื้นฐานของความคิด
    ที่สร้างแบบจำลองของสมอง --
  • 4:52 - 4:55
    ของ "จักกลปัญญา"
    อย่างที่ถูกเรียกโดย อลัน ทัวริง
  • 4:55 - 4:57
    หนึ่งในบิดาแห่งวิทยาการคอมพิวเตอร์
  • 4:58 - 5:03
    วอร์เรน แมคคัลลอช์ และ วอลเธอร์ พิทซ์
    ได้มองดูภาพร่างของ รามอน อิ กาฮาล
  • 5:03 - 5:04
    ของเปลือกสมองส่วนการมองเห็น
  • 5:04 - 5:05
    ซึ่งผมได้แสดงให้ชมอยู่นี้
  • 5:06 - 5:10
    นี่คือเปลือกสมองที่ประมวลผลภาพ
    ที่ถูกส่งมาจากดวงตา
  • 5:10 - 5:14
    และสำหรับพวกเขาแล้ว
    มันช่างดูเหมือนกับแผนภาพวงจร
  • 5:14 - 5:18
    มันมีรายละเอียดมากมายในแผนภาพวงจร
    ของ แมคคัลลอช์ และ พิทซ์
  • 5:18 - 5:20
    ที่ยังดูไม่ค่อยถูกต้อง
  • 5:20 - 5:21
    แต่พื้นฐานความคิดนี้
  • 5:21 - 5:25
    ที่ว่าเปลือกสมองส่วนการมองเห็น
    ทำงานเหมือนชุดองค์ประกอบเชิงคำนวณ
  • 5:25 - 5:28
    ที่ส่งผ่านข้อมูลจากจุดหนึ่ง
    ไปยังลำดับถัดไปนั้น
  • 5:28 - 5:29
    โดยพื้นฐานแล้วถูกต้อง
  • 5:29 - 5:32
    เรามาคุยกันก่อนสักพัก
  • 5:32 - 5:36
    เกี่ยวกับว่าโมเดลการประมวลข้อมูล
    การมองเห็นอะไรที่เราจำเป็นต้องสร้าง
  • 5:36 - 5:39
    งานพื้นฐานของการรับรู้
  • 5:39 - 5:43
    คือการรับภาพอย่างภาพนี้ และบอกว่า
  • 5:43 - 5:44
    "นั่นคือนก"
  • 5:44 - 5:47
    ซึ่งเป็นเรื่องที่ง่ายมาก
    สำหรับพวกเราที่ทำได้ด้วยสมอง
  • 5:47 - 5:51
    แต่คุณควรเข้าใจว่าสำหรับคอมพิวเตอร์
  • 5:51 - 5:54
    นี่เคยเป็นสิ่งที่แทบจะเป็นไปไม่ได้เลย
    ในไม่กี่ปีที่ผ่านมา
  • 5:54 - 5:56
    รูปแบบการคำนวณคลาสสิค
  • 5:56 - 5:58
    ไม่ใช่สิ่งที่จะทำงานแบบนี้ได้โดยง่าย
  • 5:59 - 6:02
    ดังนั้นสิ่งที่เกิดขึ้นระหว่างพิกเซล
  • 6:02 - 6:06
    ระหว่างภาพของนก กับคำว่า "นก" นั้น
  • 6:06 - 6:09
    โดยพื้นฐานแล้วก็คือ
    ชุดเซลล์ประสาทที่เชื่อมต่อระหว่างกัน
  • 6:09 - 6:10
    ในโครงข่ายประสาท
  • 6:10 - 6:11
    อย่างที่ผมแสดงให้เห็นนี้
  • 6:11 - 6:15
    โครงข่ายประสาทนี้อาจเป็นลักษณะทางชีวภาพ
    ภายในเปลือกสมองส่วนการเห็นของเรา
  • 6:15 - 6:17
    หรือ ปัจจุบัน เราเริ่มที่จะมีความสามารถ
  • 6:17 - 6:19
    ในการออกแบบโครงข่ายประสาท
    บนคอมพิวเตอร์
  • 6:20 - 6:22
    และผมจะแสดงให้คุณเห็น
    ว่าจริง ๆ แล้วมันมีหน้าตาอย่างไร
  • 6:22 - 6:26
    คุณสามารถพิจารณาพิกเซลว่าเป็นเหมือน
    ชั้นแรกของเซลล์ประสาท
  • 6:26 - 6:28
    และนั่น จริง ๆ แล้ว
    คือการทำงานภายในดวงตา --
  • 6:28 - 6:30
    นั่นคือ เซลล์ประสาทในจอตา
  • 6:30 - 6:31
    และสิ่งที่ส่งต่อ
  • 6:31 - 6:35
    ไปยังชั้นถัด ๆ ไป
    ของแต่ละชั้นของเซลล์ประสาท
  • 6:35 - 6:38
    ทั้งหมดถูกเชื่อมโยงกันด้วยไซแนป
    ที่ค่าถ่วงน้ำหนักต่าง ๆ กัน
  • 6:38 - 6:39
    พฤติกรรมของโครงข่ายนี้
  • 6:39 - 6:42
    มีลักษณะจากความสามารถ
    ของไซแนปเหล่านั้น
  • 6:42 - 6:46
    ลักษณะเหล่านั้นให้คุณสมบัติเชิงคำนวณ
    ของโครงข่ายนี้
  • 6:46 - 6:47
    ท้ายที่สุดแล้ว
  • 6:47 - 6:50
    คุณจะได้เซลล์ประสาท
    หรือกลุ่มเซลล์ประสาทเล็ก ๆ
  • 6:50 - 6:51
    ที่สว่างขึ้น เพื่อบอกว่า "นก"
  • 6:52 - 6:55
    ผมจะแทนค่า 3 สิ่งเหล่านั้น --
  • 6:55 - 7:00
    ค่าอินพุตพิกเซล
    และไซแนปในโครงข่ายประสาท
  • 7:00 - 7:01
    และนก ซึ่งคือค่าเอาต์พุต --
  • 7:01 - 7:04
    ด้วยสามตัวแปร: x, w และ y
  • 7:05 - 7:07
    อาจมีค่า x กว่าล้านค่า
  • 7:07 - 7:09
    หลายล้านพิกเซลในภาพนั้น
  • 7:09 - 7:11
    หลายพันล้าน หรือล้านล้าน ค่า w
  • 7:11 - 7:15
    ที่เป็นตัวแทนของค่าถ่วงน้ำหนัก
    ของไซแนปทั้งหมดในเซลล์ประสาท
  • 7:15 - 7:16
    และยังมีค่าจำนวนไม่มากของ y
  • 7:16 - 7:18
    ที่เป็นเอาต์พุตของโครงข่ายนั้น
  • 7:18 - 7:20
    "นก" มีแค่สี่ตัวอักษร [ในภาษาอังกฤษ]
    ใช่ไหมครับ
  • 7:21 - 7:25
    ดังนั้น ลองสมมติว่านี่เป็นแค่สูตรพื้นฐาน
  • 7:25 - 7:27
    x "x" w = y
  • 7:27 - 7:29
    ผมจะใส่ตัวคูณเข้าไปในเครื่องหมายคำพูด
  • 7:29 - 7:31
    เพราะว่าสิ่งที่เกิดขึ้นจริง ๆ แน่นอนว่า
  • 7:31 - 7:34
    มันเป็นชุดที่ซับซ้อน
    ของการปฏิบัติการทางคณิตศาสตร์
  • 7:35 - 7:36
    หนึ่งสมการนั้น
  • 7:36 - 7:38
    มีสามตัวแปร
  • 7:38 - 7:41
    และพวกเรารู้กันอยู่แล้วว่า ถ้ามีหนึ่งสมการ
  • 7:41 - 7:45
    คุณสามารถหาค่าตัวแปรหนึ่งได้
    หากรู้อีกสองตัว
  • 7:45 - 7:49
    ดังนั้น ปัญหาของการอนุมาน
  • 7:49 - 7:51
    ของการหาคำตอบว่าภาพนกนั้นคือนก
  • 7:51 - 7:53
    คือสิ่งนี้
  • 7:53 - 7:56
    มีจุดที่ไม่รู้ค่า y แต่รู้ค่า w และ x
  • 7:56 - 7:59
    คุณรู้โครงข่ายประสาท
    คุณรู้พิกเซล
  • 7:59 - 8:02
    อย่างที่คุณเห็น อันที่จริงแล้ว
    นั่นค่อนข้างเป็นปัญหาที่ตรงไปตรงมา
  • 8:02 - 8:04
    คุณเอาสองคูณสามก็จบ
  • 8:05 - 8:07
    ผมจะแสดงโครงข่ายประสาทประดิษฐ์
  • 8:07 - 8:09
    ที่พวกเราสร้างขึ้นให้คุณดู
    มันทำงานอย่างที่บอกไป
  • 8:10 - 8:12
    สิ่งนี้ทำงานแบบเรียลไทม์บนมือถือ
  • 8:13 - 8:16
    และนั่นก็เป็นสิ่งมหัศจรรย์ในตัวมันเอง
  • 8:16 - 8:19
    ที่มือถือสามารถทำงานได้
    หลายพันล้านล้านล้านปฏิบัติการ
  • 8:19 - 8:21
    ในหนึ่งวินาที
  • 8:21 - 8:22
    สิ่งที่คุณกำลังมองดูอยู่คือโทรศัพท์
  • 8:22 - 8:26
    ที่กำลังดูรูปนกตัวแล้วตัวเล่า
  • 8:26 - 8:29
    และไม่ใช่แค่กำลังบอกว่า
    "ใช่แล้ว นี่คือนก"
  • 8:29 - 8:32
    แต่มันยังแยกแยะสายพันธุ์ของนก
    ด้วยโครงข่ายลักษณะนี้
  • 8:33 - 8:35
    ดังนั้น ที่เห็นในรูปนั้น
  • 8:35 - 8:39
    เรารู้ค่า x และ w แต่ไม่รู้ค่า y
  • 8:39 - 8:41
    แน่นอนว่า ผมกำลังพูดผ่านส่วนที่ยากไป
  • 8:41 - 8:45
    ซึ่งก็คือ เรารู้ค่า w ได้อย่างไร
  • 8:45 - 8:47
    สมองสามารถทำแบบนั้นได้อย่างไร
  • 8:47 - 8:49
    เราถึงเรียนรู้โมเดลนั้นได้อย่างไร
  • 8:49 - 8:53
    นี่คือกระบวนการเรียนรู้ ในการหาค่า w
  • 8:53 - 8:55
    ถ้าเราเริ่มด้วยสมการพื้นฐาน
  • 8:55 - 8:57
    ที่เราพิจารณาสิ่งเหล่านี้ในรูปของตัวเลข
  • 8:57 - 9:00
    เรารู้อย่างแน่นอนว่าจะทำอย่างไร
    : 6 = 2 x w
  • 9:00 - 9:03
    เอาละ เราหารด้วยสองก็จบ
  • 9:04 - 9:06
    ปัญหาคือการปฏิบัติการนี้
  • 9:07 - 9:08
    ดังนั้น การหาร --
  • 9:08 - 9:11
    เราได้ใช้การหารเพราะว่า
    มันเป็นตัวผกผันกับการคูณ
  • 9:11 - 9:13
    แต่อย่างที่ผมเพิ่งจะพูดไป
  • 9:13 - 9:15
    การคูณค่อนข้างเป็นการหลอกลวง
  • 9:15 - 9:18
    สิ่งนี้ซับซ้อนมาก ๆ
    เป็นปฏิบัติการที่ไม่ใช่เชิงเส้น
  • 9:18 - 9:20
    มันไม่มีตัวผกผัน
  • 9:20 - 9:23
    ดังนั้นเราต้องหาทางคิดวิธีแก้สมการนี้
  • 9:23 - 9:25
    โดยไม่ใช้การหาร
  • 9:25 - 9:28
    และวิธีที่การนั้น
    ก็ค่อนข้างที่จะตรงไปตรงมา
  • 9:28 - 9:30
    ลองมาเล่นกับพีชคณิตกันสักเล็กน้อย
  • 9:30 - 9:33
    และย้ายเลขหกไปด้านซ้ายของสมการ
  • 9:33 - 9:35
    ตอนนี้เรายังคงใช้การคูณ
  • 9:36 - 9:39
    และเลขศูนย์นั้น --
    ลองคิดว่ามันเป็นเหมือนค่าผิดพลาด
  • 9:39 - 9:42
    อีกนัยหนึ่ง
    ถ้าเราแก้หาค่า w อย่างถูกต้อง
  • 9:42 - 9:43
    ค่าผิดพลาดก็จะเป็นศูนย์
  • 9:43 - 9:45
    และถ้าเราไม่ได้ทำอย่างถูกต้อง
  • 9:45 - 9:47
    ค่าผิดพลาดก็จะมากกว่าศูนย์
  • 9:47 - 9:51
    ดังนั้นในตอนนี้เราสามารถคาดเดา
    เพื่อลดค่าผิดพลาดลงให้น้อยที่สุด
  • 9:51 - 9:53
    และนั่นก็เป็นสิ่งที่คอมพิวเตอร์ถนัด
  • 9:53 - 9:55
    ดังนั้น คุณลองทายค่าเริ่มต้นดู
  • 9:55 - 9:56
    สมมติว่า w = 0?
  • 9:56 - 9:57
    ค่าผิดพลาดก็จะเป็น 6
  • 9:57 - 9:59
    แล้วถ้า w = 1 ล่ะ
    ค่าผิดพลาดก็จะเป็น 4
  • 9:59 - 10:01
    และถัดไปคอมพิวเตอร์
    ก็จะทำการเล่นมาร์โค โปโล
  • 10:01 - 10:04
    และลดค่าผิดพลาดให้เข้าใกล้ศูนย์
  • 10:04 - 10:07
    ขณะที่มันทำอย่างนั้น
    มันก็จะเข้าใกล้ค่าประมาณของ w
  • 10:07 - 10:11
    โดยพื้นฐาน มันหาค่านั้นไม่ได้หรอก
    แต่หลังจากหลายสิบขั้นตอน
  • 10:11 - 10:15
    เราก็จะได้ค่า w=2.999
    ซึ่งใกล้เคียงมากพอ
  • 10:16 - 10:18
    และนี่คือกระบวนการเรียนรู้
  • 10:18 - 10:21
    ดังนั้น จำไว้นะครับ
    ว่าสิ่งที่กำลังเกิดขึ้นอยู่นี้
  • 10:21 - 10:25
    เป็นการที่เรากำลังใช้
    ตัวแปร x และ y ที่รู้แล้วจำนวนมาก
  • 10:25 - 10:29
    และแก้หาค่า w ผ่านกระบวนการที่ทำซ้ำ ๆ
  • 10:29 - 10:32
    มันเป็นแนวทางเดียวกัน
    กับวิธีการที่เราทำการเรียนรู้
  • 10:32 - 10:35
    เรามีภาพเด็กทารกหลาย ๆ ภาพ
  • 10:35 - 10:37
    เราถูกสอนว่า"นี่คือนก นี่ไม่ใช่นก"
  • 10:38 - 10:40
    เมื่อเวลาผ่านไป ด้วยการทำซ้ำ ๆ
  • 10:40 - 10:43
    เราแก้หาค่า w
    เราแก้หาความสัมพันธ์ตามธรรมชาติของสิ่งนั้น
  • 10:43 - 10:48
    ดังนั้นตอนนี้ เรากำหนดค่า
    x และ w เอาไว้ เพื่อค้นหาค่า y
  • 10:48 - 10:49
    นั่นคือการเรียนรู้อย่างรวดเร็ว
    ในชีวิตประจำวัน
  • 10:49 - 10:51
    เรารู้ว่าจะหาค่า w ได้อย่างไร
  • 10:51 - 10:53
    นั่นคือการเรียนรู้ ซึ่งยากกว่ามาก
  • 10:53 - 10:55
    เพราะเราต้องการลดค่าผิดพลาดให้น้อยที่สุด
  • 10:55 - 10:57
    โดยการใช้ตัวอย่างในการฝึกเป็นจำนวนมาก
  • 10:57 - 11:00
    และประมาณปีที่แล้ว
    อเล็กซ์ มอร์ดวินเสฟ สมาชิกในทีมของเรา
  • 11:00 - 11:04
    ตัดสินใจทดลองว่าจะเกิดอะไรขึ้น
    ถ้าเราพยายามแก้หาค่า x
  • 11:04 - 11:06
    โดยให้ค่า w และ y ที่รู้แล้วมา
  • 11:06 - 11:07
    อีกแง่หนึ่งคือ
  • 11:07 - 11:09
    คุณรู้ว่ามันเป็นนก
  • 11:09 - 11:12
    และคุณมีโครงข่ายประสาท
    ที่คุณได้ฝึกฝนเกี่ยวกับเรื่องนกมาแล้ว
  • 11:12 - 11:14
    แต่อะไรคือรูปของนก
  • 11:15 - 11:20
    มันกลายเป็นว่า
    ด้วยกระบวนการลดค่าผิดพลาดเดียวกัน
  • 11:20 - 11:24
    เราจะสามารถใช้โครงข่าย
    ที่ถูกฝึกฝนเพื่อจำแนกภาพนก
  • 11:24 - 11:27
    และผลลัพธ์ก็ออกมาเป็น...
  • 11:30 - 11:32
    ภาพของนก
  • 11:33 - 11:37
    นี่คือภาพนกที่ถูกสร้างขึ้น
    โดยโครงข่ายประสาททั้งหมด
  • 11:37 - 11:38
    ที่ถูกฝึกฝนเพื่อจำแนกภาพนก
  • 11:38 - 11:42
    แค่เพียงแก้หาค่า x แทนที่จะทำการหา y
  • 11:42 - 11:43
    และทำแบบนั้นซ้ำไปเรื่อย ๆ
  • 11:44 - 11:46
    นี่เป็นอีกตัวอย่างสนุก ๆ
  • 11:46 - 11:49
    นี่เป็นงานที่ถูกสร้าง
    โดยไมค์ ไทกา สมาชิกในกลุ่มของเรา
  • 11:49 - 11:51
    งานนี้ถูกเรียกว่า "ขบวนแห่สรรพสัตว์"
  • 11:51 - 11:54
    มันทำให้ผมนึกถึงงานศิลปะ
    ของ วิลเลียม เคนทริดจ์
  • 11:54 - 11:57
    ที่เขาร่างภาพ แล้วลบออก
  • 11:57 - 11:58
    ร่างภาพขึ้นมา แล้วลบออก
  • 11:58 - 12:00
    และสร้างสรรค์ภาพยนตร์ด้วยวิธีนี้
  • 12:00 - 12:01
    ในกรณีนี้
  • 12:01 - 12:04
    สิ่งที่ไมค์ทำก็คือเปลี่ยนค่า y เรื่อย ๆ
    บนพื้นที่ของสัตว์หลายชนิด
  • 12:04 - 12:07
    ในโครงข่ายที่ถูกออกแบบ
    ให้จดจำ และ แยกแยะ
  • 12:07 - 12:08
    สัตว์ที่แตกต่างกันออกจากกัน
  • 12:08 - 12:12
    และคุณจะได้รูปร่างประหลาด
    คล้ายภาพลวงตาของสัตว์ที่เปลี่ยนร่างได้
  • 12:14 - 12:19
    เขาและอเล็กซ์ได้พยายามลด
  • 12:19 - 12:22
    ค่า y ให้อยู่บนพื้นที่ของสองมิติ
  • 12:22 - 12:25
    ด้วยวิธีการสร้างแผนที่ขึ้นมา
    จากพื้นที่ของทุก ๆ สิ่ง
  • 12:25 - 12:27
    ที่ถูกจดจำด้วยโครงข่ายนี้
  • 12:27 - 12:29
    การทำการวิเคราะห์ประเภทนี้
  • 12:29 - 12:31
    หรือการสร้างภาพบนทั้งพื้นผิวนั้น
  • 12:31 - 12:34
    เปลี่ยนแปลงค่า y เหนือพื้นผิว
    คุณได้สร้างแผนที่ --
  • 12:34 - 12:37
    แผนที่ภาพของทุก ๆ สิ่ง ที่โครงข่ายประสาท
    รู้ว่าจะแยกแยะอย่างไร
  • 12:37 - 12:40
    สัตว์ทั้งหมดอยู่ที่นี่
    "ตัวนิ่ม" อยู่ตรงจุดนั้น
  • 12:41 - 12:43
    คุณสามารถทำอย่างนี้
    กับโครงข่ายประเภทอื่นได้ด้วย
  • 12:43 - 12:46
    นี่คือโครงข่ายที่ถูกออกแบบ
    ให้จดจำใบหน้า
  • 12:46 - 12:48
    เพื่อแยกแยะใบหน้าต่าง ๆ ออกจากกัน
  • 12:48 - 12:52
    และในที่นี้ เราได้ใส่ค่า y ที่บอกว่า "ฉัน"
  • 12:52 - 12:53
    พารามิเตอร์หน้าของผม
  • 12:53 - 12:55
    และเมื่อสิ่งนี้ค้นหาค่า x
  • 12:55 - 12:58
    มันสร้างสิ่งที่ค่อนข้างประหลาด
  • 12:58 - 13:02
    เหมือนกับภาพหลอน ๆ ของผม
    แนวศิลปะภาพแบบเหลี่ยม เหนือจริง
  • 13:02 - 13:04
    จากหลายมุมมองในครั้งเดียว
  • 13:04 - 13:07
    เหตุผลที่มันดูเหมือนการมองหลายมุม
    ในครั้งเดียวนั้น
  • 13:07 - 13:10
    เพราะว่าโครงข่ายนี้ถูกออกแบบ
    เพื่อกำจัดความคลุมเครือ
  • 13:10 - 13:13
    ของหน้าที่อยู่ในท่าการจัดวางที่แตกต่างกัน
  • 13:13 - 13:16
    ถูกมองด้วยการจัดแสงที่แตกต่างกัน
  • 13:16 - 13:18
    ดังนั้นเมื่อคุณทำการประกอบภาพใหม่
  • 13:18 - 13:21
    ถ้าคุณไม่ได้ใช้ภาพชี้แนะ
  • 13:21 - 13:22
    หรือการชี้แนะด้วยสถิติ
  • 13:22 - 13:26
    คุณก็จะได้ภาพที่ดูสับสนจากหลายมุมมอง
  • 13:26 - 13:27
    เนื่องจากมันมีความคลุมเครือ
  • 13:28 - 13:32
    นี่คือสิ่งที่เกิดขึ้น
    ถ้าอเล็กซ์ใช้ใบหน้าเขาเองเป็นภาพตัวชี้แนะ
  • 13:32 - 13:35
    ระหว่างกระบวนการหาผลลัพธ์ที่ดีที่สุด
    เพื่อประกอบภาพใบหน้าของผมขึ้นใหม่
  • 13:36 - 13:39
    คุณจะเห็นว่าว่ามันไม่สมบูรณ์แบบ
  • 13:39 - 13:41
    ยังคงมีงานอีกมากที่ต้องทำ
  • 13:41 - 13:43
    ในการทำอย่างไร
    เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด
  • 13:43 - 13:46
    แต่คุณเริ่มได้รับบางอย่าง
    ที่เหมือนใบหน้าที่สอดคล้องกันมากขึ้น
  • 13:46 - 13:48
    ที่ถูกแสดงผลโดยใช้ใบหน้าของผม
    ในการชี้แนะ
  • 13:49 - 13:51
    คุณไม่จำเป็นต้องเริ่มต้นจากผ้าใบว่างเปล่า
  • 13:51 - 13:53
    หรือด้วยสัญญาณรบกวนสีขาว ๆ
  • 13:53 - 13:54
    เมื่อคุณแก้เพื่อหาค่า x
  • 13:54 - 13:58
    คุณสามารถเริ่มต้นด้วย x
    ซึ่งตัวมันเองก็เป็นภาพอื่นอยู่แล้ว
  • 13:58 - 14:00
    นั่นคือสิ่งที่การสาธิตเล็ก ๆ นี้บอกคุณ
  • 14:00 - 14:05
    นี่คือโครงข่ายที่ถูกออกแบบจัดจำแนก
  • 14:05 - 14:08
    วัตถุจำพวกต่าง ๆ --
    โครงสร้างที่มนุษย์ทำขึ้น, สัตว์...
  • 14:08 - 14:10
    เรามาเริ่มต้นด้วย
    ภาพของกลุ่มก้อนเมฆ
  • 14:10 - 14:12
    และเมื่อเราหาผลลัพธ์ที่ดีที่สุด
  • 14:12 - 14:17
    โดยพื้นฐาน โครงข่ายนี้กำลังหาว่า
    มันเห็นอะไรในกลุ่มเมฆ
  • 14:17 - 14:19
    และยิ่งคุณใช้เวลาในการมองภาพนี้
    มากขึ้นเท่าไร
  • 14:19 - 14:22
    คุณก็ยิ่งเห็นสิ่งต่างในกลุ่มเมฆ
    มากขึ้นเท่านั้น
  • 14:23 - 14:26
    คุณยังสามารถใช้โครงข่ายใบหน้า
    เพื่อให้เห็นภาพหลอนแบบนี้
  • 14:26 - 14:28
    และคุณได้อะไรประหลาด ๆ ออกมา
  • 14:28 - 14:29
    (เสียงหัวเราะ)
  • 14:30 - 14:33
    หรือ ไมค์ได้ทำการทดลองอื่น
  • 14:33 - 14:37
    ซึ่งเขานำภาพกลุ่มเมฆนั้น
  • 14:37 - 14:41
    เห็นภาพหลอน ขยาย เห็นภาพหลอน
    ขยาย เห็นภาพหลอน ขยาย
  • 14:41 - 14:42
    อย่างที่เห็น
  • 14:42 - 14:45
    คุณสามารถได้สภาวะขาดความควบคุม
    ของโครงข่ายผมว่านะ
  • 14:46 - 14:49
    หรือประมาณว่าความเกี่ยวข้องอิสระ
  • 14:49 - 14:51
    ซึ่งโครงข่ายกำลังกินหางของมันเอง
  • 14:51 - 14:55
    ดังนั้น รูปภาพทุกรูป
    ตอนนี้เป็นพื้นฐานสำหรับ
  • 14:55 - 14:56
    "ต่อไปผมจะเห็นอะไรนะ
  • 14:56 - 14:59
    ต่อไปผมจะเห็นอะไรนะ
    ต่อไปผมจะเห็นอะไรนะ"
  • 14:59 - 15:02
    ผมแสดงสิ่งนี้เป็นครั้งแรกในที่สาธารณะ
  • 15:02 - 15:08
    ให้กับกลุ่มที่ฟังบรรยายในซีแอตเทิล
    ที่เรียกว่า "การศึกษาระดับอุดมศึกษา" --
  • 15:08 - 15:10
    นี้เป็นตอนหลังจากที่กัญชา
    ถูกทำให้ถูกต้องตามกฎหมายแล้ว
  • 15:10 - 15:13
    (เสียงหัวเราะ)
  • 15:15 - 15:17
    ผมอยากจะสรุปแบบรวดเร็ว
  • 15:17 - 15:21
    ด้วยการเน้นว่าเทคโนโลยีนี้ไม่ได้ถูกจำกัด
  • 15:21 - 15:25
    ผมได้แสดงให้คุณเห็นตัวอย่างที่เห็นได้
    เพราะมันสนุกที่จะได้เห็น
  • 15:25 - 15:27
    มันไม่ได้เป็นเทคโนโลยีที่มองเห็นได้เท่านั้น
  • 15:27 - 15:29
    ศิลปินผู้ประสานงานของเรา รอสส์ กู๊ดวิน
  • 15:29 - 15:33
    ได้ทำการทดลองที่เกี่ยวข้องกับ
    กล้องที่ถ่ายภาพ
  • 15:33 - 15:37
    และจากนั้นคอมพิวเตอร์ในกระเป๋าของเขา
    ได้เขียนบทกวีด้วยโครงข่ายประสาท
  • 15:37 - 15:39
    จากเนื้อหาของรูปภาพ
  • 15:39 - 15:42
    และโครงข่ายประสาทบทกวีนั้นก็ถูกฝึกฝน
  • 15:42 - 15:44
    จากส่วนสำคัญของบทกวีศตวรรษที่ 20
  • 15:44 - 15:46
    และอย่างที่เห็นบทกวีมันก็
  • 15:46 - 15:48
    ผมว่า ที่จริงก็ไม่ได้แย่สักเท่าไหร่
  • 15:48 - 15:49
    (เสียงหัวเราะ)
  • 15:49 - 15:50
    ก่อนจากลาจากกัน
  • 15:50 - 15:53
    ผมคิดว่าตามที่ไมเคิลแองเจลโลกล่าว
  • 15:53 - 15:54
    ผมว่าเขาพูดถูกต้อง
  • 15:54 - 15:57
    การรับรู้และความคิดสร้างสรรค์
    มีความเชื่อมโยงกันอย่างใกล้ชิดมาก
  • 15:58 - 16:00
    สิ่งที่พวกเราเพิ่งได้เห็นไป
    คือโครงข่ายประสาท
  • 16:00 - 16:03
    ที่ทั้งหมดถูกฝึกฝนโดยเพื่อแยกแยะ
  • 16:03 - 16:05
    หรือเพื่อจดจำสิ่งต่าง ๆ ในโลกนี้
  • 16:05 - 16:08
    ซึ่งสามารถที่จะทำงานย้อนกลับ
    เพื่อทำการสร้างสรรค์ได้
  • 16:08 - 16:10
    สิ่งหนึ่งที่มันบอกกับผมก็คือ
  • 16:10 - 16:12
    ไม่ใช่แค่ไมเคิลแองเจลโลเห็นจริง ๆ
  • 16:12 - 16:15
    ว่าประติมากรรมอยู่ในก้อนหิน
  • 16:15 - 16:18
    แต่ทุกคน ทุกสิ่งมีชีวิต
    ทั้งในโลกหรือนอกโลก
  • 16:18 - 16:22
    ที่สามารถรับรู้หรือการทำงาน
    อะไรทำนองนั้นได้
  • 16:22 - 16:23
    ก็ย่อมสามารถที่จะสร้างสรรค์ได้
  • 16:23 - 16:27
    เพราะมันเป็นกลไกเดียวกัน
    ที่ถูกใช้ในทั้งสองกรณี
  • 16:27 - 16:31
    นอกจากนี้ ไม่ว่าจะอย่างไรก็ตาม
    ผมคิดว่าการรับรู้และความคิดสร้างสรรค์
  • 16:31 - 16:33
    ไม่ได้เป็นเอกลักษณ์
    ที่มีแต่เฉพาะในมนุษย์เท่านั้น
  • 16:33 - 16:36
    พวกเราเริ่มมีโมเดลคอมพิวเตอร์
    ที่สามารถทำสิ่งเดียวกันนี้ได้
  • 16:36 - 16:40
    และนั่นไม่ควรที่จะเป็นเรื่องน่าประหลาดใจ;
    สมองมีการคำนวณแบบคอมพิวเตอร์
  • 16:40 - 16:41
    และท้ายที่สุด
  • 16:41 - 16:46
    คอมพิวเตอร์เริ่มต้นจากความพยายาม
    ในการออกแบบเครื่องจักรที่มีความฉลาด
  • 16:46 - 16:48
    มันถูกสร้างขึ้นจากความคิดที่ว่า
  • 16:48 - 16:51
    เราจะสร้างเครื่องจักร
    ให้เฉลียวฉลาดได้อย่างไร
  • 16:52 - 16:54
    และท้ายที่สุด
    เราเริ่มที่จะเติมเต็มความคิดนั้น
  • 16:54 - 16:56
    คำสัญญาบางอย่างของผู้ริเริ่มยุคแรก
  • 16:56 - 16:58
    ของทัวริง และ ฟอน นอยมันน์
  • 16:58 - 17:00
    และ แมคคัลลอช์ และ พิทซ์
  • 17:00 - 17:04
    และผมคิดว่าคอมพิวเตอร์
    ไม่ใช่แค่สำหรับการทำบัญชี
  • 17:04 - 17:06
    หรือการเล่นแคนดี้ครัช หรืออะไร
  • 17:06 - 17:09
    ตั้งแต่แรกเริ่ม พวกเราสร้างมันขึ้นมา
    ตามแบบสมองของเรา
  • 17:09 - 17:12
    แล้วพวกมันก็ทำให้เราสามารถเข้าใจ
    จิตใจของเราเองดีขึ้น
  • 17:12 - 17:14
    ทั้งยังทำให้เราเข้าใจพวกมันดีขึ้นด้วย
  • 17:15 - 17:16
    ขอบคุณมากครับ
  • 17:16 - 17:22
    (เสียงปรบมือ)
Title:
คอมพิวเตอร์เรียนรู้การมีความคิดสร้างสรรค์ได้อย่างไร
Speaker:
เบลอิเซ อะกัวรา อิ อาร์คัส (Blaise Agüera y Arcas)
Description:

พวกเราอยู่บนขอบของพรมแดนใหม่ในศิลปะและคววามคิดสร้างสรรค์ -- และมันไม่ใช่มนุษย์ Blaise Agüera y Arcas หัวหน้านักวิทยาศาสตร์ที่กูเกิลทำงานกับโครงข่ายปนะสาทเชิงลึกสำหรับการรับรู้ของเครื่องจักรและการกระจายการเรียนรู้ ในการสาธิตที่มีเสน่ห์นี้ เขาได้แสดงวิธีการเทรนโครงข่ายประสาทให้แยกแยะรูปภาพและสามารถดำเนินงานในทางย้อนกลับเพื่อการสร้างพวกมันขึ้นมาได้ ผลลัพธ์: น่าประทับใจ, ภาพหลอนปะติดปะต่อ (และบทกวี!) ที่ไม่สามารถแยกแยะได้ Agüera y Arcas กล่าวว่า "การรับรู้และความคิดสร้างสรรค์นั้นมีความเชื่อมโยงใกล้ชิดกันมาก" "ทุกคน ทุกสิ่งมีชีวิตที่สามารถมีการรับรู้ได้ ย่อมสร้างสรรค์ได้"

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
17:34
Kelwalin Dhanasarnsombut approved Thai subtitles for How we're teaching computers to be creative
Kelwalin Dhanasarnsombut accepted Thai subtitles for How we're teaching computers to be creative
Pitchaya Phookpun edited Thai subtitles for How we're teaching computers to be creative
Kelwalin Dhanasarnsombut declined Thai subtitles for How we're teaching computers to be creative
Kelwalin Dhanasarnsombut edited Thai subtitles for How we're teaching computers to be creative
Kelwalin Dhanasarnsombut edited Thai subtitles for How we're teaching computers to be creative
Kelwalin Dhanasarnsombut edited Thai subtitles for How we're teaching computers to be creative
Kelwalin Dhanasarnsombut edited Thai subtitles for How we're teaching computers to be creative
Show all

Thai subtitles

Revisions