AI กับการจินตนาการถึงลูกบาศก์ลอยในอากาศ
นักวิทยาศาสตร์ AI ชั้นนำใน Big Tech กำลังมองหาแนวทางใหม่ในการสร้าง AI ระดับมนุษย์ Yann LeCun ชี้ว่าสิ่งที่เราต้องการไม่ใช่แบบจำลองภาษาขนาดใหญ่ (LLM) แต่เป็น “world models” หรือแบบจำลองโลก
LeCun หัวหน้านักวิทยาศาสตร์ AI ของ “fundamental AI research” ที่ Meta คาดว่าจะลาออกจาก Meta ในเร็ว ๆ นี้ ตามรายงานจากแหล่งข่าวที่น่าเชื่อถือ LeCun เป็นผู้อาวุโสวัย 65 ปีในโลกของวิทยาศาสตร์ AI และเขามีทรัพยากรมากมายในการทำงานในฐานะมันสมอง AI ที่บริษัทเทคโนโลยีที่ใหญ่ที่สุดแห่งหนึ่งของโลก
ทำไมเขาถึงออกจากบริษัทที่ใช้จ่ายอย่างฟุ่มเฟือย ดึงตัวผู้เชี่ยวชาญ AI ที่มีทักษะสูงจากบริษัทอื่น ๆ และจากการโพสต์บล็อกของ CEO Mark Zuckerberg ในเดือนกรกฎาคม ซึ่งอ้างว่ามีการพัฒนาที่น่าอัศจรรย์ภายในองค์กรจนมีการมองเห็น “superintelligence” อยู่ใกล้แค่เอื้อม?
จริง ๆ แล้วเขาได้บอกใบ้คำตอบมานานแล้ว เมื่อพูดถึงสติปัญญาระดับมนุษย์ LeCun กลายเป็นที่รู้จักกันดีในช่วงหลัง ๆ จากการกล่าวว่า LLM ที่เรารู้จักในปัจจุบันเป็นเพียงสิ่งที่ไม่คุ้มค่า ไม่ควรค่าแก่การติดตามต่อไป ไม่ว่า Big Tech จะขยายขนาดพวกมันมากแค่ไหนก็ตาม เขาเคยกล่าวไว้เมื่อเดือนเมษายนปีที่แล้วว่า “LLM เป็นเหมือนทางออกนอกเส้นทาง เป็นสิ่งเบี่ยงเบนความสนใจ เป็นทางตัน”
บทวิเคราะห์ใน Wall Street Journal เกี่ยวกับอาชีพของ LeCun ซึ่งเผยแพร่เมื่อวันศุกร์ ชี้ให้เห็นถึงความเป็นไปได้อื่น ๆ เกี่ยวกับเหตุผลในการลาออกของเขาเมื่อพิจารณาจากความเชื่อนี้ เมื่อช่วงซัมเมอร์ที่ผ่านมา Alexandr Wang วัย 28 ปี ผู้ร่วมสร้าง ChatGPT ซึ่งเป็นกระแสที่ขับเคลื่อนด้วย LLM ได้กลายเป็นหัวหน้าฝ่าย AI ที่ Meta ทำให้ผู้คลั่งไคล้ LLM กลายเป็นหัวหน้าของ LeCun และ Meta ได้นำนักวิทยาศาสตร์คนสำคัญอายุน้อยอีกคนหนึ่งชื่อ Shengjia Zhao เข้ามาทำงานเหนือ LeCun ในปีนี้ Meta ประกาศบทบาทใหม่ของ Zhao โดยกล่าวถึงความก้าวหน้าในการขยายขนาดที่เขาประสบความสำเร็จ LeCun กล่าวว่าเขาหมดศรัทธาในการขยายขนาดแล้ว
หากคุณสงสัยว่า LeCun เป็นหัวหน้านักวิทยาศาสตร์ได้อย่างไรในเมื่อ Zhao ก็เป็นหัวหน้านักวิทยาศาสตร์ด้วย นั่นเป็นเพราะการดำเนินการ AI ของ Meta ฟังดูเหมือนมีแผนผังองค์กรที่แปลกประหลาด ถูกแบ่งออกเป็นกลุ่มต่าง ๆ หลายร้อยคนถูกเลิกจ้างเมื่อเดือนที่แล้ว เห็นได้ชัดว่าพยายามที่จะแก้ไขปัญหาทั้งหมดนี้
รายงานของ Financial Times เกี่ยวกับ LeCun จากต้นสัปดาห์นี้ ชี้ให้เห็นว่า LeCun จะก่อตั้งสตาร์ทอัพที่มุ่งเน้นไปที่ “world models”
LeCun ไม่ได้ปิดบังเหตุผลที่เขาคิดว่า world models มีคำตอบที่ AI ต้องการ เขาให้รายละเอียดเกี่ยวกับการพูดเรื่องนี้ในการประชุมสุดยอด AI Action Summit ที่ปารีสเมื่อเดือนกุมภาพันธ์ แต่ถูกบดบังด้วย Vice President J.D. Vance ตัวแทนจากสหรัฐฯ ซึ่งกล่าวสุนทรพจกเกี่ยวกับวิธีการที่ทุกคนควรหลีกทางให้อเมริกาในเรื่อง AI
ตามที่ระบุไว้ในสุนทรพจน์ของเขา LeCun ซึ่งทำงานเกี่ยวกับแว่นตาอัจฉริยะ Meta AI แต่ไม่ได้มีส่วนร่วมอย่างมีนัยสำคัญใน Llama LLM ของ Meta เชื่อมั่นในอุปกรณ์สวมใส่
เราจะต้องโต้ตอบกับอุปกรณ์สวมใส่ในอนาคตราวกับว่าพวกมันเป็นคน LeCun คิด และ LLM ก็ไม่เข้าใจโลกเหมือนที่คนทั่วไปทำ เขาบอกว่า “เราไม่สามารถสร้างสติปัญญาของแมวหรือสติปัญญาของหนูได้เลย นับประสาอะไรกับสติปัญญาของสุนัข พวกมันสามารถทำสิ่งที่น่าทึ่งได้ พวกเขาเข้าใจโลกทางกายภาพ แมวบ้านใด ๆ ก็สามารถวางแผนการกระทำที่ซับซ้อนได้ และพวกเขามีแบบจำลองเชิงสาเหตุของโลก”
LeCun นำเสนอการทดลองทางความคิดเพื่อแสดงให้เห็นถึงสิ่งที่เขาคิดว่าอาจกระตุ้นให้เกิด world model ซึ่งเป็นสิ่งที่เขาคิดว่ามนุษย์ทุกคนสามารถทำได้อย่างง่ายดาย แต่ LLM ไม่สามารถทำได้:
“ถ้าฉันบอกคุณว่า ‘ลองจินตนาการถึงลูกบาศก์ลอยในอากาศต่อหน้าคุณ โอเค ตอนนี้หมุนลูกบาศก์นี้ 90 องศารอบแกนแนวตั้ง มันมีลักษณะอย่างไร’ มันเป็นเรื่องง่ายมากสำหรับคุณที่จะมีแบบจำลองทางจิตของลูกบาศก์ที่หมุนอยู่”
ด้วยความพยายามเพียงเล็กน้อย LLM สามารถเขียนบทกวีหยาบคายเกี่ยวกับลูกบาศก์ที่ลอยและหมุนได้อย่างแน่นอน แต่มันไม่สามารถช่วยให้คุณโต้ตอบกับมันได้จริง ๆ LeCun ยืนยันว่านี่เป็นเพราะความแตกต่างระหว่างข้อมูลข้อความและข้อมูลที่ได้จากการประมวลผลส่วนต่าง ๆ ของโลกที่ไม่ใช่ข้อความ ในขณะที่ LLM ได้รับการฝึกฝนเกี่ยวกับข้อความจำนวนมากซึ่งจะต้องใช้เวลา 450,000 ปีในการอ่าน LeCun กล่าวว่าเด็กอายุสี่ขวบที่ตื่นนอนมา 16,000 ชั่วโมงได้ประมวลผลด้วยสายตาหรือโดยการสัมผัสข้อมูลทางประสาทสัมผัสเกี่ยวกับโลก 1.4 x 10^14 ไบต์ ซึ่งเขาบอกว่ามากกว่า LLM
อย่างไรก็ตาม นี่เป็นเพียงการประมาณการที่ LeCun ให้ไว้ในการกล่าวสุนทรพจน์ของเขา และควรสังเกตว่าเขาได้ให้ข้อมูลอื่น ๆ ความเป็นนามธรรมที่ตัวเลขเหล่านั้นชี้ให้เห็นคือ LLM มีข้อจำกัดในแบบที่ LeCun คิดว่า world model จะไม่มี
LeCun ได้เริ่มทำงานเกี่ยวกับ world models ที่ Meta แล้ว รวมถึงการสร้างวิดีโอแนะนำที่ขอให้คุณจินตนาการถึงลูกบาศก์ที่หมุนอยู่
แบบจำลองในฝันของ LeCun ตามที่อธิบายไว้ในสุนทรพจน์ AI Action Summit ของเขามี “การประเมินสถานะของโลก” ในปัจจุบันในรูปแบบของการแสดงออกเชิงนามธรรมของทุกสิ่ง หรืออย่างน้อยทุกสิ่งที่เกี่ยวข้องในบริบทปัจจุบัน และแทนที่จะเป็นการคาดการณ์ตามลำดับและเป็นโทเค็น มัน “คาดการณ์สถานะของโลกที่จะเกิดขึ้นหลังจากที่คุณทำตามลำดับการกระทำนั้น”
LeCun กล่าวว่า world models จะช่วยให้นักวิทยาศาสตร์คอมพิวเตอร์ในอนาคตสามารถสร้าง “ระบบที่สามารถวางแผนการกระทำ ซึ่งอาจเป็นไปตามลำดับชั้น เพื่อให้บรรลุวัตถุประสงค์ และระบบที่สามารถให้เหตุผลได้” LeCun ยังยืนยันว่าระบบดังกล่าวจะมีคุณลักษณะด้านความปลอดภัยที่แข็งแกร่งยิ่งขึ้น เนื่องจากวิธีการที่เราควบคุมพวกมันจะถูกสร้างขึ้นในระบบเหล่านั้น แทนที่จะเป็นกล่องดำลึกลับที่พ่นข้อความออกมา และจะต้องได้รับการปรับแต่งโดยการปรับแต่งอย่างละเอียด
LeCun กล่าวว่าใน AI แบบคลาสสิก เช่น ซอฟต์แวร์ที่ใช้ในเครื่องมือค้นหา ปัญหาทั้งหมดสามารถลดทอนลงเป็นการเพิ่มประสิทธิภาพ World model ของเขา เขาแนะนำว่าจะดูสถานะปัจจุบันของโลกและแสวงหาความเข้ากันได้กับสถานะที่แตกต่างกันโดยการหาทางออกที่มีประสิทธิภาพ LeCun กล่าวในสุนทรพจน์ของเขาว่า “คุณต้องการฟังก์ชันพลังงานที่วัดความไม่ลงรอยกัน และเมื่อพิจารณาจาก x ให้หา y ที่มีพลังงานต่ำสำหรับ x นั้น”
อีกครั้ง นี่เป็นเพียงรายงานที่น่าเชื่อถือจากข้อมูลที่รั่วไหลเกี่ยวกับแผนการของ LeCun และเขายังไม่ได้ยืนยันด้วยซ้ำว่าเขากำลังก่อตั้งสิ่งใหม่ หากทุกสิ่งที่เราสามารถรวบรวมได้จากการแถลงการณ์ต่อสาธารณะของ LeCun ฟังดูไม่แน่นอนและคลุมเครือเล็กน้อยในระยะปัจจุบัน ก็ควรจะเป็นเช่นนั้น LeCun ฟังดูเหมือนเขามีเป้าหมายที่ยิ่งใหญ่ และเขากำลังผลักดันให้เกิดการระเบิดของความสามารถที่น่าทึ่งเหมือน ChatGPT อาจต้องใช้เวลานาน หรือตลอดไป ไม่ต้องพูดถึงเงินทุนจากนักลงทุนมหาศาล เพื่อให้สิ่งที่มีความโดดเด่นอย่างแท้จริงเกิดขึ้น
จินตนาการถึงลูกบาศก์ลอยในอากาศ
Gizmodo ได้ติดต่อ Meta เพื่อขอความคิดเห็นเกี่ยวกับว่างานของ LeCun เข้ากับพันธกิจ AI ของบริษัทได้อย่างไร และจะอัปเดตหากเราได้รับการติดต่อกลับ
World Models: ก้าวต่อไปของการพัฒนา AI ที่ต้อง จินตนาการถึงลูกบาศก์ลอยในอากาศ
โดยสรุป LeCun เชื่อว่าการพัฒนา AI ในอนาคตไม่ได้อยู่ที่การขยายขนาด LLM แต่เป็นการสร้างแบบจำลองโลกที่สามารถเข้าใจและโต้ตอบกับโลกแห่งความเป็นจริงได้เหมือนมนุษย์ การ จินตนาการถึงลูกบาศก์ลอยในอากาศ เป็นเพียงตัวอย่างหนึ่งของความสามารถที่ LLM ขาด และเป็นสิ่งที่ world models ตั้งเป้าที่จะแก้ไข การเปลี่ยนแปลงนี้อาจเป็นจุดเปลี่ยนสำคัญในการพัฒนา AI และนำไปสู่ระบบที่ฉลาด ปลอดภัย และใช้งานได้จริงมากขึ้น
ที่มา – ‘Imagine a Cube Floating in the Air’: The New AI Dream Allegedly Driving Yann LeCun Away from Meta