Google แปลภาษาเรียลไทม์ด้วย AI ล้ำยุค!

นับครั้งไม่ถ้วนที่ฉันได้รับการสัญญาว่าจะได้พบกับสิ่งที่ยิ่งใหญ่ต่อไปในการแปลภาษาด้วยแอป ตั้งแต่ยุคเริ่มต้นของ Google Translate รู้สึกเหมือนบริษัทเทคโนโลยี (ไม่ใช่แค่ Google แต่รวมถึง Samsung และ Apple ด้วย) ต่างก็โปรยข่าวถึงอนาคตที่คำพูดจะถูกแปลภาษาแบบเรียลไทม์ได้ทันที ทำให้เกิดการสื่อสารที่แทบจะไร้รอยต่อระหว่างผู้คนจากทั่วโลก แต่ความจริงก็คือ อนาคตนั้น ถึงแม้จะดูน่าดึงดูดบนกระดาษ แต่ก็ไม่ได้เกิดขึ้นจริงอย่างที่คิด

แม้ว่าแอปจะมีความสามารถในการแปลคำพูดและข้อความได้อย่างแม่นยำ แต่ก็ยังไม่สามารถเทียบเท่าความเร็วและจังหวะของการสนทนาในชีวิตจริง การออกแบบเครื่องมือแปลภาษาให้ทันกับการพูดของเรา (เช่น การพูดจริงๆ) ไม่ใช่เรื่องง่าย เราพูดเร็ว และเราคาดหวังการตอบสนองที่เร็วยิ่งกว่า ทำให้การแปลสดไม่ใช่การวิ่งมาราธอน แต่เป็นการวิ่งระยะสั้น หรือพูดให้ถูกคือ เป็นการวิ่งระยะสั้นที่อาจยาวเท่ากับการวิ่งมาราธอนก็ได้

ด้วยคำมั่นสัญญาที่ยาวนานว่าจะได้พบกับการแปลภาษาแบบเรียลไทม์ที่รวดเร็ว มีประโยชน์ และใช้งานได้จริง ฉันจึงเคยชินกับการกลอกตาเล็กน้อยเมื่อการแปลสดถูกนำเสนอในงานเปิดตัว ซึ่งเป็นสิ่งที่ฉันทำในระหว่างงาน Pixel hardware ประจำปีของ Google แต่ในปีนี้ การกลอกตานั้นอาจไม่สมเหตุสมผล ในงาน Made by Google keynote Google ได้แสดงให้เห็นถึงฟีเจอร์ที่ไม่เพียงแต่แปลคำพูดของคุณในแบบเรียลไทม์เท่านั้น แต่ยัง deepfake เสียงจริงของคุณ (ในแบบเรียลไทม์ด้วยเช่นกัน) เพื่อให้คนที่อยู่อีกฝั่งได้ยินคุณพูดในภาษาแม่ของพวกเขา และใช่ มันใช้งานได้ในทางกลับกันด้วย นั่นคือ deepfake สองคนกำลังคุยกัน ไม่มีอะไรให้ดูหรอกทุกคน

และสิ่งที่น่าทึ่งยิ่งกว่าคือ Google มั่นใจในฟีเจอร์แปลสดใหม่ของพวกเขามาก จนถึงกับเสนอการสาธิตสด ซึ่งฉันจะไม่โกหก… มันทำออกมาได้ดีมาก Raymond Wong บรรณาธิการอาวุโสฝ่าย Consumer Tech ของ Gizmodo ได้บันทึกภาพเหตุการณ์ทั้งหมดไว้ในงาน Google เพื่อความบันเทิงของคุณ นี่คือเสียงของ Jimmy Fallon ที่ถูก deepfake เป็นภาษาสเปน:

Wow, Jimmy Fallon’s voice was translated—deepfaked—into Spanish on Pixel 10… and it worked fast and accurately. Even getting inflections correct. This is the quiet game-changing AI feature… translations pic.twitter.com/SAXeowCXpE

— Ray Wong (@raywongy) August 20, 2025

ฉันก็ดูอยู่จากที่บ้านเช่นกันในช่วงนี้ และคู่ของฉันซึ่งเป็นคนสเปนและพูดได้สองภาษา ยืนยันว่าฟีเจอร์แปลภาษาแบบเรียลไทม์ใหม่ของ Google ดูเหมือนจะทำได้ดีมาก ทั้งน้ำเสียงและทุกอย่าง อย่าเข้าใจผิด ฉันยังต้องการทดสอบฟีเจอร์การแปลเหล่านั้นด้วยตัวเอง แต่จากที่เห็น Google ก็เริ่มต้นได้อย่างน่าทึ่ง

สิ่งที่ขับเคลื่อนความสามารถในการแปลเหล่านั้นคือ Gemini Nano ซึ่งเป็นเวอร์ชันขนาดกะทัดรัดของโมเดลภาษาขนาดใหญ่ที่ Google พัฒนาขึ้นเรื่อยๆ และชิป Tensor G5 ของ Pixel 10 Google กล่าวว่าโมเดล Nano และฟีเจอร์การแปลทำงานบนอุปกรณ์ในกรณีนี้ ซึ่งหมายความว่าไม่มีอะไร รวมถึงการโทรของคุณ ถูกส่งไปยังคลาวด์ขณะที่คุณกำลังแปล นั่นทำให้ฟีเจอร์ใหม่นี้ดูไม่น่าขนลุกเท่าไหร่ และฉันพูดว่า “ไม่น่า” ในกรณีนี้ เพราะเอาจริงๆ แล้ว สิ่งนี้ก็ยัง deepfake เสียงของคุณอยู่ดี

จริงๆ แล้ว ถ้าฟีเจอร์การแปลใหม่ของ Google ไม่ได้เกิดขึ้นบนอุปกรณ์ ฉันอาจจะกังวลเล็กน้อย ถึงแม้ว่ามันจะเจ๋งแค่ไหนก็ตาม การที่สำเนาเสียงของคุณถูกเก็บไว้บนเซิร์ฟเวอร์ที่ไหนสักแห่งเป็นเรื่องที่ไม่ดี เพราะผู้คนใช้ไบโอเมตริกซ์สำหรับการรักษาความปลอดภัยทางดิจิทัลที่สำคัญทุกประเภท รวมถึงการธนาคารด้วย และในทางหนึ่ง ไม่ว่าฟีเจอร์นี้จะอยู่บนอุปกรณ์หรือไม่ก็ตาม มันก็ยังน่าขนลุกอยู่ดี เห็นได้ชัดว่าเราอยู่ในขั้นตอนของ deepfake เสียงแบบทันที ลองจินตนาการดูว่า AI จะทำอะไรได้บ้างเมื่อมีเวลาและการฝึกฝนเล็กน้อย

แต่เหนือสิ่งอื่นใด ฉันรู้สึกประทับใจกับสิ่งที่ Google แสดงให้เห็นในวันนี้ โดยเฉพาะอย่างยิ่งในฐานะคนที่ได้เห็นบริษัทเทคโนโลยีให้สัญญาเกินจริงเกี่ยวกับฟีเจอร์การแปลมาหลายปีแล้ว ยังเร็วเกินไปที่จะบอกว่า Google ได้ค้นพบจอกศักดิ์สิทธิ์แห่งการแปลภาษาแบบเรียลไทม์แล้ว แต่สำหรับครั้งหนึ่ง ฉันก็คิดว่าแนวคิดของการแปลภาษาผ่านโทรศัพท์ที่ไร้รอยต่อได้ก้าวกระโดดไปข้างหน้าอย่างมาก ดังนั้น ถือว่าฉันยกเลิกการกลอกตาอย่างเป็นทางการนะ Google

แปลภาษาแบบเรียลไทม์: ก้าวกระโดดครั้งใหญ่ของ Google

อนาคตของการแปลภาษาแบบเรียลไทม์

Google ได้แสดงให้เห็นถึงศักยภาพที่น่าทึ่งของ AI ในการแปลภาษาแบบเรียลไทม์ สิ่งนี้อาจเปลี่ยนแปลงวิธีการสื่อสารของผู้คนทั่วโลก และเปิดโอกาสใหม่ๆ ในด้านธุรกิจ การศึกษา และความสัมพันธ์ส่วนตัว เราต้องติดตามดูกันต่อไปว่าเทคโนโลยีนี้จะพัฒนาไปในทิศทางใด และจะมีผลกระทบต่อสังคมอย่างไรบ้าง

ที่มา – Google’s Big Leap Forward for Real-Time Translations Is Deepfaking Your VoiceThe Pixel 10 makes Gemini-enabled deepfakes a pivotal feature of its new real-time translation features.

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *