Google เปิดตัว Gemini 3.5 Live Translate แปลเสียงได้ 70 ภาษา

Google เปิดตัว Gemini 3.5 Live Translate แปลเสียงได้ 70 ภาษา

Google เปิดตัว Gemini 3.5 Live Translate โมเดล AI แปลเสียงแบบเรียลไทม์ 70 ภาษา รักษาน้ำเสียงผู้พูด พร้อมให้ใช้งานบน Google Meet และแอปฯ Translate แล้ววันนี้

SHORT CUT

  • Gemini 3.5 Live Translate รองรับมากกว่า 70 ภาษา สามารถแปลต่อเนื่องทันทีโดยไม่ต้องรอพูดจบประโยค และยังคงจังหวะรวมถึงน้ำเสียงดั้งเดิมของผู้พูดเอาไว้
  • ผู้ใช้ทั่วไปสามารถฟังเสียงแปลสดผ่านแอป Google Translate ได้ทันที ในขณะที่ฝั่งองค์กรสามารถใช้ประชุมข้ามภาษาบน Google Meet ได้มากกว่า 2,000 คู่ภาษา
  • Google ป้องกันปัญหาข้อมูลบิดเบือน ด้วยการฝังลายน้ำดิจิทัลลงในทุกเสียงที่ AI สร้างขึ้น เพื่อให้สามารถตรวจสอบแหล่งที่มาได้เสมอ

Google เปิดตัว Gemini 3.5 Live Translate โมเดล AI แปลเสียงแบบเรียลไทม์ 70 ภาษา รักษาน้ำเสียงผู้พูด พร้อมให้ใช้งานบน Google Meet และแอปฯ Translate แล้ววันนี้

Google ประกาศเปิดตัว Gemini 3.5 Live Translate โมเดล AI ด้านเสียงตัวล่าสุดที่เข้ามาปฏิวัติการแปลภาษาแบบเสียงต่อเสียง ให้เป็นไปอย่างราบรื่นแบบเรียลไทม์ โดยรองรับมากกว่า 70 ภาษาทั่วโลก

จุดเด่นสำคัญที่ทำให้ Gemini 3.5 Live Translate แตกต่างจากเดิม คือความสามารถในการแปลภาษาอย่างต่อเนื่องโดยไม่ต้องรอให้ผู้พูดพูดจบประโยค ช่วยลดความล่าช้าและช่องว่างของบทสนทนาที่มักทำให้รู้สึกสะดุด

CREDIT : Google

นอกจากนี้ ตัวโมเดลยังสามารถตรวจจับภาษาได้อัตโนมัติ และถ่ายทอดการแปลออกมาโดยยังคงรักษาระดับเสียง จังหวะการพูด และน้ำเสียงของผู้พูดต้นทางได้อย่างเป็นธรรมชาติ แม้จะอยู่ในสภาพแวดล้อมที่มีเสียงรบกวนก็ตาม

สำหรับการเปิดให้ใช้งาน Google ได้กระจายการเข้าถึงไปยังผู้ใช้งานหลากหลายกลุ่มอย่างครอบคลุม

กลุ่มผู้ใช้งานทั่วไป : สามารถใช้งานได้แล้ววันนี้ผ่านแอปพลิเคชัน Google Translate ทั้งบน iOS และ Android พร้อมไฮไลต์ฟีเจอร์ใหม่ 'Listening Mode' สำหรับผู้ใช้ Android ที่เปิดให้คุณสามารถยกโทรศัพท์แนบหูเพื่อฟังเสียงแปลสดๆ ได้ทันทีโดยไม่ต้องพึ่งพาหูฟัง

กลุ่มธุรกิจและองค์กร : เตรียมอัปเดตลงในแพลตฟอร์ม Google Meet ภายในเดือนนี้ โดยเพิ่มขีดความสามารถการแปลแบบข้ามภาษาได้มากกว่า 2,000 คู่ภาษา (จากเดิมที่แปลได้เพียง 5 ภาษาเท่านั้น) ยกระดับการประชุมระดับโลกให้ไร้พรมแดน

กลุ่มนักพัฒนา : เปิดให้ทดลองใช้งานแบบ Public Preview ผ่าน Gemini Live API และ Google AI Studio ซึ่งปัจจุบันแพลตฟอร์มและองค์กรชั้นนำอย่าง Grab ได้เริ่มทดสอบการใช้งานเพื่อช่วยให้คนขับและผู้โดยสารที่พูดต่างภาษากันสามารถสื่อสารผ่านสายเรียกเข้าได้อย่างไร้รอยต่อแล้ว

นอกจากความล้ำหน้าทางเทคโนโลยี Google ยังคงให้ความสำคัญกับความปลอดภัยทางดิจิทัล โดยเสียงที่ถูกสร้างขึ้นจาก AI ทั้งหมดจะถูกฝังลายน้ำดิจิทัล 'SynthID' ซึ่งไม่สามารถได้ยินด้วยหูเปล่า เพื่อป้องกันการนำไปใช้สร้างข้อมูลเท็จหรือข่าวปลอมในอนาคต

ที่มา : Google Blog

related