
SHORT CUT
Google เปิดตัว Gemini 3.5 Live Translate โมเดล AI แปลเสียงแบบเรียลไทม์ 70 ภาษา รักษาน้ำเสียงผู้พูด พร้อมให้ใช้งานบน Google Meet และแอปฯ Translate แล้ววันนี้
Google ประกาศเปิดตัว Gemini 3.5 Live Translate โมเดล AI ด้านเสียงตัวล่าสุดที่เข้ามาปฏิวัติการแปลภาษาแบบเสียงต่อเสียง ให้เป็นไปอย่างราบรื่นแบบเรียลไทม์ โดยรองรับมากกว่า 70 ภาษาทั่วโลก
จุดเด่นสำคัญที่ทำให้ Gemini 3.5 Live Translate แตกต่างจากเดิม คือความสามารถในการแปลภาษาอย่างต่อเนื่องโดยไม่ต้องรอให้ผู้พูดพูดจบประโยค ช่วยลดความล่าช้าและช่องว่างของบทสนทนาที่มักทำให้รู้สึกสะดุด
นอกจากนี้ ตัวโมเดลยังสามารถตรวจจับภาษาได้อัตโนมัติ และถ่ายทอดการแปลออกมาโดยยังคงรักษาระดับเสียง จังหวะการพูด และน้ำเสียงของผู้พูดต้นทางได้อย่างเป็นธรรมชาติ แม้จะอยู่ในสภาพแวดล้อมที่มีเสียงรบกวนก็ตาม
สำหรับการเปิดให้ใช้งาน Google ได้กระจายการเข้าถึงไปยังผู้ใช้งานหลากหลายกลุ่มอย่างครอบคลุม
กลุ่มผู้ใช้งานทั่วไป : สามารถใช้งานได้แล้ววันนี้ผ่านแอปพลิเคชัน Google Translate ทั้งบน iOS และ Android พร้อมไฮไลต์ฟีเจอร์ใหม่ 'Listening Mode' สำหรับผู้ใช้ Android ที่เปิดให้คุณสามารถยกโทรศัพท์แนบหูเพื่อฟังเสียงแปลสดๆ ได้ทันทีโดยไม่ต้องพึ่งพาหูฟัง
กลุ่มธุรกิจและองค์กร : เตรียมอัปเดตลงในแพลตฟอร์ม Google Meet ภายในเดือนนี้ โดยเพิ่มขีดความสามารถการแปลแบบข้ามภาษาได้มากกว่า 2,000 คู่ภาษา (จากเดิมที่แปลได้เพียง 5 ภาษาเท่านั้น) ยกระดับการประชุมระดับโลกให้ไร้พรมแดน
กลุ่มนักพัฒนา : เปิดให้ทดลองใช้งานแบบ Public Preview ผ่าน Gemini Live API และ Google AI Studio ซึ่งปัจจุบันแพลตฟอร์มและองค์กรชั้นนำอย่าง Grab ได้เริ่มทดสอบการใช้งานเพื่อช่วยให้คนขับและผู้โดยสารที่พูดต่างภาษากันสามารถสื่อสารผ่านสายเรียกเข้าได้อย่างไร้รอยต่อแล้ว
นอกจากความล้ำหน้าทางเทคโนโลยี Google ยังคงให้ความสำคัญกับความปลอดภัยทางดิจิทัล โดยเสียงที่ถูกสร้างขึ้นจาก AI ทั้งหมดจะถูกฝังลายน้ำดิจิทัล 'SynthID' ซึ่งไม่สามารถได้ยินด้วยหูเปล่า เพื่อป้องกันการนำไปใช้สร้างข้อมูลเท็จหรือข่าวปลอมในอนาคต
ที่มา : Google Blog