SHORT CUT
Google ผสาน Gemini เข้ากับ Chrome มิติใหม่ผู้ช่วย AI อัจฉริยะที่ "มองเห็น" หน้าจอ สรุปข้อมูล ตอบคำถาม ค้นหาสิ่งต่างๆ บนเว็บได้ทันที นี่คืออนาคต AI ที่ใกล้เข้ามา
Google กำลังก้าวไปอีกขั้นในการพัฒนาปัญญาประดิษฐ์ (AI) ด้วยการผสาน Gemini ผู้ช่วย AI อัจฉริยะ เข้ากับเบราว์เซอร์ Chrome โดยตรง
ความเคลื่อนไหวนี้ถูกมองว่าเป็นก้าวสำคัญสู่ยุคที่ AI จะเข้ามามีบทบาทเชิงรุก (Agentic AI) สามารถปฏิบัติงานแทนผู้ใช้ได้มากขึ้น ซึ่ง Gemini ใน Chrome รุ่นทดลองนี้ ได้เริ่มแสดงศักยภาพให้เห็นแล้ว
ผู้ใช้งาน (ปัจจุบันจำกัดเฉพาะสมาชิกระดับ AI Pro หรือ AI Ultra และใช้ Chrome รุ่น Beta, Dev หรือ Canary) สามารถเรียกใช้ Gemini ผ่านปุ่มใหม่ที่มุมขวาบนของเบราว์เซอร์
จุดเด่นสำคัญคือ Gemini สามารถ "มองเห็น" และเข้าใจเนื้อหาที่กำลังแสดงอยู่บนหน้าจอในแท็บปัจจุบันได้ ผู้ทดลองใช้งานพบว่า Gemini สามารถสรุปบทความข่าวจากเว็บไซต์ต่างๆ นอกจากนี้ยังสามารถโต้ตอบด้วยเสียงผ่านฟีเจอร์ "Live" เพิ่มความสะดวกในการใช้งาน
ความสามารถในการวิเคราะห์เนื้อหาบนหน้าจอยังขยายไปถึงวิดีโอ YouTube โดย Gemini สามารถระบุเครื่องมือที่ถูกใช้ในวิดีโอสาธิตการซ่อมแซมบ้าน หรือชิ้นส่วนอิเล็กทรอนิกส์บนเมนบอร์ดได้อย่างแม่นยำ
รวมถึงสรุปเนื้อหาวิดีโอ หรือดึงสูตรอาหารจากคลิปสอนทำอาหาร ช่วยให้ผู้ใช้ไม่ต้องเสียเวลาจดหรือค้นหาลิงก์ด้วยตนเอง การค้นหาสินค้าบนหน้าเว็บ เช่น การชี้เป้ากระเป๋ากันน้ำบนหน้าผลการค้นหาของ Amazon ก็เป็นอีกหนึ่งความสามารถที่น่าประทับใจ
แม้จะมีประโยชน์หลายด้าน แต่ Gemini ใน Chrome ยังอยู่ในช่วงเริ่มต้นและมีข้อจำกัดอยู่บ้าง เช่น การจะให้ Gemini วิเคราะห์ข้อมูลส่วนใดส่วนหนึ่งของหน้าเว็บ ผู้ใช้จำเป็นต้องเลื่อนให้ส่วนนั้นปรากฏบนหน้าจอก่อน และยังสามารถประมวลผลได้ทีละแท็บเท่านั้น
บางครั้งคำตอบที่ได้ยังไม่สอดคล้องกันนัก เช่น การตอบคำถามเกี่ยวกับตำแหน่งปัจจุบัน หรือการให้ข้อมูลลิงก์สินค้า นอกจากนี้ รูปแบบการแสดงผลในหน้าต่างป๊อปอัปขนาดเล็กอาจไม่เพียงพอสำหรับคำตอบที่ยาว และการถามคำถามติดตามผลซ้ำๆ อาจสร้างความรำคาญได้บ้าง
อย่างไรก็ตาม ศักยภาพของ Gemini ใน Chrome นั้นมีสูงมาก ผู้ใช้งานเริ่มจินตนาการถึงอนาคตที่ AI จะสามารถทำงานที่ซับซ้อนขึ้น
เช่น การสั่งอาหารเดลิเวอรี่หลังจากสรุปเมนูร้านอาหาร การบุ๊กมาร์กหน้าเว็บที่เกี่ยวข้องกับการวางแผนท่องเที่ยว หรือการบันทึกวิดีโอสูตรอาหารไปยังเพลย์ลิสต์ส่วนตัวโดยอัตโนมัติ
ทิศทางนี้สอดคล้องกับวิสัยทัศน์ของ Google ที่ต้องการให้ AI มีความเป็น "Agentic" มากขึ้น สามารถจัดการงานหลายอย่างพร้อมกันและค้นหาข้อมูลเชิงรุกได้
ดังเช่นที่กำลังพัฒนาใน "Agent Mode" ของ Project Mariner สำหรับแอป Gemini ซึ่งคาดว่าจะถูกนำมาต่อยอดใน Gemini สำหรับ Chrome ในอนาคต เพื่อสร้างประสบการณ์ผู้ช่วย AI ที่สมบูรณ์แบบยิ่งขึ้น
ที่มา : The Verge