SHORT CUT
Google I/O งานประชุมนักพัฒนาซอฟต์แวร์ ประจำปี 2024 ครั้งนี้ Google (กูเกิล) เปิดตัวเครืองมือ AI เพียบ ต้อนรับการเข้าสู่ยุค Gemini อย่างสมบูรณ์ พร้อมสู้ค่ายคู่แข่งอย่าง OpenAI
Google I/O งานประชุมนักพัฒนาซอฟต์แวร์ ประจำปี 2024 ครั้งนี้ Google เปิดตัวเครืองมือ AI เพียบ ต้อนรับการเข้าสู่ยุค Gemini อย่างสมบูรณ์ พร้อมสู้ค่ายคู่แข่งอย่าง OpenAI
โดยในงาน Google I/O งานประชุมนักพัฒนาซอฟต์แวร์ครั้งใหญ่ ประจำปี 2024 โดยเป็นงานที่บริษัทจะประกาศผลิตภัณฑ์ตัวใหม่หรือโปรเจกต์ที่กำลังพัฒนา
และทางกูเกิ้ล ยังประกาศกร้าวว่า ณ เวลานี้ Google ได้เข้าสู่ยุค Gemini โดยสมบูรณ์แบบแล้ว พร้อมกับได้นำ AI ของตัวเองอย่าง Gemini ไปผสมผสานใช้ผลิตภัณฑ์ต่าง ๆ ของ Google
นอกจากนี้ Gemini 1.5 Flash ที่มีพื้นฐานจาก Gemini 1.5 Pro แต่เน้นความคล่องตัวในด้านการประมวลผลมากขึ้น พร้อมนำไปพัฒนาโครงการแอสตรา (Project Astra) ที่สื่อตั้งข้อสังเกตว่าการใช้งานในลักษณะเดียวกันกับ GPT-4o ของ OpenAI เรียกได้ว่าเป็นคู่แข่งกันแบบวัด หมัดต่อหมัดกันเลย
สำหรับ Gemini 1.5 Pro ซึ่งมาพร้อมกับความก้าวหน้าครั้งใหญ่ โดยสามารถรองรับการประมวลผลข้อมูลได้มากยิ่งขึ้น Gemini 1.5 Pro สามารถรองรับการประมวลผลข้อมูลจำนวนมากอย่างต่อเนื่องได้ถึง 1 ล้านโทเคน ไม่ว่าจะเป็นเอกสาร 1,500 หน้า หรือโค้ดที่ยาวกว่า 30,000 บรรทัด รองรับ 35 ภาษา ซึ่งมากกว่าโมเดลพื้นฐานขนาดใหญ่อื่นๆ ที่มีอยู่ในตอนนี้ นอกจากนี้ยังมีฟีเชอร์ใหม่ ๆ เช่น
• การอัปโหลดไฟล์ผ่าน Google Drive หรือจากอุปกรณ์เพื่อให้ผู้ใช้วิเคราะห์ข้อมูลเชิงลึกได้อย่างรวดเร็วยิ่งขึ้น และในเร็วๆ นี้ Gemini Advanced จะทำหน้าที่เป็นนักวิเคราะห์ข้อมูลเชิงลึก และสามารถแสดงข้อมูลผ่านภาพและแผนภูมิได้ทันทีจากไฟล์ข้อมูลที่อัปโหลด เช่น สเปรดชีต ที่สำคัญ Gemini จะรักษาความเป็นส่วนตัวให้กับไฟล์ และจะไม่นำข้อมูลเหล่านี้ไปใช้ในการฝึกโมเดลของเรา
• การวิเคราะข้อมูลจากรูปภาพ เช่น อัปโหลดรูปโจทย์เลขให้ Gemini ช่วยอธิบายวิธีแก้โจทย์ทีละขั้นตอน หรือให้ Gemini วิเคราะห์สูตรอาหารจานโปรดจากรูปที่ถ่ายตอนไปร้านอาหาร เช่น สามารถถ่ายรูปอาหารจานโปรดในร้านอาหารที่ผู้ใช้ชื่นชอบและขอสูตรอาหารนั้น หรือถ่ายภาพโจทย์คณิตศาสตร์และรับคำแนะนำวิธีแก้ปัญหาแบบทีละขั้นตอน ซึ่งทั้งหมดนี้สามารถทำได้โดยใช้เพียงรูปภาพเดียว
• Gemini Live พูดคุยตอบโต้กับ Gemini ผ่านมือถือ ใน Google Messages และขอความช่วยเหลือผ่านเสียงพูดได้อย่างเป็นธรรมชาติ โต้ตอบการสนทนาได้เหมือนปกติทั่วไป หรือการพูดแทรก
Veo โมเดลสร้างวิดีโอมืออาชีพ โดยเป็น บริการสร้างวิดีโอด้วยคำสั่ง (Prompt) ที่ปรับแต่งได้ โดยสร้างวิดีโอในรูปแบบภาพยนตร์ที่มีความละเอียดสูงสุด 1080p ซึ่งเชื่อว่าเปิดตัวมาเพื่อเอามาไฟต์ มาดวลกับ Sora ของ Open
ฟีเจอร์ Ask Photos ที่นำเอา Gemini มาช่วยค้นหารูปภาพในแบบที่เฉพาะเจาะจงมากขึ้น เช่น การใช้ Ask Photos ค้นหาเลขป้ายทะเบียนรถยนต์ที่เคยถ่ายไว้
ต่อกับระบบ AI บน Google Workspace หรือตัวช่วยการทำงานต่าง ๆ ของ Google เริ่มจาก Gmail ที่สามารถค้นหาและสรุปอีเมลที่ต้องการได้ เช่น ค้นหาและสรุปเมลที่ส่งมาจากโรงเรียนของลูก บน NotebookLM สามารถถามคำถามด้วยเสียงในเรื่องความรู้ต่าง ๆ จากนั้น AI จะประมวลผลออกมาให้ฟัง หรือสามารถทำงานที่ซับซ้อนได้ เช่น หากต้องการคืนรองเท้า เราสามารถโยนรูปรองเท้าพร้อมคำถามเข้าไป AI จะประมวลผลไซส์และร้านค้าที่สามารถคืนรองเท้าได้ พร้อมแนะนำการติดต่อเวลานัดคืนกับทางร้านได้เลย
AI Overviews ระบบการค้นหาที่เป็นระบบและลึกมากขึ้นด้วย AI ที่ Google เรียกว่า Search Generative Experiences หรือคำถามในรูปแบบที่มีความซับซ้อนและมีปฏิสัมพันธ์มากขึ้น เช่น การถามทริปท่องเที่ยว การช่วยวางแผนออกกำลังกาย
ปัจจุบัน Google ได้ปลดล็อกคำถามและคำตอบประเภทใหม่ ๆ เช่น การรับรู้ถึงตำแหน่ง และข้อมูลแบบเรียลไทม์ ความก้าวหน้าในเรื่องความเข้าใจภาษาธรรมชาติ
โดยทาง Google กำลังพัฒนา Project Astra ที่สามารถทำความเข้าใจข้อมูลหลายรูปแบบและสนทนาได้แบบเรียลไทม์ สามารถช่วยทำงาน ตอบคำถาม จดจำสภาพแวดล้อม ใช้ความคิดสร้างสรรค์ รวมถึงค้นหาสิ่งที่ผู้ใช้ต้องการ
ที่มา googleblog blog.google io.google