บทสรุป Google I/O 2024 มีอะไรใหม่บ้าง : AI เข้าสู่ยุค Gemini อย่างสมบูรณ์แบบ ?

16 May 2024

Google I/O งานประชุมนักพัฒนาซอฟต์แวร์ ประจำปี 2024 ครั้งนี้ Google (กูเกิล) เปิดตัวเครืองมือ AI เพียบ ต้อนรับการเข้าสู่ยุค Gemini อย่างสมบูรณ์ พร้อมสู้ค่ายคู่แข่งอย่าง OpenAI

SHORT CUT

Google เปิดตัวเครืองมือ AI เพียบ ในงาน Google I/O 2024 โดยยืนยันว่า ขอต้อนรับการเข้าสู่ยุค Gemini อย่างสมบูรณ์ พร้อมสู้ค่ายคู่แข่งอย่าง OpenAI เต็มรูปแบบ
นอกจากนี้ ยังมีสิ่งที่น่าสนใจอีกหลายประเด็น อาทิ Gemini 1.5 Pro โมเดลใหม่ล่าสุด เร็ว แรง , Veo โมเดลสร้างวิดีโอแบบมืออาชีพ , Project Astra ผู้ช่วย AI อัจฉริยะ
ขณะที่ Gemini in Workspace อัปเดต AI มาช่วยงานแบบรู้ใจ และอีกหนึ่งจุดเด่นคือ Google Photos ให้ AI ค้นหารูปภาพด้วย Ask Photos

Google I/O งานประชุมนักพัฒนาซอฟต์แวร์ ประจำปี 2024 ครั้งนี้ Google (กูเกิล) เปิดตัวเครืองมือ AI เพียบ ต้อนรับการเข้าสู่ยุค Gemini อย่างสมบูรณ์ พร้อมสู้ค่ายคู่แข่งอย่าง OpenAI

Google I/O งานประชุมนักพัฒนาซอฟต์แวร์ ประจำปี 2024 ครั้งนี้ Google เปิดตัวเครืองมือ AI เพียบ ต้อนรับการเข้าสู่ยุค Gemini อย่างสมบูรณ์ พร้อมสู้ค่ายคู่แข่งอย่าง OpenAI

โดยในงาน Google I/O งานประชุมนักพัฒนาซอฟต์แวร์ครั้งใหญ่ ประจำปี 2024 โดยเป็นงานที่บริษัทจะประกาศผลิตภัณฑ์ตัวใหม่หรือโปรเจกต์ที่กำลังพัฒนา

และทางกูเกิ้ล ยังประกาศกร้าวว่า ณ เวลานี้ Google ได้เข้าสู่ยุค Gemini โดยสมบูรณ์แบบแล้ว พร้อมกับได้นำ AI ของตัวเองอย่าง Gemini ไปผสมผสานใช้ผลิตภัณฑ์ต่าง ๆ ของ Google

นอกจากนี้ Gemini 1.5 Flash ที่มีพื้นฐานจาก Gemini 1.5 Pro แต่เน้นความคล่องตัวในด้านการประมวลผลมากขึ้น พร้อมนำไปพัฒนาโครงการแอสตรา (Project Astra) ที่สื่อตั้งข้อสังเกตว่าการใช้งานในลักษณะเดียวกันกับ GPT-4o ของ OpenAI เรียกได้ว่าเป็นคู่แข่งกันแบบวัด หมัดต่อหมัดกันเลย

สรุป Google I/O 2024 มีอะไรใหม่บ้าง : AI เข้าสู่ยุค Gemini อย่างสมบูรณ์แบบ

นี่มันคือยุคที่ AI เข้าสู่ยุค Gemini อย่างสมบูรณ์แบบแล้วจริงเหรอ ?

Gemini 1.5 Pro รองรับ 35 ภาษา

สำหรับ Gemini 1.5 Pro ซึ่งมาพร้อมกับความก้าวหน้าครั้งใหญ่ โดยสามารถรองรับการประมวลผลข้อมูลได้มากยิ่งขึ้น Gemini 1.5 Pro สามารถรองรับการประมวลผลข้อมูลจำนวนมากอย่างต่อเนื่องได้ถึง 1 ล้านโทเคน ไม่ว่าจะเป็นเอกสาร 1,500 หน้า หรือโค้ดที่ยาวกว่า 30,000 บรรทัด รองรับ 35 ภาษา ซึ่งมากกว่าโมเดลพื้นฐานขนาดใหญ่อื่นๆ ที่มีอยู่ในตอนนี้ นอกจากนี้ยังมีฟีเชอร์ใหม่ ๆ เช่น

• การอัปโหลดไฟล์ผ่าน Google Drive หรือจากอุปกรณ์เพื่อให้ผู้ใช้วิเคราะห์ข้อมูลเชิงลึกได้อย่างรวดเร็วยิ่งขึ้น และในเร็วๆ นี้ Gemini Advanced จะทำหน้าที่เป็นนักวิเคราะห์ข้อมูลเชิงลึก และสามารถแสดงข้อมูลผ่านภาพและแผนภูมิได้ทันทีจากไฟล์ข้อมูลที่อัปโหลด เช่น สเปรดชีต ที่สำคัญ Gemini จะรักษาความเป็นส่วนตัวให้กับไฟล์ และจะไม่นำข้อมูลเหล่านี้ไปใช้ในการฝึกโมเดลของเรา

• การวิเคราะข้อมูลจากรูปภาพ เช่น อัปโหลดรูปโจทย์เลขให้ Gemini ช่วยอธิบายวิธีแก้โจทย์ทีละขั้นตอน หรือให้ Gemini วิเคราะห์สูตรอาหารจานโปรดจากรูปที่ถ่ายตอนไปร้านอาหาร เช่น สามารถถ่ายรูปอาหารจานโปรดในร้านอาหารที่ผู้ใช้ชื่นชอบและขอสูตรอาหารนั้น หรือถ่ายภาพโจทย์คณิตศาสตร์และรับคำแนะนำวิธีแก้ปัญหาแบบทีละขั้นตอน ซึ่งทั้งหมดนี้สามารถทำได้โดยใช้เพียงรูปภาพเดียว

• Gemini Live พูดคุยตอบโต้กับ Gemini ผ่านมือถือ ใน Google Messages และขอความช่วยเหลือผ่านเสียงพูดได้อย่างเป็นธรรมชาติ โต้ตอบการสนทนาได้เหมือนปกติทั่วไป หรือการพูดแทรก

สรุป Google I/O 2024 มีอะไรใหม่บ้าง : AI เข้าสู่ยุค Gemini อย่างสมบูรณ์แบบ

Veo โมเดลสร้างวิดีโอมืออาชีพ

Veo โมเดลสร้างวิดีโอมืออาชีพ โดยเป็น บริการสร้างวิดีโอด้วยคำสั่ง (Prompt) ที่ปรับแต่งได้ โดยสร้างวิดีโอในรูปแบบภาพยนตร์ที่มีความละเอียดสูงสุด 1080p ซึ่งเชื่อว่าเปิดตัวมาเพื่อเอามาไฟต์ มาดวลกับ Sora ของ Open

Google Photos ให้ AI ค้นหารูปภาพด้วย Ask Photos

ฟีเจอร์ Ask Photos ที่นำเอา Gemini มาช่วยค้นหารูปภาพในแบบที่เฉพาะเจาะจงมากขึ้น เช่น การใช้ Ask Photos ค้นหาเลขป้ายทะเบียนรถยนต์ที่เคยถ่ายไว้

Google Workspace

ต่อกับระบบ AI บน Google Workspace หรือตัวช่วยการทำงานต่าง ๆ ของ Google เริ่มจาก Gmail ที่สามารถค้นหาและสรุปอีเมลที่ต้องการได้ เช่น ค้นหาและสรุปเมลที่ส่งมาจากโรงเรียนของลูก บน NotebookLM สามารถถามคำถามด้วยเสียงในเรื่องความรู้ต่าง ๆ จากนั้น AI จะประมวลผลออกมาให้ฟัง หรือสามารถทำงานที่ซับซ้อนได้ เช่น หากต้องการคืนรองเท้า เราสามารถโยนรูปรองเท้าพร้อมคำถามเข้าไป AI จะประมวลผลไซส์และร้านค้าที่สามารถคืนรองเท้าได้ พร้อมแนะนำการติดต่อเวลานัดคืนกับทางร้านได้เลย

AI Overviews บน Google Search

AI Overviews ระบบการค้นหาที่เป็นระบบและลึกมากขึ้นด้วย AI ที่ Google เรียกว่า Search Generative Experiences หรือคำถามในรูปแบบที่มีความซับซ้อนและมีปฏิสัมพันธ์มากขึ้น เช่น การถามทริปท่องเที่ยว การช่วยวางแผนออกกำลังกาย
ปัจจุบัน Google ได้ปลดล็อกคำถามและคำตอบประเภทใหม่ ๆ เช่น การรับรู้ถึงตำแหน่ง และข้อมูลแบบเรียลไทม์ ความก้าวหน้าในเรื่องความเข้าใจภาษาธรรมชาติ

Project Astra ผู้ช่วย AI อัจฉริยะ

โดยทาง Google กำลังพัฒนา Project Astra ที่สามารถทำความเข้าใจข้อมูลหลายรูปแบบและสนทนาได้แบบเรียลไทม์ สามารถช่วยทำงาน ตอบคำถาม จดจำสภาพแวดล้อม ใช้ความคิดสร้างสรรค์ รวมถึงค้นหาสิ่งที่ผู้ใช้ต้องการ

ที่มา googleblog blog.google io.google