
OpenAI เปิดตัว GPT Image 1.5 ชูจุดเด่นแก้รูปแม่นยำ สั่งได้ดั่งใจ การแก้ไขภาพที่เนียนตามากขึ้น และความเร็วในการประมวลผลที่เพิ่มขึ้นแบบก้าวกระโดด
OpenAI เดินเกมรุกตลาด Generative Image AI อีกครั้ง ด้วยการเปิดตัว ChatGPT Images เวอร์ชันล่าสุด ที่ขับเคลื่อนด้วยขุมพลังใหม่อย่าง “GPT-Image-1.5” โดยมุ่งแก้ Pain Point หลักของผู้ใช้งาน ทั้งเรื่องความแม่นยำในการทำตามคำสั่ง การแก้ไขภาพที่เนียนตา และความเร็วในการประมวลผลที่เพิ่มขึ้นแบบก้าวกระโดด
การอัปเกรดในครั้งนี้ ถือเป็นการยกเครื่องระบบการทำงานเบื้องหลัง (Backend) เพื่อให้ ChatGPT สามารถทำหน้าที่เป็น “สตูดิโอครีเอทีฟ” ที่ครบวงจรสำหรับผู้ใช้งานทั่วไปและภาคธุรกิจ
จุดเด่นที่สุดที่ OpenAI เน้นย้ำในการเปิดตัวครั้งนี้คือประสิทธิภาพของโมเดล GPT-Image-1.5 ที่สามารถสร้างภาพได้รวดเร็วขึ้นสูงสุดถึง 4 เท่า เมื่อเทียบกับรุ่นก่อนหน้า ซึ่งถือเป็นปัจจัยสำคัญที่ช่วยให้กระบวนการทำงาน (Workflow) ของคนใช้งานลื่นไหลไม่สะดุด
นอกเหนือจากความเร็ว สิ่งที่ถูกพัฒนาขึ้นอย่างเห็นได้ชัดคือ “ความเก่งในการฟังคำสั่ง” โมเดลรุ่นนี้สามารถตีความ Prompt ที่ซับซ้อนและทำตามคำสั่งได้อย่างแม่นยำและสม่ำเสมอมากขึ้น ลดปัญหา AI สร้างภาพผิดเพี้ยนไปจากสิ่งที่ผู้ใช้ต้องการ (Hallucination) หรือไม่ยอมทำตาม
รายละเอียดเล็กๆ น้อยๆ ที่ระบุไว้
การแก้ไขภาพที่ “รู้ใจ” ผู้ใช้ (Precise Editing)
หนึ่งในความท้าทายของ AI สายภาพคือการแก้ไขภาพเดิมที่มีอยู่ (In-painting) บ่อยครั้งที่การสั่งแก้จุดหนึ่งกลับไปกระทบองค์ประกอบอื่นๆ ในภาพ แต่สำหรับเวอร์ชันใหม่นี้ OpenAI ระบุว่าระบบมีความสามารถในการ “แก้เฉพาะจุด” ได้อย่างเนียนตา
ไม่ว่าจะเป็นการ ลบ เพิ่ม ผสาน หรือย้ายวัตถุในภาพ โมเดลจะยังคงรักษาองค์ประกอบสำคัญของภาพต้นฉบับไว้ได้อย่างครบถ้วน เช่น:
- แสงและเงา (Lighting)
- องค์ประกอบภาพ (Composition)
- เอกลักษณ์ของบุคคล (Character Consistency)
ฟีเจอร์นี้เปิดโอกาสให้เกิดการใช้งานใหม่ๆ เช่น การลองเสื้อผ้า (Virtual Try-ons) ที่ดูสมจริง หรือการปรับเปลี่ยนสไตล์ภาพโดยไม่เสียโครงสร้างเดิมไป ซึ่งตอบโจทย์ทั้งงานศิลปะและการใช้งานเชิงพาณิชย์
อีกหนึ่งปัญหาคลาสสิกของ AI คือการสร้างข้อความ (Text Rendering) ที่มักจะอ่านไม่ออกหรือสะกดผิด โมเดล GPT-Image-1.5 ได้รับการปรับปรุงให้จัดการกับข้อความที่มีขนาดเล็กและหนาแน่นได้ดียิ่งขึ้น รวมถึงความสามารถในการเรนเดอร์ใบหน้าคนจำนวนมากในภาพเดียวได้อย่างเป็นธรรมชาติมากขึ้น
ในมุมมองเชิงธุรกิจ OpenAI ได้ปรับลดราคาต้นทุน API สำหรับโมเดล GPT-Image-1.5 ลงถึง 20% เมื่อเทียบกับรุ่นก่อน ซึ่งดึงดูดใจนักพัฒนาและองค์กรธุรกิจอย่างมาก
ความสามารถในการ “คุม Theme” หรือรักษาเอกลักษณ์ของแบรนด์ (Brand Consistency) ได้ดีขึ้น ทำให้เหมาะอย่างยิ่งสำหรับการทำกราฟิกการตลาดหรือแคตตาล็อกสินค้า อีคอมเมิร์ซ
ฮีลา แกต (Hila Gat) หัวหน้าฝ่ายวิจัย AI ของ Wix แพลตฟอร์มสร้างเว็บไซต์ชื่อดัง ให้ความเห็นหลังได้ทดลองใช้งานว่า "ความสม่ำเสมอและคุณภาพของโมเดลนี้โดดเด่นจนสามารถแข่งขันในระดับเดียวกับโมเดลสร้างภาพระดับเรือธงในปัจจุบันได้อย่างแท้จริง ผลลัพธ์ที่ได้มีความสะอาด สมจริง และเชื่อถือได้"
ปัจจุบัน ChatGPT Images เวอร์ชันใหม่ และโมเดล GPT-Image-1.5 ผ่าน API เริ่มทยอยเปิดให้ผู้ใช้งานทั่วไปและนักพัฒนาทั่วโลกใช้งานได้แล้วตั้งแต่วันนี้ โดยมาพร้อมกับอินเทอร์เฟซใหม่บนแอปพลิเคชันและเว็บไซต์ที่มีปุ่ม "Images" แยกเฉพาะ พร้อมตัวช่วย Prompt สำเร็จรูป เพื่อให้ผู้ใช้เริ่มต้นสร้างสรรค์งานได้ง่ายที่สุด
แม้ทาง OpenAI จะยอมรับว่าระบบยังมีข้อจำกัดและพื้นที่ให้พัฒนาต่อ แต่การเปิดตัวครั้งนี้ถือเป็นสัญญาณชัดเจนว่ามาตรฐานของ AI สร้างภาพกำลังถูกยกระดับขึ้นไปอีกขั้น ทั้งในแง่ของความเร็วและความสามารถในการควบคุมผลลัพธ์ดั่งใจนึก
.