
SHORT CUT
OpenAI ส่ง ChatGPT Images 2.0 พลิกโฉม AI สร้างภาพ ผสานโมเดล Reasoning เรนเดอร์ข้อความแม่นยำ รองรับภาษาไทย ปรับสัดส่วนอิสระ พร้อมให้ลองใช้งานได้แล้วทั่วโลก
OpenAI ประกาศเปิดตัว ChatGPT Images 2.0 อย่างเป็นทางการ การอัปเกรดครั้งนี้ไม่ได้เป็นเพียงแค่การปรับปรุงคุณภาพกราฟิก แต่ Images 2.0 สามารถทำงานได้อย่างซับซ้อนและตอบโจทย์การใช้งานระดับมืออาชีพมากยิ่งขึ้น
1.แก้ปัญหาสะกดคำเพี้ยน : ปัญหาคลาสสิกของ AI สร้างภาพคือการสะกดคำที่ผิดเพี้ยน แต่ในเวอร์ชัน 2.0 ได้รับการแก้ไขให้แสดงผลข้อความได้อย่างแม่นยำ แม้กระทั่งตัวอักษรขนาดเล็กหรือองค์ประกอบ UI ที่ซับซ้อน
ทำให้เครื่องมือนี้พร้อมใช้งานจริงสำหรับการทำ Mockup ซอฟต์แวร์ หรือไดอะแกรมเชิงเทคนิค นอกจากนี้ยังทลายกำแพงภาษาด้วยการรองรับภาษาที่ไม่ใช่อักษรละติน เช่น ญี่ปุ่น เกาหลี จีน ฮินดี และเบงกาลี ได้อย่างลื่นไหล
2.ปรับไซส์ภาพได้อิสระ : ผู้ใช้งานไม่ถูกจำกัดอยู่แค่สัดส่วนมาตรฐานอีกต่อไป ระบบอนุญาตให้ปรับอัตราส่วนภาพได้กว้างตั้งแต่ แนวนอน 3:1 ไปจนถึงแนวตั้ง 1:3 หรือกำหนดเองผ่าน Prompt
ซึ่งตอบโจทย์สายคอนเทนต์ที่ต้องการภาพไปทำแบนเนอร์ สไลด์นำเสนอ หรืองานกราฟิกบนสมาร์ทโฟน พร้อมยกระดับความสมจริงในทุกสไตล์ ไม่ว่าจะเป็นภาพถ่าย ภาพยนตร์ มังงะ หรือพิกเซลอาร์ต
3.คิดวิเคราะห์ได้เอง : นี่คือไฮไลต์สำคัญที่สุด การนำโมเดลคิดวิเคราะห์ (Reasoning) มาใช้ในโหมด Thinking หรือ Pro ทำให้ AI ไม่ได้แค่ 'วาดตามคำสั่ง' แต่ 'คิดก่อนวาด' ระบบสามารถค้นหาข้อมูลจากเว็บแบบเรียลไทม์ และสามารถตรวจสอบความถูกต้องของผลลัพธ์ได้ด้วยตัวเอง
นอกจากนี้ โหมด Reasoning ยังแก้ Pain Point ของนักเล่าเรื่อง (Storytelling) ด้วยความสามารถในการสร้างภาพได้สูงสุด 8 แบบจาก Prompt เดียว โดยที่ตัวละครและองค์ประกอบต่างๆ ยังคงความต่อเนื่อง ซึ่งเป็นสิ่งที่นักออกแบบโหยหามานาน
4.ตอบโจทย์นักพัฒนา (Codex & API Integration) ฝั่งนักพัฒนาบน Mac สามารถเรียกใช้งานร่วมกับ Codex เพื่อสร้าง UI หลายรูปแบบ เปรียบเทียบ และนำไปเขียนโค้ดต่อยอดเป็นโปรดักต์จริงได้ใน Workflow เดียว
ขณะที่ผู้ใช้งานระดับองค์กรสามารถเข้าถึงผ่าน API ด้วยโมเดล gpt-image-2 ที่รองรับความละเอียดสูงสุดถึง 2K เหมาะอย่างยิ่งสำหรับเอเจนซีโฆษณาและงานออกแบบเว็บไซต์
แม้จะทรงพลังขึ้นมาก แต่ OpenAI ก็ออกมายอมรับอย่างตรงไปตรงมาว่า ระบบยังคงมีข้อจำกัดในการเรนเดอร์ภาพที่ต้องอาศัยโครงสร้างทางกายภาพที่ซับซ้อนสูง (เช่น การพับกระดาษ Origami หรือปริศนาบางประเภท) รวมถึงลวดลายแพทเทิร์นที่ซ้ำซ้อนกันมากๆ ที่ผู้ใช้อาจจะต้องคอยตรวจสอบความถูกต้องอยู่
ที่มา : OpenAI