svasdssvasds

ChatGPT เปิดตัว Images 2.0 'AI สร้างภาพ' มีอะไรใหม่ ทำอะไรได้บ้าง

ChatGPT เปิดตัว Images 2.0 'AI สร้างภาพ' มีอะไรใหม่ ทำอะไรได้บ้าง

OpenAI ส่ง ChatGPT Images 2.0 พลิกโฉม AI สร้างภาพ ผสานโมเดล Reasoning เรนเดอร์ข้อความแม่นยำ รองรับภาษาไทย ปรับสัดส่วนอิสระ พร้อมให้ลองใช้งานได้แล้วทั่วโลก

SHORT CUT

  • ChatGPT Image 2.0 แก้ปัญหา AI เขียนหนังสือผิด รองรับข้อความหลายภาษา (รวมถึงภาษาเอเชีย) พร้อมปลดล็อกการตั้งค่าสัดส่วนภาพแบบอิสระตั้งแต่ 3:1 ถึง 1:3
  • ChatGPT Image 2.0 สามารถคิดวิเคราะห์ ค้นหาข้อมูลเรียลไทม์ ตรวจสอบตัวเอง และที่สำคัญคือสามารถคุมโทน/ตัวละครให้ต่อเนื่องกันได้สูงสุด 8 ภาพในคำสั่งเดียว ตอบโจทย์งานแนว Storytelling
  • OpenAI เปิดตัวโมเดล API gpt-image-2 รองรับความละเอียด 2K และผสานการทำงานกับ Codex บน Mac ได้โดยตรง ช่วยลดขั้นตอนในการสร้างสรรค์ซอฟต์แวร์และงานออกแบบเชิงพาณิชย์ (เปิดให้ใช้งานแล้ววันนี้ โดยฟีเจอร์ระดับสูงสงวนสิทธิ์สำหรับผู้ใช้ Plus, Pro และ Business)

OpenAI ส่ง ChatGPT Images 2.0 พลิกโฉม AI สร้างภาพ ผสานโมเดล Reasoning เรนเดอร์ข้อความแม่นยำ รองรับภาษาไทย ปรับสัดส่วนอิสระ พร้อมให้ลองใช้งานได้แล้วทั่วโลก

OpenAI ประกาศเปิดตัว ChatGPT Images 2.0 อย่างเป็นทางการ การอัปเกรดครั้งนี้ไม่ได้เป็นเพียงแค่การปรับปรุงคุณภาพกราฟิก แต่ Images 2.0 สามารถทำงานได้อย่างซับซ้อนและตอบโจทย์การใช้งานระดับมืออาชีพมากยิ่งขึ้น

ChatGPT Images 2.0 มีอะไรใหม่บ้าง?

1.แก้ปัญหาสะกดคำเพี้ยน : ปัญหาคลาสสิกของ AI สร้างภาพคือการสะกดคำที่ผิดเพี้ยน แต่ในเวอร์ชัน 2.0 ได้รับการแก้ไขให้แสดงผลข้อความได้อย่างแม่นยำ แม้กระทั่งตัวอักษรขนาดเล็กหรือองค์ประกอบ UI ที่ซับซ้อน

CREDIT : OpenAI

ทำให้เครื่องมือนี้พร้อมใช้งานจริงสำหรับการทำ Mockup ซอฟต์แวร์ หรือไดอะแกรมเชิงเทคนิค นอกจากนี้ยังทลายกำแพงภาษาด้วยการรองรับภาษาที่ไม่ใช่อักษรละติน เช่น ญี่ปุ่น เกาหลี จีน ฮินดี และเบงกาลี ได้อย่างลื่นไหล

2.ปรับไซส์ภาพได้อิสระ : ผู้ใช้งานไม่ถูกจำกัดอยู่แค่สัดส่วนมาตรฐานอีกต่อไป ระบบอนุญาตให้ปรับอัตราส่วนภาพได้กว้างตั้งแต่ แนวนอน 3:1 ไปจนถึงแนวตั้ง 1:3 หรือกำหนดเองผ่าน Prompt

Prompt: create a photorealistic panorama shot as if taken on iphone of a busy asian city. make it a bit jaggedy like my hand shook while taking the panorama shot ; there should be fault lines where the image

ซึ่งตอบโจทย์สายคอนเทนต์ที่ต้องการภาพไปทำแบนเนอร์ สไลด์นำเสนอ หรืองานกราฟิกบนสมาร์ทโฟน พร้อมยกระดับความสมจริงในทุกสไตล์ ไม่ว่าจะเป็นภาพถ่าย ภาพยนตร์ มังงะ หรือพิกเซลอาร์ต

ChatGPT เปิดตัว Images 2.0 'AI สร้างภาพ' มีอะไรใหม่ ทำอะไรได้บ้าง

3.คิดวิเคราะห์ได้เอง : นี่คือไฮไลต์สำคัญที่สุด การนำโมเดลคิดวิเคราะห์ (Reasoning) มาใช้ในโหมด Thinking หรือ Pro ทำให้ AI ไม่ได้แค่ 'วาดตามคำสั่ง' แต่ 'คิดก่อนวาด' ระบบสามารถค้นหาข้อมูลจากเว็บแบบเรียลไทม์ และสามารถตรวจสอบความถูกต้องของผลลัพธ์ได้ด้วยตัวเอง

นอกจากนี้ โหมด Reasoning ยังแก้ Pain Point ของนักเล่าเรื่อง (Storytelling) ด้วยความสามารถในการสร้างภาพได้สูงสุด 8 แบบจาก Prompt เดียว โดยที่ตัวละครและองค์ประกอบต่างๆ ยังคงความต่อเนื่อง ซึ่งเป็นสิ่งที่นักออกแบบโหยหามานาน

4.ตอบโจทย์นักพัฒนา (Codex & API Integration) ฝั่งนักพัฒนาบน Mac สามารถเรียกใช้งานร่วมกับ Codex เพื่อสร้าง UI หลายรูปแบบ เปรียบเทียบ และนำไปเขียนโค้ดต่อยอดเป็นโปรดักต์จริงได้ใน Workflow เดียว

ขณะที่ผู้ใช้งานระดับองค์กรสามารถเข้าถึงผ่าน API ด้วยโมเดล gpt-image-2 ที่รองรับความละเอียดสูงสุดถึง 2K เหมาะอย่างยิ่งสำหรับเอเจนซีโฆษณาและงานออกแบบเว็บไซต์

CREDIT : OpenAI

แม้จะทรงพลังขึ้นมาก แต่ OpenAI ก็ออกมายอมรับอย่างตรงไปตรงมาว่า ระบบยังคงมีข้อจำกัดในการเรนเดอร์ภาพที่ต้องอาศัยโครงสร้างทางกายภาพที่ซับซ้อนสูง (เช่น การพับกระดาษ Origami หรือปริศนาบางประเภท) รวมถึงลวดลายแพทเทิร์นที่ซ้ำซ้อนกันมากๆ ที่ผู้ใช้อาจจะต้องคอยตรวจสอบความถูกต้องอยู่

ที่มา : OpenAI

related