SHORT CUT
ครั้งแรกที่ AI ซึ่งเป็นโมเดลภาษาสำหรับใช้งานทั่วไป สามารถแก้โจทย์คณิตศาสตร์โอลิมปิกที่ต้องใช้การพิสูจน์และความคิดสร้างสรรค์ในระดับเหรียญทองได้สำเร็จ ภายใต้เงื่อนไขเดียวกับมนุษย์ทุกประการ
การประกาศผลของ OpenAI ถูกตั้งคำถามถึงความชอบธรรม เนื่องจากบริษัทเป็นผู้จัดการตรวจให้คะแนนเอง และยังละเมิดข้อตกลงการประกาศผลก่อนกำหนด ทำให้เกิดความขัดแย้งกับผู้จัดงาน IMO และบริษัทคู่แข่ง
การชิงประกาศผลของ OpenAI สะท้อนถึงการแข่งขันที่เข้มข้นในอุตสาหกรรม AI เพื่อแสดงความเป็นผู้นำด้านความสามารถในการให้เหตุผลเชิงตรรกะที่ซับซ้อน และได้กดดันให้คู่แข่งอย่าง Google อาจต้องปรับแผนการประกาศของตนเอง
OpenAI เผยโมเดล AI ทำคะแนนระดับเหรียญทองคณิตศาสตร์โอลิมปิก แต่ถูกวิจารณ์หนักหลังชิงประกาศผลก่อนกำหนดและตั้งกรรมการตรวจข้อสอบเอง
Alexander Wei นักวิจัยจาก OpenAI ได้สร้างความสั่นสะเทือนให้วงการ AI และคณิตศาสตร์
"AI" สามารถชนะการแข่งขันคณิตศาสตร์โอลิมปิกในระดับเหรียญทอง ซึ่งเป็นมาตรฐานที่ผู้เข้าแข่งขันที่เป็นมนุษย์เพียงไม่ถึง 9% สามารถทำได้ในแต่ละปี
We achieved gold medal-level performance 🥇on the 2025 International Mathematical Olympiad with a general-purpose reasoning LLM!
— OpenAI (@OpenAI) July 19, 2025
Our model solved world-class math problems—at the level of top human contestants. A major milestone for AI and mathematics. https://t.co/u2RlFFavyT
ความสำเร็จของ OpenAI ครั้งนี้ถือเป็นก้าวสำคัญ เพราะโมเดล AI ดังกล่าวเป็นโมเดลภาษาสำหรับใช้งานทั่วไป ไม่ใช่ระบบที่สร้างขึ้นเพื่อพิสูจน์ทฤษฎีทางคณิตศาสตร์โดยเฉพาะ
โดยสามารถแก้โจทย์คณิตศาสตร์แบบการพิสูจน์ทั้ง 6 ข้อ ภายใต้เงื่อนไขเดียวกับมนุษย์ คือใช้เวลา 4.5 ชั่วโมงต่อรอบ ไม่มีการเชื่อมต่ออินเทอร์เน็ต และไม่ใช้เครื่องคิดเลข โมเดลจะประมวลผลโจทย์ในรูปแบบข้อความธรรมดาและสร้างบทพิสูจน์เป็นภาษาธรรมชาติ
ซึ่งแตกต่างจากแนวทางของคู่แข่งอย่าง Google ที่เคยประกาศเมื่อเดือนกรกฎาคม 2024 ว่าโมเดล AlphaProof และ AlphaGeometry 2 ของตนทำคะแนนเทียบเท่าเหรียญเงิน แต่ใช้เวลาแก้โจทย์นานถึง 3 วันต่อข้อ และยังต้องอาศัยมนุษย์ช่วยแปลงโจทย์เป็นภาษาสัญลักษณ์ทางคณิตศาสตร์
"คณิตศาสตร์คือสนามพิสูจน์ความสามารถในการให้เหตุผล ซึ่งมีโครงสร้างที่รัดกุมและยากที่จะลอกเลียนแบบ"
อย่างไรก็ตาม ผลลัพธ์ยังคงเป็นที่กังขา เนื่องจากแหล่งข่าววงในหลายรายระบุว่า OpenAI เป็นผู้จัดการตรวจและให้คะแนนผลงานของตนเอง
แม้ทางบริษัทจะชี้แจงว่าได้จัดตั้งคณะกรรมการที่ประกอบด้วยอดีตผู้ได้รับเหรียญรางวัล IMO จำนวน 3 คน มาตรวจข้อสอบแบบไม่เปิดเผยตัวตน และต้องได้รับความเห็นเป็นเอกฉันท์ แต่การกระทำดังกล่าวก็ยังถูกตั้งคำถามถึงความเป็นกลาง
Noam Brown หนึ่งในทีมนักวิจัยของ OpenAI ได้โพสต์ชี้แจงผ่าน X ว่าได้แจ้งผู้จัดงานแล้วและรอจนพิธีปิดสิ้นสุดลง แต่ผู้ประสานงานของ IMO ได้ออกมาโต้แย้งว่า OpenAI ประกาศผลก่อนพิธีปิดจะเริ่มขึ้นด้วยซ้ำ
เหตุการณ์นี้ได้ส่งผลกระทบเป็นวงกว้าง โดย Google DeepMind ซึ่งเตรียมจะประกาศผลงานของตนในวันที่ 28 กรกฎาคม ได้ตัดสินใจเลื่อนการประกาศให้เร็วขึ้น ขณะที่ Harmonic ซึ่งเป็นบริษัท AI อีกแห่งที่เข้าร่วม จะยังคงยึดกำหนดการเดิม
ทาง OpenAI ยืนยันว่าโมเดล AI ตัวนี้ยังเป็นรุ่นทดลองและต้องใช้ทรัพยากรในการประมวลผลมหาศาล ซึ่งจะไม่ใช่โมเดลที่จะเปิดให้ผู้บริโภคทั่วไปใช้งานในเร็ว ๆ นี้ และไม่ใช่ GPT-5 ที่หลายคนรอคอย
ที่มา : arstechnica