svasdssvasds

OpenAI ชิงประกาศผล AI คว้าเหรียญทองคณิตฯโอลิมปิก ก่อดราม่าเดือด

OpenAI ชิงประกาศผล AI คว้าเหรียญทองคณิตฯโอลิมปิก ก่อดราม่าเดือด

OpenAI เผยโมเดล AI ทำคะแนนระดับเหรียญทองคณิตศาสตร์โอลิมปิก แต่ถูกวิจารณ์หนักหลังชิงประกาศผลก่อนกำหนดและตั้งกรรมการตรวจข้อสอบเอง

SHORT CUT

  • ครั้งแรกที่ AI ซึ่งเป็นโมเดลภาษาสำหรับใช้งานทั่วไป สามารถแก้โจทย์คณิตศาสตร์โอลิมปิกที่ต้องใช้การพิสูจน์และความคิดสร้างสรรค์ในระดับเหรียญทองได้สำเร็จ ภายใต้เงื่อนไขเดียวกับมนุษย์ทุกประการ

  • การประกาศผลของ OpenAI ถูกตั้งคำถามถึงความชอบธรรม เนื่องจากบริษัทเป็นผู้จัดการตรวจให้คะแนนเอง และยังละเมิดข้อตกลงการประกาศผลก่อนกำหนด ทำให้เกิดความขัดแย้งกับผู้จัดงาน IMO และบริษัทคู่แข่ง

  • การชิงประกาศผลของ OpenAI สะท้อนถึงการแข่งขันที่เข้มข้นในอุตสาหกรรม AI เพื่อแสดงความเป็นผู้นำด้านความสามารถในการให้เหตุผลเชิงตรรกะที่ซับซ้อน และได้กดดันให้คู่แข่งอย่าง Google อาจต้องปรับแผนการประกาศของตนเอง

OpenAI เผยโมเดล AI ทำคะแนนระดับเหรียญทองคณิตศาสตร์โอลิมปิก แต่ถูกวิจารณ์หนักหลังชิงประกาศผลก่อนกำหนดและตั้งกรรมการตรวจข้อสอบเอง

Alexander Wei นักวิจัยจาก OpenAI ได้สร้างความสั่นสะเทือนให้วงการ AI และคณิตศาสตร์

"AI" สามารถชนะการแข่งขันคณิตศาสตร์โอลิมปิกในระดับเหรียญทอง ซึ่งเป็นมาตรฐานที่ผู้เข้าแข่งขันที่เป็นมนุษย์เพียงไม่ถึง 9% สามารถทำได้ในแต่ละปี

ความสำเร็จของ OpenAI ครั้งนี้ถือเป็นก้าวสำคัญ เพราะโมเดล AI ดังกล่าวเป็นโมเดลภาษาสำหรับใช้งานทั่วไป ไม่ใช่ระบบที่สร้างขึ้นเพื่อพิสูจน์ทฤษฎีทางคณิตศาสตร์โดยเฉพาะ

โดยสามารถแก้โจทย์คณิตศาสตร์แบบการพิสูจน์ทั้ง 6 ข้อ ภายใต้เงื่อนไขเดียวกับมนุษย์ คือใช้เวลา 4.5 ชั่วโมงต่อรอบ ไม่มีการเชื่อมต่ออินเทอร์เน็ต และไม่ใช้เครื่องคิดเลข โมเดลจะประมวลผลโจทย์ในรูปแบบข้อความธรรมดาและสร้างบทพิสูจน์เป็นภาษาธรรมชาติ

OpenAI ชิงประกาศผล AI คว้าเหรียญทองคณิตฯโอลิมปิก ก่อดราม่าเดือด

ซึ่งแตกต่างจากแนวทางของคู่แข่งอย่าง Google ที่เคยประกาศเมื่อเดือนกรกฎาคม 2024 ว่าโมเดล AlphaProof และ AlphaGeometry 2 ของตนทำคะแนนเทียบเท่าเหรียญเงิน แต่ใช้เวลาแก้โจทย์นานถึง 3 วันต่อข้อ และยังต้องอาศัยมนุษย์ช่วยแปลงโจทย์เป็นภาษาสัญลักษณ์ทางคณิตศาสตร์

"คณิตศาสตร์คือสนามพิสูจน์ความสามารถในการให้เหตุผล ซึ่งมีโครงสร้างที่รัดกุมและยากที่จะลอกเลียนแบบ"

อย่างไรก็ตาม ผลลัพธ์ยังคงเป็นที่กังขา เนื่องจากแหล่งข่าววงในหลายรายระบุว่า OpenAI เป็นผู้จัดการตรวจและให้คะแนนผลงานของตนเอง

แม้ทางบริษัทจะชี้แจงว่าได้จัดตั้งคณะกรรมการที่ประกอบด้วยอดีตผู้ได้รับเหรียญรางวัล IMO จำนวน 3 คน มาตรวจข้อสอบแบบไม่เปิดเผยตัวตน และต้องได้รับความเห็นเป็นเอกฉันท์ แต่การกระทำดังกล่าวก็ยังถูกตั้งคำถามถึงความเป็นกลาง

Noam Brown หนึ่งในทีมนักวิจัยของ OpenAI ได้โพสต์ชี้แจงผ่าน X ว่าได้แจ้งผู้จัดงานแล้วและรอจนพิธีปิดสิ้นสุดลง แต่ผู้ประสานงานของ IMO ได้ออกมาโต้แย้งว่า OpenAI ประกาศผลก่อนพิธีปิดจะเริ่มขึ้นด้วยซ้ำ 

เหตุการณ์นี้ได้ส่งผลกระทบเป็นวงกว้าง โดย Google DeepMind ซึ่งเตรียมจะประกาศผลงานของตนในวันที่ 28 กรกฎาคม ได้ตัดสินใจเลื่อนการประกาศให้เร็วขึ้น ขณะที่ Harmonic ซึ่งเป็นบริษัท AI อีกแห่งที่เข้าร่วม จะยังคงยึดกำหนดการเดิม

ทาง OpenAI ยืนยันว่าโมเดล AI ตัวนี้ยังเป็นรุ่นทดลองและต้องใช้ทรัพยากรในการประมวลผลมหาศาล ซึ่งจะไม่ใช่โมเดลที่จะเปิดให้ผู้บริโภคทั่วไปใช้งานในเร็ว ๆ นี้ และไม่ใช่ GPT-5 ที่หลายคนรอคอย

ที่มา : arstechnica

related