SHORT CUT
สตาร์ทอัป AI จีน DeepSeek ปล่อยอัปเดต R1-0528 เพิ่มพลังการคิดเชิงลึก ลดภาพหลอน เทียบชั้น OpenAI, Google ท่ามกลางการแข่งขันที่ดุเดือดในสมรภูมิ AI โลก
DeepSeek สตาร์ทอัปปัญญาประดิษฐ์จากจีน สร้างแรงสั่นสะเทือนในวงการอีกครั้ง ด้วยการเปิดตัว R1-0528
ซึ่งเป็นรุ่นอัปเกรดของโมเดล AI ด้านการใช้เหตุผล (Reasoning Model) ยอดนิยมอย่าง R1 การอัปเดตครั้งนี้แม้จะเป็นเพียง "เวอร์ชันย่อย" แต่ก็มาพร้อมกับการปรับปรุงประสิทธิภาพครั้งสำคัญ
โดยเฉพาะอย่างยิ่งในด้านความสามารถในการคิดเชิงลึก การอนุมาน และการจัดการกับงานที่ซับซ้อน ทำให้ R1-0528 ขยับเข้าใกล้คู่แข่งระดับโลกอย่างโมเดล o3 ของ OpenAI และ Gemini 2.5 Pro ของ Google มากยิ่งขึ้น
การเปิดตัว DeepSeek R1 รุ่นแรกเมื่อเดือนมกราคมที่ผ่านมา ได้สร้างปรากฏการณ์ไปทั่วโลกและส่งผลให้หุ้นเทคโนโลยีนอกประเทศจีนดิ่งลงอย่างหนัก พร้อมกับท้าทายความเชื่อเดิมที่ว่าการพัฒนา AI จำเป็นต้องใช้พลังการประมวลผลและการลงทุนมหาศาลเสมอไป
การอัปเดตล่าสุดนี้เกิดขึ้นท่ามกลางการแข่งขันที่เข้มข้น โดยยักษ์ใหญ่เทคโนโลยีจีนอย่าง Alibaba และ Tencent ต่างก็เปิดตัวโมเดลที่อ้างว่ามีประสิทธิภาพเหนือกว่า DeepSeek
DeepSeek เปิดเผยผ่านแพลตฟอร์มสำหรับนักพัฒนาอย่าง Hugging Face และช่องทางโซเชียลมีเดีย X และ WeChat ว่า R1-0528 ได้รับการปรับปรุงประสิทธิภาพในหลายด้าน
โดยเฉพาะอย่างยิ่ง อัตราการเกิด "ภาพหลอน" (Hallucinations) หรือการสร้างข้อมูลที่ผิดพลาดหรือทำให้เข้าใจผิด ลดลงถึงประมาณ 45-50% ในสถานการณ์เช่น การเขียนใหม่ (Rewriting) และการสรุปเนื้อหา (Summarizing)
นอกจากนี้ R1-0528 ยังแสดงให้เห็นถึงความสามารถที่โดดเด่นในการเขียนเชิงสร้างสรรค์ เช่น เรียงความ นวนิยาย และงานเขียนประเภทอื่นๆ รวมถึงการปรับปรุงความสามารถในการสร้างโค้ดส่วนหน้า (Front-end code) และการสวมบทบาท (Role-playing)
บริษัทฯ ยืนยันว่า "โมเดลนี้ได้แสดงประสิทธิภาพที่โดดเด่นในการประเมินผลมาตรฐานต่างๆ รวมถึงคณิตศาสตร์ การเขียนโปรแกรม และตรรกะทั่วไป"
ความสำเร็จของ DeepSeek ได้ทลายความเชื่อที่ว่ามาตรการควบคุมการส่งออกของสหรัฐฯ จะสามารถสกัดกั้นความก้าวหน้าด้าน AI ของจีนได้
หลังจากที่บริษัทฯ ได้เปิดตัวโมเดล AI ที่มีประสิทธิภาพทัดเทียมหรือเหนือกว่าโมเดลชั้นนำในสหรัฐฯ แต่มาในราคาที่ถูกกว่ามาก
อีกหนึ่งนวัตกรรมที่น่าสนใจคือ DeepSeek ได้นำกระบวนการคิดเชิงเหตุผล (Chain-of-thought) ของ R1-0528 ไปใช้ในการปรับปรุงโมเดล Qwen 3 8B Base ของ Alibaba ซึ่งเป็นเทคนิคที่เรียกว่า "การกลั่นโมเดล" (Distillation) ส่งผลให้โมเดลของ Alibaba มีประสิทธิภาพสูงขึ้นกว่า 10%
DeepSeek เชื่อว่ากระบวนการคิดนี้จะมีความสำคัญอย่างยิ่งต่องานวิจัยเชิงวิชาการเกี่ยวกับโมเดลการใช้เหตุผลและการพัฒนาโมเดลขนาดเล็กในภาคอุตสาหกรรม
การรุกคืบของ DeepSeek ส่งผลให้คู่แข่งอย่าง Google Gemini ต้องออกมานำเสนอระดับการเข้าถึงในราคาที่ถูกลง ขณะที่ OpenAI ก็ได้ปรับลดราคาและเปิดตัว o3 Mini ซึ่งเป็นโมเดลที่ใช้พลังการประมวลผลน้อยลง
แม้ว่าการอัปเดตครั้งนี้จะมุ่งเน้นไปที่การปรับปรุง R1 แต่ตลาดยังคงคาดการณ์อย่างกว้างขวางถึงการเปิดตัว R2 ซึ่งเป็นรุ่นถัดไปของ R1
โดยมีรายงานก่อนหน้านี้ว่า R2 อาจเปิดตัวภายในเดือนพฤษภาคม นอกจากนี้ DeepSeek ยังได้เปิดตัวการอัปเกรด V3 LLM ไปเมื่อเดือนมีนาคมที่ผ่านมา สะท้อนให้เห็นถึงการพัฒนาที่ไม่หยุดนิ่งของสตาร์ทอัปดาวรุ่งจากจีนรายนี้
ที่มา : REUTERS