svasdssvasds

DeepSeek R1 อัปเกรด AI จีน เพิ่มดีกรี พร้อมท้าชนยักษ์ใหญ่สหรัฐฯ

DeepSeek R1 อัปเกรด AI จีน เพิ่มดีกรี พร้อมท้าชนยักษ์ใหญ่สหรัฐฯ

สตาร์ทอัป AI จีน DeepSeek ปล่อยอัปเดต R1-0528 เพิ่มพลังการคิดเชิงลึก ลดภาพหลอน เทียบชั้น OpenAI, Google ท่ามกลางการแข่งขันที่ดุเดือดในสมรภูมิ AI โลก

SHORT CUT

  • DeepSeek R1-0528 นำเสนอความสามารถในการใช้เหตุผลที่ซับซ้อน เทียบเคียงโมเดลชั้นนำจากบริษัทสหรัฐฯ โดยมีการลดอัตราการสร้างข้อมูลเท็จลงอย่างมีนัยสำคัญ และยังคงจุดเด่นด้าน "ต้นทุนที่ต่ำกว่าคู่แข่ง"
  • DeepSeek ไม่เพียงแต่พัฒนาโมเดลของตนเอง แต่ยังแสดงให้เห็นถึงความก้าวหน้าทางเทคนิคผ่านการ "กลั่นโมเดล" (Distillation) เพื่อเพิ่มประสิทธิภาพให้โมเดลอื่น (Qwen 3 ของ Alibaba) ซึ่งเป็นประโยชน์ต่อวงการ AI ในภาพรวม
  • ความสำเร็จของ DeepSeek เป็นเครื่องพิสูจน์ว่าจีนมีความสามารถในการพัฒนา AI ระดับสูงทัดเทียมชาติตะวันตก แม้จะมีข้อจำกัดด้านการเข้าถึงเทคโนโลยีบางอย่าง ซึ่งเป็นการส่งสัญญาณถึงการแข่งขันที่เข้มข้นยิ่งขึ้นในตลาด AI โลก

สตาร์ทอัป AI จีน DeepSeek ปล่อยอัปเดต R1-0528 เพิ่มพลังการคิดเชิงลึก ลดภาพหลอน เทียบชั้น OpenAI, Google ท่ามกลางการแข่งขันที่ดุเดือดในสมรภูมิ AI โลก

DeepSeek สตาร์ทอัปปัญญาประดิษฐ์จากจีน สร้างแรงสั่นสะเทือนในวงการอีกครั้ง ด้วยการเปิดตัว R1-0528

ซึ่งเป็นรุ่นอัปเกรดของโมเดล AI ด้านการใช้เหตุผล (Reasoning Model) ยอดนิยมอย่าง R1 การอัปเดตครั้งนี้แม้จะเป็นเพียง "เวอร์ชันย่อย" แต่ก็มาพร้อมกับการปรับปรุงประสิทธิภาพครั้งสำคัญ

CREDIT : REUTERS

โดยเฉพาะอย่างยิ่งในด้านความสามารถในการคิดเชิงลึก การอนุมาน และการจัดการกับงานที่ซับซ้อน ทำให้ R1-0528 ขยับเข้าใกล้คู่แข่งระดับโลกอย่างโมเดล o3 ของ OpenAI และ Gemini 2.5 Pro ของ Google มากยิ่งขึ้น

การเปิดตัว DeepSeek R1 รุ่นแรกเมื่อเดือนมกราคมที่ผ่านมา ได้สร้างปรากฏการณ์ไปทั่วโลกและส่งผลให้หุ้นเทคโนโลยีนอกประเทศจีนดิ่งลงอย่างหนัก พร้อมกับท้าทายความเชื่อเดิมที่ว่าการพัฒนา AI จำเป็นต้องใช้พลังการประมวลผลและการลงทุนมหาศาลเสมอไป

CREDIT : REUTERS

การอัปเดตล่าสุดนี้เกิดขึ้นท่ามกลางการแข่งขันที่เข้มข้น โดยยักษ์ใหญ่เทคโนโลยีจีนอย่าง Alibaba และ Tencent ต่างก็เปิดตัวโมเดลที่อ้างว่ามีประสิทธิภาพเหนือกว่า DeepSeek

DeepSeek เวอร์ชันใหม่ R1-0528 มีอะไรน่าสนใจบ้าง?

DeepSeek เปิดเผยผ่านแพลตฟอร์มสำหรับนักพัฒนาอย่าง Hugging Face และช่องทางโซเชียลมีเดีย X และ WeChat ว่า R1-0528 ได้รับการปรับปรุงประสิทธิภาพในหลายด้าน

โดยเฉพาะอย่างยิ่ง อัตราการเกิด "ภาพหลอน" (Hallucinations) หรือการสร้างข้อมูลที่ผิดพลาดหรือทำให้เข้าใจผิด ลดลงถึงประมาณ 45-50% ในสถานการณ์เช่น การเขียนใหม่ (Rewriting) และการสรุปเนื้อหา (Summarizing)

นอกจากนี้ R1-0528 ยังแสดงให้เห็นถึงความสามารถที่โดดเด่นในการเขียนเชิงสร้างสรรค์ เช่น เรียงความ นวนิยาย และงานเขียนประเภทอื่นๆ รวมถึงการปรับปรุงความสามารถในการสร้างโค้ดส่วนหน้า (Front-end code) และการสวมบทบาท (Role-playing)

บริษัทฯ ยืนยันว่า "โมเดลนี้ได้แสดงประสิทธิภาพที่โดดเด่นในการประเมินผลมาตรฐานต่างๆ รวมถึงคณิตศาสตร์ การเขียนโปรแกรม และตรรกะทั่วไป"

ความสำเร็จของ DeepSeek ได้ทลายความเชื่อที่ว่ามาตรการควบคุมการส่งออกของสหรัฐฯ จะสามารถสกัดกั้นความก้าวหน้าด้าน AI ของจีนได้

หลังจากที่บริษัทฯ ได้เปิดตัวโมเดล AI ที่มีประสิทธิภาพทัดเทียมหรือเหนือกว่าโมเดลชั้นนำในสหรัฐฯ แต่มาในราคาที่ถูกกว่ามาก

อีกหนึ่งนวัตกรรมที่น่าสนใจคือ DeepSeek ได้นำกระบวนการคิดเชิงเหตุผล (Chain-of-thought) ของ R1-0528 ไปใช้ในการปรับปรุงโมเดล Qwen 3 8B Base ของ Alibaba ซึ่งเป็นเทคนิคที่เรียกว่า "การกลั่นโมเดล" (Distillation) ส่งผลให้โมเดลของ Alibaba มีประสิทธิภาพสูงขึ้นกว่า 10%

DeepSeek เชื่อว่ากระบวนการคิดนี้จะมีความสำคัญอย่างยิ่งต่องานวิจัยเชิงวิชาการเกี่ยวกับโมเดลการใช้เหตุผลและการพัฒนาโมเดลขนาดเล็กในภาคอุตสาหกรรม

การรุกคืบของ DeepSeek ส่งผลให้คู่แข่งอย่าง Google Gemini ต้องออกมานำเสนอระดับการเข้าถึงในราคาที่ถูกลง ขณะที่ OpenAI ก็ได้ปรับลดราคาและเปิดตัว o3 Mini ซึ่งเป็นโมเดลที่ใช้พลังการประมวลผลน้อยลง

CREDIT : REUTERS

แม้ว่าการอัปเดตครั้งนี้จะมุ่งเน้นไปที่การปรับปรุง R1 แต่ตลาดยังคงคาดการณ์อย่างกว้างขวางถึงการเปิดตัว R2 ซึ่งเป็นรุ่นถัดไปของ R1

โดยมีรายงานก่อนหน้านี้ว่า R2 อาจเปิดตัวภายในเดือนพฤษภาคม นอกจากนี้ DeepSeek ยังได้เปิดตัวการอัปเกรด V3 LLM ไปเมื่อเดือนมีนาคมที่ผ่านมา สะท้อนให้เห็นถึงการพัฒนาที่ไม่หยุดนิ่งของสตาร์ทอัปดาวรุ่งจากจีนรายนี้

ที่มา : REUTERS

related