Alibaba โอเพ่นซอร์ส AI Qwen3 รองรับภาษาไทยให้โหลดฟรี

Alibaba

อาลีบาบา (Alibaba) เปิดตัว โอเพ่นซอร์ส AI Qwen3 รุ่นล่าสุด ที่รองรับภาษาไทย และสามารถทำงานแบบ Hybrid Reasoning ให้ดาวน์โหลดได้ฟรีทั่วโลก…

Alibaba โอเพ่นซอร์ส AI : Qwen3 ที่ทำงานแบบ Hybrid Reasoning และรองรับภาษาไทยให้โหลดฟรี

อาลีบาบา สร้างมาตรฐานใหม่ให้กับนวัตกรรมด้าน AI เปิดตัว Qwen3 ซึ่งเป็นรุ่นล่าสุดของตระกูลโมเดลภาษาขนาดใหญ่ (LLM) แบบโอเพ่นซอร์สของบริษัทฯ โดย ซีรีส์ Qwen3 ประกอบด้วย 6 dense model และ 2 Mixture-of-Experts (MoE) model

ซึ่งช่วยให้ผู้พัฒนาซอฟต์แวร์สร้างแอปพลิเคชันยุคใหม่สำหรับอุปกรณ์เคลื่อนที่ แว่นตาอัจฉริยะ ยานยนต์ไร้คนขับ หุ่นยนต์ และอื่น ๆ อีกมากมายได้อย่างยืดหยุ่น โมเดล Qwen3 ทั้งหมด ปัจจุบันเปิดเป็นโอเพ่นซอร์สทั่วโลก ซึ่งรวมถึง dense models (ขนาดพารามิเตอร์ 0.6B, 1.7B, 4B, 8B, 14B, และ 32B) และ MoE models (30B with 3B active, และ 235B with 22B active)

Alibaba

โมเดลการใช้เหตุผลแบบผสมผสาน (hybrid reasoning models) คือ การผสานรวมโหมดการคิดเป็นขั้นเป็นตอน (thinking mode) และโหมดการใช้สัญชาตญาณ (non-thinking mode) ไว้ด้วยกัน

Qwen3 เป็น hybrid reasoning models แรกของอาลีบาบา เป็นการรวมความสามารถของ LLM แบบเดิม เข้ากับการใช้เหตุผลแบบไดนามิกที่ล้ำหน้า โมเดล Qwen3 สามารถสลับการใช้งานทั้งสองโหมดไปมา โดยใช้ thinking mode กับงานที่ซับซ้อนหลายขั้นตอน

เช่น คณิตศาสตร์ การเขียนโค้ด การอนุมานเชิงตรรกะ และใช้ non-thinking mode เมื่อต้องการการตอบสนองที่รวดเร็วและตามวัตถุประสงค์อื่นทั่ว ๆ ไป นักพัฒนาซอฟต์แวร์ที่เข้าใช้งาน Qwen3 ผ่าน API จะสามารถควบคุมระยะเวลาการคิดอย่างละเอียด (สูงสุด 38K โทเค็น) ช่วยให้เกิดสมดุลระหว่าง

การดำเนินงานที่ชาญฉลาด และประสิทธิภาพในการประมวลผล โดยเฉพาะ Qwen3-235B-A22B MoE model ที่ช่วยลดต้นทุนการติดตั้งใช้งานได้อย่างมากเมื่อเทียบกับโมเดลระดับเดียวกันอื่น ๆ เป็นการย้ำให้เห็นความมุ่งมั่นของ อาลีบาบา ที่มุ่งสร้าง AI สมรรถนะสูงที่ให้ทุกคนเข้าใช้งานได้

Alibaba

ความก้าวหน้าครั้งสำคัญ

Qwen3 ได้รับการเทรนจากชุดข้อมูลขนาดใหญ่จำนวน 36 ล้านล้านโทเค็น ซึ่งมากกว่า Qwen2.5 ซึ่งเป็นรุ่นก่อนหน้าถึงสองเท่า จึงมีประสิทธิภาพล้ำหน้าอย่างมากทั้งด้านการใช้เหตุผล การทำตามคำสั่ง การใช้เครื่องมือและงานที่เป็นภาษาต่าง ๆ หลายภาษา โดย Qwen3 มีความสามารถสำคัญ ๆ ได้แก่

  • เชี่ยวชาญหลายภาษา : รองรับ 119 ภาษาหลักและภาษาถิ่น มีความสามารถในการแปลและปฏิบัติตามคำสั่งได้หลายภาษาด้วยประสิทธิภาพสูง
  • สามารถผสานรวมเอเจนต์ประสิทธิภาพสูง : รองรับ Model Context Protocol (MCP) และการเรียกใช้ฟังก์ชันหรือการเรียกใช้เครื่องมือที่ทรงประสิทธิภาพ นับเป็นโมเดลโอเพ่นซอร์สระดับแนวหน้าเพื่องานที่ต้องใช้เอเจนต์ที่ซับซ้อน
  • มีการใช้เหตุผลที่เหนือกว่า : เหนือกว่าโมเดล Qwen รุ่นก่อนหน้านี้ (QwQ ใช้ thinking mode และ Qwen2.5 ใช้ non-thinking mode) ในด้านการวัดประสิทธิภาพทางคณิตศาสตร์ การเขียนโค้ด และการใช้เหตุผลเชิงตรรกะ
  • สอดคล้องกับความคิด และพฤติกรรมของมนุษย์มากขึ้น : สามารถมอบการเขียนเชิงสร้างสรรค์ การแสดงบทบาทสมมติ และการสนทนาโต้ตอบไปมา เพื่อทำให้การสนทนาเป็นธรรมชาติ และน่าสนใจมากขึ้น

Alibaba

ความก้าวหน้าทางสถาปัตยกรรมของโมเดล ปริมาณข้อมูลการเทรนที่เพิ่มขึ้น และวิธีการเทรนที่มีประสิทธิภาพมากขึ้น ช่วยให้ Qwen3 สามารถทำผลงานได้อย่างโดดเด่นในการทดสอบระดับมาตรฐานอุตสาหกรรมต่าง ๆ

เช่น AIME25 (การให้เหตุผลทางคณิตศาสตร์), LiveCodeBench (ความสามารถในการเขียนโค้ด), BFCL (ความสามารถในการใช้เครื่องมือและการเรียกใช้ฟังก์ชัน) และ Arena-Hard (เกณฑ์มาตรฐานสำหรับ LLM ที่สามารถปรับแต่งเพื่อให้เข้าใจและทำตามคำสั่งเฉพาะได้) 

นอกจากนี้ ได้มีการนำกระบวนการเทรนสี่ขั้นตอนมาใช้ เพื่อพัฒนา hybrid reasoning model ประกอบด้วย การเริ่มต้นการเทรนให้มีความสามารถในการใช้เหตุผลแบบเป็นขั้นตอน โดยใช้ห่วงโซ่การคิดที่เป็นลำดับในปริมาณจำกัดตั้งแต่ระยะแรกของการเทรน (long chain-of-thought cold start), 

การเรียนรู้แบบเสริมแรงโดยใช้เหตุผล (reasoning-based reinforcement learning: RL), การผสานผสาน thinking mode (thinking mode fusion) และ การเรียนรู้แบบเสริมแรงทั่วไป (general RL)

Alibaba

เปิดให้เข้าถึงเพื่อขับเคลื่อนนวัตกรรม

โมเดล Qwen3 พร้อมให้ดาวน์โหลดฟรีแล้วบน Hugging FaceGithubModelScope และสามารถทดลองใช้ได้ที่ chat.qwen.ai สำหรับการเข้าใช้ผ่าน API บน Model Studio ซึ่งเป็นแพลตฟอร์มสำหรับการพัฒนาโมเดล AI ของ อาลีบาบา จะเปิดให้เข้าใช้ได้เร็ว ๆ นี้

นอกจากนี้ Qwen3 ยังเป็นโมเดลที่ขับเคลื่อน Quark ซึ่งเป็นแอปพลิเคชันผู้ช่วยอัจฉริยะ AI สำคัญของ อาลีบาบา อีกด้วย

โดยนับแต่ อาลีบาบา เปิดตัว โมเดลในตระกูล Qwen มียอดดาวน์โหลดแล้วมากกว่า 300 ล้านครั้งทั่วโลก และนักพัฒนาซอฟต์แวร์ได้สร้างโมเดลต่อยอดจาก Qwen มากกว่า 100,000 โมเดลบน Hugging Face ทำให้ Qwen กลายเป็นหนึ่งใน ซีรีส์โมเดล opensource AI ที่มีการนำไปใช้อย่างแพร่หลายที่สุดในโลก 

Alibaba

ส่วนขยาย

* บทความเรื่องนี้น่าจะเป็นประโยชน์สำหรับการวิเคราะห์ในมุมมองที่น่าสนใจ 
** เขียน: ชลัมพ์ ศุภวาที (บรรณาธิการ และผู้สื่อข่าว) 
*** ขอขอบคุณภาพประกอบบางส่วนจาก N/A

สามารถกดติดตามข่าวสาร และบทความทางด้านเทคโนโลยีของเราได้ที่  www.facebook.com/itday.in.th

ITDay