เอไอ สิงค์โปร์ (AI Singapore) ร่วมมือกับ อะเมซอน เว็บ เซอร์วิส หรือ เอดับบลิวเอส (Amazon Web Services : AWS) สร้างโมเดล “เจเนอเรทีฟ เอไอ” (Generative AI) ที่ครอบคลุมประเทศในเอเชียตะวันออกเฉียงใต้ (Southeast Asia : SEA) …
AI Singapore ร่วมมือกับ AWS สร้างโมเดล Generative AI ที่ครอบคลุมประเทศใน Southeast Asia
![AWS](https://www.itday.in.th/wp-content/uploads/2024/02/Werner-Vogels.jpg)
เวอร์เนอร์ โวเกลส์ (Werner Vogels) ซีทีโอของ บริษัท Amazon กล่าวว่า จาการการวิเคราะห์แนวโน้มเทคโนโลยีในปี 2567 ของ “เจเนอเรทีฟ เอไอ“ (Generative AI) หรือ ปัญญาประดิษฐ์ที่รู้จักคิดจดจำ และเรียนรู้สิ่งต่าง ๆ ได้ จะสามารถรับรู้ด้านวัฒนธรรมมากขึ้น
โดยการเทรนโมเดลภาษาขนาดใหญ่ (Large language models: LLM) ซึ่งเป็นแขนงหนึ่งในหมวดหมู่ของเทคโนโลยีปัญญาประดิษฐ์ (Artificial intelligence: AI) ด้วยข้อมูลที่หลากหลาย จึงนำไปสู่ผลลัพธ์ที่ลึกซึ้งและแม่นยำยิ่งขึ้น เป้าหมายหลักคือการทำให้ Generative AI เข้าถึงผู้คนหลากหลายกลุ่ม
และเป็นประโยชน์แก่ผู้ใช้ทั่วโลก อย่างไรก็ตาม LLM นั้นพึ่งพาข้อมูลที่ได้รับจากอินเทอร์เน็ต ซึ่งส่วนใหญ่มักเป็นในรูปแบบภาษาและอักษรที่ถูกใช้จำนวนมาก อย่างเช่นภาษาอังกฤษ ที่มีข้อมูลสำหรับการประมวลผลภาษาธรรมชาติ (Natural language processing: NLP) อยู่มากมาย
สิ่งสำคัญที่องค์กรต่าง ๆ มองข้ามไม่ได้คือความสามารถในการดัดแปลง LLM ด้วยข้อมูล และภาษาท้องถิ่น เพื่อส่งเสริมความมีส่วนร่วมในสังคม กระตุ้นการเติบโตทางเศรษฐกิจด้วยการเปิดตลาดใหม่ ๆ และสร้างประสบการณ์ที่ดียิ่งขึ้นให้กับประชาชน โดยฌฉพาะอย่างในเรื่องของวัฒนธรรมซึ่งมีผลในทุก ๆ อย่าง
นี่เป็นสิ่งที่ผลให้ AI สิงค์โปร์ (AI Singapore : AISG) ซึ่งเป็นโครงการของภาครัฐริเริ่มโดยมูลนิธิ เพื่อการวิจัยแห่งชาติของสิงค์โปร์ (National Research Foundation) เพื่อเสริมสร้างศักยภาพของประเทศในด้าน AI และทำให้ LLM มีความแม่นยำตรงกับบริบททางวัฒนธรรมของแต่ละประเทศมากยิ่งขึ้น โดยเฉพาะสำหรับประเทศในภูมิภาคเอเชียตะวันออกเฉียงใต้
โครงการ SEA–LION : โครงการแรกสำหรับภูมิภาค
ต่อยอดจากโครงสร้างพื้นฐานของ เอดับบลิวเอส ที่มีความยืดหยุ่นในการปรับขนาดได้อย่างง่ายดาย AISG ได้พัฒนา SEA–LION ซึ่งเป็นโครงการด้าน LLM ที่ถูกเทรน และรับคำสั่งเฉพาะเจาะจงสำหรับภาษาและวัฒนธรรมจากประเทศในเอเชียตะวันออกเฉียงใต้ (การเทรนล่วงหน้าและรับคำสั่งแบบ instruct-tuned เป็นวิธีการที่ช่วยให้สามารถควบคุมพฤติกรรม LLM ได้ดียิ่งขึ้น)
โครงการแรกในภูมิภาค SEA–LION ยังทำหน้าที่เป็นรากฐานสำหรับโครงการ National Multimodal LLM ของสิงคโปร์ ซึ่งมีส่วนสนับสนุนในการวิจัย และนวัตกรรมด้าน AI ของประเทศอีกด้วย โครงการนี้เป็นส่วนหนึ่งของ National AI Strategy 2.0
ซึ่งเป็นแผนการใช้เทคโนโลยี AI ในสิงคโปร์ให้ลึกซึ้งยิ่งขึ้น โมเดลนี้จะมุ่งเน้นไปที่ภาษาที่มีการใช้งานอย่างแพร่หลายในเอเชียตะวันออกเฉียงใต้ เช่น บาฮาซาอินโดนีเซีย บาฮาซามลายู ไทย และเวียดนาม และในระยะยาวจะถูกขยายไปยัง ภาษาอื่น ๆ ในเอเชียตะวันออกเฉียงใต้เข้ามา เช่น พม่า และลาว
ซึ่งการสร้าง LLM ที่ครอบคลุมหลายประเทศในระดับภูมิภาคนั้นต้องใช้ข้อมูล[เชิงลึก]และเจาะจง กับท้องถิ่นในภาษาที่เกี่ยวข้องอีกด้วย ตัวอย่างของความแตกต่างทางภาษาท้องถิ่นคือคำว่า “LOL“ (คำย่อของ “laughing out loud” ในภาษาอังกฤษ) ในประเทศไทยคนมักใช้ “55555“ ในขณะที่ชาวอินโดนีเซียมักใช้ “wkwkwk“
ดังนั้น LLM ที่ได้รับการเทรนด้วยข้อมูลที่หลากหลายทางวัฒนธรรม เช่น SEA–LION ช่วยเพิ่มความสามารถของแอปพลิเคชัน Generative AI ให้เข้าใจแง่มุมที่ละเอียดอ่อน เหมาะแก่ประสบการณ์ใช้งานของมนุษย์ อีกทั้งยังสามารถเข้าใจความซับซ้อนทางสังคมที่อาจเป็นอุปสรรคอีกด้วย
การเร่งพัฒนา Generative AI แบบเจาะจงในแต่ละท้องถิ่น (Hyper-local) ในเอเชียตะวันออกเฉียงใต้
วันนี้ SEA–LION พร้อมใช้งานแล้วบน Amazon SageMaker JumpStart รวมทั้งโมเดลที่ได้รับการเทรนล่วงหน้า (pre-trained models) และเปิดให้ใช้งานแบบสาธารณะ เพื่อช่วยลูกค้าทั่วโลกในการเริ่มต้นใช้งานกับแมชชีนเลิร์นนิง (ML) โมเดล SEA–LION ที่ได้เปิดตัวไปแล้วมีขนาดที่ค่อนข้างเล็กด้วยพารามิเตอร์
ขนาด 3 พันล้าน และ 7 พันล้าน และได้รับการเทรนโดยใช้ Amazon EC2 ซึ่งเป็นบริการที่ให้ความสามารถในการประมวลผลที่ปรับขนาดได้บนคลาวด์ (Cloud) โมเดลรุ่นเล็ก ๆ เหล่านี้มีความยืดหยุ่น และเข้าถึงได้ง่ายกว่า LLM ที่ใช้กันทั่วไปในตลาดปัจจุบัน ซึ่งโดยปกติแล้วจะมีขนาดหลายแสนล้านพารามิเตอร์ โดยในช่วงปลายเดือน
มกราคม พ.ศ. 2567 AISG ได้ทำการเปิดตัวโมเดล SEA–LION เชิงพาณิชย์ ด้วยพารามิเตอร์ เพื่อรองรับการปรับแต่งคำสั่ง และจะมีความสามารถมากขึ้นในการจับความแตกต่างทางภาษาในเอเชียตะวันออกเฉียงใต้ รวมไปถึงปรับปรุงความเข้าใจในบริบทต่าง ๆ พัฒนาการใช้เหตุผลในหลายภาษา และสร้างผลลัพธ์ที่มีบริบทมากยิ่งขึ้น
การพัฒนาโมเดลที่มีความคล่องแคล่วในภาษาท้องถิ่นนั้น จะช่วยเพิ่มประสิทธิภาพในการสื่อสาร
พอล คอนดิลิส ผู้ช่วยรองประธาน (AVP) ด้าน Data Science ที่ Tokopedia กล่าวว่า การที่ AISG ให้ความสำคัญกับภาษาท้องถิ่นในเอเชียตะวันออกเฉียงใต้ที่ไม่ค่อยมีบทบาทนั้นมีความสำคัญอย่างมาก เนื่องจากลูกค้าส่วนใหญ่ของเราที่ Tokopedia โต้ตอบกับเราในภาษาบาฮาซา อินโดนีเซีย
การพัฒนาโมเดลที่มีความคล่องแคล่วในภาษาท้องถิ่นนั้น จะช่วยเพิ่มประสิทธิภาพของเราในการสื่อสารกับลูกค้า และพัฒนาประสบการณ์ของพวกเขา เรากำลังอยู่ในระยะทดลองขั้นต้นกับ SEA–LION ซึ่งโดยรวมดูมีแนวโน้มที่ดี
ด้าน หยิง เฉาเหว่ย หัวหน้านักวิทยาศาสตร์ที่ NCS กล่าวว่า ในขณะที่เทคโนโลยีกำลังพัฒนาไปอย่างรวดเร็วในเอเชียแปซิฟิก เรามองเห็นโอกาสที่น่าตื่นเต้นในการปรับแต่งโมเดลภาษาเพื่อสะท้อนถึงความหลากหลายทางภาษาในภูมิภาค และพลิกโฉมวิธีการประมวลผล และแบ่งปันข้อมูล
เรายินดีที่ได้ทำงานอย่างใกล้ชิดกับ AISG ในโครงการ SEA–LION LLM ที่ใช้ประโยชน์จากทรัพยากรของ เอดับบลิวเอส โครงการนี้ช่วยลดความเหลื่อมล้ำทางดิจิทัลโดยการปรับปรุงการสื่อสารระหว่างวัฒนธรรม และมอบประสบการณ์ทีเจาะจงให้สำหรับแต่ละท้องถิ่น
นอกจากนี้ ธุรกิจ และภาครัฐยังสามารถใช้ประโยชน์จากความเชี่ยวชาญของ NCS ในการตอบสนองความต้องการทางธุรกิจผ่านการใช้แอปพลิเคชันที่ขับเคลื่อนด้วย LLM เพื่อควบคุมศักยภาพสูงสุดของ LLM ใน โครงการ SEA–LION อีกด้วย
ML และการประมวลผลที่คุ้มค่า
การสร้าง การเทรน และการใช้งาน LLM ต้องใช้เวลา ทรัพยากรการประมวลผลจำนวนมาก และความเชี่ยวชาญ AISG จึงได้ร่วมมือกับ เอดับบลิวเอส เพื่อจัดการกับความท้าทายเหล่านี้ โดยการใช้ประสิทธิภาพอันทรงพลังของคลาวด์สำหรับงานต่าง ๆ
เช่น การเทรน ML และการประมวลผลประสิทธิภาพสูงโดยใช้ NVIDIA A100 Tensor Core GPU ซึ่งมอบผลลัพธ์ระดับสูงสุดพร้อมเครือข่ายที่รวดเร็ว และตอบสนองไว และด้วยขนาดที่กะทัดรัดของ SEA–LION ทำให้มีความคุ้มค่าและประสิทธิภาพมากกว่า LLM ขนาดใหญ่ ที่มีพารามิเตอร์มากกว่าหลายร้อยเท่า LLM ขนาดเล็ก
ช่วยให้นักพัฒนาสามารถใช้งานได้เร็วขึ้น ปรับแต่งได้ในราคาที่ถูกกว่า และดำเนินการได้รวดเร็วยิ่งขึ้นในระหว่างการเทรน ความง่ายในการปรับใช้ LLM ขนาดเล็กบนอุปกรณ์เคลื่อนที่ หรือที่ Edge ยังช่วยให้ธุรกิจต่าง ๆ สามารถนำมาใช้และสร้างแอปพลิเคชันได้ง่ายขึ้นอีกด้วย
ดร. เลสลี่ย์ เทียว ผู้อำนวยการอาวุโสฝ่ายผลิตภัณฑ์ AI ของ AISG กล่าวว่า การสร้าง LLM จำเป็นต้องมีโครงสร้างพื้นฐานระบบคลาวด์ที่เชื่อถือได้และพร้อมใช้งานทุกเมื่อ โดย เอดับบลิวเอส ช่วยให้เราสามารถปรับขนาดได้อย่างคุ้มค่า เราสร้าง LLM ที่มีพารามิเตอร์ 3 พันล้าน ในเวลาเพียง 3 เดือน ด้วย เอดับบลิวเอส
และตั้งแต่นั้นมาเราได้ปรับขนาดโมเดลเป็น 7 พันล้านพารามิเตอร์ เพื่อขยายการเข้าถึงไปยังผู้คนมากขึ้น การทำงานร่วมกับ เอดับบลิวเอส ทำให้เราสามารถมุ่งเน้นไปที่การเทรนโมเดลของเราเพียงอย่างเดียวแทนที่จะต้องจัดการโครงสร้างพื้นฐาน ปัจจัยนี้จึงช่วยเร่งการพัฒนา LLM ที่เป็นเอกลักษณ์ และสะท้อนถึงความหลากหลายในภูมิภาคของเรา
ด้าน เอลซี่ ตัน ผู้จัดการประจำประเทศสิงคโปร์ ฝ่ายภาครัฐทั่วโลก ของ เอดับบลิวเอส กล่าวว่า LLM ที่มีความเฉพาะด้านภาษา และวัฒนธรรม เช่น SEA–LION ของ AISG จะช่วยให้การสื่อสาร และความเข้าใจระหว่างวัฒนธรรมราบรื่นยิ่งขึ้น ช่วยรักษารายละเอียดทางวัฒนธรรม และช่วยให้ภาครัฐ และธุรกิจสามารถให้บริการประชาชน
และลูกค้าในเอเชียตะวันออกเฉียงใต้ได้ดีขึ้น เรารู้สึกตื่นเต้นที่ได้ช่วย AISG ปลดล็อกศักยภาพของ Generative AI เพื่อสร้างประโยชน์มากมายให้กับเศรษฐกิจต่าง ๆ ในอาเซียน เราหวังว่าจะได้ช่วยให้ AISG ขยายการเข้าถึงของ LLM ด้วยเครือข่ายลูกค้า และพาร์ทเนอร์ของเราในภูมิภาค
ส่วนขยาย * บทความเรื่องนี้น่าจะเป็นประโยชน์สำหรับการวิเคราะห์ในมุมมองที่น่าสนใจ ** เขียน: ชลัมพ์ ศุภวาที (บรรณาธิการ และผู้สื่อข่าว) *** ขอขอบคุณภาพประกอบบางส่วนจาก N/A
สามารถกดติดตามข่าวสาร และบทความทางด้านเทคโนโลยีของเราได้ที่ www.facebook.com/itday.in.th