เอเอ็มดี (AMD) เปิดตัวกลุ่มผลิตภัณฑ์ และโซลูชั่น AI ในงาน Advancing AI 2024 สำหรับการขับเคลื่อนโซลูชั่น AI สำหรับองค์กร และผู้ใช้งานทั่วไป…
AMD เปิดตัวกลุ่มผลิตภัณฑ์ และโซลูชั่น AI ในงาน Advancing AI 2024 สำหรับการขับเคลื่อนองค์กร และผู้ใช้งานทั่วไป
เอเอ็มดี (AMD) ประกาศเปิดตัวโซลูชันการประมวลผลประสิทธิภาพสูงรุ่นล่าสุด เพื่อกำหนดนิยามของยุคแห่งการประมวลผลด้าน AI ประกอบด้วยโปรเซสเซอร์สำหรับเซิร์ฟเวอร์ 5th Gen AMD EPYC™, กราฟิกการ์ด เอเอ็มดี Instinct™ MI325X, ชิปหน่วยประมวลผลข้อมูล เอเอ็มดี Pensando™ Salina DPUs,
เอเอ็มดี Pensando Pollara 400 NICs และโมบายโปรเซสเซอร์ เอเอ็มดี Ryzen™ AI PRO 300 series สำหรับโซลูชั่น AI ระดับองค์กร เอเอ็มดี และพันธมิตรยังได้นำเสนอการใช้งานโซลูชัน AI ของ เอเอ็มดี ในระดับองค์กร
การเติบโตอย่างต่อเนื่องของระบบนิเวศซอฟต์แวร์ AI โอเพ่นซอร์สบน เอเอ็มดี ROCm™ และกลุ่มผลิตภัณฑ์ใหม่ที่หลากหลายบนพื้นฐานผลิตภัณฑ์กราฟิกการ์ด เอเอ็มดี Instinct, โปรเซสเซอร์ EPYC และโปรเซสเซอร์ Ryzen PRO
ดร.ลิซ่า ซู ประธานและซีอีโอ บริษัท เอเอ็มดี กล่าวว่า ดาต้าเซ็นเตอร์ และ AI เป็นโอกาสเติบโตที่สำคัญสำหรับ เอเอ็มดี และเรากำลังสร้างโมเมนตัมที่แข็งแกร่งสำหรับโปรเซสเซอร์ EPYC และกราฟิกการ์ด Instinct ของเราในกลุ่มลูกค้าที่เพิ่มขึ้น
ด้วยผลิตภัณฑ์ใหม่โปรเซสเซอร์ EPYC และกราฟิกการ์ด Instinct และ Pensando DPUs เรากำลังส่งมอบเทคโนโลยีการประมวลผลระดับผู้นำเพื่อขับเคลื่อนเวิร์คโหลดงานที่สำคัญ และมีความต้องการสูงที่สุดให้กับลูกค้าของเรา
เมื่อมองไปในอนาคต เราเห็นว่าตลาดกราฟิกการ์ด AI สำหรับดาต้าเซ็นเตอร์จะเติบโตถึง 5 แสนล้านดอลลาร์ ภายในปี 2028 เรามุ่งมั่นทุ่มเทเพื่อส่งมอบนวัตกรรมแบบเปิดผ่านโซลูชันระดับซิลิคอน ซอฟต์แวร์ เครือข่าย และคลัสเตอร์ของ เอเอ็มดี
การกำหนดนิยามของดาต้าเซ็นเตอร์ในยุค AI
เอเอ็มดี ได้ประกาศเปิดตัวกลุ่มผลิตภัณฑ์ดาต้าเซ็นเตอร์สำหรับ AI ระดับองค์กร คลาวด์ และการผสานรวมงานที่หลากหลาย
- โปรเซสเซอร์ EPYC 9005 Series ใหม่ มอบประสิทธิภาพการประมวลผลในระดับที่สามารถทำลายสถิติ[i] เพื่อเปิดใช้งานโซลูชันด้านการประมวลผลที่ได้รับการคำนวณให้เหมาะสมสำหรับความต้องการของดาต้าเซ็นเตอร์ที่หลากหลาย สร้างขึ้นบนสถาปัตยกรรม “Zen 5” รุ่นล่าสุด มาพร้อมคอร์ประมวลผลสูงสุด 192 คอร์ และจะวางจำหน่ายบนแพลตฟอร์มที่หลากหลายผ่าน OEM และ ODM ชั้นนำ ตั้งแต่วันนี้เป็นต้นไป
- เอเอ็มดี ยังคงดำเนินการตามแผนการเปิดตัวผลิตภัณฑ์กราฟิกการ์ด AI ประจำปี ผ่านการเปิดตัวผลิตภัณฑ์กราฟิกการ์ด เอเอ็มดี Instinct MI325X มอบประสิทธิภาพการประมวลผล และหน่วยความจำระดับชั้นนำสำหรับงานด้าน AI ที่ต้องการประสิทธิภาพสูงสุด โดย เอเอ็มดี ได้แชร์รายละเอียดใหม่ของกราฟิกการ์ด Instinct MI350 series รุ่นต่อไป ซึ่งคาดว่าจะเปิดตัวในช่วงครึ่งหลังของปี 2025 โดยขยายความจุหน่วยความจำและประสิทธิภาพด้าน generative AI บน เอเอ็มดี Instinct นอกจากนี้ เอเอ็มดี ยังมีความคืบหน้าอย่างมากในการพัฒนากราฟิกการ์ด Instinct MI400 Series บนสถาปัตยกรรม CDNA Next โดยวางแผนจะวางจำหน่ายในปี 2026
- เอเอ็มดี ได้พัฒนาชุดซอฟต์แวร์ ROCm อย่างต่อเนื่อง ทำให้ประสิทธิภาพการอนุมาน และการเรียนรู้บนกราฟิกการ์ด Instinct MI300X เพิ่มขึ้นเป็นสองเท่า[ii] ในโมเดลด้าน AI ที่กำลังได้รับความนิยมมากที่สุด ปัจจุบัน มีโมเดลมากกว่าหนึ่งล้านโมเดลที่ทำงานได้อย่างราบรื่นบนกราฟิกการ์ด Instinct ซึ่งเพิ่มขึ้นถึงสามเท่าของจำนวนที่เปิดตัว MI300X โดยมาพร้อมการรองรับบนโมเดลต่าง ๆ ที่ใช้กันอย่างแพร่หลาย
- เอเอ็มดี ได้ขยายกลุ่มผลิตภัณฑ์เครือข่ายประสิทธิภาพสูง เพื่อตอบสนองความต้องการด้านระบบเครือข่ายที่เปลี่ยนแปลงไปสำหรับโครงสร้างพื้นฐาน AI โดยเพิ่มประสิทธิภาพการประมวลผลของโปรเซสเซอร์ และกราฟิกการ์ดสูงสุด เพื่อมอบประสิทธิภาพ ความสามารถในการปรับขนาดเวิร์คโหลด และประสิทธิภาพทั่วทั้งระบบ ชิปหน่วยประมวลผลข้อมูล Pensando Salina DPU มอบเครือข่ายส่วนหน้า (front-end) ประสิทธิภาพสูงสำหรับระบบ AI ในขณะที่ Pensando Pollara 400 ซึ่งเป็นผลิตภัณฑ์กลุ่ม NIC ที่รองรับ Ultra Ethernet Consortium ช่วยลดความซับซ้อนของการปรับแต่งประสิทธิภาพและยกระดับเวลาในการผลิตให้ดียิ่งขึ้น
พันธมิตรของ เอเอ็มดี ได้นำเสนอว่าพวกเขาใช้โซลูชันดาต้าเซ็นเตอร์ของ เอเอ็มดี ในการขับเคลื่อนความเป็นผู้นำด้าน generative AI มอบโครงสร้างพื้นฐานระบบคลาวด์ที่ใช้งานโดยผู้คนหลายล้านคนต่อวัน และขับเคลื่อนดาต้าเซ็นเตอร์แบบ ออน-เพรเมิส (on-prem) และแบบไฮบริดให้กับองค์กรชั้นนำต่าง ๆ
- นับตั้งแต่เปิดตัวในเดือนธันวาคม 2023 กราฟิกการ์ด เอเอ็มดี Instinct MI300X มีการใช้งานอย่างแพร่หลายผ่านพันธมิตรชั้นนำด้านระบบคลาวด์ OEM และ ODM และกำลังให้บริการผู้ใช้หลายล้านคนต่อวันบนโมเดล AI ที่ได้รับความนิยม เช่น OpenAI’s ChatGPT, Meta Llama และมากกว่าหนึ่งล้านโมเดลโอเพ่นซอร์สบนแพลตฟอร์ม Hugging Face
- Google ได้เน้นย้ำถึงวิธีการที่โปรเซสเซอร์ EPYC ขับเคลื่อนบนอินสแตนซ์ที่หลากหลายสำหรับงานด้าน AI, การประมวลผลประสิทธิภาพสูง, การประมวลผลทั่วไป และการประมวลผลที่เป็นความลับขั้นสูง รวมถึง AI Hypercomputer สถาปัตยกรรมซูเปอร์คอมพิวเตอร์ที่ออกแบบมา เพื่อเพิ่มผลตอบแทนจากการลงทุนด้าน AI สูงสุด Google ยังได้ประกาศว่า VM ที่ใช้โปรเซสเซอร์ EPYC 9005 Series จะพร้อมวางจำหน่ายในช่วงต้นปี 2025
- Oracle Cloud Infrastructure ได้แชร์วิธีการใช้ประโยชน์จากโปรเซสเซอร์ EPYC, กราฟิกการ์ด เอเอ็มดี Instinct และ Pensando DPUs เพื่อมอบการประมวลผล และโครงสร้างพื้นฐานเครือข่ายที่รวดเร็วและประหยัดพลังงานให้กับลูกค้า เช่น Uber, Red Bull Powertrains, PayPal และ Fireworks AI โดย OCI ได้ประกาศเปิดตัวแพลตฟอร์มการประมวลผล E6 ใหม่ที่ขับเคลื่อนขุมพลังการประมวลผลบนโปรเซสเซอร์ EPYC 9005
- Databricks เน้นย้ำว่าโมเดล และเวิร์กโฟลว์ ทำงานได้อย่างราบรื่นบนกราฟิกการ์ด Instinct และ ROCm พร้อมเปิดเผยว่าจากการทดสอบแสดงให้เห็นว่าความจุหน่วยความจำขนาดใหญ่ และความสามารถในการประมวลผลของ Instinct MI300X GPUs ช่วยเพิ่มประสิทธิภาพขึ้นมากกว่า 50% ใน Llama และโมเดลเฉพาะของ Databricks
- ความร่วมมือ Microsoft และการสร้างสรรค์ร่วมกันมาอย่างยาวนานระหว่าง ไมโครซอฟต์ และ เอเอ็มดี ในผลิตภัณฑ์และโครงสร้างพื้นฐานของ Microsoft โดย MI300X มอบประสิทธิภาพที่แข็งแกร่งบนเวิร์คโหลด Microsoft Azure และ GPT นอกจากนี้ทั้ง 2 บริษัทฯ ยังได้หารือเกี่ยวกับความร่วมมือเชิงลึกเกี่ยวกับแผนการพัฒนา Instinct และวิธีที่ Microsoft จะใช้ประโยชน์จากกราฟิกการ์ด Instinct รุ่นต่อไป รวมถึง MI350 series และรุ่นต่อ ๆ ไป เพื่อมอบประสิทธิภาพต่อดอลลาร์ต่อวัตต์ในระดับผู้นำสำหรับแอปพลิเคชันด้าน AI
- Meta อธิบายถึงรายละเอียดกระบวนการที่โปรเซสเซอร์ EPYC และกราฟิกการ์ด Instinct ขับเคลื่อนโครงสร้างพื้นฐานการประมวลผลในงาน และบริการด้าน AI โดย MI300X ให้บริการการรับส่งข้อมูลแบบเรียลไทม์ทั้งหมดบน Llama 405B นอกจากนี้ Meta ยังจับมือเป็นพันธมิตรกับ เอเอ็มดี เพื่อเพิ่มประสิทธิภาพ AI ทั้งในระดับซิลิคอน ระบบ เครือข่าย ไปจนถึงซอฟต์แวร์และแอปพลิเคชัน
- คามร่วมมือกับบริษัทชั้นนำอย่าง Dell, HPE, Lenovo และ Supermicro กำลังขยายกลุ่มผลิตภัณฑ์ประสิทธิภาพสูง และประหยัดพลังงานบนขุมพลังโปรเซสเซอร์ EPYC ด้วยแพลตฟอร์มใหม่ที่ออกแบบมาเพื่อทำให้ดาต้าเซ็นเตอร์ทันสมัยสำหรับยุค AI
เอเอ็มดี ขยายอีโคซิสเต็มด้าน Open AI
เอเอ็มดี ยังคงลงทุนในอีโคซิสเต็มด้าน AI แบบเปิด และขยายซอฟต์แวร์โอเพ่นซอร์ส ROCm ด้วยฟีเจอร์ เครื่องมือ การเพิ่มประสิทธิภาพ และการสนับสนุนใหม่ ๆ เพื่อช่วยให้ผู้พัฒนาสามารถดึงประสิทธิภาพได้สูงสุดจากกราฟิกการ์ด Instinct และมอบการรองรับโมเดลด้าน AI ชั้นนำในปัจจุบัน
โดยผู้นำธุรกิจด้าน AI อย่าง Essential AI, Fireworks AI, Luma AI และ Reka AI ได้หารือถึงวิธีการเพิ่มประสิทธิภาพบนโมเดลต่าง ๆ ทั้งบนฮาร์ดแวร์ และซอฟต์แวร์ของ เอเอ็มดี
นอกจากนี้ เอเอ็มดี ยังได้จัดกิจกรรมสำหรับนักพัฒนา ซึ่งมีผู้นำด้านเทคนิคจากอีโคซิสเต็มนักพัฒนา AI เข้าร่วม เช่น Microsoft, OpenAI, Meta, Cohere, xAI และบริษัทชั้นนำอื่น ๆ มากมาย โดยมีผู้บรรยายชื่อดังซึ่งเป็นผู้ประดิษฐ์ภาษาการเขียนโปรแกรม โมเดล และเฟรมเวิร์ก AI ที่สำคัญต่อการปฎิรูปอุตสาหกรรม AI
เช่น Triton, TensorFlow, vLLM และ Paged Attention, FastChat และอื่น ๆ อีกมากมาย ซึ่งได้มาแชร์วิธีที่นักพัฒนาปลดล็อกการเพิ่มประสิทธิภาพ AI ผ่านภาษาการเขียนโปรแกรมที่ไม่ขึ้นกับผู้ขาย หรือผู้จัดจำหน่าย การเร่งความเร็วการประมวลผลโมเดลบนกราฟิกการ์ด Instinct
และการเน้นย้ำถึงความสะดวกในการพอร์ตไปยังซอฟต์แวร์ ROCm และวิธีที่อีโคซิสเต็มกำลังได้รับประโยชน์จากแนวทางโอเพ่นซอร์ส
เพิ่มประสิทธิภาพการทำงานในระดับองค์กรด้วย AI PC
เอเอ็มดี เปิดตัวโปรเซสเซอร์ Ryzen AI PRO 300 Series ซึ่งเป็นโปรเซสเซอร์ที่ขับเคลื่อนขุมพลังการประมวลผลให้กับแล็ปท็อป Microsoft Copilot+ ตัวแรกที่เปิดใช้งานสำหรับองค์กร[iii] กลุ่มผลิตภัณฑ์โปรเซสเซอร์ Ryzen AI PRO 300 Series ขยายความเป็นผู้นำของ เอเอ็มดี ด้านประสิทธิภาพการประมวลผลและอายุการใช้งานแบตเตอรี่ พร้อมด้วยฟีเจอร์ด้านความปลอดภัย และการจัดการระดับองค์กรสำหรับผู้ใช้งานทางธุรกิจ
- โปรเซสเซอร์ Ryzen AI PRO 300 Series ใช้สถาปัตยกรรม เอเอ็มดี “Zen 5” และ AMD XDNA™ 2 ใหม่ เป็นโปรเซสเซอร์เชิงพาณิชย์ที่ล้ำสมัยที่สุดในโลก[iv] มอบประสิทธิภาพการประมวลผลที่ดีที่สุดในกลุ่มผลิตภัณฑ์ระดับเดียวกันเพื่อผลิตผลงานที่ยกระดับไปอีกขั้น[v] และประสิทธิภาพด้าน AI ระดับ 55 NPU TOPS[vi] ซึ่งเป็นประสิทธิภาพระดับชั้นนำของอุตสาหกรรม บนโปรเซสเซอร์ Ryzen AI 9 HX PRO 375 เพื่อประมวลผลงานด้าน AI บนเครื่องแล็ปท็อป Ryzen AI PRO
- Microsoft เน้นว่า Windows 11 Copilot+ และกลุ่มผลิตภัณฑ์โปรเซสเซอร์ Ryzen AI PRO 300 พร้อมแล้วสำหรับประสบการณ์ด้าน AI รุ่นต่อไป รวมถึงฟีเจอร์ใหม่ด้านประสิทธิภาพการผลิต และความปลอดภัย
- พันธมิตร OEM อย่าง HP และ Lenovo กำลังขยายข้อเสนอเชิงพาณิชย์ด้วยกลุ่มผลิตภัณฑ์คอมพิวเตอร์ใหม่ที่ขับเคลื่อนขุมพลังการประมวลผลบนโปรเซสเซอร์ Ryzen AI PRO 300 Series โดยคาดว่าจะมีแพลตฟอร์มมากกว่า 100 แพลตฟอร์มที่จะออกสู่ตลาดภายในปี 2025
รายละเอียดเพิ่มเติม
[ii] Testing conducted by internal AMD Performance Labs as of September 29, 2024 inference performance comparison between ROCm 6.2 software and ROCm 6.0 software on the systems with 8 AMD Instinct™ MI300X GPUs coupled with Llama 3.1-8B, Llama 3.1-70B, Mixtral-8x7B, Mixtral-8x22B, and Qwen 72B models.
ROCm 6.2 with vLLM 0.5.5 performance was measured against the performance with ROCm 6.0 with vLLM 0.3.3, and tests were performed across batch sizes of 1 to 256 and sequence lengths of 128 to 2048.
Configurations:
1P AMD EPYC™ 9534 CPU server with 8x AMD Instinct™ MI300X (192GB, 750W) GPUs, Supermicro AS-8125GS-TNMR2, NPS1 (1 NUMA per socket), 1.5 TiB (24 DIMMs, 4800 mts memory, 64 GiB/DIMM), 4x 3.49TB Micron 7450 storage, BIOS version: 1.8, , ROCm 6.2.0-00, vLLM 0.5.5, PyTorch 2.4.0, Ubuntu® 22.04 LTS with Linux kernel 5.15.0-119-generic.
vs.
1P AMD EPYC 9534 CPU server with 8x AMD Instinct™ MI300X (192GB, 750W) GPUs, Supermicro AS-8125GS-TNMR2, NPS1 (1 NUMA per socket), 1.5TiB 24 DIMMS, 4800 mts memory, 64 GiB/DIMM), 4x 3.49TB Micron 7450 storage, BIOS version: 1.8, ROCm 6.0.0-00, vLLM 0.3.3, PyTorch 2.1.1, Ubuntu 22.04 LTS with Linux kernel 5.15.0-119-generic. MI300-62
Server manufacturers may vary configurations, yielding different results. Performance may vary based on factors including but not limited to different versions of configurations, vLLM, and drivers.
[iii] Based on Microsoft Copilot+ requirements of minimum 40 TOPS using AMD product specifications and competitive products announced as of Oct 2024. Microsoft requirements found here – https://support.microsoft.com/
[iv] Based on a small node size for an x86 platform and cutting-edge, interconnected technologies, as of September 2024. GD-203b
[v] Testing as of Sept 2024 by AMD performance labs using the following systems: HP EliteBook X G1a with AMD Ryzen AI 9 HX PRO 375 processor @40W, Radeon™ 890M graphics, 32GB of RAM, 512GB SSD, VBS=ON, Windows 11 Pro; Lenovo ThinkPad T14s Gen 6 with AMD Ryzen™ AI 7 PRO 360 processor @22W, Radeon™ 880M graphics, 32GB RAM, 1TB SSD, VBS=ON, Windows 11 Pro; Dell Latitude 7450 with Intel Core Ultra 7 165U processor @15W (vPro enabled), Intel Iris Xe Graphics, VBS=ON, 32GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Professional; Dell Latitude 7450 with Intel Core Ultra 7 165H processor @28W (vPro enabled), Intel Iris Xe Graphics, VBS=ON, 16GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Pro. The following applications were tested in Balanced Mode: Teams + Procyon Office Productivity, Teams + Procyon Office Productivity Excel, Teams + Procyon Office Productivity Outlook, Teams + Procyon Office Productivity Power Point, Teams + Procyon Office Productivity Word, Composite Geomean Score. Each Microsoft Teams call consists of 9 participants (3X3). Laptop manufactures may vary configurations yielding different results. STXP-10.
Testing as of Sept 2024 by AMD performance labs using the following systems: (1) Lenovo ThinkPad T14s Gen 6 with an AMD Ryzen™ AI 7 PRO 360 processor (@22W), Radeon™ 880M graphics, 32GB RAM, 1TB SSD, VBS=ON, Windows 11 Pro; (2) Dell Latitude 7450 with Intel Core Ultra 7 165U processor (@15W) (vPro enabled), Intel Iris Xe Graphics, VBS=ON, 32GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Professional; and (3) Dell Latitude 7450 with Intel Core Ultra 7 165H processor (@28W) (vPro enabled), Intel Arc Graphics, VBS=ON, 16GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Pro. Tested applications (in Balanced Mode) include: Procyon Office Productivity, Procyon Office Productivity Excel, Procyon Office Productivity Outlook, Procyon Office Productivity Power Point, Procyon Office Productivity Word, Composite Geomean Score. Laptop manufactures may vary configurations yielding different results. STXP-11.
[vi] Trillions of Operations per Second (TOPS) for an AMD Ryzen processor is the maximum number of operations per second that can be executed in an optimal scenario and may not be typical. TOPS may vary based on several factors, including the specific system configuration, AI model, and software version. GD-243.
ส่วนขยาย * บทความเรื่องนี้น่าจะเป็นประโยชน์สำหรับการวิเคราะห์ในมุมมองที่น่าสนใจ ** เขียน: ชลัมพ์ ศุภวาที (บรรณาธิการ และผู้สื่อข่าว) *** ขอขอบคุณภาพประกอบบางส่วนจาก N/A
สามารถกดติดตามข่าวสาร และบทความทางด้านเทคโนโลยีของเราได้ที่ www.facebook.com/itday.in.th