Huawei โชว์ชิป AI ใหม่ ทำงานได้เร็วกว่า Nvidia

Huawei โชว์ชิป AI ใหม่ ทำงานได้เร็วกว่า Nvidia ในการรันโมเดล AI DeepSeek R1
20-6-2025
SCMP เปิดเผยว่า สถาปัตยกรรมศูนย์ข้อมูลขั้นสูงของ Huawei Technologies ชื่อ CloudMatrix 384 ได้ช่วยให้ชิป Ascend ของบริษัทมีประสิทธิภาพเหนือกว่าหน่วยประมวลผลกราฟิก (GPU) H800 ของ Nvidia ในการเรียกใช้โมเดลปัญญาประดิษฐ์ (AI) R1 ของ DeepSeek ตามเอกสารทางเทคนิคที่เผยแพร่ล่าสุด
เอกสารที่เขียนร่วมกันโดยนักวิจัยจาก Huawei และ SiliconFlow ซึ่งเป็นสตาร์ทอัพโครงสร้างพื้นฐาน AI ของจีน ได้อธิบาย CloudMatrix 384 ว่าเป็น "AI ซูเปอร์โหนด" เฉพาะทางที่สร้างขึ้นโดยเฉพาะสำหรับจัดการภาระงาน AI ขนาดใหญ่
Huawei คาดหวังว่า CloudMatrix "จะปรับโฉมรากฐานของโครงสร้างพื้นฐาน AI" ตามเอกสารที่เผยแพร่ในสัปดาห์นี้ ระบบประกอบด้วยหน่วยประมวลผลประสาท (NPU) Ascend 910C จำนวน 384 หน่วย และหน่วยประมวลผลกลางเซิร์ฟเวอร์ Kunpeng จำนวน 192 หน่วย ซึ่งเชื่อมต่อกันผ่านบัสรวมที่ให้แบนด์วิดท์สูงสุดและความล่าช้าต่ำสุด
## ประสิทธิภาพเหนือกว่าระบบชั้นนำโลก
โซลูชันการให้บริการโมเดลภาษาขนาดใหญ่ (LLM) ขั้นสูงที่เรียกว่า CloudMatrix-Infer ใช้ประโยชน์จากโครงสร้างพื้นฐานดังกล่าว โดยมีประสิทธิภาพเหนือกว่าระบบที่โดดเด่นที่สุดในโลกบางระบบในการเรียกใช้โมเดลการใช้เหตุผล R1 ที่มีพารามิเตอร์ 671 พันล้านตัวของ DeepSeek
สถาปัตยกรรมดังกล่าวสะท้อนความพยายามของ Huawei ซึ่งถูกคว่ำบาตรโดยสหรัฐฯ ในการเอาชนะมาตรการควบคุมเทคโนโลยีของวอชิงตัน ขณะที่บริษัทกำลังขยายขอบเขตประสิทธิภาพระบบ AI
ในระยะพรีฟิลซึ่งเกี่ยวข้องกับการประมวลผลคำสั่งเบื้องต้น CloudMatrix-Infer ทำได้ 6,688 โทเค็นต่อวินาทีต่อ NPU สำหรับความยาวคำสั่ง 4,000 โทเค็น ซึ่งเทียบเท่าประสิทธิภาพการคำนวณ 4.45 โทเค็นต่อวินาทีต่อ TFLOPS (ล้านล้านการดำเนินการจุดลอยตัวต่อวินาที)
โทเค็นเป็นหน่วยพื้นฐานที่ LLM ซึ่งเป็นเทคโนโลยีเบื้องหลังบริการ AI เชิงสร้างสรรค์อย่าง ChatGPT ใช้ประมวลผลข้อความ ความยาวโทเค็นส่งผลโดยตรงต่อต้นทุน เวลาประมวลผล และความสามารถของโมเดล AI ในการเข้าใจและตอบสนองคำสั่งหรือเรื่องเล่าที่ซับซ้อน
## ชนะ Nvidia ในทุกตัวชี้วัด
ในขั้นตอนถอดรหัสที่สร้างผลลัพธ์จากโมเดล AI ผลการวิจัยแสดงว่า CloudMatrix บันทึกได้ 1,943 โทเค็นต่อวินาทีต่อ NPU สำหรับแคชคีย์-แวลูความยาว 4,000 ซึ่งเป็นโครงสร้างหน่วยความจำที่ช่วยให้ใช้โปรเซสเซอร์ AI ได้มีประสิทธิภาพมากขึ้น
ขั้นตอนเดียวกันแสดงเวลาสร้างผลลัพธ์ต่ำกว่า 50 มิลลิวินาทีต่อโทเค็นอย่างสม่ำเสมอ ให้ประสิทธิภาพ 1.29 โทเค็นต่อวินาทีต่อ TFLOPS
ตามเอกสาร ตัวชี้วัดเหล่านี้เหนือกว่าประสิทธิภาพของเฟรมเวิร์กการให้บริการรวดเร็ว SGLang ของ Nvidia สำหรับ LLM ที่ใช้ GPU H100 ซึ่งเป็นเรือธงของบริษัทสหรัฐฯ และระบบอื่นที่เรียกใช้ R1 ของ DeepSeek ด้วยโปรเซสเซอร์ H800
## สร้างความเชื่อมั่นเทคโนโลยีจีน
การศึกษาครั้งนี้ "นำเสนอสแต็กเทคโนโลยีครอบคลุมของ Huawei CloudMatrix อย่างเต็มรูปแบบและโปร่งใส" จั่ว เผิงเฟย ผู้ที่คัดเลือกจากโครงการ "อัจฉริยะเยาวชน" ของ Huawei และผู้เขียนหลักของบทความที่ตีพิมพ์ เขียนไว้ในโพสต์เมื่อวันพุธบนแพลตฟอร์มถามตอบ Zhihu
"สิ่งนี้มีจุดมุ่งหมายช่วยให้อุตสาหกรรมเข้าใจความสามารถของ NPU Ascend ในประเทศได้อย่างเต็มที่" จั่วเขียน เขาเสริมว่าบทความยังมีจุดมุ่งหมาย "สร้างความเชื่อมั่นภายในระบบนิเวศเทคโนโลยีในประเทศในการใช้ NPU ที่พัฒนาโดยจีนเพื่อเอาชนะ GPU ของ Nvidia"
บทความนี้เป็นครั้งแรกที่ Huawei ซึ่งตั้งอยู่ในเซินเจิ้นให้รายละเอียดอย่างเป็นทางการเกี่ยวกับความสามารถของเครื่องเร่งความเร็ว AI รุ่นเรือธง Ascend 910C
## ผู้นำยอมรับ "ตามหลังหนึ่งชั่วอายุคน"
เอกสารนี้สะท้อนคำกล่าวที่เผยแพร่เมื่อเร็วๆ นี้ของเหริน เจิ้งเฟย ผู้ก่อตั้งและซีอีโอของ Huawei ซึ่งยอมรับว่าชิป Ascend ของบริษัทยังคง "ตามหลังคู่แข่งสหรัฐฯ หนึ่งชั่วอายุคน" อย่างไรก็ตาม เขาเสริมว่าการใช้วิธีการเช่น "การซ้อนและการจัดกลุ่ม" ส่งผลให้ประสิทธิภาพการคำนวณเทียบได้กับระบบที่ก้าวหน้าที่สุดในโลก
เจนเซน หวง ผู้ก่อตั้งและซีอีโอของ Nvidia ดูเหมือนเห็นด้วยกับการประเมินของเหริน "AI เป็นปัญหาที่ประมวลผลแบบขนาน ดังนั้นหากคอมพิวเตอร์แต่ละเครื่องไม่เพียงพอ... เพียงเพิ่มคอมพิวเตอร์เข้าไป" หวงกล่าวเมื่อสัปดาห์ที่แล้วในการสัมภาษณ์กับ CNBC ในงาน VivaTech ที่ปารีส
"สิ่งที่เขาพูดคือ ในจีนที่มีพลังงานมากมาย พวกเขาจะใช้ชิปเพิ่มขึ้น" หวงกล่าว เขาเสริมว่าจีนยังคงเป็นตลาดที่สำคัญเชิงยุทธศาสตร์สำหรับสหรัฐฯ เนื่องจากมีบุคลากร AI จำนวนมากในเศรษฐกิจใหญ่อันดับสองของโลก
---
IMCT NEWS
ที่มา https://www.scmp.com/tech/tech-trends/article/3315068/how-huaweis-ascend-ai-chips-outperform-nvidia-processors-running-deepseeks-r1-model?module=top_story&pgtype=homepage