IBM ได้สร้างซูเปอร์คอมพิวเตอร์ AI ที่ทำกำไรได้บนคลาวด์

IBM ได้สร้างซูเปอร์คอมพิวเตอร์ AI ที่ทำกำไรได้บนคลาวด์

คำตอบของ IBM สำหรับซูเปอร์คอมพิวเตอร์ที่ให้ผลกำไรได้ดำเนินการมาหลายเดือนแล้ว แต่เมื่อเร็ว ๆ นี้มีการรั่วไหลของข้อมูลที่จับต้องได้เกี่ยวกับสิ่งที่เรียกว่าโครงการ Candela

เมื่อเปิดเว็บบล็อก (เปิดในแท็บใหม่) เพื่อหารือเกี่ยวกับรายละเอียด IBM พบว่างานวิจัยที่เขียนโดยพนักงานบริษัท 5 คน กล่าวถึงปัญหาของซูเปอร์คอมพิวเตอร์รุ่นก่อนๆ และการขาดความพร้อมสำหรับงาน AI ในอนาคต

เพื่อปรับแต่งโมเดลซูเปอร์คอมพิวเตอร์ให้เหมาะกับปริมาณงานในอนาคต บริษัทได้เน้นย้ำถึงการตัดสินใจของบริษัทในด้านการใช้ฮาร์ดแวร์ราคาย่อมเยาที่มีประสิทธิภาพมากขึ้น

Candela AI ซูเปอร์คอมพิวเตอร์จาก IBM

หนังสือระบุว่า "การสร้างซูเปอร์คอมพิวติ้งหมายถึงโหนดโลหะเปล่า ฮาร์ดแวร์เครือข่ายประสิทธิภาพสูง...ระบบไฟล์คู่ขนาน และสิ่งอื่นๆ ที่มักเกี่ยวข้องกับการประมวลผลประสิทธิภาพสูง (HPC)

แม้ว่าจะไม่มีข้อสงสัยว่าซูเปอร์คอมพิวเตอร์เหล่านี้สามารถจัดการกับปริมาณงาน AI ขนาดใหญ่ได้ ซึ่งรวมถึงซูเปอร์คอมพิวเตอร์ที่พัฒนาขึ้นสำหรับ OpenAI ซึ่งเป็นการเริ่มต้นเบื้องหลังซอฟต์แวร์สนทนาสดยอดนิยม ChatGPT การขาดการปรับให้เหมาะสมหมายความว่าซูเปอร์คอมพิวเตอร์แบบดั้งเดิมอาจสูญเสียพลังงานที่มีค่าและมีส่วนเกินในพื้นที่อื่นๆ ทำให้ใช้จ่ายฟุ่มเฟือย .

แม้ว่าโหนด Bare Metal จะได้รับการยอมรับมานานแล้วว่าเหมาะสมที่สุดสำหรับ AI แต่ IBM ต้องการสำรวจความเป็นไปได้ในการนำเสนอโหนดเหล่านี้ภายในเครื่องเสมือน (VM) ผลลัพธ์ตาม Big Blue คือประสิทธิภาพที่เพิ่มขึ้นอย่างมาก

“หลังจากการวิจัยและการค้นพบจำนวนมาก เราได้คิดค้นวิธีเปิดเผยความจุแต่ละโหนด (GPU, CPU, เครือข่าย และสตอเรจ) ในเครื่องเสมือน เพื่อให้โอเวอร์เฮดของเวอร์ชวลไลเซชันน้อยกว่าห้าเปอร์เซ็นต์ ซึ่งก็คือ ค่าโสหุ้ยต่ำที่สุดในอุตสาหกรรมที่เรารู้จัก

ในแง่ของการออกแบบโหนด Candela มาพร้อมกับหน่วยความจำ 4 GB หรือ GPU หนึ่งตัวมี DRAM XNUMX TB และไดรฟ์จัดเก็บ NVMe XNUMX x XNUMX TB

Next Platform (เปิดในแท็บใหม่) ประมาณการว่าหาก IBM ต้องการให้ซูเปอร์คอมพิวเตอร์ของตนติดอันดับ Top500 ก็จะเสนอประสิทธิภาพการทำงานราว XNUMX เพตาฟล็อป ซึ่งจะจัดให้อยู่ในอันดับที่ XNUMX ในการจัดอันดับสองปีพฤศจิกายน พันยี่สิบสอง

ในขณะที่ซูเปอร์คอมพิวเตอร์ในปัจจุบันสามารถจัดการกับปริมาณงานของ AI ได้ การพัฒนาอย่างมหาศาลของปัญญาประดิษฐ์ควบคู่ไปกับความต้องการเร่งด่วนในการทำกำไรได้เน้นย้ำถึงความต้องการเครื่องดังกล่าว