NASA เตรียมขยาย Supercomputer ด้วย Supermicro ทำความเร็ว 1.56 Petaflops

NASA Center for Climate Simulation (NCCS) หน่วยงานที่มีหน้าที่ในการให้บริการ Supercomputer สำหรับโครงการหรืองานวิจัยต่างๆที่เกี่ยวข้องกับสภาพอากาศและระบบจักรวาลใน NASA ได้ทำการเลือก Supermicro ให้เป็น Platform ใหม่สำหรับส่วนต่อขยาย Supercomputer เดิม ทำความเร็วได้ถึง 1.56 Petaflops

Credit: NASA

ระบบ Supercomputer ของ NCCS มีชื่ออย่างเป็นทางการว่า “Discover” ซึ่งประกอบไปด้วย Scalable Unit (SCU) หลายๆตัวรวมกัน และจะมีการเพิ่มขยายขนาด Cluster ให้มีประสิทธิภาพมากขึ้นเรื่อยๆตามเทคโนโลยีใหม่ที่เปิดตัวออกมาในท้องตลาด ล่าสุด NCCS ได้ทำการเลือก Supermicro ให้เป็น Platform ใหม่ สำหรับโครงการต่อขยาย Supercomputer เดิม (SCU 14) โดยผ่านการประเมินจากผลการทดสอบ Bechmark Software ทั้งหมด 6 ตัว เทียบเท่ากับการใช้งานจริง จากผู้เข้าแข่งขันหลายราย

สำหรับ SCU-14 นั้นประกอบไปด้วย Node 3 แบบ ได้แก่ Compute Nodes, Service Nodes และ I/O Nodes โดย Compute Node จะใช้ในการประมวลผลแบบ Parallel Jobs ที่มีการสื่อสารภายใน Compute Node ทั้งหมดด้วยกันเอง และ Service Node ใช้ในการรับคำสั่งจากผู้ใช้งาน พร้อมทั้งเป็นตัวกระจายงาน ส่วน I/O Nodes จะคอยช่วยในการเชื่อมต่อดึงข้อมูลระหว่าง Fibre Channel SAN และ Compute Node ด้วยความเร็วสูง โดย Scalable Unit 14 (SCU-14) มีจุดเด่นดังนี้

  • ความเร็ว 1,560 Tflop/s
  • ใช้ Supermicro FatTwin 520 nodes
  • หน่วยประมวลผลรวม 20,800 Cores
  • 2 x 20-core Intel Xeon Gold 6148 “Skylake” processors (2.4 GHz) ต่อ Node
  • 192 GB Memory ต่อ Node
  • Interconnect: Intel OmniPath

Node ทั้งหมดนั้นทำงานอยู่บน Supermicro FatTwin ซึ่งเป็น Server Chassis ขนาด 4U ภายในมี Server ทั้งหมด 8 Node แต่ละ Node รองรับหน่วยประมวลผล Intel Xeon Scalable จำนวน 2 Sockets ซึ่งใหม่กว่า SCU-13 ที่ใช้หน่วยประมวลผล Haswell ถึง 2 Generation และรองรับชุดคำสั่งแบบ AVX-512 ซึ่งหากมีการปรับ Code ที่ใช้ทำงาน จะช่วยเพิ่มความเร็วให้มากกว่าชุดคำสั่ง AVX2 ได้ถึง 2 เท่า โดยในฝั่ง Network นั้น เลือกใช้ Intel Omni-Path (OPA) ที่มีความเร็ว 100Gbps ในการส่งข้อมูลแทนที่ InfiniBand แบบเดิม นอกจากนี้ยังเลือกใช้ Rack ชนิดพิเศษในการระบายความร้อน เพื่อให้ใช้พลังงานได้อย่างมีประสิทธิภาพมากที่สุด

SCU-14 Test and Development System
Credit: NCCS

ปัจจุบัน NASA ได้เริ่มติดตั้งระบบ Test and Development System ของ SCU-14 แล้ว โดยระบบทั้งหมดคาดว่าจะติดตั้งแล้วเสร็จภายในไตรมาสที่ 2 ปี 2018 ซึ่งจะช่วยให้ Discover มี Compute Node รวม 3,800 Nodes และมีหน่วยประมวลผลมากกว่า 110,000 Cores ทำความเร็วรวม 5 Petaflops

 

เกี่ยวกับ Throughwave Thailand

Throughwave Thailand เป็นตัวแทนจำหน่าย (Distributor) สำหรับผลิตภัณฑ์ Enterprise IT ครบวงจรทั้ง Server, Storage, Network และ Security พร้อมโซลูชัน VMware และ Microsoft ที่มีลูกค้าเป็นองค์กรชั้นนำระดับหลายหมื่นผู้ใช้งานมากมาย โดยทีมงาน Throughwave Thailand ได้รับความไว้วางใจจากลูกค้าจากทีมงาน Engineer มากประสบการณ์ ที่คอยสนับสนุนการใช้งานของลูกค้าตลอด 24×7 ร่วมกับ Partner ต่างๆ ทั่วประเทศไทยนั่นเอง https://www.throughwave.co.th

ที่มา: https://www.supermicro.com.tw/newsroom/pressreleases/2017/press171106_NASA.cfm