美國俄亥俄州超級計算機中心(OSC)正在建立造一個用于人工智能應用的新高性能計算集群,該集群基于戴爾硬件,配備了AMD Epyc處理器和Nvidia GPU加速器。
該新高性能計算集群名為Ascend,將在今年晚些時候推出,主打支持OSC的人工智能、機器學習、大數據和數據分析工作,OSC是坊間知名的公私合作和工業高性能計算機構。據OSC稱,Ascend將和旗下現有的Pitzer 和 Owens計算集群合在一起,整個設施的人工智能、建模和模擬能力可提高兩倍。
據OSC中心副主任Doug Johnson表示,在過去幾年里,OSC對GPU資源的需求不斷增長,因此Ascend將是OSC的第一個完全致力于提供基于GPU密集處理能力的計算集群。
他表示,“建立一個專注于快速分析非常大的數據集的集群,進而提供我們目前的系統上不能運行的人工智能機器學習應用以及一些需要最快GPU的模擬,OSC將可以更好地滿足這些客戶的需求,同時確保迅速處理我們現有集群Pitzer 和 Owens的請求。”
新集群的硬件包括24個戴爾PowerEdge XE8545服務器節點,配有4U機架式系統及雙AMD Eypc第三代處理器。每個節點將配置四個Nvidia A100 80GB GPU,并與Nvidia Quantum HDR 200Gbps網絡互連。
Ascend網站目前參與了兩個美國國家科學基金會資助的項目,兩個項目旨在推進人工智能工作。第一個項目是智能網絡基礎設施與環境計算學習人工智能研究所(ICICLE),該研究所由俄亥俄州立大學領頭,旨在開發下一代網絡基礎設施,重點放在人工智能的普及。
第二個項目是將于今年舉行的“網絡基礎設施(CI)專業人員AI訓練營”,該訓練營的焦點是在全國范圍內的諸如OSC一類的研究計算設施培養其工作人員的人工智能技能。
OSC的研究軟件應用主管Karen Tomko表示,Ascend將為ICICLE研究團隊提供探索和開發新的人工智能技術方面最先進的資源,同時也令OSC自己的員工有機會增加對人工智能工作負載的了解以及支持該增長領域的最佳實踐。
Ascend將可以通過OSC的OnDemand門戶網站訪問,而該網站的客戶服務團隊將評估在該集群上運行項目的請求。OSC表示將在今年夏天給出Ascend推出日期和可用性的更詳細時間表。