當(dāng)下,數(shù)字經(jīng)濟(jì)背景下,伴隨企業(yè)不斷深入云化轉(zhuǎn)型、科研體系深度接軌實(shí)體經(jīng)濟(jì)以及數(shù)據(jù)科學(xué)新領(lǐng)域的飛速發(fā)展,算力需求呈現(xiàn)出多樣化、個(gè)性化、巨量化趨勢(shì),原本服務(wù)于尖端科研的HPC也逐漸成為企業(yè)發(fā)展的重要力量。
然而,具有高維、時(shí)變、海量等特征的科學(xué)數(shù)據(jù)不僅需要超高性能底層算力,更需要彈性伸縮、簡(jiǎn)便運(yùn)維提升綜合算效,傳統(tǒng) HPC 集群在材料學(xué)、基因組學(xué)、生命科學(xué)、CAE 仿真、深度學(xué)習(xí)、地理測(cè)繪、影視渲染等應(yīng)用場(chǎng)景面臨諸多不便。
日前,青云QingCloud(qingcloud.com,股票代碼:688316)重磅上線EHPC高性能計(jì)算平臺(tái),基于尖端超算算力,結(jié)合公有云架構(gòu)提供彈性伸縮、按需計(jì)費(fèi)的高性價(jià)比方案。同時(shí),打通云平臺(tái)豐富的產(chǎn)品和服務(wù)種類(lèi),創(chuàng)新云化超算的服務(wù)新模式,更好賦能新科研、助力新場(chǎng)景。
高性能計(jì)算是什么?
對(duì)于非IT專(zhuān)業(yè)人士而言,大家接觸較多的信息和通信設(shè)備,通常是個(gè)人電腦和手機(jī),很多人都不了解計(jì)算機(jī)界“皇冠上明珠”的高性能計(jì)算 (HPC) 到底是什么樣子?這次我們就帶大家認(rèn)識(shí)認(rèn)識(shí)它。
其實(shí),高性能計(jì)算,指的是用大量服務(wù)器并行地對(duì)某一個(gè)任務(wù)執(zhí)行運(yùn)算,來(lái)解決工程和科學(xué)上的問(wèn)題。它的用途很多,最核心的是用來(lái)模擬世界萬(wàn)物。宏觀上,可以用衛(wèi)星圖像、遙感數(shù)據(jù)、氣象數(shù)據(jù)利用高性能計(jì)算來(lái)模擬地球、海洋和氣候;微觀上,青云能模擬分子原子來(lái)了解生命的原理,使藥物的研發(fā)更快速、更精確。
比如,天氣預(yù)報(bào)需要融合幾十個(gè)緯度的數(shù)據(jù),石油天然氣勘探需要進(jìn)行空間分析和建模,DNA測(cè)序需要對(duì)比成千上萬(wàn)個(gè)堿基對(duì)等,這些對(duì)任意一個(gè)單一計(jì)算機(jī)來(lái)說(shuō)都負(fù)荷太大了,而高性能計(jì)算可以很好應(yīng)對(duì)。
青云QingCloud 云平臺(tái)&服務(wù)部高級(jí)總監(jiān)陳海泉表示:“高性能計(jì)算這一領(lǐng)域出現(xiàn)了一個(gè)新的場(chǎng)景,大數(shù)據(jù)和人工智能正在與超算融合。”
第一,高性能計(jì)算跟尖端科研是密不可分的。科學(xué)家要讓科技持續(xù)進(jìn)步,一定要之前的研究人員對(duì)更大規(guī)模的數(shù)據(jù)做計(jì)算,并且不斷提高計(jì)算精度。
第二,大數(shù)據(jù)驅(qū)動(dòng)存儲(chǔ)跟算力融合。以前建超算中心的時(shí)候,普遍是以算力為主導(dǎo),但在存儲(chǔ)方面出現(xiàn)新的挑戰(zhàn)。
一方面,現(xiàn)在數(shù)據(jù)越來(lái)越多,比如衛(wèi)星、無(wú)人機(jī)在不斷產(chǎn)生大量的高精度照片。
另一方面,數(shù)據(jù)類(lèi)型也在變多,比如可穿戴設(shè)備的普及、IoT 的廣泛應(yīng)用,都在不斷產(chǎn)生各種新的、不同類(lèi)型的數(shù)據(jù)。這些數(shù)據(jù)都需要利用大數(shù)據(jù)進(jìn)行處理和分析。這一改變正在驅(qū)使數(shù)據(jù)中心和算力中心互相融合,并且數(shù)據(jù)量越大,對(duì)應(yīng)的算力也需要更強(qiáng)。
第三,人工智能應(yīng)用爆發(fā)。人工智能通常指的是機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)最常用的技術(shù)是深度學(xué)習(xí)。深度學(xué)習(xí)有兩個(gè)階段:第一階段是對(duì)大量的數(shù)據(jù)進(jìn)行計(jì)算,得到訓(xùn)練模型;第二階段是通過(guò)已得到的訓(xùn)練模型,結(jié)合新的數(shù)據(jù)做推理計(jì)算,解決實(shí)際的問(wèn)題,比如圖像識(shí)別、自然語(yǔ)言識(shí)別等,都需要推理。其中,訓(xùn)練階段需要進(jìn)行大量的浮點(diǎn)運(yùn)算,為了達(dá)到足夠的算力,就需要用很多的GPU節(jié)點(diǎn)。
陳海泉表示介紹道:“青云看到的兩個(gè)具體場(chǎng)景,都是大數(shù)據(jù)、人工智能與超算結(jié)合的場(chǎng)景。”
當(dāng)青云提供了一個(gè)基礎(chǔ)設(shè)施,它適應(yīng)了人工智能、大數(shù)據(jù)和超算,以及不同的業(yè)務(wù)時(shí),青云希望它能盡快復(fù)用。這就是青云提供的EHPC超算平臺(tái)—— QingCloud EHPC,可以全面地支持各種新的業(yè)務(wù)場(chǎng)景。
青云的超算布局
一直以來(lái),HPC渲染創(chuàng)造了很多科幻電影中的經(jīng)典場(chǎng)景,而在現(xiàn)實(shí)中,HPC早已成為各國(guó)“科技競(jìng)賽”中最尖端的領(lǐng)域之一。
從藥品研制、天氣預(yù)報(bào)、地震監(jiān)測(cè),到能源勘探、基因分析、人工智能,HPC幫助人們解決了科研、工作、生活中的許多難題。如今,隨著技術(shù)創(chuàng)新發(fā)展、智能化持續(xù)加速,人們對(duì)算力的需求越來(lái)越大,應(yīng)用場(chǎng)景從傳統(tǒng)向物聯(lián)網(wǎng)、人工智能等領(lǐng)域不斷滲透,HPC在各個(gè)方面都面臨著巨大的挑戰(zhàn)。
為解決傳統(tǒng)HPC資源利用率低、投入成本大、運(yùn)維管理重、安全防護(hù)難等痛點(diǎn),青云科技推出了青云彈性高性能計(jì)算——QingCloud EHPC。相較于傳統(tǒng)HPC,QingCloud EHPC提供了一種快捷、彈性、安全以及互通的基于云平臺(tái)的高性能計(jì)算服務(wù),它能支持計(jì)算資源的彈性定制,降低成本,提高資源利用率,具有極大的靈活性。
針對(duì)超算在尖端科技、大數(shù)據(jù)以及人工智能場(chǎng)景的支持,QingCloud EHPC也給出了相應(yīng)的解決方案。
如超算最常見(jiàn)的仿真和建模業(yè)務(wù),青云提供了低延時(shí)、高帶寬的InfiniBand網(wǎng)絡(luò),高速并行文件存儲(chǔ)以及CPU/GPU的算力組合,不僅能支持大規(guī)模求解運(yùn)算,還能提供GPU桌面進(jìn)行圖形前后處理,完成一個(gè)閉環(huán)的業(yè)務(wù)場(chǎng)景。
對(duì)于大數(shù)據(jù)業(yè)務(wù),QingCloud云平臺(tái)提供的對(duì)象存儲(chǔ)容量達(dá)245PB,跟計(jì)算節(jié)點(diǎn)結(jié)合,可以用于大規(guī)模的數(shù)據(jù)處理和分析。計(jì)算節(jié)點(diǎn)到對(duì)象存儲(chǔ)的網(wǎng)絡(luò)帶寬有1.6T,能夠保證大數(shù)據(jù)計(jì)算的超高性能。
對(duì)于人工智能訓(xùn)練業(yè)務(wù),青云提供算力達(dá)850PFlops的A100 GPU資源池和全閃并行文件存儲(chǔ),并且能夠結(jié)合容器平臺(tái),提供性能極致優(yōu)化、輕量便捷、開(kāi)源開(kāi)放的人工智能平臺(tái)。
另外,使用方式也是超算中心一個(gè)痛點(diǎn),傳統(tǒng)的超算中心用戶,在使用時(shí),需要提交申請(qǐng),并且有人工審批的環(huán)節(jié),當(dāng)他得到審批通過(guò)后,還需要自己安裝VPN客戶端連接超算中心提供的登錄節(jié)點(diǎn)。
為了讓整個(gè)超算使用更靈活,青云提供了偏傳統(tǒng)的共享型超算集群和獨(dú)享EHPC集群兩種不同類(lèi)型的超算集群。
其中,共享型超算集群給用戶的計(jì)算節(jié)點(diǎn)是共享的,但登錄節(jié)點(diǎn)是獨(dú)享,所以用戶自己軟件的安裝、執(zhí)行、操作還是在自己的節(jié)點(diǎn)上,跟別的用戶沒(méi)有關(guān)聯(lián)。
獨(dú)享EHPC集群給用戶一個(gè)root賬號(hào),用戶使用會(huì)非常方便。它的優(yōu)勢(shì)是不僅能自由地安裝自己需要的系統(tǒng)軟件,甚至切換超算平臺(tái)的各種軟件,或是大數(shù)據(jù)相關(guān)的Hadoop、MapReduce,用戶可以自己隨便安裝;二是EHPC集群的節(jié)點(diǎn)是用戶獨(dú)享,可以自己合理安排使用時(shí)間。三是EHPC集群的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)類(lèi)型,用戶可以自由搭配。
除此之外,云計(jì)算給HPC帶來(lái)的一個(gè)最大的變化是,把傳統(tǒng)的審批制度變成用戶自服務(wù)的形式,用戶隨時(shí)可以自己到云平臺(tái)注冊(cè)賬號(hào),并且充值購(gòu)買(mǎi)他需要的計(jì)算資源。
QingCloud EHPC 產(chǎn)品經(jīng)理苗慧表示:“青云EHPC提供云上超算SaaS化服務(wù),方便快捷讓作業(yè)運(yùn)行起來(lái)。通過(guò)青云的彈性公網(wǎng)IP、公網(wǎng)帶寬,將數(shù)據(jù)進(jìn)行快速地上傳、下載,與本地?cái)?shù)據(jù)同步。”
寫(xiě)在最后
陳海泉總結(jié)道:“青云的超算云平臺(tái)可以支持大數(shù)據(jù)和人工智能融合的超算業(yè)務(wù),并且以云服務(wù)的方式提供,讓超算資源更便捷地交付給用戶。”
目前,數(shù)字化創(chuàng)新對(duì)企業(yè)發(fā)展和業(yè)務(wù)創(chuàng)新都提出了更大挑戰(zhàn)。青云意識(shí)到EHPC將云計(jì)算與高性能計(jì)算的結(jié)合,對(duì)于數(shù)字經(jīng)濟(jì)發(fā)展有著重要意義。為此,青云科技將緊扣技術(shù)發(fā)展趨勢(shì),繼續(xù)創(chuàng)新,不斷更新迭代彈性高性能計(jì)算能力,豐富和完善EHPC方案的能力,持續(xù)滿足用戶高性能計(jì)算需求。