2015年,UCloud在國內(nèi)云廠商中首先推出了K80-GPU云主機(jī)。此后,我們又相繼推出了P40、V100等GPU云主機(jī)、定制化物理機(jī)以及UAI-Train、UAI-Inference等以GPU為基礎(chǔ)的AI產(chǎn)品,為人工智能用戶持續(xù)創(chuàng)造價(jià)值。如今,我們更進(jìn)一步,推出專門的GPU可用區(qū)。通過對(duì)架構(gòu)精裁,其相比于普通可用區(qū),GPU價(jià)格降低20%,帶寬價(jià)格降低64%,并支持10G/25G物理網(wǎng)絡(luò)和VPC私有網(wǎng)絡(luò),憑借獨(dú)享性能、豐富產(chǎn)品互聯(lián)、自助購買、按月租賃,幫助用戶避免自行維護(hù)GPU集群做AI訓(xùn)練的高昂投入。
目前,福建GPU可用區(qū)A已對(duì)全部用戶開放,并支持在控制臺(tái)直接購買下單。
降低20%成本,支持按月付費(fèi)
GPU使用成本高,一方面是GPU卡本身非常昂貴,另一方面功耗與機(jī)柜成本幾乎占據(jù)了整體成本的40%,而這部分成本可以被有效降低。為此UCloud在國內(nèi)臻選電力成本較低且符合基礎(chǔ)標(biāo)準(zhǔn)的機(jī)房建立GPU可用區(qū)。此次上線的GPU可用區(qū)位于福建省,為省級(jí)骨干IDC機(jī)房,符合國際數(shù)據(jù)中心標(biāo)準(zhǔn)Tier3,提供移動(dòng)線路。
UCloud的云計(jì)算核心原本為標(biāo)準(zhǔn)可用區(qū)設(shè)計(jì),目的是支撐上萬級(jí)別的服務(wù)器,近百種不同的云計(jì)算服務(wù)。為了提升整體性價(jià)比,我們花費(fèi)1周時(shí)間,便對(duì)GPU可用區(qū)快速進(jìn)行了定制,推出了一個(gè)全新版本的迷你型云計(jì)算核心,內(nèi)部代號(hào)“螞蟻”?!拔浵仭焙诵膲嚎s了超過50%的云控制面成本,依然能支撐起完整的物理云主機(jī)與網(wǎng)絡(luò)產(chǎn)品并提供穩(wěn)定的服務(wù)。
受益于功耗、機(jī)柜、云計(jì)算核心攤銷成本的降低,GPU可用區(qū)的物理云單價(jià)比UCloud其他標(biāo)準(zhǔn)可用區(qū)都要便宜20%。以V100物理云為例,GPU可用區(qū)在北京二可用區(qū)E的列表單價(jià)降低5000元/月,和業(yè)內(nèi)相比也有突出的價(jià)格優(yōu)勢。UCloud亦提供更具性價(jià)比的GPU機(jī)型可供選擇。
GPU可用區(qū)的計(jì)費(fèi)模式與其他可用區(qū)一致,物理機(jī)支持按月與按年付費(fèi),可隨時(shí)釋放。用戶不必一次性投入巨大的開支,可自如增減集群規(guī)模,應(yīng)對(duì)市場的動(dòng)態(tài)變化。此外,福建GPU可用區(qū)提供移動(dòng)單線網(wǎng)絡(luò),帶寬費(fèi)用比其他可用區(qū)降低64%。
大單精浮點(diǎn)性能104 TFLOPs,獨(dú)享物理機(jī)
GPU可用區(qū)以成熟的物理云產(chǎn)品體系為依托。計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)性能均沒有任何虛擬化帶來的額外開銷。這對(duì)AI訓(xùn)練這樣看重絕對(duì)性能的場景非常重要。
一臺(tái)GPU物理機(jī)大能支持104 TFLOPs的單精度浮點(diǎn)性能,約等于2000顆CPU的算力。采用10G與25G兩套物理網(wǎng)絡(luò)環(huán)境。25G網(wǎng)絡(luò)帶來更高的集群運(yùn)算效率,集群規(guī)?!?0臺(tái)計(jì)算節(jié)點(diǎn)時(shí),均推薦采用25G。和普通可用區(qū)提供的GPU云主機(jī)相比,整體性能翻倍。
物理云主機(jī)產(chǎn)品已實(shí)現(xiàn)后臺(tái)資源交付入庫、系統(tǒng)裝機(jī)等流程高度自動(dòng)化,并支持多種鏡像、多種RAID模式可選。用戶直接在控制臺(tái)點(diǎn)選后就自動(dòng)執(zhí)行裝機(jī)操作,30分鐘內(nèi)裝機(jī)完成即可使用,免去傳統(tǒng)物理機(jī)運(yùn)輸、搭建、部署、調(diào)試等冗長過程。
物理云主機(jī)裝機(jī)中
針對(duì)物理機(jī)難以避免的硬件故障隱患,UCloud硬件運(yùn)維團(tuán)隊(duì)維護(hù)了詳細(xì)的固件問題列表,發(fā)現(xiàn)隱患會(huì)及時(shí)發(fā)起固件的全網(wǎng)升級(jí);物理云主機(jī)在交付用戶前、用戶退還機(jī)器后均會(huì)自動(dòng)執(zhí)行完整的硬件檢測。此外物理云集成了UCloud監(jiān)控平臺(tái),通過監(jiān)控提前發(fā)現(xiàn)磁盤故障、GPU卡溫度過高等硬件問題,并通知NOC團(tuán)隊(duì)快速處理(7*24小時(shí))。
GPU物理云的網(wǎng)關(guān)有A/B兩套互備集群,網(wǎng)絡(luò)流量可在AB集群之間平滑切換。由于此架構(gòu),在主網(wǎng)關(guān)出現(xiàn)故障時(shí)能實(shí)現(xiàn)快速切換到備用網(wǎng)關(guān),最小化對(duì)用戶的影響;亦能通過集群切換實(shí)現(xiàn)網(wǎng)絡(luò)架構(gòu)的平滑升級(jí)。通過這套模式,北京地區(qū)的物理云集群實(shí)現(xiàn)了從10G網(wǎng)關(guān)到25G網(wǎng)關(guān)的在線動(dòng)態(tài)升級(jí),用戶除了低峰期網(wǎng)絡(luò)瞬斷外完全無感知。未來GPU可用區(qū)的網(wǎng)關(guān)也能通過這種能力不斷更新版本。
物理云網(wǎng)關(guān)互備集群
豐富的產(chǎn)品互聯(lián)
GPU可用區(qū)支持標(biāo)準(zhǔn)的網(wǎng)絡(luò)產(chǎn)品,包括彈性EIP、私有網(wǎng)絡(luò)VPC、NAT網(wǎng)關(guān)等。未來計(jì)劃將上線高速通道UDPN,和廣州可用區(qū)互聯(lián)。
在AI訓(xùn)練場景下,TB級(jí)別的訓(xùn)練數(shù)據(jù)如何搬遷上云是用戶的核心訴求。UCloud提供高性能NAS盤柜寄送服務(wù),可支持大100T的離線數(shù)據(jù)搬遷,傳輸作業(yè)完成后,會(huì)以低階格式化方式擦除數(shù)據(jù),以確保數(shù)據(jù)安全。
分布式訓(xùn)練場景下通常需要大容量的中央存儲(chǔ)節(jié)點(diǎn)。GPU可用區(qū)目前提供SSD磁盤的高性能物理機(jī)作為存儲(chǔ)節(jié)點(diǎn)。后續(xù)將提供UFS(分布式文件存儲(chǔ))產(chǎn)品,給用戶提供最優(yōu)的存儲(chǔ)選擇。
對(duì)福建GPU可用區(qū)有任何建議和疑問,歡迎點(diǎn)擊http://ucloudtml.mikecrm.com/aiTDtNg垂詢。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
本文標(biāo)題:降低20%成本,國內(nèi)首個(gè)GPU可用區(qū)上線-創(chuàng)新互聯(lián)
標(biāo)題鏈接:http://aaarwkj.com/article48/jddep.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供商城網(wǎng)站、App開發(fā)、品牌網(wǎng)站設(shè)計(jì)、網(wǎng)站維護(hù)、做網(wǎng)站、關(guān)鍵詞優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容