国产三区四区_亚洲精品国产精品色欲AV_青青操av在线_黄的网站在线观看_中文字幕无码无遮挡在线看_日韩精品中文字幕吗一区二区

IT之道-艾銻知道

IT運(yùn)維 | 異構(gòu)計(jì)算簡(jiǎn)介


2020-05-12 17:50 作者:艾銻無(wú)限 瀏覽量:
北京IT外包服務(wù)商為您提供專業(yè)的IT外包服務(wù)
 
隨著人工智能的發(fā)展,越來(lái)越多的計(jì)算平臺(tái)都采用了異構(gòu)計(jì)算。作為IT運(yùn)維必須要了解這種運(yùn)算架構(gòu),以便更好的服務(wù)我們的客戶。異構(gòu)計(jì)算主要是指使用不同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式。異構(gòu)計(jì)算已經(jīng)無(wú)處不在,從超算系統(tǒng)到桌面到云到終端,都包含不同類型指令集和體系架構(gòu)的計(jì)算單元,下面先從幾個(gè)系統(tǒng)了解下異構(gòu)計(jì)算超算系統(tǒng)。


天河-2:包括16,000個(gè)計(jì)算節(jié)點(diǎn),每個(gè)節(jié)點(diǎn) 2*Xeon (IveBridge)+3*Phi。Total 3,120,000 Core, Linpack測(cè)試基準(zhǔn)為33.86 petaFLOPS ,Power 17.6 megawatts。編程框架:OpenMC/OpeMP。

Mac Pro: Intel Xeon E5 (6/8/2 cores) + Dual AMD FirePro D500 GPU (1526 stream processors, 2.2 teraflops, 3-way 4k video)。編程框架:CUDA、OpenCL、Metal。 

Amazon Linux GPU Instances g2.8xlarge: 4 GPU (each with 1,536 CUDA cores and 4 GB of video memory and the ability to 4* 1080p@30fps), 32 vCPU 。編程框架:CUDA,OpenCL。

Qualcomm Snapdragon 820 : octa-core CPU+ Adreno 530 GPU+ Hexagon 680 DSP,編程框架:MARE,OpenCL。

顯然,異構(gòu)計(jì)算系統(tǒng)包含了不同異構(gòu)計(jì)算單元,如CPU、GPU、DSP、ASIC、FPGA等。除了異構(gòu)硬件單元,不同異構(gòu)計(jì)算平臺(tái)采用的編程框架也不盡相同。那么,為什么要用異構(gòu)計(jì)算?異構(gòu)計(jì)算優(yōu)勢(shì)主要提現(xiàn)在性能、性價(jià)比、功耗、面積等指標(biāo)上,在特定場(chǎng)景,異構(gòu)計(jì)算往往會(huì)表現(xiàn)出驚人的計(jì)算優(yōu)勢(shì)。

· Google Brain:1,000臺(tái)服務(wù)器 (16,000 CPU核) 模擬simulating a model of the brain with a billion synapses.

· Nvidia:three GPU-accelerated servers: 12 GPUs in total, 18,432 CUDA processor cores.

The Nvidia solution uses 100 times less energy, and a 100 times less cost.

除OpenCL之外,還有很多編程框架?異構(gòu)并行計(jì)算框架是充分發(fā)揮異構(gòu)硬件性能和屏蔽硬件差異的關(guān)鍵,但目前業(yè)界不存在一個(gè)統(tǒng)一標(biāo)準(zhǔn)。OpenCL是業(yè)界主流公司推動(dòng)的異構(gòu)并行計(jì)算編程標(biāo)準(zhǔn)。OpenCL屬于性能層,業(yè)界很多產(chǎn)能層框架對(duì)接OpenCL。

· Intel、ARM、高通的異構(gòu)硬件均支持OpenCL軟件設(shè)計(jì)。

· Intel Xeon+FPGA異構(gòu)芯片支持OpenCL。

Nvidia CUDA、Apple Metal是針對(duì)各自異構(gòu)硬件設(shè)計(jì)的計(jì)算私有框架,是封閉系統(tǒng),但都有廣泛的開發(fā)者支持。CUDA和OpenCL在設(shè)計(jì)理念上非常相近,但Nvidia GPU性能業(yè)界最強(qiáng),有能力通過(guò)CUDA綁定用戶,比如深度學(xué)習(xí)上Nvidia GPU效果最好,開發(fā)者只能選擇CUDA。異構(gòu)硬件的一個(gè)趨勢(shì)是SOC上集成多種異構(gòu)硬件。比如高通820芯片集成了ARM64+GPU+DSP等多種形態(tài)。

· 但傳統(tǒng)的計(jì)算框架只針對(duì)一種硬件設(shè)計(jì),無(wú)法支持多形態(tài)。

· 高通設(shè)計(jì)了Symphony異構(gòu)并行計(jì)算框架來(lái)發(fā)揮多形態(tài)異構(gòu)硬件性能,同時(shí)適應(yīng)未來(lái)芯片的演進(jìn)。

OpenCL異構(gòu)編程技術(shù)得到各大廠家的大力支持,可屏蔽異構(gòu)硬件與OS差異,簡(jiǎn)化異構(gòu)核編程復(fù)雜度,OpenCL由蘋果提出,得到業(yè)界大多數(shù)廠商的支持:如Nvidia、Apple、AMD、ARM、INTEL、TI等等,支撐GPGPU、DSP、FPGA等通用硬件加速器。

· 優(yōu)勢(shì):OpenCL是針對(duì)GPGPU大規(guī)模數(shù)據(jù)并行的特性所開發(fā)的底層編程框架,屏蔽各廠商GPU之間的差異,與芯片設(shè)計(jì)協(xié)同演進(jìn),C語(yǔ)言的擴(kuò)展。

· 不足:性能的可移植性不足。


 


 
OpenCL編程模型中隱含了很多的硬件特征,比如并行粒度、內(nèi)存模型、存儲(chǔ)層次、資源粒度、內(nèi)存帶寬和延遲、ISA差異等,這導(dǎo)致不同的加速器上的OpenCL代碼都要重新思考上述特征。隨著FPGA的廣泛使用,成本逐步降低,作為軟件定義實(shí)現(xiàn)快速在線指令優(yōu)化,對(duì)整個(gè)編譯器、運(yùn)行框架、

OS產(chǎn)生巨大影響。新架構(gòu)對(duì)軟件的挑戰(zhàn):

· 1)支持CPU+FPGA融合并行的計(jì)算框架,包括FPGA編譯和高層語(yǔ)言設(shè)計(jì)。

· 2)大規(guī)模分布式FPGA資源管理與調(diào)度

· 3)高性能FPGA算法庫(kù)。

異構(gòu)計(jì)算主要是指使用不同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式。常見的計(jì)算單元類別包括CPU、GPU、DSP、ASIC、FPGA等。FPGA和GPU/CPU對(duì)比具有以下不同:

· 1.軟件定義的硬件架構(gòu):GPU/CPU硬件固定,其并行性設(shè)計(jì)是適應(yīng)固定硬件。而FPGA的硬件邏輯可以通過(guò)軟件動(dòng)態(tài)改變,從硬件的角度來(lái)適配軟件,從而獲得更高的計(jì)算性能。

· 2.更高并行性、能效比:FPGA擁有更豐富的計(jì)算資源組件,從而能夠滿足更多并行計(jì)算需求。并且能夠充分發(fā)掘軟件算法中的并行性,降低功耗。

同時(shí),新架構(gòu)融合CPU+FPGA,將成為一種發(fā)展趨勢(shì):

· 1. 異構(gòu)核首次作為一等公民:通過(guò)CPU+FPGA的融合設(shè)計(jì),由主機(jī)+外設(shè)的Offloading模式轉(zhuǎn)變?yōu)楫悩?gòu)多核片上系統(tǒng)設(shè)計(jì),CPU與FPGA地位等同,通信方式由板級(jí)轉(zhuǎn)向片內(nèi)。

·  2. OpenCL帶來(lái)了FPGA的編程革命:提高了FPGA的可編程性,將程序員從復(fù)雜的硬件電路設(shè)計(jì)中解救出來(lái),更專注于系統(tǒng)/算法的設(shè)計(jì)。



 


 
總結(jié):CPU主要是做通用控制以及計(jì)算的,整個(gè)算術(shù)邏輯單元ALU占整個(gè)芯片面積不到5%。CPU里面包含很多控制邏輯,預(yù)測(cè),Cache等邏輯,所以算力不高,但是什么都能做。

· CPU主要特點(diǎn):主頻高,但核數(shù)有限;邏輯控制和算術(shù)運(yùn)算單元、具有大量緩存,主要功能在于管理和調(diào)度任務(wù)。

GPU專門用來(lái)做浮點(diǎn)運(yùn)算,只能作為協(xié)處理器配合CPU完成特定計(jì)算。但GPU天然假設(shè)所有運(yùn)算可以并行(GPU具有數(shù)千個(gè)計(jì)算核),整個(gè)芯片90%都是運(yùn)算邏輯。所以算力非常高,通常是CPU的幾十上百倍。

· GPU特點(diǎn):高并發(fā)(幾千個(gè)核并),強(qiáng)浮點(diǎn)能力和高顯存帶寬。

FPGA主頻低但集成大量計(jì)算單元,流水線并行和數(shù)據(jù)并行,具備硬件編程和加速和特定應(yīng)用IP核。然而,ASIC是針對(duì)某一場(chǎng)景優(yōu)化的專用處理單元,硬件基本不可編程,采用多個(gè)IP集成,但有高性價(jià)比和能效比。
 
艾銻無(wú)限科技專業(yè):IT外包、企業(yè)外包、北京IT外包、桌面運(yùn)維、弱電工程、網(wǎng)站開發(fā)、wifi覆蓋方案,網(wǎng)絡(luò)外包,網(wǎng)絡(luò)管理服務(wù),網(wǎng)管外包,綜合布線,服務(wù)器運(yùn)維服務(wù),中小企業(yè)it外包服務(wù),服務(wù)器維保公司,硬件運(yùn)維,網(wǎng)站運(yùn)維服務(wù)
 
以上文章由北京艾銻無(wú)限科技發(fā)展有限公司整理

相關(guān)文章

IT外包服務(wù)
二維碼 關(guān)閉
主站蜘蛛池模板: 日日视频 | 欧美成人免费观看视频 | 亚洲午夜理论片在线观看 | 蜜臀亚洲AV无码精品国产午夜. | 国产特色特黄的视频免费观看 | 亚洲一区二区观看 | 四只虎影院在线免费 | 俄罗斯ZOOM与人性ZOOM | 久久精品三 | 5252aⅴhaose我爱久久 | 亚洲成a| 呻吟求饶的人妻中文字幕 | 国产成人av免费看 | 大乳警花受辱记 | 狠狠躁天天躁无码中文字幕图 | 亚洲毛片大全 | 一级片免费观看视频 | 成人做爰高潮片免费看视频 | 饥渴少妇与三个黑人互动 | 日本三级韩国三级香港三级写真集 | 东北老夫妇啪啪嗷嗷叫 | 香蕉高清永久在线视频 | 一个人看的视频www在线观看 | 永夜星河在线免费观看 | 浪货跪下给我好好含着羞辱调教 | 久久久亚洲精品视频 | 中文字幕二区在线 | 亚洲午夜精品久久 | 澳门成免费crm大全 狠狠躁夜夜躁av蜜臀少妇 | 蜜臀忘忧草久久久久久久aⅴ | av网站免费看 | 好爽好黄好刺激的视频 | 欧美精品国产制服第一页 | 亚洲精品视频免费 | 五月天婷婷色综合 | 午夜视频在线观看免费视频 | 国产日本欧美一区二区三区 | 在线视频日韩精品 | 国产日本欧洲亚洲 | 男插女高潮一区二区 | 久久99最新地址 |