“由于5G的普及,人工智能技術(shù)的成熟,再加上現(xiàn)在已經(jīng)非常完善的數(shù)據(jù)中心以及云計算技術(shù),我們會有很多的機(jī)會能夠從一些新的數(shù)據(jù)里面挖掘出新的價值,能夠去洞察各行各業(yè),獲得更多的效率提升,帶來更多的可能性,從而實現(xiàn)更高質(zhì)量的數(shù)字化轉(zhuǎn)型?!庇⑻貭柺袌鰻I銷集團(tuán)副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理陳葆立表示。為了構(gòu)建以數(shù)據(jù)為中心的產(chǎn)品組合,英特爾提供了涵蓋CPU、GPU、FPGA、ASIC等不同計算架構(gòu)滿足于各類應(yīng)用負(fù)載的解決方案,并進(jìn)一步在制程&封裝、架構(gòu)、內(nèi)存&存儲、互連、安全、軟件等領(lǐng)域提出六大技術(shù)支柱,以滿足從云端到網(wǎng)絡(luò)到邊緣的多元化客戶需求。
創(chuàng)新互聯(lián)長期為上1000+客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊從業(yè)經(jīng)驗10年,關(guān)注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為雞西企業(yè)提供專業(yè)的做網(wǎng)站、成都做網(wǎng)站,雞西網(wǎng)站改版等技術(shù)服務(wù)。擁有十余年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。在英特爾看來,這些關(guān)鍵性的技術(shù)創(chuàng)新能夠彼此作用形成相乘的效應(yīng),“我們稱之為‘智能X效應(yīng)’,例如5G可以讓人工智能無所不在,人工智能又可以讓邊緣、5G的連接更加智能化,這種邊緣智能不僅是在設(shè)備端,還可以在數(shù)據(jù)中心和任意的地方。萬物互聯(lián)之后,帶來了數(shù)據(jù)量的‘爆炸’,會有更多的機(jī)會能夠讓我們對這些數(shù)據(jù)進(jìn)行分析,加速數(shù)字化轉(zhuǎn)型。如果有企業(yè)沒有跟上這個大潮流,沒有使用到新的技術(shù)、洞察數(shù)據(jù)的價值,可能就會落后于市場上的其他公司?!?/p>
2019年,英特爾投入了占公司營收近19%的130億美元資金用于研發(fā),除了持續(xù)的技術(shù)創(chuàng)新投入,英特爾也在加速將包括至強(qiáng)、凌動、FPGA、以太網(wǎng)、硅光、傲騰持久內(nèi)存在內(nèi)的一系列新品或新技術(shù)推向商用市場,以實現(xiàn)數(shù)據(jù)“傳輸更快、存儲更多、處理一切”的目標(biāo)。例如在集成AI加速的英特爾第三代至強(qiáng)可擴(kuò)展處理器中,支持bfloat16使得其在深度學(xué)習(xí)加速中能夠以一半的比特數(shù)和更少的軟件調(diào)整,達(dá)到與FP32同等水平的模型精度。同時,其支持的傲騰持久內(nèi)存200系列可提供每路至多4.5TB的容量,平均內(nèi)存帶寬增加了25%。
英特爾第三代至強(qiáng)可擴(kuò)展處理器
第三代至強(qiáng)可擴(kuò)展處理器分為兩個產(chǎn)品系列,先行發(fā)布的Cooper Lake定位4-8個處理器插槽,今年晚些時候亮相的Ice Lake則會支持1-2個處理器插槽,而代號為“Sapphire Rapids”的下一代至強(qiáng)可擴(kuò)展處理器預(yù)計將在明年下半年發(fā)布。未來10年,人工智能和數(shù)據(jù)分析無疑會成為關(guān)鍵的工作負(fù)載,要想讓客戶在任意平臺都能獲得高效的數(shù)據(jù)處理能力,將硬件和軟件的融合創(chuàng)新賦能于數(shù)據(jù)中心、邊緣、傳感器、移動計算、自動駕駛等各個領(lǐng)域,就變得至關(guān)重要。
人工智能和數(shù)據(jù)密集型服務(wù),是第三代英特爾至強(qiáng)可擴(kuò)展處理器關(guān)注的兩個焦點(diǎn),借助升級后的DL Boost技術(shù),以及在深度學(xué)習(xí)加速架構(gòu)下的VNNI神經(jīng)網(wǎng)絡(luò)指令支持bfloat16數(shù)據(jù)格式,第三代至強(qiáng)可擴(kuò)展處理器較上一代平臺Cascade Lake 8280在處理圖像分類時,計算性能可提升1.93倍。通過支持更多的內(nèi)核、更高的主頻,配合更多的內(nèi)存通道數(shù)和更快的內(nèi)存速度,第三代至強(qiáng)可擴(kuò)展處理器在處理計算密集型任務(wù)時較以往四路平臺的計算性能提高了92%。
據(jù)了解,第三代至強(qiáng)可擴(kuò)展處理器的處理器插槽之間通過UPI總線以拓?fù)浼軜?gòu)實現(xiàn)互聯(lián),UPI通道數(shù)較上一代平臺翻倍,UPI端口數(shù)量增至6個,即每個插槽會有6個接口,兩兩之間就有兩個UPI總線,多一個UPI總線意味著帶寬變高了,有利于支持更多的CPU內(nèi)核、更大的內(nèi)存、更高的計算速度,相當(dāng)于有更寬的高速公路,可以讓數(shù)據(jù)在不同的插槽之間傳輸。“在多路處理器當(dāng)中,這是非常重要的架構(gòu)創(chuàng)新?!币晃毁Y深的英特爾技術(shù)專家稱。
內(nèi)存方面,內(nèi)存通道每個插槽有6個通道,八路48通道時每個通道都可以支持高3200MT/s的速度,容量上基于16GB顆粒可在單條內(nèi)存用RDIMM支持64GB、用LRDIMM支持256G,搭配傲騰持久內(nèi)存則可以讓每個插槽高支持4.5T,這樣一來,八路高36T的容量就足以應(yīng)付各類密集型的應(yīng)用。
在多路平臺上,英特爾對RAS功能格外重視,提供了非常豐富的相關(guān)支持,可以處理可能出現(xiàn)的內(nèi)存錯誤、PCIe設(shè)備錯誤,或是CPU內(nèi)核的錯誤,利用RAS特性實現(xiàn)更好的錯誤隔離和故障診斷。
為了幫助客戶更加靈活的配置多樣化的業(yè)務(wù)系統(tǒng),英特爾推出了第二代Speed Select技術(shù)(SST),包括SST-PP、SST-CP、SST-BF、SST-TF四種功能。其中,SST-PP(Performance Profile)是指一個CPU的供電和散熱的邊界條件是確定的,在這個邊界條件下,根據(jù)業(yè)務(wù)的不同需求選配該CPU允許使用多少個核,在使用相應(yīng)核數(shù)時,會提供對應(yīng)的頻率讓其運(yùn)行。同時,也可以在另一種場景下關(guān)掉一些或打開一些核,使其工作在另一個頻率上。由此,可以在設(shè)備平穩(wěn)運(yùn)行時通過“一鍵切換”來滿足單線程或多線程的負(fù)載,讓機(jī)器的使用效率化。
SST-BF(Base Frequency)和SST-TF(Turbo Frequency)可以動態(tài)調(diào)節(jié)運(yùn)行不同應(yīng)用時,根據(jù)優(yōu)先級的高低來調(diào)配基頻或睿頻頻率,可以保證整個處理器的供電和散熱在邊界條件下,其他的核會比高優(yōu)先級的核的溫度低一些。
SST-CP(Core Power)能夠在CPU接近滿載快要達(dá)到供電和散熱邊界時,自動降頻處理來保護(hù)CPU和服務(wù)器。與之前降頻保護(hù)時將所有內(nèi)核“一同下降”不同,SST-CP可以允許客戶制定一些核運(yùn)行高優(yōu)先級業(yè)務(wù),其他的核運(yùn)行低優(yōu)先級業(yè)務(wù)。當(dāng)運(yùn)行的負(fù)載較滿時,可以先減少低優(yōu)先級的核來保證高優(yōu)先級的核不受影響。
從Int8到bfloat16,英特爾在指令集層面為客戶的數(shù)據(jù)精度處理提供了最優(yōu)的性能,可以解決各類通用的AI應(yīng)用需求,并且對TensorFlow、Pytorch、MXNet等主流框架均進(jìn)行了優(yōu)化,完成了對AVX-512、DL Boost的支持。在提供更高的運(yùn)算性能、運(yùn)算效率和內(nèi)存讀寫效率的同時,bfloat16對精度的影響甚微,而且數(shù)據(jù)位寬只有FP32的一半,與升級后的DL Boost搭配可讓AI訓(xùn)練性能提升93%、推理性能提升90%。同時,英特爾為OpenVINO工具包和ONNX Runtime環(huán)境提供了bfloat16優(yōu)化,以簡化推理的部署工作。
如果使用Int8,在不同的深度學(xué)習(xí)算法、不同的應(yīng)用數(shù)據(jù)對象中會有1%以內(nèi)的準(zhǔn)確率影響,而對于推薦系統(tǒng)、語音識別、NLP等特定AI領(lǐng)域的應(yīng)用,通常會需要更低甚至是接近完美的推理加速方案,bfloat16以其6數(shù)據(jù)位寬的特性實現(xiàn)了降噪效果,獲得了更高的精度。
在螞蟻金服,英特爾與其合作基于3D-CNN I3D Video深度學(xué)習(xí)模型研發(fā)了視頻分類應(yīng)用,去識別拍攝視頻中的物體正在進(jìn)行的動作或行為,借助DL Boost和bfloat16將訓(xùn)練能力較此前的FP32技術(shù)方案提升了12倍,在模型推理上也提升了1.8倍的性能。整個合作工程中,客戶只需要把平臺切換至第三代至強(qiáng)可擴(kuò)展處理器即可,選擇支持bfloat16的AI框架,無需進(jìn)行額外的代碼和參數(shù)調(diào)整。
英特爾技術(shù)專家介紹稱,隨著英特爾“One Intel”軟件戰(zhàn)略的推出,英特爾的MKL-DNN軟件也進(jìn)化到了“One DNN”,與最新的TensorFlow2.2X版本進(jìn)行了集成,使得螞蟻金服直接使用TensorFlow就能夠體驗到bfloat16的優(yōu)勢。
在醫(yī)療行業(yè),衛(wèi)寧健康使用DL Boost加速技術(shù)進(jìn)行AI診斷,通過OpenVINO獲得了基于各類深度學(xué)習(xí)框架的支持,在進(jìn)行胸部影像檢測時得到了數(shù)十倍的性能提升。在TensorFlow應(yīng)用中,性能提升8.24倍,精度影響僅有0.17%,在對3個Pytorch模型進(jìn)行加速的過程中,性能有數(shù)十倍至百倍的提升。
作為第三代至強(qiáng)可擴(kuò)展平臺的一部分,英特爾傲騰持久內(nèi)存200系列在單條512GB和DRAM的配合下,可為客戶提供每路高達(dá)4.5TB的容量,以進(jìn)行內(nèi)存數(shù)據(jù)庫、密集虛擬化、分析及高耗能計算等數(shù)據(jù)密集型工作負(fù)載的管理。在單DIMM的部署下,有著25%的內(nèi)存帶寬提升,并且在之后的Ice Lake平臺可以獲得更大的系統(tǒng)性能增長。在數(shù)據(jù)寫入時,傲騰持久內(nèi)存200系列較NAND Flash有超過200倍的提升,主要體現(xiàn)在NAND SSD的訪問延遲在100微秒左右,而持久內(nèi)存只有幾百納秒的延遲。
在運(yùn)行模式上,傲騰持久內(nèi)存200系列同樣支持兩種模式,其一是Memory Mode,特點(diǎn)是持久內(nèi)存會和DRAM組成一個新的內(nèi)存整體,由CPU內(nèi)部的硬件邏輯實現(xiàn)控制。如果客戶希望數(shù)據(jù)可以長久保留,也可以使用App Direct Mode(又細(xì)分為塊設(shè)備訪問或應(yīng)用直接對內(nèi)存對象訪問),當(dāng)軟件把數(shù)據(jù)寫入之后,下一次可以從原來的地方可以直接取出來,斷電之后的數(shù)據(jù)是存在的,這種模式下,既可以作為內(nèi)存對象,在寫入后保留數(shù)據(jù),也可以作為塊存儲,兼顧對軟件應(yīng)用的兼容性。
英特爾傲騰持久內(nèi)存200系列
面對云計算時代的彈性需求,傳統(tǒng)的數(shù)據(jù)中心內(nèi)存難以滿足資源靈活配置的需求,持久內(nèi)存較DRAM有很大的成本優(yōu)勢,可以通過取代DRAM的容量改善TCO,并且單機(jī)里面也可以部署更大的內(nèi)容容量,實現(xiàn)更高的應(yīng)用部署密度。同時,持久內(nèi)存還能夠有效緩解I/O的瓶頸,衍生出更多新的內(nèi)存和存儲融合類的應(yīng)用,像云計算的基礎(chǔ)架構(gòu)、數(shù)據(jù)庫、AI/大數(shù)據(jù)分析等都是持久內(nèi)存所擅長的領(lǐng)域。
RocksDB是一款由Facebook開源的數(shù)據(jù)庫引擎,既可以作為獨(dú)立的鍵值存儲方案,也可以作為像MySQL等關(guān)系數(shù)據(jù)庫的存儲引擎,在寫入性能上做了大量優(yōu)化,被不少企業(yè)選用去取代原生MySQL的InnoDB。不過,其結(jié)構(gòu)上卻面臨著一些問題,例如,寫在關(guān)鍵路徑上的日志會讓I/O速度變成它的性能瓶頸,另外在RocksDB的一層數(shù)據(jù)和另一層數(shù)據(jù)進(jìn)行數(shù)據(jù)合并寫的時候,也會存在寫放大的問題。
“磁盤的I/O壓力本身有一個性能影響,但影響更大的是在做Compaction的時候,有可能會阻塞前端的寫操作,也就是說從內(nèi)存表到磁盤的寫入操作,因為Compaction操作被阻止了,就阻塞了往內(nèi)存寫的過程,這就造成了更大的性能的影響和抖動?!庇⑻貭柤夹g(shù)專家解釋稱,“持久內(nèi)存就可以很好的解決這個問題。”傲騰持久內(nèi)存會先保證日志得到很好的寫性能,同時用持久內(nèi)存替換L0和L1中的SST文件,把原來壓縮合并的操作變成內(nèi)存對象的指針操作,大幅減少數(shù)據(jù)的寫放大,從而提升性能。
在使用Spark進(jìn)行大數(shù)據(jù)分析的場景中,如果某公安局要從海量數(shù)據(jù)庫中找到某個車牌或人臉的行動軌跡,從硬盤讀數(shù)據(jù)會花費(fèi)很長的查詢周期。借助持久內(nèi)存,就可以通過索引或數(shù)據(jù)緩存的形式,大幅提升Spark作為數(shù)據(jù)查詢的性能,從而改善分析的性能。國內(nèi)某互聯(lián)網(wǎng)企業(yè)對DRAM和傲騰持久內(nèi)存進(jìn)行了評估,在相同成本的情況下,傲騰持久內(nèi)存有著更顯著的大容量優(yōu)勢,緩存性能也更好,在Decision Support Benchmark性能指標(biāo)中,更是帶來了六倍的性能提升。
推薦系統(tǒng)是快手主打的一項AI實踐,該系統(tǒng)分為計算敏感型和存儲敏感型兩部分任務(wù),前者包括推薦服務(wù)、預(yù)估服務(wù)、召回服務(wù)等,后者包括用戶畫像、參數(shù)服務(wù)器和分布式服務(wù)器的索引,需要實現(xiàn)大容量內(nèi)存的數(shù)據(jù)存儲以及快速的數(shù)據(jù)訪問。在第三代至強(qiáng)可擴(kuò)展平臺上,英特爾幫助快手使用傲騰持久內(nèi)存將服務(wù)器上的每個節(jié)點(diǎn)容量從數(shù)百GB擴(kuò)展至TB級別,使得每個計算和存儲節(jié)點(diǎn)上實現(xiàn)了更有效的數(shù)據(jù)訪問。
傲騰持久內(nèi)存幫助快手把原來需要在外部存儲上做的索引工作轉(zhuǎn)移到內(nèi)存中,降低了訪問延時,提高了推薦系統(tǒng)響應(yīng),改進(jìn)了用戶服務(wù)體驗。得益于傲騰持久內(nèi)存的Memory Mode,快手在升級過程中沒有進(jìn)行任何軟件代碼的修改。經(jīng)過測試,傲騰持久內(nèi)存的應(yīng)用性能較DRAM在延時上并未降低,每秒請求量也與之前的TB級DDR內(nèi)存維持在同一水準(zhǔn),考慮到使用成本因素,傲騰持久內(nèi)存幫助跨手實現(xiàn)了TB級內(nèi)存容量擴(kuò)展,TCO優(yōu)化了30%。此外,快手還通過引入App Direct Mode獲得了額外的應(yīng)用優(yōu)勢,包括秒級的數(shù)據(jù)恢復(fù)等等。
“我們有全面的產(chǎn)品組合,可以在數(shù)據(jù)中心領(lǐng)域?qū)崿F(xiàn)全面的覆蓋,例如在軟件方面,英特爾有成千上萬的軟件工程師一直在關(guān)注如何釋放硬件性能?!标愝崃⒈硎?,“更重要的是,我們還擁有一個龐大的生態(tài)體系。英特爾在中國已經(jīng)有36年的歷史,在這36年間,我們有諸多良好的客戶和合作伙伴,很高興能夠與他們一起成長。我們的哲學(xué)之道是水利萬物而不爭,希望可以通過持續(xù)提供基礎(chǔ)設(shè)施,幫助我們的客戶獲得更好的方案,最終能夠解決用戶的問題。”
網(wǎng)頁名稱:英特爾以數(shù)據(jù)為中心的全棧創(chuàng)新解鎖智能未來
URL分享:http://jinyejixie.com/article48/cjdeep.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站內(nèi)鏈、做網(wǎng)站、虛擬主機(jī)、企業(yè)網(wǎng)站制作、ChatGPT、關(guān)鍵詞優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)