作者 | Just
成都創(chuàng)新互聯(lián)致力于網(wǎng)站制作、做網(wǎng)站,成都網(wǎng)站設(shè)計,集團網(wǎng)站建設(shè)等服務(wù)標準化,推過標準化降低中小企業(yè)的建站的成本,并持續(xù)提升建站的定制化服務(wù)水平進行質(zhì)量交付,讓企業(yè)網(wǎng)站從市場競爭中脫穎而出。 選擇成都創(chuàng)新互聯(lián),就選擇了安全、穩(wěn)定、美觀的網(wǎng)站建設(shè)服務(wù)!
出品 | AI科技大本營(ID:rgznai100)
毋庸置疑,在業(yè)界對人工智能(AI)應用落地備受期待的時期,數(shù)據(jù)這一重要支點卻越來越成為一個“卡脖子”的難題。
AI落地需要數(shù)據(jù)來優(yōu)化模型效果,但大部分企業(yè)不會輕易把數(shù)據(jù)無條件提供給AI公司使用,因為數(shù)據(jù)某種程度上是它們賴以生存的底牌,這也導致少數(shù)巨頭公司壟斷大量數(shù)據(jù),而小公司很難獲得數(shù)據(jù)的局面,另一方面,由于法律法規(guī)對數(shù)據(jù)隱私保護的規(guī)定,數(shù)據(jù)融合難上加難。數(shù)據(jù)孤島問題似乎成了無法解開的死結(jié),人工智能落地進程嚴重受阻。
此時,Google 于 2016 年提出的聯(lián)邦學習(Federated Learning)技術(shù)開始在業(yè)內(nèi)被寄予厚望,國內(nèi)以微眾銀行、平安科技、百度為代表的公司成為新技術(shù)的“嘗鮮者”,希望它成為打通數(shù)據(jù)孤島的橋梁。
Google 率先建立建立聯(lián)邦學習系統(tǒng)來解決用戶個人終端設(shè)備的數(shù)據(jù)隱私問題,在安卓系統(tǒng)的手機用戶中,首先將初始化模型下載到各終端,然后根據(jù)其本身的數(shù)據(jù)更新模型參數(shù),不同終端隨之產(chǎn)生不同的更新結(jié)果送到云端進行聚合,匯總后的模型參數(shù)將作為下一次更新的初始參數(shù),一直迭代直到收斂。
用這樣的方法既能保證數(shù)據(jù)不共享,保護用戶隱私,同時又能共享一個通用模型,利用群體智能在云端不斷更新,這就是聯(lián)邦學習技術(shù),而以該技術(shù)為核心的相關(guān)技術(shù)統(tǒng)稱為聯(lián)邦智能,平安科技副總工程師、聯(lián)邦學習團隊負責人王健宗博士首度提出了這一概念。他在近期接受 AI科技大本營(ID:rgznai100)等媒體采訪時稱, 聯(lián)邦學習之于聯(lián)邦智能,猶如深度學習之于人工智能,不過聯(lián)邦智能仍屬人工智能范疇,其最終目標是為了實現(xiàn)人工智能。
破局數(shù)據(jù)孤島,聯(lián)邦學習的應用實踐
作為聯(lián)邦學習技術(shù)的早期使用者,Google 在今年 2 月開源了聯(lián)邦學習框架 TensorFlow Federated,可用于去中心化數(shù)據(jù)的機器學習及運算實驗。國內(nèi),微眾銀行 AI 團隊對外開源了自研的“聯(lián)邦學習 FATE(Federated AI Technology Enabler)” 學習框架,并推動其在信貸風控、監(jiān)管科技等領(lǐng)域的應用落地。
平安科技同樣自主了蜂巢聯(lián)邦學習平臺,并有了相對成熟的落地案例。王健宗提到,基于平安科技的金融、保險業(yè)務(wù)數(shù)據(jù),他們通過聯(lián)邦學習技術(shù)對此前無法獲取的數(shù)據(jù)進行聯(lián)合建模,從而準確預測用戶貸款或者信用卡的逾期違約率以及預測跨域產(chǎn)品購買行為,以及通過銀行客戶去預測買保險客戶等應用,除了金融、保險領(lǐng)域,他們還在醫(yī)療、智能語音以及車聯(lián)網(wǎng)等多個領(lǐng)域進行了實踐應用。
這些應用的共通之處在于,聯(lián)邦智能解決方案要求數(shù)據(jù)在傳輸過程當中能夠?qū)崿F(xiàn)實時的加解密,在此基礎(chǔ)上還要高效實現(xiàn),比如做深度學習訓練時,要做到幾千萬甚至上億參數(shù)的交換、同步、異步處理。基于此,新方案還要保證多源數(shù)據(jù)在AI 模型調(diào)優(yōu)過程中的安全性,同時也要有效地評估各數(shù)據(jù)源對于最終優(yōu)化結(jié)果的貢獻度。
總之,要在分布式環(huán)境下實現(xiàn)聯(lián)合建模,自然會對硬件支持提出相應要求,而平安科技與英特爾的合作為上述問題的初步解決提供了有效方案。
硬件層面上,雙方形容在聯(lián)邦學習技術(shù)層面的合作是“一拍即合”。英特爾一直都想做一個可信計算數(shù)據(jù)分析的執(zhí)行環(huán)境,希望能有效地防止外界觸達和攻擊敏感的數(shù)據(jù)和應用。英特爾最新發(fā)布的 SGX(軟件防護擴展)技術(shù)實現(xiàn)了這一點,其通過處理器指令,在不同數(shù)據(jù)源中創(chuàng)建可信區(qū)域來用于數(shù)據(jù)訪問,這正好符合目前聯(lián)邦學習運算的需求。
王健宗稱,SGX 一開始的配置并不是為聯(lián)邦學習而生,但這個硬件可信平臺后期陸續(xù)開放了一些專用接口,如此可以直接封裝接口,從而在信息傳遞加解密過程當中更快、更高效,這種把可信計算環(huán)境“硬化”的方法能夠加快迭代訓練,也符合當下軟件硬化,硬件軟化的趨勢。
對比傳統(tǒng)軟加密的方式,比如在傳統(tǒng)的深度學習框架 TensorFlow, PyTortch , Caffe, MxNet 上進行改造,其在信息處理傳輸中的加解密過程會消耗太多時間。
英特爾? SGX 技術(shù)以可信“飛地”來增強數(shù)據(jù)安全防護
具體來說,英特爾? SGX 技術(shù)可通過在特定硬件(例如內(nèi)存)中構(gòu)造出一個可信的“飛地”(Enclave), 用于中間參數(shù)的交互和傳輸,以幫助防止內(nèi)外部攻擊,使數(shù)據(jù)和應用程序的安全邊界僅限于“飛地”本身以及處理器,同時其運行過程也不依賴于其他軟硬件設(shè)備。這意味著數(shù)據(jù)的安全保護是獨立于軟件操作系統(tǒng)或硬件配置之外,即使硬件驅(qū)動程序、虛擬機乃至操作系統(tǒng)均受到攻擊和破壞,能更有效防止數(shù)據(jù)泄露。
英特爾? SGX技術(shù)的聯(lián)邦學習方案
基于英特爾?SGX 技術(shù)所具備的特性,聯(lián)邦學習團隊與英特爾一起,在其聯(lián)邦學習方案中設(shè)計了 1+N 式的多源數(shù)據(jù) AI 模型訓練方法,有助于精確地評估各節(jié)點數(shù)據(jù)對于 AI 模型訓練的貢獻度,方便用戶對方案進行調(diào)整。
以聯(lián)邦學習在保險行業(yè)的應用為例,以往用戶在投保時,業(yè)務(wù)人員只能根據(jù)用戶的年齡、性別等基本信息來確定保費金額,但隨著信息社會的不斷發(fā)展,用戶數(shù)據(jù)的數(shù)量和特征維度得到大幅增加,比如對于健康類險種來說,業(yè)務(wù)系統(tǒng)如果能夠利用海量的病歷、家族病史數(shù)據(jù)等進行 AI 預測,并得到更加細分的健康評估類別,有望提升投保人健康評估結(jié)果的準確度。
其中,病歷、病史等無疑是各個健康醫(yī)療機構(gòu)中需要絕對確保隱私的數(shù)據(jù),不僅不可能予以公開,更需要提升安全等級予以保護?,F(xiàn)在聯(lián)邦學習方案的引入,保險企業(yè)可以在不觸及用戶數(shù)據(jù)的情況下開展保險定價模型的 AI 訓練,從目前的效果來看,聯(lián)邦學習 1+N 式解決方案使保險個性化定價效果得到了明顯提升。
當然新技術(shù)的應用總是伴隨著新挑戰(zhàn),聯(lián)邦學習自有其目前無法解決的短板。王健宗指出,聯(lián)邦學習目前是用不同算法來改造模型以進行聯(lián)合建模,并沒有一個工具或者方法論,能夠解決所有的深度學習算法聯(lián)邦化的問題。
同時,不同于區(qū)塊鏈的去中心化機制,聯(lián)邦學習形成的是有中心化的聯(lián)邦 政府。在“聯(lián)邦 政府”里只有一個共同模型負責分發(fā),所以還要解決“兩個信任”問題:一是確保有一個各參與方都信任的聯(lián)邦 政府,二是聯(lián)邦 政府的運作信息要透明。
不過各項新技術(shù)都在不斷演進,王健宗認為,只要有更多企業(yè)和從業(yè)者加入到使用聯(lián)邦學習的隊伍中來,這些問題將逐步得到解決。
他類比十幾年前做信息系統(tǒng)時面臨的困境,當時每個信息系統(tǒng)的開發(fā)語言都不同,但現(xiàn)在已經(jīng)完全解決;面臨的數(shù)據(jù)孤島問題依然存在,但后來云計算的出現(xiàn)讓上百個系統(tǒng)數(shù)據(jù)互不相通的狀況一去不返,所以這也讓他樂觀看待聯(lián)邦學習在未來的發(fā)展前景。
聯(lián)邦智能,引領(lǐng) AI 革新的新曙光?
聯(lián)邦學習技術(shù)這盤更大的棋在于各參與方共同打造聯(lián)邦學習生態(tài),但王健宗表示,當下最重要的是搶占先機,提出聯(lián)邦學習應用于未來趨勢的生態(tài)與解決方案。
生態(tài)離不開系統(tǒng)架構(gòu)的布局。硬件層面,目前英特爾與平安科技的雙方合作尚處第一階段,只是拿出了一個硬體加密盒,解決了數(shù)據(jù)訓練的其中一個環(huán)節(jié)。平安科技聯(lián)邦學習團隊將與英特爾進一步開展技術(shù)合作,以更多、更先進的技術(shù)驅(qū)動數(shù)據(jù)資源在聯(lián)邦學習中的安全運轉(zhuǎn)和高效轉(zhuǎn)化,王健宗希望后續(xù)硬體加解密環(huán)境更多的改造成為聯(lián)邦智能服務(wù),同時在信息傳輸標準、知識訓練接口規(guī)范等方面,英特爾可以通過業(yè)界標準渠道來打造生態(tài),推動聯(lián)邦學習在各行各業(yè)中的快速發(fā)展和應用。
英特爾還可能開發(fā)訓練框架以支持聯(lián)邦學習,同時其相關(guān)存儲技術(shù),比如SSD(固態(tài)硬盤)等也會做出相應行業(yè)解決方案,以點蓋面進一步深化聯(lián)邦學習解決方案。
在網(wǎng)絡(luò)層,王健宗認為 5G 技術(shù)的到來會給聯(lián)邦學習提供很好的機會,比如一定程度上解決參數(shù)交換瓶頸,這就需要在網(wǎng)絡(luò)通訊層、編碼層、存儲層要為聯(lián)邦智能定制相應技術(shù)規(guī)范,他還稱平安科技在做相關(guān)聯(lián)邦芯片的研究工作,也在考慮未來是否要設(shè)計聯(lián)邦操作系統(tǒng)。
不過,要想落地相關(guān)應用,系統(tǒng)化實現(xiàn)聯(lián)邦智能生態(tài),還要依靠更多前線的人工智能從業(yè)者,他們希望這套聯(lián)邦學習解決方案科技能夠支持更多公司和行業(yè),對以聯(lián)邦學習為基礎(chǔ)的技術(shù)進行深入探索,做一些實在的落地應用研究。
聯(lián)邦學習技術(shù)目前更多應用于 AI 訓練過程,其目標是形成聯(lián)邦生態(tài),不過王健宗更希望基于聯(lián)邦學習技術(shù),通過聯(lián)邦數(shù)據(jù)庫、聯(lián)邦數(shù)據(jù)中心、聯(lián)邦可視化來共同實現(xiàn)聯(lián)邦智能。他堅信,新技術(shù)和新需求衍生的新一輪革新會助力AI產(chǎn)業(yè)實現(xiàn)騰飛,而聯(lián)邦智能無疑是引領(lǐng) AI 革新的新曙光。
https://www.toutiao.com/a6741933088483312140/
標題名稱:AI落地遭“卡脖子”困境:為什么說聯(lián)邦學習是解決良方?
網(wǎng)頁鏈接:http://jinyejixie.com/article20/pgshjo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站改版、品牌網(wǎng)站建設(shè)、、域名注冊、動態(tài)網(wǎng)站、自適應網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)