編譯器是很基礎(chǔ)的軟件,不過已經(jīng)很多年沒有冒出新的編譯器了,技術(shù)也很成熟了,華為為什么要搞一個方舟編譯器呢?當(dāng)然是為了編譯程序使之更好的運行了。多數(shù)人都知道JAVA是一個跨平臺的編程語言,為什么JAVA可以跨平臺呢?這就是JAVA虛擬機(jī)(JVM)的功勞,JAVA語言其實是通過JVM來運行的,JVM與各個平臺之間做了適配,其實跨平臺的是JVM,Android的ART虛擬機(jī)是一個特別的JVM。在計算機(jī)領(lǐng)域沒有什么問題是不能通過增加一個間接的中間層來解決的,JVM就是這樣的中間層。很多人會問Android 的APP需要跨平臺運行嗎?現(xiàn)在來看不需要,那Google為什么選JAVA作為開發(fā)語言呢?可能有很多因素的考量,但是誰也沒有想到SUN居然被著名的專利流氓ORACLE收購了,即便Google把JVM改寫了好幾遍也依然沒躲過這個專利官司,真正的大公司還是要有自己能完全控制的編程語言呀,華為會走出這一步嗎?有點跑題了,虛擬機(jī)是JAVA的精髓所在,虛擬機(jī)帶來的好處是以性能為代價的,那么那些必須考考慮效率的庫和應(yīng)用怎么辦呢?用JNI技術(shù)調(diào)用C/C++庫,又是一筆不必要的開銷,還是影響效率。JAVA作為Android的開發(fā)語言已經(jīng)成為事實,即便不需要跨平臺依然要忍受虛擬機(jī)帶來的低效問題。如何解決呢?干掉虛擬機(jī)最好了,反正現(xiàn)在也不需要跨平臺,這也是方舟編譯器的主要目的之一,當(dāng)然,也并不是說方舟不能支持跨平臺,從公布的材料中看,還是有跨平臺方面的考慮只是不是JAVA虛擬機(jī)這種形式了。
解讀開源的方舟編譯器,創(chuàng)新的RC與多層的IR
既來之則安之,既然只能用JAVA就想法優(yōu)化他,優(yōu)化JAVA的運行效率關(guān)鍵還是在于虛擬機(jī)。Android 在5.0之后將Dalvik虛擬機(jī)替換為ART虛擬機(jī),這也是Android Run Time,在幾經(jīng)更改之后現(xiàn)在Android采用的是 解釋執(zhí)行+ JIT + AOT 的混合編譯策略。
解讀開源的方舟編譯器,創(chuàng)新的RC與多層的IR
一般的靜態(tài)編程語言(編譯時確定類型,C/C++、JAVA都是)用編譯器編譯成二進(jìn)制代碼并不難,但是JAVA還存在一些動態(tài)特性,比如反射,通常被稱為JAVA語言的高級特性,使用也很廣泛,尤其是框架。反射這樣的特性對程序員很友好,但是對編譯器是個災(zāi)難,與runtime密切相關(guān),方舟編譯器如何解決這個問題還沒有具體的Codes公布,不過在Readme中有一句可以留意:更輕量的語言運行時,這很可能與反射有關(guān)。編譯器本身是一個翻譯的過程,現(xiàn)代編譯器的結(jié)構(gòu)基本就如下圖LLVM的結(jié)構(gòu)差不多,分為前后端,方舟編譯器也是如此,目前主要開源的就是里面的IR部分。還是那句話,在計算機(jī)領(lǐng)域沒有什么問題是不能通過增加一個間接的中間層來解決的,IR也是一個中間層,連接編譯器的前端和后端。更形象的說,IR可以理解為JAVA的字節(jié)碼,后端可以理解為JAVA虛擬機(jī)。
解讀開源的方舟編譯器,創(chuàng)新的RC與多層的IR
在之前公布的信息中表示方舟編譯器支持跨語言編譯(尚未開源),跨語言編譯的原理就是將多種語言翻譯成同一種IR表示語言,然后兩部分合并優(yōu)化。方舟編譯器的IR分多層,其中編程語言相關(guān)的優(yōu)化使用高層表示(high level ir)
通用優(yōu)化使用中層表示(mid level ir),編譯時就是一個持續(xù)降低層次的過程。在high level 中我們還能看到 if、while這樣的操作碼,與高級語言很像。用個例子看,C語言如下:
int fact(int n) {
if (n != 1)
return foo(n-1);
else return 1;
翻譯成MIR如下所示:
可以看出來很像,MIR中的語言像極了高級語言,只是有一些冗余,對于編譯器來說準(zhǔn)確是第一位的,需要適當(dāng)?shù)娜哂唷8鶕?jù)方舟編譯器的文檔說明,當(dāng)所有語言都翻譯成MIR后,都有自己的Opcodes,更加接近原語言,但是在逐級降低優(yōu)化的時就越來越接近處理器的原生指令。
方舟編譯器目前開源的代碼還有一部分是關(guān)于GC(Garbage Collection)的,GC是對內(nèi)存的管理,在程序運行中內(nèi)存是一種寶貴的資源,當(dāng)這塊內(nèi)存的外部引用不存在時需要釋放內(nèi)存,有些語言比如C/C++不提供內(nèi)存回收機(jī)制,需要程序員手動的new/delete、malloc/free,一不小心就會造成內(nèi)存泄漏,而JAVA的GC機(jī)制就很好的解決了這個問題。
自動內(nèi)存管理通常有兩種垃圾回收策略:一種是引用追蹤垃圾回收(Tracing Garbage Collection,Tracing GC),另一種是基于引用計數(shù)(Reference Counting,RC)垃圾回收。JAVA上的垃圾回收采用的是GC方式,這個追蹤過程回依賴整個系統(tǒng)中多線程的間歇同步和停頓,可能會造成卡頓。方舟編譯器是在JAVA上嘗試RC,RC的方式是在函數(shù)返回時或異常退出時進(jìn)行標(biāo)記,這些操作會帶來額外的開銷,華為是想通過編譯器優(yōu)化將RC開銷降低。
RC并不是一種落后的內(nèi)存回收機(jī)制,廣受好評的蘋果swift就采用的RC回收機(jī)制,在用戶體驗非常重要的客戶端RC其實很適合,但是JAVA實現(xiàn)RC并不是很好弄,他還有龐大的舊JAVA庫。方舟編譯器引入RC機(jī)制的目的為了解決GC造成的卡頓問題, RC的機(jī)制大的問題在于可能產(chǎn)生循環(huán)引用,方舟編譯器的應(yīng)對方法是:
1、程序員標(biāo)記(目前還沒有開放給第三方);
2、引入一個環(huán)模式匹配的算法,在Runtime里會收集環(huán)在程序過程中的信息記錄到手機(jī)上,然后給三方應(yīng)有使用,這是一個學(xué)習(xí)的過程,學(xué)習(xí)完下次運行時就會快速知道如何避免這些環(huán);
3、GC兜底確保環(huán)能正確的解掉。
確切的說方舟編譯器并沒有拋棄GC,而是采用了RC為主GC兜底的方式。當(dāng)內(nèi)存閾值,或者程序員調(diào)動System.GC的時候使用GC來回收內(nèi)存,根據(jù)華為在首場開源技術(shù)沙龍上的說法觸發(fā)GC的幾率大概為5%,這樣確實可以大大提高流暢性,目的基本達(dá)到了。
目前方舟編譯器開源的代碼還很少,不好分析,也給出一個演示示例,這個演示示例可以做的更好一些。
解讀開源的方舟編譯器,創(chuàng)新的RC與多層的IR
采用RC的方式,還會有一個循環(huán)引用的問題,目前方舟編譯器開源的代碼還很少,不知這個循環(huán)引用如何解決,對于已存在庫的標(biāo)記要如何添加呢?說到標(biāo)記我想到了一個人工智能訓(xùn)練的數(shù)據(jù)標(biāo)注,從理論上來說引用的標(biāo)記和解除循環(huán)也是可以自動學(xué)習(xí)的,如果說能做到自動學(xué)習(xí),那將是編譯器這些年來大的進(jìn)步。所以我對下一步的開源很有興趣,想知道是如何做的。
RC的自動學(xué)習(xí)解環(huán)是我之前沒想到的,不知道這個自動學(xué)習(xí)算法是否會開源,對于他是如何保證解環(huán)正確的還是充滿好奇。目前方舟編譯器開源的部分還是少,等待更多的開源,包括運行時。
文章名稱:解讀開源的方舟編譯器,創(chuàng)新的RC與多層的IR
新聞來源:http://jinyejixie.com/news/98809.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)網(wǎng)站建設(shè)、自適應(yīng)網(wǎng)站、虛擬主機(jī)、企業(yè)網(wǎng)站制作、網(wǎng)站建設(shè)、微信公眾號
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源:
創(chuàng)新互聯(lián)