小編給大家分享一下Segmentation中anchor free方法怎么實現(xiàn)的,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
專注于為中小企業(yè)提供成都網(wǎng)站建設(shè)、網(wǎng)站建設(shè)服務(wù),電腦端+手機(jī)端+微信端的三站合一,更高效的管理,為中小企業(yè)株洲免費做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動了數(shù)千家企業(yè)的穩(wěn)健成長,幫助中小企業(yè)通過網(wǎng)站建設(shè)實現(xiàn)規(guī)模擴(kuò)充和轉(zhuǎn)變。
3. 基于Segmentation的方法
按照FCOS的說法,它是把每個location都當(dāng)做一個樣本,如下圖所示,可以看到,最左面的橙色點在棒球運(yùn)動員的box內(nèi),這個點的gt實際上是該點到box的四個邊緣的距離以及box的obj類別,所以最后預(yù)測出來的output是HxWxC以及HxWx4,C和4分別代表每個特征圖的每個location要預(yù)測的該點所屬于的類別和該點到box的邊界距離。在通過這種方式得到box后,F(xiàn)COS回合anchor based的方法一樣進(jìn)行NMS等:實際上如果不考慮Classification下面的Center-ness分支,怎么樣,會不會覺得非常熟悉?在這里貼一下retinanet的網(wǎng)絡(luò)圖:可以發(fā)現(xiàn),兩者最大的差別是最后輸出的通道,Retinanet輸出的是KA和4A(A代表anchors數(shù)量,K代表類別數(shù)量),是對每個location位置的A個anchors預(yù)測它們的類別和相對偏移量,而FCOS則直接對格子所在的類別和產(chǎn)生box進(jìn)行預(yù)測了,完全沒有box的概念,整體上也非常接近語義分割的segmentation思想。這樣做的方法會有一個問題,就是box里面,越接近中心的位置往往效果越好,但是越靠近Box邊緣,雖然理論上應(yīng)該仍然是正類,但是因為往往落在obj外,預(yù)測效果不佳,對此,F(xiàn)COS的解決方法是引入一個新的分支centerness,它的gt計算如下:
可以看到,如果location距離box的左邊界距離和右邊界距離相同,根號內(nèi)第一項應(yīng)該是1,同理,當(dāng)距離上下邊界距離一樣時候,根號內(nèi)第二項是1,此時,gt值為1,location恰好處于中心位置。而如果location非常接近邊緣,則gt會非常小。這個分支訓(xùn)練以后,在inference階段將會和classification預(yù)測的值相乘作為最終scores得分,從而抑制接近中心點的位置。此外,F(xiàn)COS還引入了多尺度的概念,如果在FPN的某個level上,t/b/l/r中的最大值大于某個閾值,則認(rèn)為這個box不適合當(dāng)前l(fā)evel的feature,從而進(jìn)行排除。在了解了FCOS之后,認(rèn)識foveabox也比較簡單了。foveabox的不同首先在于多尺度策略和encoding的方法。foveabox的多尺度策略是將不同大小的box根據(jù)面積分配到不同level的feature map上,且有重疊。FPN的P3~P7的每個leval的Pl分別有一個基數(shù)Sl,取l=3的時候,P3對應(yīng)的S3是3232,取l=4的時候,P4對應(yīng)的S4是6464,一直倍增。每個level負(fù)責(zé)的box的面積范圍為,其中n^2是可變化的參數(shù),可以看到,不同leval預(yù)測的范圍會有重疊,這可以增加一定的魯棒性:而考慮到不同level預(yù)測的box大小不同,預(yù)測的box位置坐標(biāo)也是經(jīng)過編碼的,編碼方式如下(z代表系數(shù),具體計算方式見論文):最后,也就是foveabox名稱的由來,對于box內(nèi)部離中心點比較遠(yuǎn)的抑制方法,foveabox沒有centerness那樣的分支,而是用了另一個思路,那就是只有box內(nèi)部比較靠近中心的點才被視作正樣本(下圖帶黑色點的紅色區(qū)域),如果該點在Box內(nèi)部但是離邊緣比較近,則往往被視作灰色區(qū)域,即不算正樣本,也不算負(fù)樣本,梯度回傳的時候不考慮(紅色box內(nèi)部白色區(qū)域)。正樣本所在的矩形框和灰色區(qū)域的矩形框大小是由兩個不同的伸縮系數(shù)控制的。關(guān)于FSAF,就沒有太多需要介紹的內(nèi)容了,只需要知道以下三點:1. FSAF在每個location預(yù)測box的方式也是預(yù)測點到box四個邊界的距離,類似FCOS 2. FSAF抑制box內(nèi)部遠(yuǎn)離中心點的干擾的方法類似Foveabox,同樣把非??拷行牡木匦螀^(qū)域視作正樣本,在box內(nèi)又離得比較遠(yuǎn)的不計入梯度計算 3. FSAF的多尺度策略比較特殊,它不會手動分配level預(yù)測某個box(這一點和FCOS和Fovea不同,這兩本本質(zhì)上多尺度都用了手動分配的方法),而是在各個尺度上同時計算,看box在哪個level上得到的loss最小,就在這個level的特征上計算,由此實現(xiàn)針對不同obj的特征選擇自動化。以上是“Segmentation中anchor free方法怎么實現(xiàn)的”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!
網(wǎng)站欄目:Segmentation中anchorfree方法怎么實現(xiàn)的
當(dāng)前路徑:http://jinyejixie.com/article20/gpioco.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供手機(jī)網(wǎng)站建設(shè)、面包屑導(dǎo)航、App設(shè)計、軟件開發(fā)、網(wǎng)站建設(shè)、
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源:
創(chuàng)新互聯(lián)