1.計算機視覺技術(shù)(ComputerVision),什么是計算機視覺?
“人的大腦皮層的活動,大約70%是在處理視覺相關(guān)信息。視覺就相當于人腦的大門,其它如聽覺、觸覺、味覺那都是帶寬較窄的通道。視覺相當于八車道的高速,其它感覺是兩旁的人行道。如果不能處理視覺信息的話,整個人工智能系統(tǒng)是個空架子,只能做符號推理,比如下棋、定理證明,沒法進入現(xiàn)實世界。計算機視覺之于人工智能,它相當于說芝麻開門。大門就在這里面,這個門打不開,就沒法研究真實世界的人工智能?!薄焖杉儯又荽髮W洛杉磯分校UCLA統(tǒng)計學和計算機科學教授根據(jù)科普中國撰寫的對計算機視覺的定義,這是一門研究如何讓機器“看”的科學,更進一步的說,是指用計算機代替人眼對目標進行識別、跟蹤和測量的機器視覺,并進一步做圖形處理,使計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像。
2.計算機視覺VS機器視覺
計算機視覺更關(guān)注圖像信號本身以及圖像相關(guān)交叉領(lǐng)域(地圖、醫(yī)療影像)的研究;機器視覺則偏重計算機視覺技術(shù)工程化,更關(guān)注廣義上的圖像信號(激光和攝像頭)和自動化控制(生產(chǎn)線)方面的應(yīng)用。
3.計算機視覺識別技術(shù)的分類
物體識別分為“1VSN”對不同物體進行歸類,以及“1VS1”對同類型的物體進行區(qū)分和鑒別;物體屬性識別,結(jié)合地圖模型讓物體在視覺的三維空間里得到記憶的重建,進而進行場景的分析和判斷;物體行為識別分為3個進階的步驟,移動識別判斷物體是否做了位移,動作識別判斷物體做的是什么動作,行為識別是結(jié)合視覺主體和場景的交互做出行為的分析和判斷。
4.計算機視覺的識別流程
訓練模型:樣本數(shù)據(jù)包括正樣本(包含待檢目標的樣本)和負樣本(不包含目標的樣本),視覺系統(tǒng)利用算法對原始樣本進行特征的選擇和提取訓練出分類器(模型);此外因為樣本數(shù)據(jù)成千上萬、提取出來的特征更是翻番,所以一般為了縮短訓練的過程,會人為加入知識庫(提前告訴計算機一些規(guī)則),或者引入限制條件來縮小搜索空間。
識別圖像:會先對圖像進行信號變換、降噪等預處理,再來利用分類器對輸入圖像進行目標檢測。一般檢測過程為用一個掃描子窗口在待檢測的圖像中不斷的移位滑動,子窗口每到一個位置就會計算出該區(qū)域的特征,然后用訓練好的分類器對該特征進行篩選,判斷該區(qū)域是否為目標。
5.計算機視覺技術(shù)模式圖和對應(yīng)企業(yè)圖
目前世界上圖像識別大的數(shù)據(jù)庫,是斯坦福大學人工智能實驗室提供的ImageNet,針對諸如醫(yī)療等細分領(lǐng)域也需要收集相應(yīng)的訓練數(shù)據(jù);Google、Microsoft此類科技巨頭會面向市場提供開源算法框架,為初創(chuàng)視覺識別公司提供初級算法。
文章名稱:AI人工智能知識科普篇—計算機視覺技術(shù)
文章轉(zhuǎn)載:http://jinyejixie.com/news34/127134.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站建設(shè)、網(wǎng)站排名、品牌網(wǎng)站建設(shè)、響應(yīng)式網(wǎng)站、企業(yè)網(wǎng)站制作、建站公司
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源:
創(chuàng)新互聯(lián)