免费观看日韩激情视频网站_老师让我了一个晚上网站_国产九一视频在线播放_国产97色在线亚洲_思思久久精品丝袜一区_又大又黄的刺激免费视频_日韩亚洲亚洲综合_国产丝袜va丝袜老师_青青草免费中文字幕组_日韩欧美成人高清

導(dǎo)航

機(jī)器視覺(jué)技術(shù)路線的總結(jié)與討論

2020-08-30

       各位好,本人是電子工程專業(yè)碩士,從事機(jī)器視覺(jué)算法和系統(tǒng)研發(fā)有接近10年時(shí)間。在這些過(guò)程中,大部分是自己獨(dú)立解決工程應(yīng)用問(wèn)題,因此養(yǎng)成了善于思考,善于總結(jié)的習(xí)慣。這個(gè)領(lǐng)域研究論文很多,針對(duì)各個(gè)項(xiàng)目各個(gè)行業(yè)均有涉足,但是沒(méi)有一篇整體把握的文章。結(jié)合自己將近10年做過(guò)各種項(xiàng)目,看過(guò)很多文獻(xiàn),希望對(duì)這個(gè)領(lǐng)域發(fā)表一下自己的看法,讓后來(lái)者有章可循,有據(jù)可依,在項(xiàng)目開展之前,能清楚地知道什么項(xiàng)目能做,什么項(xiàng)目不能做,推動(dòng)行業(yè)的進(jìn)步。

      本文不會(huì)像一般論文那樣,先把什么是機(jī)器視覺(jué),機(jī)器視覺(jué)發(fā)展歷史先介紹一遍。雖然那樣對(duì)于寫論文來(lái)說(shuō)是必要的,但是在這里顯得啰嗦。直接上核心內(nèi)容。

     必要的敘述還是要的,機(jī)器視覺(jué)是計(jì)算機(jī)視覺(jué)在工業(yè)領(lǐng)域的分支。而計(jì)算機(jī)視覺(jué)是人工智能的重要分支。人工智能的發(fā)展水平直接影響計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)的發(fā)展水平。人工智能是什么,簡(jiǎn)單說(shuō)就是用計(jì)算機(jī)軟硬件去模擬人類的學(xué)習(xí)、理解、思考、決策能力。目前有幾個(gè)學(xué)派:貝葉斯學(xué)派、符號(hào)主義學(xué)派、聯(lián)結(jié)主義學(xué)派。之所以有這些學(xué)派是因?yàn)槟壳翱茖W(xué)界尚不清楚為什么人類有智能,因此三個(gè)大牛分別從不同角度進(jìn)行研究,創(chuàng)立了三個(gè)學(xué)派。具體學(xué)派的內(nèi)容大家可以自行網(wǎng)上搜索,在此不再贅述。

      現(xiàn)在大家用的語(yǔ)音助手,手寫識(shí)別、中英文翻譯,智能客服,人臉識(shí)別,基于視覺(jué)的自動(dòng)駕駛都是人工智能技術(shù)的體現(xiàn)。在此不去吹捧這些技術(shù),而是客觀評(píng)價(jià)一下。大家用這些東西的時(shí)候有什么感覺(jué),是不是覺(jué)得有些東西不那么智能? 例如智能客服,你說(shuō)了半天他還是自說(shuō)自話,不會(huì)變通。比如基于視覺(jué)的自動(dòng)駕駛,偶爾還是會(huì)錯(cuò)誤的把行人識(shí)別成椅子或者其他東西。語(yǔ)音助手也只能是按照套路來(lái),你如果不按套路講話,他還是聽不懂。

      之所以出現(xiàn)以上問(wèn)題,是因?yàn)楝F(xiàn)在人工智能技術(shù)還無(wú)法實(shí)現(xiàn)人類水平的智能。而是從數(shù)學(xué)、統(tǒng)計(jì)學(xué)、或者大量樣本中去提取特征建模。所走的路線跟我們?nèi)祟愂峭耆煌摹D悴挥萌W(xué)習(xí)什么是貝葉斯,但是你就是能看過(guò)幾個(gè)紅富士蘋果之后,也能毫不費(fèi)力的認(rèn)出黃元帥蘋果,蘋果爛掉一點(diǎn)哪怕爛掉一半你也能認(rèn)出這是蘋果。我們?nèi)祟惖闹悄苁亲园l(fā)的,不需要刻意去想的。但是機(jī)器(人工智能)就達(dá)不到這種能力。機(jī)器(人工智能)是利用數(shù)學(xué)的、統(tǒng)計(jì)的、工程技術(shù)的各種手段去模擬,去逼近。而無(wú)法做出跟人類完全一樣的智能體。而目前人工智能研究水平還非常有限,只有在某些受控環(huán)境下可以做的非常好(例如AlphaGo),一旦環(huán)境隨機(jī),可靠性穩(wěn)定性都會(huì)大幅下降。

      介紹完上述背景之后,我們來(lái)看機(jī)器視覺(jué)目前發(fā)展的水平。

      機(jī)器視覺(jué),行業(yè)里的人都知道,是用來(lái)代替人眼在生產(chǎn)線上的工作。這些工作有對(duì)位(擰螺絲)、外觀檢查、尺寸測(cè)量等。有些工作機(jī)器視覺(jué)技術(shù)做的非常好,有的卻做不來(lái),為什么呢?

      人眼完成工作是基于人類的理解能力,看到哪里有個(gè)螺絲,就去擰,這個(gè)過(guò)程無(wú)需過(guò)多描述,是我們?nèi)祟愖罨A(chǔ)的能力。但是機(jī)器是怎么做的呢? 既然是去擰螺絲,那么什么是螺絲?機(jī)器不懂,計(jì)算機(jī)科學(xué)家也無(wú)法寫一個(gè)程序讓計(jì)算機(jī)知道那是螺絲。因?yàn)闋砍兜饺斯ぶ悄苓@個(gè)學(xué)科的發(fā)展水平,這個(gè)學(xué)科無(wú)法做出一個(gè)具有自主思考理解能力的機(jī)器。因此在機(jī)器視覺(jué)工程應(yīng)用中也無(wú)法使用一個(gè)自主思考的機(jī)器去完成任務(wù)。

      工程上用的方法是利用顏色,邊緣,角點(diǎn)等信息去描述什么是螺絲,或者簡(jiǎn)單點(diǎn),一到白光打下來(lái),背景是亮的,黑的那個(gè)就是螺絲。那么如果產(chǎn)品上掉了一個(gè)墨點(diǎn),機(jī)械手也會(huì)去擰。不要笑,現(xiàn)在技術(shù)水平就是這樣的。當(dāng)然實(shí)際用的時(shí)候,可能會(huì)設(shè)計(jì)很多特征和規(guī)則去讓機(jī)器盡可能降低誤識(shí)別。

     具體的來(lái)講,第一步打光成像,以缺陷檢測(cè)為例,比如要檢測(cè)白紙上的墨點(diǎn),周圍用光源將紙面照亮。然后用相機(jī)將紙面圖像拍下來(lái),用灰度對(duì)比的方法將墨點(diǎn)提取出來(lái)。用對(duì)比度,面積,周長(zhǎng),圓度等指標(biāo)去界定目標(biāo)是不是一個(gè)墨點(diǎn)。

      白紙檢測(cè)墨點(diǎn)是初級(jí)任務(wù),可以很好的完成。當(dāng)任務(wù)復(fù)雜一些,情況就不一樣了。例如在印有森林圖案的彩色掛歷上檢測(cè)墨點(diǎn),難度陡增。白紙檢測(cè)墨點(diǎn),本科畢業(yè)生可以勝任,而森林掛歷檢測(cè)墨點(diǎn)研究生不一定能搞定。因?yàn)榘准埌咐奶卣魈崛》椒ㄔ谶@里無(wú)效了:森林背景圖案,樹蔭的形態(tài)與墨點(diǎn)極其接近,對(duì)比度,灰度,形狀等特征全部失效。就好比指紋識(shí)別系統(tǒng),但是用戶手指脫皮嚴(yán)重,而且手上還占了很多灰塵,此時(shí)要正確識(shí)別指紋,堪比登天。

     當(dāng)前機(jī)器視覺(jué)技術(shù),概括起來(lái)就是打光成像,特征分析。如果有明顯特征,任務(wù)有希望解決。例如當(dāng)前的深度學(xué)習(xí)就是為了解決特征難以刻畫的問(wèn)題。白紙墨點(diǎn)檢測(cè)容易實(shí)現(xiàn),圖案掛歷檢測(cè)墨點(diǎn)難以實(shí)現(xiàn),就是這個(gè)道理。

     更直觀的例子,像物體識(shí)別。以前識(shí)別貓狗很困難,因?yàn)樨埞返奶卣麟y以準(zhǔn)確刻畫。計(jì)算機(jī)就是這樣的工具,如果無(wú)法將某個(gè)特征轉(zhuǎn)化為程序語(yǔ)言,那么它就是無(wú)法執(zhí)行。即使像貓狗識(shí)別這樣的人類感覺(jué)是零難度的問(wèn)題,卻很難轉(zhuǎn)換為程序語(yǔ)言。計(jì)算機(jī)只能處理底層數(shù)據(jù),無(wú)法理解人類的名詞概念。我們說(shuō)長(zhǎng)這樣的是貓,長(zhǎng)成那樣的是狗。小孩子都可以理解,但是計(jì)算機(jī)理解不了,因?yàn)橛?jì)算機(jī)只會(huì)執(zhí)行運(yùn)算指令,它不能思考和學(xué)習(xí)。這是特征工程的技術(shù)瓶頸所致。

      特征根據(jù)復(fù)雜程度分為簡(jiǎn)單特征與復(fù)雜特征,根據(jù)顯著性分為明顯特征和不明顯特征。復(fù)雜特征可以是顯著性特征,簡(jiǎn)單特征也可以是不明顯特征。復(fù)雜的明顯特征相對(duì)好處理,因?yàn)槿绻须y度,難在特征刻畫能力不夠,一旦找到了合適的刻畫手段,問(wèn)題就解決了。但是如果特征不明顯,哪怕是簡(jiǎn)單特征也很難解決。可以采用一維信號(hào)處理的信噪比概念來(lái)解釋,即簡(jiǎn)單特征但是不明顯,等價(jià)于信噪比低。有限的特征信號(hào)淹沒(méi)在大量相似的噪聲之中。做過(guò)通信工程技術(shù)都知道,如果信號(hào)干擾和衰減太大,那么數(shù)據(jù)誤碼率會(huì)很高。只有想辦法提高信道的信噪比才能保證數(shù)據(jù)傳輸?shù)目煽啃浴?/p>

      對(duì)于特征不明顯的目標(biāo),要檢測(cè)出來(lái)只能采用不同成像手段,使特征更加明顯,噪聲更加微弱。如果不能達(dá)到這一點(diǎn),基本是不具有可行性的。

      深度學(xué)習(xí)主要解決的是復(fù)雜特征刻畫能力這一個(gè)環(huán)節(jié),原來(lái)手工特征時(shí)代,對(duì)于貓狗,植物種類識(shí)別這種人眼看起來(lái)明顯但是操作起來(lái)卻很難保證準(zhǔn)確性的項(xiàng)目,深度學(xué)習(xí)解決的很好,因?yàn)樘卣鞯目坍嬆芰Υ蠓嵘5菍?duì)于森林圖案中找墨點(diǎn)這種應(yīng)用一樣力不從心,原因是特征太不明顯。

      深度學(xué)習(xí)出來(lái)以后,手工特征的研究大大減少。因?yàn)樯疃葘W(xué)習(xí)可以很好的解決復(fù)雜特征刻畫問(wèn)題,雖然我們還無(wú)法保證其100%可靠性,但是通過(guò)技術(shù)手段已經(jīng)可以實(shí)現(xiàn)相當(dāng)高的可靠性。以后研究方向可能在于成像系統(tǒng),對(duì)于某些特殊場(chǎng)景的識(shí)別。以及深度學(xué)習(xí)理解能力的加深。

      傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別在于,傳統(tǒng)機(jī)器學(xué)習(xí)還是要求人工設(shè)計(jì)特征,但是機(jī)器學(xué)習(xí)的分類能力大大超過(guò)if else. 不過(guò)弊端也很明顯,如果輸入的特征不典型,沒(méi)有抓到實(shí)質(zhì)問(wèn)題,那么機(jī)器學(xué)習(xí)系統(tǒng)也還是無(wú)法令人滿意。深度學(xué)習(xí)同時(shí)解決了特征刻畫和特征分類問(wèn)題。雖然還無(wú)法用理論推出精確的模型結(jié)構(gòu),但是效果很好。這也是技術(shù)進(jìn)步的必經(jīng)之路,先把東西搞出來(lái),能用、好用,然后不斷完善理論,最后能夠解釋這種現(xiàn)象。就像電磁學(xué)的發(fā)展一樣,一開始科學(xué)家只發(fā)現(xiàn)電磁之間能互相轉(zhuǎn)化,但是無(wú)法定量計(jì)算,直到麥克斯韋創(chuàng)造出麥克斯韋方程組,電磁之間的轉(zhuǎn)化關(guān)系才得以徹底量化,建立出完善的理論體系。

      另外,既然是工程問(wèn)題,那么當(dāng)二維無(wú)法解決時(shí),可以嘗試三維。例如復(fù)雜圖案掛歷要檢測(cè)劃傷,凹坑。如果采用二維成像,很難識(shí)別,因?yàn)樘卣鞑幻黠@。但是提取表面深度信息之后,原有的復(fù)雜圖案全部被濾除,只留下凹坑和劃痕,就很容易識(shí)別了。

      簡(jiǎn)單概括起來(lái),我們雖然不了解人類眼睛識(shí)別和理解的機(jī)理,但是通過(guò)工程技術(shù)的手段去模仿了一些人眼的某些功能,成為現(xiàn)在的機(jī)器視覺(jué)技術(shù)。在這項(xiàng)技術(shù)中,成像是基礎(chǔ)要素,也是關(guān)鍵要素,要把目標(biāo)物突顯出來(lái)。特征提取是第二要素,大部分情況下也是衡量一個(gè)機(jī)器視覺(jué)系統(tǒng)是否優(yōu)秀的關(guān)鍵。

      以上是本人對(duì)于機(jī)器視覺(jué)技術(shù)路線的總結(jié)和討論。希望給各位有所啟示,推動(dòng)行業(yè)進(jìn)步。有不同意見或建議,歡迎留言參與討論。

 

版權(quán)所屬:常州范視電子科技,馬浩洋