想記錄眼前美景?不用再掏出相機(jī)或手機(jī),只需一句語(yǔ)音指令,佩戴的輕巧時(shí)尚的谷歌眼鏡就能立刻拍出眼前的圖景;走在陌生的大街上,不用再查地圖或問(wèn)路,只需將手機(jī)攝像頭對(duì)準(zhǔn)街道,諾基亞“城市萬(wàn)花筒”就能將眼前的商店、餐館和景點(diǎn)直接標(biāo)注,覆蓋顯示在手機(jī)圖像上……這些以往多是在電影中看到的畫面,已成為普通人可以觸摸到的現(xiàn)實(shí)。機(jī)器視覺(jué)——這一“第三只眼”正以巨大的能量,改變著人們的生活和工作方式。記者就此專訪中國(guó)科學(xué)院自動(dòng)化所專家,為讀者解密神奇的“第三只眼”
與人眼一決高低
“機(jī)器視覺(jué)就是用機(jī)器代替人眼來(lái)進(jìn)行識(shí)別、測(cè)量、判斷等。機(jī)器視覺(jué)系統(tǒng)是通過(guò)攝像頭將拍攝對(duì)象轉(zhuǎn)換成圖像信號(hào),然后再交由圖像分析系統(tǒng)進(jìn)行分析、測(cè)量等?!敝袊?guó)科學(xué)院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室研究員黃凱奇博士介紹:“機(jī)器視覺(jué)是一項(xiàng)典型的跨學(xué)科任務(wù),涉及到光學(xué)、計(jì)算機(jī)視覺(jué)、模式識(shí)別、機(jī)器學(xué)習(xí)、人工智能、統(tǒng)計(jì)學(xué)、認(rèn)知心理學(xué)等等?!?
機(jī)器視覺(jué)最早應(yīng)用于工業(yè)制造領(lǐng)域。通過(guò)機(jī)器視覺(jué)的自動(dòng)識(shí)別功能,許多流水線上具有高度重復(fù)性的檢測(cè)工作都可以不再依靠人來(lái)完成,大大提高了檢測(cè)效率和精度。黃凱奇介紹,機(jī)器視覺(jué)系統(tǒng)最基本的特點(diǎn)就是提高生產(chǎn)的靈活性和自動(dòng)化程度。在一些不適于人工作業(yè)的危險(xiǎn)工作環(huán)境或者人工視覺(jué)難以滿足要求的場(chǎng)合,常用機(jī)器視覺(jué)來(lái)替代人工視覺(jué)。同時(shí),在大批量重復(fù)性工業(yè)生產(chǎn)過(guò)程中,用機(jī)器視覺(jué)檢測(cè)方法可以大大提高生產(chǎn)的效率和自動(dòng)化程度。
一個(gè)典型的機(jī)器視覺(jué)系統(tǒng)包括照明、鏡頭、相機(jī)、圖像采集卡和視覺(jué)處理器5個(gè)部分。由于采集卡能更加迅速地傳輸圖像到存儲(chǔ)器,且計(jì)算機(jī)速度不斷加快,所以在目前的機(jī)器視覺(jué)系統(tǒng)中,視覺(jué)處理器的應(yīng)用逐漸減少。圖像采集卡在機(jī)器視覺(jué)系統(tǒng)中舉足輕重。比較典型的PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計(jì)算機(jī)存儲(chǔ)器進(jìn)行處理。有些采集卡有內(nèi)置的多路開關(guān),可連接多臺(tái)相機(jī),能控制采集卡采用任意一個(gè)相機(jī)捕獲的信息。
伴隨著技術(shù)的發(fā)展,機(jī)器視覺(jué)的功能也在不斷擴(kuò)展。黃凱奇說(shuō):“缺陷檢測(cè)是通過(guò)機(jī)器視覺(jué)手段來(lái)分析零部件信息,從而判斷其是否存在缺陷;測(cè)量是通過(guò)使用機(jī)器視覺(jué)來(lái)對(duì)考察對(duì)象的尺寸、形狀等信息進(jìn)行度量;人機(jī)交互是利用機(jī)器視覺(jué)工具分析人或者其他機(jī)器發(fā)出的指令,從而實(shí)現(xiàn)對(duì)機(jī)器的操縱;環(huán)境建模是對(duì)機(jī)器周圍環(huán)境進(jìn)行感知建模,比如移動(dòng)機(jī)器人對(duì)路面環(huán)境進(jìn)行感知建模等?!?
“目前總的看來(lái),機(jī)器視覺(jué)在工業(yè)電子以及半導(dǎo)體行業(yè)應(yīng)用還是最為主要的,如PCB板缺陷檢測(cè)、IC芯片缺陷檢測(cè)等。交通領(lǐng)域的應(yīng)用如電子眼也較為廣泛,其他行業(yè)如制藥中的藥品成分分析、互聯(lián)網(wǎng)中的視覺(jué)計(jì)算廣告、物流中的物品分揀等等,都有機(jī)器視覺(jué)應(yīng)用的影子?!秉S凱奇說(shuō)。
機(jī)器視覺(jué)——這“第三只眼”已在多個(gè)領(lǐng)域展現(xiàn)出了比人眼更強(qiáng)大的功能。黃凱奇表示:“機(jī)器視覺(jué)利用好了完全可以比人做得更好,因?yàn)椴煌娜嗽谟^看時(shí),信息得不到充分和及時(shí)的交流,主觀性也很強(qiáng)。而機(jī)器視覺(jué)不僅計(jì)算功能強(qiáng)大,而且獲取的信息通過(guò)協(xié)同分析后得到的知識(shí)會(huì)具有‘極高’的價(jià)值,尤其在其更趨于智能化之后?!?