185-0822-7772
四川海輝千訊網(wǎng)絡(luò)科技有限公司
地址:成都雙流區(qū)東升街道藏衛(wèi)路南二段699號(hào)附6號(hào)1層
電話:185-0822-7772(王)  
189-8000-5257(佘)
郵箱:ibfs@qq.com
成都弱電公司訊:
近一兩年來(lái),人工智能領(lǐng)域得到了媒體界、產(chǎn)業(yè)界和學(xué)術(shù)界等前所未有的關(guān)注,機(jī)器正在越來(lái)越多的取代人類特有的優(yōu)勢(shì)和技能,這其中最為重要的可能就是圖像辨認(rèn)技術(shù)。本文將從圖像辨認(rèn)技術(shù)的原理闡述出發(fā),介紹這一技術(shù)在安防行業(yè)的具體應(yīng)用,并且闡述其在當(dāng)前安防應(yīng)用上碰到的困難。當(dāng)然,面對(duì)這些困難,圖像辨認(rèn)技術(shù)將以此為契機(jī),與安防技術(shù)實(shí)現(xiàn)更大范圍的融合與發(fā)展。
圖像辨認(rèn)技術(shù)與人工智能
說(shuō)起圖像辨認(rèn),人類的這一能力非常突出。圖形**作用于感覺(jué)器官,人們辨認(rèn)出它是經(jīng)驗(yàn)過(guò)的某一圖形,甚至能感知到與圖像距離或者形狀的改變,這一過(guò)程叫做圖像再認(rèn)。在圖像辨認(rèn)中,既要有當(dāng)時(shí)進(jìn)入感官的信息,也要有記憶中存儲(chǔ)的信息。只有通過(guò)存儲(chǔ)的信息與當(dāng)前的信息進(jìn)行比較的加工過(guò)程,才能實(shí)現(xiàn)對(duì)圖像的再認(rèn)。
計(jì)算機(jī)圖像辨認(rèn)技術(shù),則是利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以辨認(rèn)各種分歧模式的目標(biāo)和對(duì)象的技術(shù)。圖像辨認(rèn)所研究的問(wèn)題,是如何用計(jì)算機(jī)代替人類去自動(dòng)處理大量的物理信息,解決人類所無(wú)法辨認(rèn)或者辨認(rèn)過(guò)于耗費(fèi)資源的問(wèn)題,從而很大程度上解放人類的勞動(dòng)力。
圖像辨認(rèn)技術(shù)是人工智能的一個(gè)重要領(lǐng)域。圖像辨認(rèn)技術(shù)是以圖像的主要特征為基礎(chǔ)的。每個(gè)圖像都有它的特征,對(duì)圖像辨認(rèn)時(shí)眼動(dòng)的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向忽然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個(gè)特征轉(zhuǎn)到另一個(gè)特征上。由此可見(jiàn),在圖像辨認(rèn)過(guò)程中,知覺(jué)機(jī)制必須排除輸入的多余信息,抽出關(guān)鍵的信息。同時(shí),在大腦里必定有一個(gè)負(fù)責(zé)整合信息的機(jī)制,它能把分階段獲得的信息整理成一個(gè)完整的知覺(jué)映象。
為了編制模擬人類圖像辨認(rèn)活動(dòng)的計(jì)算機(jī)程序,人們提出了分歧的圖像辨認(rèn)模型。例如模板匹配模型。這種模型認(rèn)為,辨認(rèn)某個(gè)圖像,必須在過(guò)去的經(jīng)驗(yàn)中有這個(gè)圖像的記憶模式,又叫模板。當(dāng)前的**假如能與大腦中的模板相匹配,這個(gè)圖像也就被辨認(rèn)了。但這種模型強(qiáng)調(diào)圖像必須與腦中的模板完全符合才能加以辨認(rèn),有一定的局限性。格式塔心理學(xué)家又據(jù)此提出了一個(gè)原型匹配模型。這種模型認(rèn)為,在長(zhǎng)時(shí)記憶中存儲(chǔ)的并不是所要辨認(rèn)的無(wú)數(shù)個(gè)模板,而是圖像的某些“相似性”。從圖像中抽象出來(lái)的“相似性”就可作為原型,拿它來(lái)檢驗(yàn)所要辨認(rèn)的圖像。假如能找到一個(gè)相似的原型,這個(gè)圖像也就被辨認(rèn)了。但是,這種模型沒(méi)有說(shuō)明人是怎樣對(duì)相似的刺激進(jìn)行辨別和加工的,它也難以在計(jì)算機(jī)程序中得到實(shí)現(xiàn)。因此又有人提出了一個(gè)更復(fù)雜的模型,即“泛魔”辨認(rèn)模型。
隨著計(jì)算機(jī)技術(shù)及人工智能技術(shù)的發(fā)展,圖像辨認(rèn)技術(shù)越來(lái)越成為人工智能的基礎(chǔ)技術(shù),它將是未來(lái)科技領(lǐng)域幾大關(guān)鍵產(chǎn)業(yè)的核心技術(shù)之一。微軟、谷歌、Facebook、亞馬遜、百度、騰訊等巨頭都在傾注大量資源推動(dòng)這項(xiàng)功能進(jìn)步。好比微軟的圖像辨認(rèn)應(yīng)用“我看起來(lái)有多大”(HowOldDoILook?),成為網(wǎng)絡(luò)上紅極一時(shí)的話題。在去年舉行的第六屆ImageNet圖像辨認(rèn)技術(shù)比賽中,微軟憑借“圖像辨認(rèn)的深度殘差學(xué)習(xí)”(DeepResidualLearningforImageRecognition)系統(tǒng)獲得第一名??萍脊救绱藷嶂杂趫D像辨認(rèn)技術(shù)的應(yīng)用和創(chuàng)新,這種進(jìn)步顯然會(huì)大大方便互聯(lián)網(wǎng)、傳媒行業(yè)及科研領(lǐng)域的相關(guān)工作。