完美世界辰东,完美世界txt全集下载

　　一臺(tái)機(jī)器為什么能看到你?因?yàn)樗辛俗约旱囊曈X(jué)。機(jī)器視覺(jué)技術(shù)是一門(mén)涉及人工智能、神經(jīng)生物學(xué)、心理物理學(xué)、計(jì)算機(jī)科學(xué)、圖像處理、模式識(shí)別等諸多領(lǐng)域的交叉學(xué)科。機(jī)器視覺(jué)主要用計(jì)算機(jī)來(lái)模擬人的視覺(jué)功能，從客觀事物的圖像中提取信息，進(jìn)行處理并加以理解，最終用于實(shí)際檢測(cè)、測(cè)量和控制，技術(shù)最大的特點(diǎn)是速度快、信息量大、功能多。

　　機(jī)器視覺(jué)主要用計(jì)算機(jī)來(lái)模擬人的視覺(jué)功能，但并不僅僅是人眼的簡(jiǎn)單延伸，更重要的是具有人腦的一部分功能一一從客觀事物的圖像中提取信息，進(jìn)行處理并加以理解，最終用于實(shí)際檢測(cè)、測(cè)量和控制。

　　一個(gè)典型的工業(yè)機(jī)器視覺(jué)應(yīng)用系統(tǒng)，包括數(shù)字圖像處理技術(shù)、機(jī)械工程技術(shù)、控制技術(shù)、光源照明技術(shù)、光學(xué)成像技術(shù)、傳感器技術(shù)、模擬與數(shù)字視頻技術(shù)、計(jì)算機(jī)軟硬件技術(shù)、人機(jī)接口技術(shù)等。

　　發(fā)展歷史簡(jiǎn)介

　　機(jī)器視覺(jué)的研究是從20世紀(jì)60年代中期美國(guó)學(xué)者L.R.羅伯茲關(guān)于理解多面體組成的積木世界研究開(kāi)始的。當(dāng)時(shí)運(yùn)用的預(yù)處理、邊緣檢測(cè)、輪廓線構(gòu)成、對(duì)象建模、匹配等技術(shù)，后來(lái)一直在機(jī)器視覺(jué)中應(yīng)用。

　　羅伯茲在圖像分析過(guò)程中，采用了自底向上的方法。用邊緣檢測(cè)技術(shù)來(lái)確定輪廓線，用區(qū)域分析技術(shù)將圖像劃分為由灰度相近的像素組成的區(qū)域，這些技術(shù)統(tǒng)稱為圖像分割。其目的在于用輪廓線和區(qū)域?qū)λ治龅膱D像進(jìn)行描述，以便同機(jī)內(nèi)存儲(chǔ)的模型進(jìn)行比較匹配。

　　實(shí)踐表明，只用自底向上的分析太困難，必須同時(shí)采用自頂向下，即把目標(biāo)分為若干子目標(biāo)的分析方法，運(yùn)用啟發(fā)式知識(shí)對(duì)對(duì)象進(jìn)行預(yù)測(cè)。這同言語(yǔ)理解中采用的自底向上和自頂向下相結(jié)合的方法是一致的。在圖像理解研究中，A.古茲曼提出運(yùn)用啟發(fā)式知識(shí)，表明用符號(hào)過(guò)程來(lái)解釋輪廓畫(huà)的方法不必求助于諸如最小二乘法匹配之類的數(shù)值計(jì)算程序。

　　70年代以后，機(jī)器視覺(jué)形成幾個(gè)重要研究分支：一、目標(biāo)制導(dǎo)的圖像處理;二、圖像處理和分析的并行算法;三、從二維圖像提取三維信息;四、序列圖像分析和運(yùn)動(dòng)參量求值;五、視覺(jué)知識(shí)的表示;六、視覺(jué)系統(tǒng)的知識(shí)庫(kù)等。

機(jī)器視覺(jué)

　　全球應(yīng)用情況

　　在國(guó)外，機(jī)器視覺(jué)的應(yīng)用普及主要體現(xiàn)在半導(dǎo)體及電子行業(yè)，其中大概40%-50%都集中在半導(dǎo)體行業(yè)。機(jī)器視覺(jué)系統(tǒng)還在質(zhì)量檢測(cè)的各個(gè)方面已經(jīng)得到了廣泛的應(yīng)用，并且其產(chǎn)品在應(yīng)用中占據(jù)著舉足輕重的地位。除此之外，機(jī)器視覺(jué)還用于其他各個(gè)領(lǐng)域。

　　而在中國(guó)，視覺(jué)技術(shù)的應(yīng)用開(kāi)始于90年代，因?yàn)樾袠I(yè)本身就屬于新興的領(lǐng)域，再加之機(jī)器視覺(jué)產(chǎn)品技術(shù)的普及不夠，導(dǎo)致以上各行業(yè)的應(yīng)用幾乎空白。目前國(guó)內(nèi)機(jī)器視覺(jué)大多為國(guó)外品牌。國(guó)內(nèi)大多機(jī)器視覺(jué)公司基本上是靠代理國(guó)外各種機(jī)器視覺(jué)品牌起家，隨著機(jī)器視覺(jué)的不斷應(yīng)用，公司規(guī)模慢慢做大，技術(shù)上已經(jīng)逐漸成熟。

　　在行業(yè)應(yīng)用方面，主要有制藥、包裝、電子、汽車(chē)制造、半導(dǎo)體、紡織、煙草、交通、物流等行業(yè)，用機(jī)器視覺(jué)技術(shù)取代人工，可以提供生產(chǎn)效率和產(chǎn)品質(zhì)量。例如在物流行業(yè)，可以使用機(jī)器視覺(jué)技術(shù)進(jìn)行快遞的分揀分類，不會(huì)出現(xiàn)大多快遞公司人工進(jìn)行分揀，減少物品的損壞率，可以提高分揀效率，減少人工勞動(dòng)。

　　主要問(wèn)題和發(fā)展瓶頸

　　機(jī)器視覺(jué)可以看作是與人工智能和模式識(shí)別密切相關(guān)的一個(gè)子學(xué)科或子領(lǐng)域。限制機(jī)器視覺(jué)發(fā)展的瓶頸是多方面的，其中最重要的可以歸結(jié)為三個(gè)方面：計(jì)算能力不足、認(rèn)知理論未明以及精確識(shí)別與模糊特征之間的自相矛盾。

　　1.機(jī)器視覺(jué)面向的研究對(duì)象主要是圖像和視頻，其特點(diǎn)是數(shù)據(jù)量龐大、冗余信息多、特征空間維度高，同時(shí)考慮到真正的機(jī)器視覺(jué)面對(duì)的對(duì)象和問(wèn)題的多樣性，單一的簡(jiǎn)單特征提取算法(如顏色、空間朝向與頻率、邊界形狀等等)難以滿足算法對(duì)普適性的要求，因此在設(shè)計(jì)普適性的特征提取算法時(shí)對(duì)計(jì)算能力和存儲(chǔ)速度的要求是十分巨大的，這就造成了開(kāi)發(fā)成本的大幅度提高。

　　2. 如何讓機(jī)器認(rèn)知這個(gè)世界?這一問(wèn)題目前沒(méi)有成熟的答案，早期的人工智能理論發(fā)展經(jīng)歷了符號(hào)主義學(xué)派、行為主義學(xué)派、連接主義學(xué)派等一系列的發(fā)展但都沒(méi)有找到令人滿意的答案，目前較新的思想認(rèn)為應(yīng)該從分析、了解和模擬人類大腦的信息處理功能去構(gòu)建智能機(jī)器視覺(jué)系統(tǒng)，但神經(jīng)科學(xué)的發(fā)展目前只能做到了解和模擬大腦的一個(gè)局部，而不是整體(當(dāng)然計(jì)算能力限制也是原因之一)。事實(shí)上，我們對(duì)人是如何對(duì)一個(gè)目標(biāo)或場(chǎng)景進(jìn)行認(rèn)知的這一問(wèn)題仍停留在定性描述而非定量描述上。

　　3. 機(jī)器視覺(jué)系統(tǒng)經(jīng)常被人詬病的問(wèn)題之一就是準(zhǔn)確性。以十年前如火如荼的人臉識(shí)別算法為例，盡管一系列看似優(yōu)秀的算法不斷問(wèn)世，但目前為止在非指定大規(guī)模樣本庫(kù)下進(jìn)行人臉識(shí)別的準(zhǔn)確率仍然無(wú)法滿足實(shí)際應(yīng)用的需求，因此無(wú)法取代指紋或虹膜等近距接觸式生物特征識(shí)別方法。這一問(wèn)題的出現(xiàn)并非偶然。因?yàn)槟繕?biāo)越精細(xì)，越復(fù)雜，信息越大，則其模糊性和不確定性也越強(qiáng)。人類之所以能夠較好的對(duì)人臉進(jìn)行識(shí)別，其實(shí)也是以犧牲一定的準(zhǔn)確性為代價(jià)的。而機(jī)器視覺(jué)在做的事情一方面想要借鑒人腦或人眼系統(tǒng)的靈感去處理復(fù)雜而龐大的信息流，另一方面又想摒除人腦在模式識(shí)別方面存在的精確性不足的缺陷。這顯然是一種一廂情愿的做法。

　　綜合以上三點(diǎn)，機(jī)器視覺(jué)的發(fā)展在短期內(nèi)難有重大突破，當(dāng)前的實(shí)用技術(shù)仍然還是會(huì)集中在特定性任務(wù)或特定性目標(biāo)的識(shí)別算法的開(kāi)發(fā)上。

　　關(guān)于視覺(jué)測(cè)量研究：

　　(1)機(jī)器視覺(jué)測(cè)量的可靠性。相比與其他測(cè)量手段，視覺(jué)的最大優(yōu)點(diǎn)就是可以快速獲得三維信息，一張或幾張照片就可以重建出被測(cè)物體的三維特征，進(jìn)而實(shí)現(xiàn)測(cè)量。但正如大家所說(shuō)，只要測(cè)量條件、環(huán)境、被測(cè)物表面特性等改變，有時(shí)甚至?xí)r稍加改變，結(jié)果則大不一樣，測(cè)量重復(fù)性和精度更無(wú)從談起。這也是目前機(jī)器視覺(jué)測(cè)量尺寸、位姿等參數(shù)時(shí)比較突出的問(wèn)題，特別是在一些強(qiáng)光干擾、溫度場(chǎng)變化、光照條件變化的應(yīng)用場(chǎng)合這個(gè)問(wèn)題尤為突出。因此，視覺(jué)測(cè)量的環(huán)境適應(yīng)性問(wèn)題解決難度很大，無(wú)法找到普適性的方法，只能針對(duì)具體問(wèn)題，研究相應(yīng)光照、特征提取、匹配、重建、標(biāo)定等具體方法。

　　(2)測(cè)量精度問(wèn)題。精度是測(cè)量系統(tǒng)的重要指標(biāo)。視覺(jué)測(cè)量精度依賴于相機(jī)分辨率、視場(chǎng)大小、圖像處理算法等等。CCD和CMOS的制造工藝已取得長(zhǎng)足進(jìn)步，目前6000*4000pixel的分辨率已經(jīng)成為穩(wěn)定商品。而采用壓電驅(qū)動(dòng)芯片做微米級(jí)移動(dòng)進(jìn)行像素細(xì)分的方法和設(shè)備已經(jīng)商品化，號(hào)稱分辨率可近20000*14000pixel。在軟件方面，各類算法層出不窮，但具有普適性的算法幾乎沒(méi)有，這個(gè)在CV領(lǐng)域也是如此。因此，提高視覺(jué)測(cè)量的普適性、并確保精度，目前似乎是個(gè)不可能完成的任務(wù)。

　　綜上，視覺(jué)測(cè)量要大的突破確實(shí)很難，必須和應(yīng)用光學(xué)、視覺(jué)認(rèn)知、CV、人工智能等相關(guān)學(xué)科進(jìn)行深度交叉。

　　提升三維技術(shù)

　　在現(xiàn)實(shí)生活中，我們?cè)絹?lái)越需要更多的三維模型來(lái)實(shí)現(xiàn)對(duì)物體或環(huán)境的全面掌握。獲得三維模型有兩種基本方式，一種是利用激光掃描儀，一種是拍攝照片。但激光掃描儀的成本高，也有可能會(huì)對(duì)樣本帶來(lái)一些損害。第二種方式的成本小，而且在精度上也跟激光掃描儀相差無(wú)幾，因此成為了現(xiàn)在研究的一個(gè)熱點(diǎn)。

　　我們知道，一般的圖像上是沒(méi)有長(zhǎng)度、距離等深度信息的，而三維模型則能更加全面、精確地記錄環(huán)境，可以直觀呈現(xiàn)物體的位置、距離、姿態(tài)等。比如中國(guó)古代建筑全自動(dòng)三維重建系統(tǒng)，能夠?qū)崿F(xiàn)全自動(dòng)三維建模，即從底層圖像處理到生成最終的三維模型，全部自動(dòng)實(shí)現(xiàn)，無(wú)需人工交互。它對(duì)圖像的拍攝方式也無(wú)特殊約束和限制，只需手持自由拍攝即可。在精度上，也與激光掃描精度相當(dāng)，精度小于3cm/100米，通過(guò)配備更高像素?cái)?shù)量的相機(jī)和長(zhǎng)焦鏡頭還可以實(shí)現(xiàn)毫米級(jí)重建。

　　此外，在實(shí)時(shí)定位與在線三維重建方面，機(jī)器視覺(jué)也具有極大的應(yīng)用潛力。將手機(jī)上攝像頭讀取的視頻作為輸入，通過(guò)初始化、特征點(diǎn)提取、動(dòng)態(tài)模板特征點(diǎn)匹配、幾何變化計(jì)算階段后得到視頻每一幀中感興趣區(qū)域的位置。

　　目前，我國(guó)基于機(jī)器視覺(jué)的三維重建技術(shù)在國(guó)際上可以說(shuō)處于領(lǐng)先地位，應(yīng)用也比較廣泛。除了上述之外，還能用在一些不太適合人工作業(yè)的環(huán)境監(jiān)測(cè)方面，像對(duì)露天煤礦的監(jiān)測(cè)，就是通過(guò)無(wú)人機(jī)對(duì)煤礦進(jìn)行全方位拍攝，生成三維模型來(lái)實(shí)時(shí)監(jiān)測(cè)礦山的變化。此外，也能應(yīng)用于城市規(guī)劃、數(shù)字媒體、三維試衣、牙模制造等多方面。

　　未來(lái)發(fā)展趨勢(shì)

　　由于機(jī)器視覺(jué)是自動(dòng)化的一部分，沒(méi)有自動(dòng)化就不會(huì)有機(jī)器視覺(jué)，機(jī)器視覺(jué)軟硬件產(chǎn)品正逐漸成為協(xié)作生產(chǎn)制造過(guò)程中不同階段的核心系統(tǒng)，無(wú)論是用戶還是硬件供應(yīng)商都將機(jī)器視覺(jué)產(chǎn)品作為生產(chǎn)線上信息收集的工具，這就要求機(jī)器視覺(jué)產(chǎn)品大量采用標(biāo)準(zhǔn)化技術(shù)，直觀地說(shuō)就是要隨著自動(dòng)化的開(kāi)放而逐漸開(kāi)放，可以根據(jù)用戶的需求進(jìn)行二次開(kāi)發(fā)。

　　當(dāng)今，自動(dòng)化企業(yè)正在倡導(dǎo)軟硬一體化解決方案，機(jī)器視覺(jué)的廠商在未來(lái)十年內(nèi)也應(yīng)該不單純是只提供產(chǎn)品的供應(yīng)商，而是逐漸向一體化解決方案的系統(tǒng)集成商邁進(jìn)。隨著中國(guó)加工制造業(yè)的發(fā)展，對(duì)于機(jī)器視覺(jué)的需求也逐漸增多。隨著機(jī)器視覺(jué)產(chǎn)品的增多，技術(shù)的提高，國(guó)內(nèi)機(jī)器視覺(jué)的應(yīng)用狀況將由初期的低端轉(zhuǎn)向高端。由于機(jī)器視覺(jué)的介入，自動(dòng)化將朝著更智能、更快速的方向發(fā)展。

深圳市思普泰克科技有限公司

相關(guān)推薦

機(jī)器視覺(jué)助力汽車(chē)密封圈檢測(cè)：產(chǎn)線大媽看完直呼“這活兒我能干到退休！”

選擇機(jī)器視覺(jué)光源應(yīng)考慮哪些特性？

目前機(jī)器視覺(jué)技術(shù)存在哪些難點(diǎn)？

機(jī)器視覺(jué)相關(guān)技術(shù)及所遇問(wèn)題

機(jī)器視覺(jué)從發(fā)展到成熟，最新技術(shù)又有些什么？

改善機(jī)器視覺(jué)系統(tǒng)的十大方法

技術(shù)動(dòng)態(tài)

機(jī)器視覺(jué)的應(yīng)用及其發(fā)展

深圳市思普泰克科技

聯(lián)系我們