自動(dòng)駕駛汽車(chē)、交通標(biāo)志檢測(cè)、面部識(shí)別和自助結(jié)賬。 將所有這些先進(jìn)解決方案結(jié)合在一起的是計(jì)算機(jī)視覺(jué)。 計(jì)算機(jī)視覺(jué)允許計(jì)算機(jī)從原始圖像中提取信息,并為更有效的業(yè)務(wù)數(shù)字化開(kāi)辟了許多機(jī)會(huì)。 讓我們來(lái)看看計(jì)算機(jī)視覺(jué)如何顛覆各個(gè)行業(yè),以及它為幫助業(yè)主解決關(guān)鍵業(yè)務(wù)挑戰(zhàn)帶來(lái)了哪些獨(dú)特的好處。
#1:物體檢測(cè)
傳統(tǒng)的計(jì)算機(jī)視覺(jué)實(shí)現(xiàn)使用對(duì)輸入和輸出的深入分析。老式 CV 的典型流程依賴(lài)于邊緣檢測(cè)等圖像處理技術(shù)來(lái)識(shí)別和標(biāo)記圖像中的對(duì)象。
計(jì)算機(jī)科學(xué)中深度學(xué)習(xí)架構(gòu)的出現(xiàn)導(dǎo)致了從經(jīng)典的 CV 技術(shù)(如基于定義的特征結(jié)構(gòu))到 AI 驅(qū)動(dòng)的圖像神經(jīng)網(wǎng)絡(luò)分析的巨大轉(zhuǎn)變,這使得圖像中數(shù)據(jù)的提取和分類(lèi)幾乎完全自動(dòng)化。簡(jiǎn)單來(lái)說(shuō),人工智能將編程從畫(huà)面中剔除,取而代之的是一種監(jiān)督較少的方法,在這種方法中,計(jì)算機(jī)解釋輸入數(shù)據(jù)并訓(xùn)練自己識(shí)別圖像的內(nèi)容。
用例
當(dāng) AI 進(jìn)入醫(yī)學(xué)成像等領(lǐng)域時(shí),計(jì)算機(jī)會(huì)利用卓越的模式識(shí)別來(lái)識(shí)別原始圖像中的細(xì)微元素,例如 X 射線或 MRI 中是否存在微量癌細(xì)胞。盡管仍然需要人工解釋和專(zhuān)業(yè)知識(shí)來(lái)檢查機(jī)器的推斷,但額外的閃電般的快速分析層有助于補(bǔ)充人類(lèi)智能并挽救生命。
隨著自動(dòng)駕駛汽車(chē)在美國(guó)和其他許多國(guó)家上路,CV 領(lǐng)域?qū)⒂瓉?lái)爆發(fā)式增長(zhǎng)。沒(méi)有計(jì)算機(jī)視覺(jué),自動(dòng)駕駛汽車(chē)就無(wú)法存在。由于車(chē)輛的車(chē)載計(jì)算機(jī)需要對(duì)道路上的潛在障礙物做出快速?zèng)Q策,因此它依賴(lài)于一套高度優(yōu)化的基于 CV 的技術(shù)。
值得注意的是,在醫(yī)學(xué)、安全、制造等領(lǐng)域,人工智能驅(qū)動(dòng)系統(tǒng)如何做出決策的透明度至關(guān)重要。這就是可解釋的人工智能發(fā)揮作用的地方。該技術(shù)允許以人類(lèi)可以理解的方式解釋系統(tǒng)的發(fā)現(xiàn),并顯示人工智能算法做出的特定決策的可靠性。
使用計(jì)算機(jī)視覺(jué)解決以下業(yè)務(wù)挑戰(zhàn):
公安(車(chē)輛識(shí)別、武器類(lèi)型識(shí)別、可疑物體定位等)
銷(xiāo)售自動(dòng)化和庫(kù)存管理(識(shí)別貨架上的低庫(kù)存或錯(cuò)放物品、檢測(cè)空貨架、執(zhí)行質(zhì)量控制、自助結(jié)賬的產(chǎn)品識(shí)別等)
消除人為錯(cuò)誤并防止工作流程中的重復(fù)計(jì)算
#2:光學(xué)字符識(shí)別(OCR)
光學(xué)字符識(shí)別 (OCR) 是計(jì)算機(jī)視覺(jué)的獨(dú)特實(shí)現(xiàn),可解決各種特定領(lǐng)域的任務(wù)。 OCR 旨在從輸入圖像中檢測(cè)和提取字母、數(shù)字和其他字符。
用例
Google Lens 使用 OCR 讓客戶從照片中翻譯外語(yǔ),并從圖像或 Google 搜索中提取文本。 OCR 技術(shù)還使傳統(tǒng)媒體的數(shù)字化變得簡(jiǎn)單,從報(bào)紙、雜志和書(shū)籍的掃描中提取文本。以前,大學(xué)很難將藏傳佛教宗教文本等更晦澀的文件數(shù)字化,但現(xiàn)代 OCR 技術(shù)使得從非標(biāo)準(zhǔn)語(yǔ)言文件中提取文本變得簡(jiǎn)單。
金融機(jī)構(gòu)使用 OCR 來(lái)改善客戶的生活質(zhì)量,例如讓客戶從文件中提取他們的國(guó)際銀行帳號(hào) (IBAN) 或掃描支票圖像,這樣就不必去銀行存款.一些應(yīng)用程序可以掃描借記卡或信用卡以輸入付款詳情,因此您不必在結(jié)帳窗口繁瑣地輸入所有付款信息。
政府通常使用 OCR 來(lái)縮短國(guó)家邊境的處理時(shí)間或識(shí)別和登記文件。現(xiàn)代護(hù)照和駕駛執(zhí)照上的機(jī)器可讀區(qū)域與政府和商業(yè)環(huán)境中的 OCR 系統(tǒng)兼容。
#3:面部識(shí)別
與對(duì)象識(shí)別類(lèi)似,面部識(shí)別旨在使用計(jì)算機(jī)視覺(jué)識(shí)別圖像中的人類(lèi)面部特征。經(jīng)典的計(jì)算機(jī)視覺(jué)方法利用“Haar-like features”來(lái)計(jì)算面部特征之間的片段,但現(xiàn)代面部識(shí)別實(shí)現(xiàn)依賴(lài)于人工智能,就像人工智能用于物體識(shí)別一樣。
用例
面部識(shí)別技術(shù)對(duì)于安全應(yīng)用程序至關(guān)重要,因?yàn)樗兄诜乐挂苿?dòng)和 Web 應(yīng)用程序漏洞。無(wú)數(shù) Apple iPhone 用戶依靠 Apple 的 Face ID 技術(shù)進(jìn)行生物識(shí)別來(lái)解鎖他們的手機(jī)。
零售商已經(jīng)部署了類(lèi)似的實(shí)現(xiàn)來(lái)識(shí)別已知的商店扒手。實(shí)時(shí)掃描儀從安全攝像頭流中抓取客戶的面部,并交叉引用已知犯罪分子的數(shù)據(jù)庫(kù)。同樣的技術(shù)通過(guò)從執(zhí)法數(shù)據(jù)庫(kù)中提取來(lái)幫助尋找失蹤兒童。
面部識(shí)別還可以幫助您完成以下任務(wù):
安全和訪問(wèn)控制
身份驗(yàn)證
員工跟蹤
醫(yī)療保健中的患者篩查程序
識(shí)別和追蹤犯罪分子
下一代面部識(shí)別軟件甚至可以查看姿勢(shì)、手勢(shì)和面部表情,以確定客戶是否可能在賭場(chǎng)作弊。與相同的安全軟件捆綁的步態(tài)分析還可以幫助根據(jù)他們獨(dú)特的腳步和步幅模式來(lái)檢測(cè)犯罪分子,因?yàn)樵S多犯罪分子通過(guò)戴口罩來(lái)躲避面部識(shí)別。
#4:圖像恢復(fù)和場(chǎng)景重建
計(jì)算機(jī)視覺(jué)技術(shù)還可以恢復(fù)嚴(yán)重退化的檔案鏡頭和圖像,這可能是一項(xiàng)關(guān)鍵的業(yè)務(wù)技術(shù)。與從照片中去除噪點(diǎn)就足夠的簡(jiǎn)單情況不同,計(jì)算機(jī)視覺(jué)可以幫助處理更多損壞的圖像,這些圖像需要進(jìn)行重大更改和詳細(xì)分析。圖像的損壞部分通常使用評(píng)估照片廣播內(nèi)容的生成模型來(lái)填充。
用例
除了恢復(fù)圖像和視頻之外,現(xiàn)代神經(jīng)網(wǎng)絡(luò)還可以?xún)H通過(guò)掃描照片中的對(duì)象來(lái)重建 3D 場(chǎng)景。考古學(xué)家、法醫(yī)專(zhuān)家、環(huán)境科學(xué)家和許多其他專(zhuān)業(yè)人士使用場(chǎng)景重建,這是一種改變游戲規(guī)則的計(jì)算機(jī)視覺(jué)范例。 RetrievalFuse 等項(xiàng)目能夠從單個(gè) RGB 圖像構(gòu)建全景 3D 場(chǎng)景。
#5:人體姿勢(shì)估計(jì)
姿勢(shì)估計(jì)旨在模擬人類(lèi)視覺(jué)能力,特別是識(shí)別圖像和視頻中的姿勢(shì)和手勢(shì)。一些最早的高級(jí)人體姿勢(shì)估計(jì)示例出現(xiàn)在大預(yù)算電影中,例如彼得杰克遜的《指環(huán)王》。隨著計(jì)算資源隨著時(shí)間的推移而擴(kuò)大,姿勢(shì)估計(jì)將在許多不同的產(chǎn)品中發(fā)揮作用。
用例
在安全應(yīng)用中,姿勢(shì)估計(jì)通過(guò)分析面部識(shí)別不可行的步態(tài)來(lái)幫助識(shí)別潛在的麻煩制造者。計(jì)算機(jī)視覺(jué)可以通過(guò)分析身體姿勢(shì)來(lái)幫助實(shí)時(shí)檢測(cè)入店行竊。該系統(tǒng)可以區(qū)分正常的購(gòu)物行為和可疑行為,例如拿走物品并將其藏在口袋或外套中。當(dāng)檢測(cè)到可疑行為時(shí),管理人員會(huì)收到警報(bào),并可以在小偷離開(kāi)商店之前迅速做出反應(yīng)。
以下是在您的業(yè)務(wù)中使用姿勢(shì)估計(jì)的一些方法:
康復(fù)措施分析
開(kāi)發(fā)基于人工智能的健身教練應(yīng)用程序
識(shí)別人體在空間中的位置以改進(jìn)增強(qiáng)現(xiàn)實(shí)的應(yīng)用
游戲角色動(dòng)畫(huà)
人在商店和購(gòu)物中心的活動(dòng)分析
盡管姿態(tài)估計(jì)曾經(jīng)是一項(xiàng)巨大的計(jì)算挑戰(zhàn),但云計(jì)算和硬件的創(chuàng)新使更多公司能夠接觸到這項(xiàng)技術(shù)。
一切都是可能的
對(duì)象檢測(cè)、面部識(shí)別、場(chǎng)景重建、圖像恢復(fù)和人體姿態(tài)估計(jì)只是計(jì)算機(jī)視覺(jué)技術(shù)的幾種不同實(shí)現(xiàn)方式。由于下一代 AI 的強(qiáng)大功能,無(wú)論您的企業(yè)從事何種行業(yè),計(jì)算機(jī)視覺(jué)都可以提供獨(dú)特的優(yōu)勢(shì),使您的公司在競(jìng)爭(zhēng)中處于領(lǐng)先地位。從重建犯罪現(xiàn)場(chǎng)照片的全深度 3D 模型到識(shí)別工廠線上量產(chǎn)產(chǎn)品的缺陷,計(jì)算機(jī)視覺(jué)不斷改變每個(gè)人的業(yè)務(wù)方式。