?
什么是智能影像偵測(cè)?
智能相機(jī)在近年經(jīng)由學(xué)術(shù)單位大量研究與擴(kuò)展讓影像偵測(cè)技術(shù)更上一層樓,因其功能卓越及使用便利,也逐漸成為許多家庭必買的智能用品之一。簡(jiǎn)單來說,智能影像分析系統(tǒng)會(huì)透過計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)與深度學(xué)習(xí)等技術(shù),從中學(xué)習(xí)人的視覺識(shí)別能力,并自動(dòng)判讀影像中的關(guān)鍵信息,目前被大量使用在人臉識(shí)別、人體動(dòng)作捕捉、光學(xué)文字識(shí)別技術(shù)等。此外,智能相機(jī)也導(dǎo)入了云端系統(tǒng),使數(shù)據(jù)可以循環(huán)儲(chǔ)存在云端上,搭配網(wǎng)絡(luò)平臺(tái)上導(dǎo)入的識(shí)別技術(shù),無需額外再架設(shè)主機(jī)或儲(chǔ)存設(shè)備,從而減少設(shè)備的開銷。
?
市場(chǎng)常見的四大影像識(shí)別軟件與平臺(tái)
百佳泰從市面上常見的影像識(shí)別軟件,分別介紹其功能及原理:
?
人臉識(shí)別
人臉識(shí)別是智能相機(jī)中最重要的一部分,其原理為當(dāng)相機(jī)取得人臉影像后,會(huì)取得人臉五官相對(duì)位置的坐標(biāo)。我們以知名影星為例(圖1.1),從照片中擷取眉毛、眼睛、嘴部等多點(diǎn)位置后,描繪出多點(diǎn)所形成的輪廓;如拍攝到數(shù)張同一人臉在不同角度的影像時(shí),軟件會(huì)利用神經(jīng)網(wǎng)絡(luò)處理圖片,從中提取特征點(diǎn),并將其數(shù)張影像代入機(jī)器學(xué)習(xí)算法,可訓(xùn)練分類器分類以及訓(xùn)練出人臉身份對(duì)應(yīng)的模型。
?
?
圖1.1:將不同角度的同一人臉導(dǎo)入偵測(cè)系統(tǒng)進(jìn)行訓(xùn)練
?
當(dāng)下一次再拍攝到同一個(gè)人的人臉時(shí),偵測(cè)系統(tǒng)便會(huì)代入之前訓(xùn)練好的模型,便可準(zhǔn)確辨認(rèn)出該人的身份(如圖1.2)。?
?
?
圖1.2
?
此外,這一系列的技術(shù)也可運(yùn)用在實(shí)時(shí)視頻中,影像偵測(cè)透過模型可迅速識(shí)別人員身份(如圖1.3)。
圖1.3
?
人體動(dòng)作偵測(cè)
在居家環(huán)境中,嬰幼兒及老人的居家照顧較為費(fèi)心;如稍不注意,可能會(huì)導(dǎo)致嬰兒跌落床下或是老人跌倒等情形發(fā)生。智能攝影機(jī)另一項(xiàng)著重的功能在于可偵測(cè)人員防跌以及防摔,鏡頭會(huì)偵測(cè)人員的肢體由直立快速改變?yōu)槠教苫蚓砬鸂畹膭?dòng)作。另外像是運(yùn)動(dòng)訓(xùn)練單位所使用的智能攝影機(jī),也搭配了肢體捕捉功能,可精準(zhǔn)進(jìn)行動(dòng)作肢體的校正。目前肢體捕捉最主流的為Open Pose,識(shí)別的原理先由相機(jī)捕捉到2D圖像并傳到網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)庫(kù),圖像數(shù)據(jù)再導(dǎo)入Open Pose運(yùn)算平臺(tái),之后Open Pose中的關(guān)鍵點(diǎn)檢測(cè)器會(huì)識(shí)別并標(biāo)記出身體特點(diǎn)的部位,身體跟蹤算法會(huì)計(jì)算出不同角度下每個(gè)姿勢(shì)的表現(xiàn),并以3D彩色火柴人的形式呈現(xiàn)出來。 (圖2)
圖2
?
車輛識(shí)別
在交通管理工作領(lǐng)域中,車輛識(shí)別是相當(dāng)實(shí)用的功能,例如停車場(chǎng)停車、路邊違停、超速等交通安全事件,往往都需要拍攝車牌號(hào)碼取得證據(jù)。不同地區(qū)的國(guó)家有不同車牌格式,當(dāng)攝影機(jī)拍下車牌影像后會(huì)立即上傳到平臺(tái)數(shù)據(jù)庫(kù)。就目前來說,網(wǎng)絡(luò)平臺(tái)上Open ALPR可針對(duì)不同地區(qū)的車牌格式進(jìn)行訓(xùn)練并儲(chǔ)存模型,當(dāng)用戶上傳數(shù)據(jù)到平臺(tái)時(shí)便能快速識(shí)別該車牌,并提供車輛型號(hào)、年分、廠牌、車牌號(hào)碼等信息。
圖3
?
?
光學(xué)文字識(shí)別功能
利用圖像識(shí)別的方式擷取文字信息,可以大量應(yīng)用在各種場(chǎng)合,例如各種有文字信息的圖像、光學(xué)文件掃描儀、文字翻譯機(jī)等。目前較為廣泛使用的是Tesseract的OCR技術(shù),在網(wǎng)絡(luò)平臺(tái)先建置并設(shè)定好使用的文字語系模型,再輸入含有文字的影像和模型比對(duì),即完成文字識(shí)別輸出(圖4)。
?
圖4
?
?
?
百佳泰四大影像軟件驗(yàn)證服務(wù)
百佳泰與時(shí)俱進(jìn),導(dǎo)入四大影像識(shí)別驗(yàn)證測(cè)試,確保您的產(chǎn)品可針對(duì)不同目標(biāo)進(jìn)行精準(zhǔn)識(shí)別與校正,除可保有良好的產(chǎn)品質(zhì)量外,也能在市場(chǎng)中占據(jù)一席之地。
以下為智能攝影機(jī)驗(yàn)證項(xiàng)目其具體方法(表1)
驗(yàn)證項(xiàng)目 | 驗(yàn)證方法 |
人臉識(shí)別驗(yàn)證 | 臉部影像捕捉傳送至網(wǎng)絡(luò)平臺(tái),導(dǎo)入 Face API 偵測(cè)功能,回傳偵測(cè)結(jié)果并實(shí)際比對(duì)該廠牌智能相機(jī)APP端的人臉識(shí)別功能。 |
人體動(dòng)作偵測(cè)驗(yàn)證 |
人體影像捕捉傳送至網(wǎng)絡(luò)平臺(tái),導(dǎo)入 OpenPose偵測(cè)功能,回傳偵測(cè)結(jié)果并實(shí)際比對(duì)該廠牌智能攝影機(jī)APP端的人體動(dòng)作偵測(cè)功能。? |
車輛識(shí)別驗(yàn)證 | 車輛影像捕捉傳送至網(wǎng)絡(luò)平臺(tái),導(dǎo)入Open ALPR偵測(cè)功能,回傳偵測(cè)結(jié)果并實(shí)際比對(duì)該智能攝影機(jī)APP端的車輛識(shí)別功能。? |
光學(xué)文字識(shí)別功能驗(yàn)證 |
文字影像捕捉傳送至網(wǎng)絡(luò)平臺(tái),導(dǎo)入 Optical character recognition (OCR) API 偵測(cè)功能,回傳偵測(cè)結(jié)果并實(shí)際比對(duì)該廠牌智能攝影機(jī)APP端的光學(xué)文字識(shí)別功能。? |
表1
?
此外,我們參考市面上三大熱門網(wǎng)絡(luò)平臺(tái)供貨商(表2),透過平臺(tái)搭配能為您的產(chǎn)品架構(gòu)出最佳智能影像識(shí)別測(cè)試方案。?
? | 微軟 | 亞馬遜 | |
網(wǎng)絡(luò)平臺(tái) | Azure Computer Vision | AWS Rekognition | Cloud Vision |
表2
?
]]>