它抓的住你！智能影像偵測(cè)的具體應(yīng)用與驗(yàn)證

cooper — Thu, 12 Sep 2019 07:59:14 +0000

Allion Labs / Kali Chen

什么是智能影像偵測(cè)？

智能相機(jī)在近年經(jīng)由學(xué)術(shù)單位大量研究與擴(kuò)展讓影像偵測(cè)技術(shù)更上一層樓，因其功能卓越及使用便利，也逐漸成為許多家庭必買的智能用品之一。簡(jiǎn)單來說，智能影像分析系統(tǒng)會(huì)透過計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)與深度學(xué)習(xí)等技術(shù)，從中學(xué)習(xí)人的視覺識(shí)別能力，并自動(dòng)判讀影像中的關(guān)鍵信息，目前被大量使用在人臉識(shí)別、人體動(dòng)作捕捉、光學(xué)文字識(shí)別技術(shù)等。此外，智能相機(jī)也導(dǎo)入了云端系統(tǒng)，使數(shù)據(jù)可以循環(huán)儲(chǔ)存在云端上，搭配網(wǎng)絡(luò)平臺(tái)上導(dǎo)入的識(shí)別技術(shù)，無需額外再架設(shè)主機(jī)或儲(chǔ)存設(shè)備，從而減少設(shè)備的開銷。

市場(chǎng)常見的四大影像識(shí)別軟件與平臺(tái)

百佳泰從市面上常見的影像識(shí)別軟件，分別介紹其功能及原理：

人臉偵測(cè)
人體動(dòng)作偵測(cè)
車輛識(shí)別
光學(xué)文字識(shí)別功能

人臉識(shí)別

人臉識(shí)別是智能相機(jī)中最重要的一部分，其原理為當(dāng)相機(jī)取得人臉影像后，會(huì)取得人臉五官相對(duì)位置的坐標(biāo)。我們以知名影星為例（圖1.1），從照片中擷取眉毛、眼睛、嘴部等多點(diǎn)位置后，描繪出多點(diǎn)所形成的輪廓；如拍攝到數(shù)張同一人臉在不同角度的影像時(shí)，軟件會(huì)利用神經(jīng)網(wǎng)絡(luò)處理圖片，從中提取特征點(diǎn)，并將其數(shù)張影像代入機(jī)器學(xué)習(xí)算法，可訓(xùn)練分類器分類以及訓(xùn)練出人臉身份對(duì)應(yīng)的模型。

圖1.1：將不同角度的同一人臉導(dǎo)入偵測(cè)系統(tǒng)進(jìn)行訓(xùn)練

當(dāng)下一次再拍攝到同一個(gè)人的人臉時(shí)，偵測(cè)系統(tǒng)便會(huì)代入之前訓(xùn)練好的模型，便可準(zhǔn)確辨認(rèn)出該人的身份（如圖1.2）。?

圖1.2

此外，這一系列的技術(shù)也可運(yùn)用在實(shí)時(shí)視頻中，影像偵測(cè)透過模型可迅速識(shí)別人員身份（如圖1.3）。

圖1.3

人體動(dòng)作偵測(cè)

在居家環(huán)境中，嬰幼兒及老人的居家照顧較為費(fèi)心；如稍不注意，可能會(huì)導(dǎo)致嬰兒跌落床下或是老人跌倒等情形發(fā)生。智能攝影機(jī)另一項(xiàng)著重的功能在于可偵測(cè)人員防跌以及防摔，鏡頭會(huì)偵測(cè)人員的肢體由直立快速改變?yōu)槠教苫蚓砬鸂畹膭?dòng)作。另外像是運(yùn)動(dòng)訓(xùn)練單位所使用的智能攝影機(jī)，也搭配了肢體捕捉功能，可精準(zhǔn)進(jìn)行動(dòng)作肢體的校正。目前肢體捕捉最主流的為Open Pose，識(shí)別的原理先由相機(jī)捕捉到2D圖像并傳到網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)庫(kù)，圖像數(shù)據(jù)再導(dǎo)入Open Pose運(yùn)算平臺(tái)，之后Open Pose中的關(guān)鍵點(diǎn)檢測(cè)器會(huì)識(shí)別并標(biāo)記出身體特點(diǎn)的部位，身體跟蹤算法會(huì)計(jì)算出不同角度下每個(gè)姿勢(shì)的表現(xiàn)，并以3D彩色火柴人的形式呈現(xiàn)出來。（圖2）

圖2

車輛識(shí)別

在交通管理工作領(lǐng)域中，車輛識(shí)別是相當(dāng)實(shí)用的功能，例如停車場(chǎng)停車、路邊違停、超速等交通安全事件，往往都需要拍攝車牌號(hào)碼取得證據(jù)。不同地區(qū)的國(guó)家有不同車牌格式，當(dāng)攝影機(jī)拍下車牌影像后會(huì)立即上傳到平臺(tái)數(shù)據(jù)庫(kù)。就目前來說，網(wǎng)絡(luò)平臺(tái)上Open ALPR可針對(duì)不同地區(qū)的車牌格式進(jìn)行訓(xùn)練并儲(chǔ)存模型，當(dāng)用戶上傳數(shù)據(jù)到平臺(tái)時(shí)便能快速識(shí)別該車牌，并提供車輛型號(hào)、年分、廠牌、車牌號(hào)碼等信息。

圖3

光學(xué)文字識(shí)別功能

利用圖像識(shí)別的方式擷取文字信息，可以大量應(yīng)用在各種場(chǎng)合，例如各種有文字信息的圖像、光學(xué)文件掃描儀、文字翻譯機(jī)等。目前較為廣泛使用的是Tesseract的OCR技術(shù)，在網(wǎng)絡(luò)平臺(tái)先建置并設(shè)定好使用的文字語系模型，再輸入含有文字的影像和模型比對(duì)，即完成文字識(shí)別輸出（圖4）。

圖4

百佳泰四大影像軟件驗(yàn)證服務(wù)

百佳泰與時(shí)俱進(jìn)，導(dǎo)入四大影像識(shí)別驗(yàn)證測(cè)試，確保您的產(chǎn)品可針對(duì)不同目標(biāo)進(jìn)行精準(zhǔn)識(shí)別與校正，除可保有良好的產(chǎn)品質(zhì)量外，也能在市場(chǎng)中占據(jù)一席之地。

以下為智能攝影機(jī)驗(yàn)證項(xiàng)目其具體方法（表1）

驗(yàn)證項(xiàng)目	驗(yàn)證方法
人臉識(shí)別驗(yàn)證	臉部影像捕捉傳送至網(wǎng)絡(luò)平臺(tái)，導(dǎo)入 Face API 偵測(cè)功能，回傳偵測(cè)結(jié)果并實(shí)際比對(duì)該廠牌智能相機(jī)APP端的人臉識(shí)別功能。
人體動(dòng)作偵測(cè)驗(yàn)證	人體影像捕捉傳送至網(wǎng)絡(luò)平臺(tái)，導(dǎo)入 OpenPose偵測(cè)功能，回傳偵測(cè)結(jié)果并實(shí)際比對(duì)該廠牌智能攝影機(jī)APP端的人體動(dòng)作偵測(cè)功能。?
車輛識(shí)別驗(yàn)證	車輛影像捕捉傳送至網(wǎng)絡(luò)平臺(tái)，導(dǎo)入Open ALPR偵測(cè)功能，回傳偵測(cè)結(jié)果并實(shí)際比對(duì)該智能攝影機(jī)APP端的車輛識(shí)別功能。?
光學(xué)文字識(shí)別功能驗(yàn)證	文字影像捕捉傳送至網(wǎng)絡(luò)平臺(tái)，導(dǎo)入 Optical character recognition (OCR) API 偵測(cè)功能，回傳偵測(cè)結(jié)果并實(shí)際比對(duì)該廠牌智能攝影機(jī)APP端的光學(xué)文字識(shí)別功能。?

表1

此外，我們參考市面上三大熱門網(wǎng)絡(luò)平臺(tái)供貨商（表2），透過平臺(tái)搭配能為您的產(chǎn)品架構(gòu)出最佳智能影像識(shí)別測(cè)試方案。?

?	微軟	亞馬遜	Google
網(wǎng)絡(luò)平臺(tái)	Azure Computer Vision	AWS Rekognition	Cloud Vision

表2

盗墓笔记小说txt下载,小说排行榜,小说阅读器

它抓的住你！智能影像偵測(cè)的具體應(yīng)用與驗(yàn)證