Allion Labs / Kali Chen
?
什么是智能影像偵測?
智能相機在近年經(jīng)由學術(shù)單位大量研究與擴展讓影像偵測技術(shù)更上一層樓,因其功能卓越及使用便利,也逐漸成為許多家庭必買的智能用品之一。簡單來說,智能影像分析系統(tǒng)會透過計算機視覺、機器學習與深度學習等技術(shù),從中學習人的視覺識別能力,并自動判讀影像中的關(guān)鍵信息,目前被大量使用在人臉識別、人體動作捕捉、光學文字識別技術(shù)等。此外,智能相機也導入了云端系統(tǒng),使數(shù)據(jù)可以循環(huán)儲存在云端上,搭配網(wǎng)絡(luò)平臺上導入的識別技術(shù),無需額外再架設(shè)主機或儲存設(shè)備,從而減少設(shè)備的開銷。
?
市場常見的四大影像識別軟件與平臺
百佳泰從市面上常見的影像識別軟件,分別介紹其功能及原理:
- 人臉偵測
- 人體動作偵測
- 車輛識別
- 光學文字識別功能
?
人臉識別
人臉識別是智能相機中最重要的一部分,其原理為當相機取得人臉影像后,會取得人臉五官相對位置的坐標。我們以知名影星為例(圖1.1),從照片中擷取眉毛、眼睛、嘴部等多點位置后,描繪出多點所形成的輪廓;如拍攝到數(shù)張同一人臉在不同角度的影像時,軟件會利用神經(jīng)網(wǎng)絡(luò)處理圖片,從中提取特征點,并將其數(shù)張影像代入機器學習算法,可訓練分類器分類以及訓練出人臉身份對應(yīng)的模型。
?
?
圖1.1:將不同角度的同一人臉導入偵測系統(tǒng)進行訓練
?
當下一次再拍攝到同一個人的人臉時,偵測系統(tǒng)便會代入之前訓練好的模型,便可準確辨認出該人的身份(如圖1.2)。?
?
?
圖1.2
?
此外,這一系列的技術(shù)也可運用在實時視頻中,影像偵測透過模型可迅速識別人員身份(如圖1.3)。
圖1.3
?
人體動作偵測
在居家環(huán)境中,嬰幼兒及老人的居家照顧較為費心;如稍不注意,可能會導致嬰兒跌落床下或是老人跌倒等情形發(fā)生。智能攝影機另一項著重的功能在于可偵測人員防跌以及防摔,鏡頭會偵測人員的肢體由直立快速改變?yōu)槠教苫蚓砬鸂畹膭幼?。另外像是運動訓練單位所使用的智能攝影機,也搭配了肢體捕捉功能,可精準進行動作肢體的校正。目前肢體捕捉最主流的為Open Pose,識別的原理先由相機捕捉到2D圖像并傳到網(wǎng)絡(luò)平臺數(shù)據(jù)庫,圖像數(shù)據(jù)再導入Open Pose運算平臺,之后Open Pose中的關(guān)鍵點檢測器會識別并標記出身體特點的部位,身體跟蹤算法會計算出不同角度下每個姿勢的表現(xiàn),并以3D彩色火柴人的形式呈現(xiàn)出來。 (圖2)
圖2
?
車輛識別
在交通管理工作領(lǐng)域中,車輛識別是相當實用的功能,例如停車場停車、路邊違停、超速等交通安全事件,往往都需要拍攝車牌號碼取得證據(jù)。不同地區(qū)的國家有不同車牌格式,當攝影機拍下車牌影像后會立即上傳到平臺數(shù)據(jù)庫。就目前來說,網(wǎng)絡(luò)平臺上Open ALPR可針對不同地區(qū)的車牌格式進行訓練并儲存模型,當用戶上傳數(shù)據(jù)到平臺時便能快速識別該車牌,并提供車輛型號、年分、廠牌、車牌號碼等信息。
圖3
?
?
光學文字識別功能
利用圖像識別的方式擷取文字信息,可以大量應(yīng)用在各種場合,例如各種有文字信息的圖像、光學文件掃描儀、文字翻譯機等。目前較為廣泛使用的是Tesseract的OCR技術(shù),在網(wǎng)絡(luò)平臺先建置并設(shè)定好使用的文字語系模型,再輸入含有文字的影像和模型比對,即完成文字識別輸出(圖4)。
?
圖4
?
?
?
百佳泰四大影像軟件驗證服務(wù)
百佳泰與時俱進,導入四大影像識別驗證測試,確保您的產(chǎn)品可針對不同目標進行精準識別與校正,除可保有良好的產(chǎn)品質(zhì)量外,也能在市場中占據(jù)一席之地。
以下為智能攝影機驗證項目其具體方法(表1)
驗證項目 | 驗證方法 |
人臉識別驗證 | 臉部影像捕捉傳送至網(wǎng)絡(luò)平臺,導入 Face API 偵測功能,回傳偵測結(jié)果并實際比對該廠牌智能相機APP端的人臉識別功能。 |
人體動作偵測驗證 |
人體影像捕捉傳送至網(wǎng)絡(luò)平臺,導入 OpenPose偵測功能,回傳偵測結(jié)果并實際比對該廠牌智能攝影機APP端的人體動作偵測功能。? |
車輛識別驗證 | 車輛影像捕捉傳送至網(wǎng)絡(luò)平臺,導入Open ALPR偵測功能,回傳偵測結(jié)果并實際比對該智能攝影機APP端的車輛識別功能。? |
光學文字識別功能驗證 |
文字影像捕捉傳送至網(wǎng)絡(luò)平臺,導入 Optical character recognition (OCR) API 偵測功能,回傳偵測結(jié)果并實際比對該廠牌智能攝影機APP端的光學文字識別功能。? |
表1
?
此外,我們參考市面上三大熱門網(wǎng)絡(luò)平臺供貨商(表2),透過平臺搭配能為您的產(chǎn)品架構(gòu)出最佳智能影像識別測試方案。?
? | 微軟 | 亞馬遜 | |
網(wǎng)絡(luò)平臺 | Azure Computer Vision | AWS Rekognition | Cloud Vision |
表2
?