人臉、指紋、虹膜等都是可以標(biāo)定主體唯一性的生物特性,可以用于主體身體的識別與認(rèn)證,進(jìn)而允許主體的合法操作,如領(lǐng)件、登錄、支付等。
隨著互聯(lián)網(wǎng)經(jīng)濟(jì)的發(fā)展,電子商務(wù)、物流運(yùn)輸、支付等行業(yè)都越來越依賴于網(wǎng)絡(luò)。身份認(rèn)證技術(shù)是保障物流系統(tǒng)安全性的重要手段。網(wǎng)絡(luò)安全和信息系統(tǒng)安全的第一道屏障就是身份認(rèn)證技術(shù),身份認(rèn)證技術(shù)在物流這種極不安全、陌生關(guān)系的環(huán)境中,是關(guān)鍵問題之一,具有不少典型的應(yīng)用場景。貨物的領(lǐng)用、操作設(shè)備、駕駛安全等研究熱點(diǎn)問題,都是以身份認(rèn)證技術(shù)為中心。例如,取快件為防止冒領(lǐng),需要確定取件者和用戶是否統(tǒng)一,避免快件遺失的情況發(fā)生。
人臉識別技術(shù)是對人臉圖像進(jìn)行特征提取和分析,將提取的有效面部進(jìn)行建模并對后續(xù)傳入的面部特征進(jìn)行分類和預(yù)測的方法。人臉識別方法與傳統(tǒng)的身份鑒定手段相比具有友好性,無多余操作、非接觸性、實時性、隱蔽性的特點(diǎn)。
二、人臉識別在物流中的典型場景
主要應(yīng)用場景有以下幾種。
(1)快遞簽收
電商的發(fā)展,使得快遞行業(yè)呈現(xiàn)出井噴式發(fā)展。實際中,快遞員需要在較短的時間完全貨物的交付、派件,造成了物流簽收環(huán)節(jié)存在很多的問題。在簽收過程中經(jīng)常出現(xiàn)冒領(lǐng),誤領(lǐng),簽收慢等問題。其中造成誤領(lǐng)、冒領(lǐng)的主要原因是傳統(tǒng)的物流簽收認(rèn)證存在容易偽造的缺陷,簽收過程耗時的主原是在簽收過程中需要對收貨人進(jìn)行復(fù)雜的身份驗證,浪費(fèi)快遞員寶貴的時間。所以,需要一種安全、快捷、便利的身份認(rèn)證方式。
(2)刷臉支付
與“刷臉登陸”相比,“刷臉支付”難度更大。涉及資金的安全,支付在安全性方面的要求比登陸更高。同時,刷臉支付多在線下公共設(shè)備和公開環(huán)境中進(jìn)行,場景復(fù)雜多變,晝夜間的光線變化極大,背景及環(huán)境噪音大,人的面相隨自然環(huán)境的變化而可能顯現(xiàn)較大的區(qū)別,例如面對攝像頭的角度與姿勢差異、光線的變化,都會使識別難度提高和安全風(fēng)險上升。
以支付寶為例,目前人臉識別準(zhǔn)確率已遠(yuǎn)超肉眼,而且有活體檢測算法來判斷采集到的人臉信息是否為照片、視頻等。這一技術(shù)將越來越接近大規(guī)模應(yīng)用。
(3)防疲勞駕駛
駕駛員長時的疲勞駕駛,是物流貨運(yùn)重大事故的主因。在途行駛過程中,疲勞駕駛、違規(guī)操作的駕駛員,其面部會出現(xiàn)典型的風(fēng)險特征,閉眼、打呵欠、分神、頻繁低頭、玩手機(jī)等,通過攝像頭的高速圖像傳感器等設(shè)備,實時采集駕駛員面部信息,通過智能識別和機(jī)器學(xué)習(xí),可以判定和抓取駕駛員不良駕駛行為及狀態(tài)。通過AI框架展開云端檢測和實時識別判斷,及時輸出該運(yùn)行車輛的運(yùn)行風(fēng)險狀態(tài),并進(jìn)行干預(yù)。
在分析出運(yùn)行車輛的風(fēng)險等級之后,根據(jù)風(fēng)險等級,即時觸發(fā)相應(yīng)的風(fēng)險預(yù)警和報警,提示駕駛員及后臺管理人員,平臺安全管理人員便可即時下發(fā)語音警告或電話通知駕駛員,多重干預(yù),保障安全。
(4)授權(quán)操作
例如,保稅倉、重要設(shè)備及其他特定區(qū)域,需要確認(rèn)身份后、獲得授權(quán)才可作下一步操作。以監(jiān)控系統(tǒng)采集端從人臉圖像中提取人臉特征,并與監(jiān)視名單數(shù)據(jù)庫中的目標(biāo)人人臉特征進(jìn)行比對,生成閡值。相據(jù)預(yù)設(shè)的閥值,系統(tǒng)會返回報警結(jié)果給監(jiān)控計算機(jī),并自動給出聲光信號報警,提示安保人員及時進(jìn)行處理;同時系統(tǒng)能實時記錄標(biāo)有目標(biāo)人人臉位置的現(xiàn)場圖像,及時給出關(guān)聯(lián)信息、閾值和告警時間。例如,倉庫的管理人員、出庫操作等,需要相應(yīng)的身份確認(rèn)后可以操作,采用“刷卡+人臉識別”的雙重認(rèn)證模式后,是更為安全的授權(quán)方式。
結(jié)合AI與人臉識別、大數(shù)據(jù)技術(shù)的智能安全應(yīng)用,具有以下優(yōu)點(diǎn):系統(tǒng)通過數(shù)據(jù)采集,對人員、人群、及其他證件信息,進(jìn)行行為實時分析,對非法闖入、人群異常行為可及時預(yù)警;同時可進(jìn)行多種方式報警,改變了傳統(tǒng)的人工辨認(rèn)的做法,降低了安保人員監(jiān)視值守的工作強(qiáng)度,也防止了安保人員的內(nèi)部腐敗、勾結(jié),提高了工作效率。
三、人臉識別的深度學(xué)習(xí)技術(shù)
人臉識別早在上世紀(jì)60、70年代就被提出了,涌現(xiàn)了很多識別算法和技術(shù),人臉識別技術(shù)一般包括了三個子模塊,分別是人臉檢測、特征提取和對特征進(jìn)行分類。人臉識別研究的重點(diǎn)集中在人臉特征提取和特征分類的算法中。算法不斷改進(jìn),使得特征的提取越來越準(zhǔn)確、明確,分類器設(shè)計的越來越合理,識別精度在不斷的提高。
人臉識別的技術(shù)流程中,分為多個步驟:人臉檢測,截取圖像預(yù)處理,人臉特征提取,將提取的特征進(jìn)行“降維”和處理最后輸入到分類器進(jìn)行分類。人臉檢測是人臉識別的第一步,其中包括標(biāo)識出圖片中的一張或多張人臉。然后根據(jù)對檢測的人臉圖片進(jìn)行直方均值等處理,將處理好的圖片放入卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行特征提取和結(jié)果預(yù)測。
隨著對人臉識別研究的深入,研究出了不同的人臉識別方法,分為以下幾類:
(1)基于自然特征的提取
(2)使用模板對人臉進(jìn)行匹配的方法
(3)基于神經(jīng)網(wǎng)絡(luò)人臉識別方法
(4)基于深度學(xué)習(xí)的人臉識別方法,目前研究熱度最高、使用最廣泛的基于卷積網(wǎng)絡(luò)的人臉識別技術(shù)。
深度學(xué)習(xí)在 2012 年取得了巨大了突破,Hinton 等人設(shè)計并訓(xùn)練了一個具有 6 千萬個參數(shù)和 65 萬個神經(jīng)元的深度卷積神經(jīng)網(wǎng)絡(luò),此神經(jīng)網(wǎng)絡(luò)在當(dāng)年的 Image Net 競賽中對 1000 個不同種類的圖片進(jìn)行分類,得到了很好的識別精度并獲得了當(dāng)年的圖像識別競賽的冠軍,因此引發(fā)了大家對深度學(xué)習(xí)研究的熱潮。
人臉識別技術(shù)的基礎(chǔ)技術(shù)包括關(guān)鍵幀篩選和人臉識別技術(shù)。深度學(xué)習(xí)在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)架構(gòu)上增加了池化層和卷積層,其中池化和卷積是對輸入的數(shù)據(jù)集作非線性的特征提取操作。
深度學(xué)習(xí)是對輸入的數(shù)據(jù)集做特征抽象化的處理,將特征抽象成矩陣的表現(xiàn)形式。深度學(xué)習(xí)特征提取方法和傳統(tǒng)的手工提取特征的方法有所不同,手工提取特征是根據(jù)操作者的主觀認(rèn)知進(jìn)行提取,不能現(xiàn)出數(shù)據(jù)集的整體分布式特征,并且手工提取所提取的特征數(shù)量較少,準(zhǔn)確度較差,嚴(yán)重影響識別的精度。深度學(xué)習(xí)主要對數(shù)據(jù)集進(jìn)行無監(jiān)督的特征提取并構(gòu)建一個或多個具有一定的深度的神經(jīng)網(wǎng)絡(luò)。
構(gòu)建的深度學(xué)習(xí)網(wǎng)絡(luò)對數(shù)據(jù)集進(jìn)行多次訓(xùn)練得出一個準(zhǔn)確的訓(xùn)練參數(shù)。深度學(xué)習(xí)能更加精確的提取圖片的特征提高了特征提取的精度。池化層是將提取出的特征進(jìn)行降維,減少進(jìn)入全連接層和 SoftMax 特征向量的維度,提高卷積神經(jīng)網(wǎng)絡(luò)的實時性。
典型的深度學(xué)習(xí)可以分成三類:
(1)深度信念網(wǎng)絡(luò)(deep beliefnetworks,DBN),應(yīng)用廣泛,靈活性強(qiáng),容易擴(kuò)展。但圖像是一維特征,缺少空間特征。
(2)卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)是一種訓(xùn)練多層網(wǎng)絡(luò)結(jié)構(gòu)的深度學(xué)習(xí)算法,二維圖像在卷積神經(jīng)網(wǎng)絡(luò)是最適合進(jìn)行人臉識別的算法。
(3)第三類是混合型結(jié)構(gòu),混合型算法分為生成性部分和區(qū)分性部分,這兩部分別使用最優(yōu)化方法和區(qū)分性網(wǎng)絡(luò)模型。
目前,卷積神經(jīng)網(wǎng)絡(luò)(CNN)具有訓(xùn)練所需參數(shù)少、便于操作的優(yōu)點(diǎn),近年來圖像識別效果最好的神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)一般四種結(jié)構(gòu),卷積層,池化層,全連接層和 SoftMax 層。
(1)卷積層:在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)中基礎(chǔ)上增加卷積的操作,對圖像的卷積可以理解為一個濾波的過程。卷積神經(jīng)網(wǎng)絡(luò)對輸入的圖像或者二維的數(shù)據(jù)進(jìn)行逐層的處理,有效提取輸入圖片或者數(shù)據(jù)的特征。
(2)池化層:是把卷積層卷積的圖像不同位置的特征進(jìn)行聚合,因為圖像的像素點(diǎn)周圍的其他像素點(diǎn)和該點(diǎn)有很高的相似度。經(jīng)過池化層處理后,一個區(qū)域的像素點(diǎn)具備一種局部性的特征,達(dá)到降低圖像特征維度,同時也使圖像特征不容易擬合。
(3)全連接層和SoftMax 層:對傳統(tǒng)的全連接處理后的數(shù)據(jù)做分類,可以對特征進(jìn)行多分類操作。
技術(shù)發(fā)展趨勢是深度學(xué)習(xí)技術(shù),可作為人臉識別的主流研究方向,解決方案將是新技術(shù)與深度學(xué)習(xí)技術(shù)相結(jié)合。目前,仍然存在一些問題,如訓(xùn)練需要的時間較長,計算復(fù)雜度高,識別效率較低,需要 GPU 等設(shè)備的支持,遮擋問題如何解決等。
如何克服這些影響因素稱為了目前研究的熱點(diǎn)??朔@些影響因素的方法可以分為:基于特征的人臉檢測方法,基于表象的人臉檢測方法。基于特征的檢測方法可以分為基于灰度特征和膚色特征的兩種檢測方法?;谔卣鞯娜四槞z測應(yīng)用較廣,單一背景識別精度高,實時性高。但種識別方法要求色度較高,不能有遮擋物、背景要求單一化,否則識別效果大幅下降。
基于表象的人臉檢測方法,常根據(jù)先驗規(guī)則,特征提取前對人臉特征有一定的理解,并根據(jù)經(jīng)驗值進(jìn)行提取。例如,五官的位置比例就具有對稱性,且為中線對齊性質(zhì),根據(jù)這些規(guī)則來確定人臉特征的提取方法。
四、小結(jié)
對于主體的行為識為來解決安全等諸多問題,將是人臉識別從身份認(rèn)證向人工智能方向發(fā)展的大趨勢。
參考文獻(xiàn):
基于深度學(xué)習(xí)的人臉識別研究及其在物流中的應(yīng)用,施旭濤,2018
“刷臉”就能取快遞,螞蟻要開人臉識別技術(shù),環(huán)球網(wǎng),2017
智能物流:自動人臉識別“包裹找人”,廣州新聞頻道,2019