時間:2017-11-20 17:19:25來æºï¼šä¸åœ‹å‚³å‹•ç¶²(wÇŽng)
引言
行人檢測任務(wù)的目標(biÄo)是在圖åƒä¸æª¢æ¸¬è¡Œäººå¹¶ç¢ºå®šè¡Œäººçš„ä½ç½®ã€‚隨著人工智能技術(shù)的發(fÄ)å±•ï¼Œè¶Šä¾†è¶Šå¤šçš„ç ”ç©¶äººå“¡é—œ(guÄn)æ³¨é€™é …ä»»å‹™(wù)并且åšäº†å¾ˆå¤šç›¸é—œ(guÄn)çš„ç ”ç©¶å·¥ä½œã€‚æº–(zhÇ”n)確的行人檢測方法å¯ä»¥æ‡‰(yÄ«ng)ç”¨äºŽå¾ˆå¤šé ˜(lÇng)åŸŸï¼Œä¾‹å¦‚æ™ºèƒ½è¼”åŠ©é§•é§›ï¼Œæ™ºèƒ½è¦–é »ç›£(jiÄn)控和智能機器人ç‰ã€‚
近年來,å€(qÅ«)域å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)(R-CNN)模型被廣泛應(yÄ«ng)用于通用類物體檢測任務(wù)。有相關(guÄn)æ–‡ç»æå‡ºäº†ä¸€ç¨®å¿«é€Ÿå€(qÅ«)域å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)(FastR-CNN)模型,在21類的物體檢測任務(wù)ä¸å–得了顯著的效果。這種模型首先使用候é¸å€(qÅ«)域框方法SelectiveSearch去é (yù)測物體å¯èƒ½å˜åœ¨çš„ä½ç½®ï¼Œç„¶åŽå†ä½¿ç”¨å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)å°å€™é¸å€(qÅ«)域框進行進一æ¥çš„精細分類和定ä½ã€‚å—這種模型在通用類檢測ä¸çš„啟發(fÄ),我們試圖將這種方法應(yÄ«ng)用于行人檢測。但是SelectiveSearchæ–¹æ³•ä¸æ˜¯é‡å°å–®ä¸€é¡žçš„候鏿¡†æå–方法,它會é (yù)測所有種類物體的å¯èƒ½ä½ç½®ï¼ŒåŒ…括車輛,建ç‘ç‰ã€‚å› æ¤ç”Ÿæˆçš„候é¸å€(qÅ«)域框å˜åœ¨å¾ˆå¤šçš„冗余,é™ä½Žè¨“(xùn)練的分類器的質(zhì)é‡ã€‚åŒæ™‚冗余的候é¸å€(qÅ«)域框會消耗較多的計算資æºï¼Œé™ä½Žå·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)的訓(xùn)練和測試的速度。在行人檢測ä¸ï¼Œåªå°è¡Œäººé¡žåˆ¥ç”Ÿæˆå€™é¸å€(qÅ«)åŸŸæ¡†ï¼Œå¹¶ä½¿ç”¨é€™ç¨®å€™é¸æ¡†è¨“(xùn)練和測試å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò),ç†è«–上å¯ä»¥å–得很好的檢測效果。
候é¸å€(qÅ«)域框æå–在一定程度å¯ä»¥çœ‹ä½œå°ç‰©é«”的粗糙檢測。我們å¯ä»¥å°åœ–åƒæå–特å¾ï¼Œå¹¶è¨“(xùn)練一個判別行人的簡單分類器,使用分類器去生æˆå€™é¸å€(qÅ«)域框。這樣就å¯ä»¥å¯¦ç¾(xià n)åªé‡å°è¡Œäººé¡žåˆ¥æå–候é¸å€(qÅ«)åŸŸæ¡†çš„ç›®çš„ã€‚åŸºäºŽé€™å€‹æ€æƒ³ï¼Œæœ¬æ–‡æå‡ºäº†ä¸€ç¨®é©ç”¨äºŽè¡Œäººæª¢æ¸¬çš„候鏿¡†æå–æ–¹æ³•ã€‚æˆ‘å€‘å°‡é€™ç¨®å€™é¸æ¡†æå–方法與å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)模型çµ(jié)åˆèµ·ä¾†ï¼Œå¹¶æ‡‰(yÄ«ng)用于行人檢測。這種檢測方法主è¦åˆ†ç‚ºå…©æ¥ï¼š1)ä½¿ç”¨å€™é¸æ¡†æå–方法為æ¯å¼µåœ–åƒç”Ÿæˆå€™é¸å€(qÅ«)域框;2)將圖åƒå’Œå®ƒçš„候é¸å€(qÅ«)域框輸入到å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)ä¸ã€‚ç¶²(wÇŽng)絡(luò)包å«å…©å€‹è¼¸å‡ºå±¤ã€‚一個輸出行人類別的概率估計,å¦ä¸€å€‹è¼¸å‡ºå››å€‹å¯¦æ•¸(shù)表示行人邊界框的ä½ç½®ã€‚
本文的模型和其他行人檢測方法相比å–得了很好的檢測效果。在INRIA,PKUå’ŒETH數(shù)據(jù)集上分別實ç¾(xià n)了14.1%,15.3%å’Œ45.6%çš„æ¼æª¢çŽ‡ã€‚å¯¦é©—çµ(jié)果表明,在行人檢測任務(wù)䏿ˆ‘å€‘çš„å€™é¸æ¡†æå–æ–¹æ³•è¦æ¯”SelectiveSearchæ›´æœ‰æ•ˆã€‚åŒæ™‚,我們的方法去除了冗余的候é¸å€(qÅ«)域框,æé«˜äº†å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)訓(xùn)練和測試的速度。
背景
1.ç¾(xià n)有行人檢測算法的分類
ç¾(xià n)有的行人檢測算法通常會被分為兩類。第一類稱為傳統(tÇ’ng)算法,這類方法從圖åƒä¸æå–手工è¨(shè)計特å¾å¹¶è¨“(xùn)練一個支æŒå‘釿©Ÿ(SVM)或增強(boosting)作為分類器。這些手工è¨(shè)計特å¾åŒ…括哈爾,梯度直方圖和局部二值模å¼ç‰ï¼Œåœ¨è¡Œäººæª¢æ¸¬è¡¨ç¾(xià n)出很好的性能。DPM在檢測ä¸è€ƒæ…®äº†å±€éƒ¨çš„å€(qÅ«)域特å¾ä»¥åŠå€(qÅ«)域間的形變。有相關(guÄn)æ–‡ç»å°‡ä¸Šä¸‹æ–‡ä¿¡æ¯åŠ å…¥åˆ°æ¨¡åž‹ä¸ã€‚å¦å¤–,èšåˆé€šé“特å¾å°‡æ¢¯åº¦ç›´æ–¹åœ–å’ŒLUVé¡è‰²ç©ºé–“特å¾èžåˆåˆ°ä¸€èµ·ç”¨äºŽè¡Œäººæª¢æ¸¬ã€‚æ–‡ç»æå‡ºäº†ä¸€ç¨®æœ‰æ•ˆçš„ç‰¹å¾è®Šæ›æ–¹æ³•去除了局部特å¾é–“的關(guÄn)è¯(lián)。
å¦ä¸€é¡žè¡Œäººæª¢æ¸¬æ–¹æ³•是采樣深度模型。深度模型å¯ä»¥å¾žåŽŸåœ–åƒä¸å¸(xué)ç¿’(xÃ)特å¾ï¼Œæ¥µå¤§åœ°æé«˜äº†è¡Œäººæª¢æ¸¬ç®—法的性能。從行人的ä¸åŒèº«é«”部門å¸(xué)ç¿’(xÃ)特å¾ä¾†è™•ç†è¡Œäººé–“çš„é®æ“‹å•題,å·ç©ç¶²(wÇŽng)絡(luò)方法采用å·ç©ç¨€ç–編碼無監(jiÄn)ç£åœ°é (yù)訓(xùn)ç·´å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò),通éŽèªžç¾©çš„特å¾å„ª(yÅu)化行人檢測效果。
2.候鏿¡†æå–方法
由于物體å¯èƒ½æ˜¯ä»»æ„尺寸并且å¯èƒ½å‡ºç¾(xià n)在圖åƒçš„任一ä½ç½®ï¼Œå› æ¤éœ€è¦æœç´¢æ•´å¹…圖åƒä¾†å®Œæˆåˆ†é¡žå’Œå®šä½ã€‚æ»‘å‹•çª—å£æ–¹æ³•å¯ä»¥ç²å¾—所有å¯èƒ½çš„物體ä½ç½®ï¼Œä½†æ˜¯è¨ˆç®—復(fù)é›œåº¦å¾ˆé«˜ã€‚æœ€è¿‘ï¼Œç ”ç©¶äººå“¡æå‡ºäº†å…¶ä»–å¹¾ç¨®å€™é¸æ¡†æå–方法,例如selectivesearch,bingå’Œedgeboxes。Selectivesearch通éŽåˆ†å‰²å’Œç›¸ä¼¼åº¦è¨ˆç®—çš„æ–¹å¼æå–候é¸å€(qÅ«)域框,å€(qÅ«)域框的質(zhì)é‡è¼ƒå¥½ä½†æ˜¯é€Ÿåº¦å¾ˆæ…¢ã€‚Bing使用æ£å‰‡æ¢¯åº¦ä¿¡æ¯å’ŒäºŒåˆ†æ“作生æˆå€™é¸å€(qÅ«)域框,速度較快但是質(zhì)é‡å¾ˆå·®ã€‚Edgeboxes是在質(zhì)é‡å’Œé€Ÿåº¦ä¹‹é–“折ä¸çš„一種算法。
這類方法生æˆçš„候é¸å€(qÅ«)域框包å«äº†æ‰€æœ‰çš„種類,é©ç”¨äºŽé€šç”¨é¡žçš„æª¢æ¸¬ï¼Œä½†ç„¡æ³•完æˆå–®ä¸€é¡žçš„候鏿¡†æå–。冗余的候é¸å€(qÅ«)域框會é™ä½Žå·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)的性能,并消耗更多的計算資æºã€‚行人檢測å•題åªéœ€è¦é‡å°è¡Œäººé¡žåˆ¥ç”Ÿæˆå€™é¸å€(qÅ«)域框而無需其它物體的冗余信æ¯ï¼Œæœ¬æ–‡å¯¦ç¾(xià n)了一種基于行人檢測算法的候é¸å€(qÅ«)域框æå–方法。我們將這種優(yÅu)化的候é¸å€(qÅ«)域框æå–方法和å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)çµ(jié)åˆèµ·ä¾†ï¼Œå¹¶å°‡å…¶æ‡‰(yÄ«ng)用于行人檢測。
æå‡ºçš„æ–¹æ³•
1.方法概述
本文所æå‡ºçš„æ–¹æ³•包括兩部分。第一部分是候é¸å€(qÅ«)域框的æå–,第二部分是å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)模型。其ä¸å€™é¸æ¡†æå–方法采用èšåˆé€šé“特å¾(ACF),å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)模型基于文ç»ä¸çš„æ·±åº¦ç¶²(wÇŽng)絡(luò)çµ(jié)æ§‹(gòu)。網(wÇŽng)絡(luò)的輸入是原始的圖åƒå’Œå€™é¸å€(qÅ«)域框。模型首先通éŽå·ç©å’Œæ± 化æå–圖åƒçš„å·ç©ç‰¹å¾ï¼Œç¶“(jÄ«ng)由興趣å€(qÅ«)åŸŸæ± åŒ–(RoI)層將候é¸å€(qÅ«)域框的å·ç©ç‰¹å¾æ˜ 射為固定長度的特å¾å‘é‡å¹¶è¢«å‚³å…¥å…¨é€£æŽ¥å±¤ã€‚全連接層åŽé¢æœ‰å…©å€‹å¹³è¡Œçš„輸出層,輸出行人檢測框的置信分數(shù)å’Œåæ¨™(biÄo)。
2.候é¸å€(qÅ«)域框æå–
該候é¸å€(qÅ«)域框算法從圖åƒä¸æå–10個通é“的手工è¨(shè)計特å¾å¹¶è¨“(xùn)練一個AdaBoost分類器。通é“特å¾åŒ…括æ¸ä¸€åŒ–的梯度幅值,梯度方å‘(6bins)å’ŒLUVé¡è‰²é€šé“。算法通éŽè¨ˆç®—ä¸åŒå°ºåº¦ä¸‹çš„通é“ç‰¹å¾æ§‹(gòu)建特å¾é‡‘å—塔。ä¸åŒå°ºå¯¸ä¸‹çš„特å¾ä¸æ˜¯ç›´æŽ¥è¨ˆç®—,而是通éŽç›¸é„°å°ºå¯¸çš„特å¾è¿‘似計算ç²å¾—,其詳細éŽç¨‹å¦‚下文所述。
å°äºŽåœ–åƒI,è¨(shè)為任æ„低層次旋轉(zhuÇŽn)ä¸è®Šç‰¹å¾è¨ˆç®—方法,圖åƒçš„一個通é“計算方法為
。通é“C是åƒç´ 級別的特å¾ï¼ŒC䏿¯å€‹åƒç´ éƒ½æ˜¯å¾žå°æ‡‰(yÄ«ng)圖åƒI的圖åƒå¡Šè¨ˆç®—而來。è¨(shè)
表示圖åƒI在s尺寸下的é‡é‡‡æ¨£ï¼Œ
,R表示采樣函數(shù)。當(dÄng)計算多尺寸圖åƒç‰¹å¾æ™‚,首先將圖åƒI在尺寸s下é‡é‡‡æ¨£ï¼Œä¹‹åŽé€šéŽè¿‘似計算得到
的通é“特å¾ã€‚近似計算方法如下:
是ä¸åŒå°ºå¯¸é–“的變æ›å› å,æ¯ç¨®é€šé“。å¾é¡žåž‹
å°æ‡‰(yÄ«ng)一個
。通用的特å¾é‡‘å—塔方法通常是在æ¯ä¸€å€‹å°ºå¯¸è¨ˆç®—
。這種近似計算的方法在框的æå–速度。在候é¸å€(qÅ«)域框æå–éŽç¨‹ä¸ï¼Œæœ¬æ–‡é¦–å…ˆå°åœ–åƒæå–10通é“的特å¾ï¼Œç„¶åŽä½¿ç”¨è¿‘似計算得到ä¸åŒåœ–åƒå°ºå¯¸ä¸‹çš„ç‰¹å¾æ§‹(gòu)建特å¾é‡‘å—塔。最åŽè¨“(xùn)練了一個由2048個深度為2的分類樹組æˆçš„Adaboost分類器生æˆå€™é¸å€(qÅ«)域框。為了ç²å¾—è¶³å¤ çš„å€™é¸å€(qÅ«)域框,我們é™ä½Žäº†æª¢æ¸¬çš„閾值。
圖1.å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)çµ(jié)æ§‹(gòu)
ç¶²(wÇŽng)絡(luò)çµ(jié)æ§‹(gòu)
在這一部分,我們首先介紹采用的深度網(wÇŽng)絡(luò)模型的çµ(jié)æ§‹(gòu),然åŽèªªæ˜Žæ¨¡åž‹çš„æå¤±å‡½æ•¸(shù)。
本文的網(wÇŽng)絡(luò)çµ(jié)æ§‹(gòu)如圖1所示。網(wÇŽng)絡(luò)包å«5個å·ç©å±¤ã€‚æ¯å€‹å·ç©å±¤åˆ†åˆ¥æœ‰96,256,384,384å’Œ256å€‹æ ¸å‡½æ•¸(shù)。采用線性整æµå‡½æ•¸(shù)(ReLU)作為網(wÇŽng)絡(luò)的激活函數(shù)。æ¯å€‹å·ç©å±¤åŽé¢é€£æŽ¥äº†ä¸€å€‹ç©ºé–“æœ€å¤§æ± åŒ–å±¤ã€‚ç¶²(wÇŽng)絡(luò)å¯ä»¥è¼¸å…¥ä»»æ„尺寸的圖åƒã€‚ç¶“(jÄ«ng)éŽå·ç©å’Œæ± 化,得到圖åƒçš„å·ç©ç‰¹å¾ã€‚在å·ç©ç‰¹å¾å‚³å…¥å…¨é€£æŽ¥å±¤ä¹‹å‰ï¼Œèˆˆè¶£å€(qÅ«)åŸŸæ± åŒ–å±¤æœƒå°‡å·ç©ç‰¹å¾æ˜ 射為固定長度的特å¾å‘é‡ã€‚分別使用標(biÄo)準(zhÇ”n)差為0.01å’Œ0.001的高斯分布åˆå§‹åŒ–用于分類和邊界框回æ¸çš„全連接層權(quán)é‡(weights)。åç½®(bias)åˆå§‹åŒ–為0。網(wÇŽng)絡(luò)çš„æ¯ä¸€å±¤æ¬Š(quán)é‡çš„å¸(xué)ç¿’(xÃ)率為0.001,å置的å¸(xué)ç¿’(xÃ)率為0.002。
全連接層åŽé¢é€£æŽ¥äº†å…©å€‹å¹³è¡Œè¼¸å‡ºå±¤ã€‚第一個輸出層輸出在行人和背景類上的概率值,用表示。其ä¸
和
分別表示物體是背景和行人的概率值。通常,p通éŽåœ¨å…¨é€£æŽ¥å±¤çš„å…©å€‹è¼¸å‡ºåŠ ä¸Šsoftmax計算得到。第二個輸出層是在行人類上的邊界框回æ¸è£œå„Ÿï¼Œä½¿ç”¨
表示。æ¯å€‹è¨“(xùn)練的候é¸å€(qÅ«)域框都有一個類別標(biÄo)定u和邊界框目標(biÄo)v。我們使用了多任務(wù)æå¤±å‡½æ•¸(shù)LåŒæ™‚訓(xùn)練分類和邊界框回æ¸ï¼š
其䏿˜¯é¡žåˆ¥uçš„å°æ•¸(shù)æå¤±å‡½æ•¸(shù)。第二個任務(wù)çš„æå¤±å‡½æ•¸(shù)是在類別u的邊界框上定義的,
。當(dÄng)
時,艾弗森括號指示函數(shù)
值為1,其他值為0。按照慣例,通用背景類被標(biÄo)記為u=0。由于背景類的候é¸å€(qÅ«)域框沒有特定的標(biÄo)æ³¨ï¼Œæ¤æ™‚在æå¤±å‡½æ•¸(shù)ä¸å°±å°‡èƒŒæ™¯é¡žçš„
忽略ä¸è¨ˆã€‚å°äºŽè¡Œäººé¡žçš„邊界回æ¸ï¼Œä½¿ç”¨å¦‚下?lián)p失函數(shù):
å…¶ä¸åƒæ•¸(shù)
控制兩個任務(wù)æå¤±ä¹‹é–“的平衡。標(biÄo)注的回æ¸ç›®æ¨™(biÄo)v被æ¸ä¸€åŒ–為零å‡å€¼å’Œå–®ä½æ–¹å·®ã€‚在所有的實驗ä¸ï¼Œæœ¬æ–‡éƒ½è¨(shè)ç½®
。本文使用隨機梯度下é™çš„æ–¹æ³•最å°åŒ–æå¤±å‡½æ•¸(shù)。
çµ(jié)æŸèªž
本文æå‡ºäº†ä¸€ç¨®å–®ä¸€é¡žå€™é¸æ¡†æå–方法與å·ç©ç¥žç¶“(jÄ«ng)ç¶²(wÇŽng)絡(luò)çµ(jié)åˆçš„æ¨¡åž‹ã€‚è©²å€™é¸æ¡†æå–算法從圖åƒä¸æå–手工è¨(shè)計特å¾ï¼Œå¹¶è¨“(xùn)ç·´AdaBoost分類器。本文所æå‡ºçš„æ–¹æ³•ä¸åŒäºŽé€šç”¨çš„候鏿¡†æå–方法,å¯ä»¥åªç‚ºè¡Œäººé¡žåˆ¥ç”Ÿæˆå€™é¸å€(qÅ«)åŸŸæ¡†ã€‚æœ¬æ–‡é‚„é—¡è¿°äº†å€™é¸æ¡†æå–算法的具體細節(jié)以åŠç¶²(wÇŽng)絡(luò)çš„çµ(jié)æ§‹(gòu)。實驗的çµ(jié)果表明,本文的方法æé«˜äº†å€™é¸æ¡†æå–的質(zhì)é‡ï¼Œåœ¨è¡Œäººæª¢æ¸¬ä¸Šå–å¾—äº†å¾ˆå¥½çš„æ•ˆæžœï¼ŒåŒæ™‚縮çŸäº†ç¶²(wÇŽng)絡(luò)訓(xùn)練和測試的時間。
標(biÄo)簽:
ä¸åœ‹å‚³å‹•ç¶²(wÇŽng)版權(quán)與å…責(zé)è²æ˜Žï¼šå‡¡æœ¬ç¶²(wÇŽng)注明[來æºï¼šä¸åœ‹å‚³å‹•ç¶²(wÇŽng)]的所有文å—ã€åœ–片ã€éŸ³è¦–å’Œè¦–é »æ–‡ä»¶ï¼Œç‰ˆæ¬Š(quán)å‡ç‚ºä¸åœ‹å‚³å‹•ç¶²(wÇŽng)(www.siyutn.com)ç¨å®¶æ‰€æœ‰ã€‚如需轉(zhuÇŽn)載請與0755-82949061è¯(lián)系。任何媒體ã€ç¶²(wÇŽng)站或個人轉(zhuÇŽn)è¼‰ä½¿ç”¨æ™‚é ˆæ³¨æ˜Žä¾†æºâ€œä¸åœ‹å‚³å‹•ç¶²(wÇŽng)â€ï¼Œé•å者本網(wÇŽng)將追究其法律責(zé)任。
本網(wÇŽng)轉(zhuÇŽn)載并注明其他來æºçš„稿件,å‡ä¾†è‡ªäº’è¯(lián)ç¶²(wÇŽng)或æ¥(yè)å…§(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuÇŽn)載請ä¿ç•™ç¨¿ä»¶ä¾†æºåŠä½œè€…ï¼Œç¦æ¢æ“…自篡改,é•è€…è‡ªè² ç‰ˆæ¬Š(quán)法律責(zé)任。
相關(guÄn)資訊