識(shí)別算法的性能提升依靠大量的圖像標(biāo)注,傳統(tǒng)模式下,需要人工對(duì)同一識(shí)別目標(biāo)的數(shù)據(jù)集進(jìn)行一步一步手動(dòng)拉框,但是這個(gè)過(guò)程的痛苦只有做過(guò)的人才知道。越多素材的數(shù)據(jù)集對(duì)于算法的提升越有幫助,常規(guī)情況下,一個(gè)20秒時(shí)長(zhǎng)30幀的視頻就多達(dá)兩三百?gòu)埉?huà)面需要標(biāo)注,如果視頻時(shí)長(zhǎng)或者視頻的幀速率增加,需要標(biāo)注的幀畫(huà)面將會(huì)更多。小編曾試過(guò)標(biāo)注一個(gè)時(shí)長(zhǎng)為1分30秒幀速率為60的視頻,需要標(biāo)注的畫(huà)面竟然多達(dá)5000多張,當(dāng)我標(biāo)注到500張的時(shí)候,整個(gè)人都已經(jīng)麻木,并且出現(xiàn)情緒波動(dòng),望著剩下的4500多張待標(biāo)注畫(huà)面,看著都頭皮發(fā)麻,怎么都不想繼續(xù)了。自動(dòng)化領(lǐng)域急需檢測(cè)識(shí)別技術(shù)。北京快速目標(biāo)檢測(cè)
YOLO系列算法是目標(biāo)識(shí)別領(lǐng)域很重要的技術(shù)之一,因?yàn)樾阅軓?qiáng)大、消耗算力較少,一直以來(lái)都是實(shí)時(shí)目標(biāo)檢測(cè)領(lǐng)域的主要范式。該框架被用于各種實(shí)際應(yīng)用,包括自動(dòng)駕駛、監(jiān)控和物流等行業(yè)的目標(biāo)識(shí)別。自今年2月YOLOv9發(fā)布以后,清華又推出了YOLOv10,作為計(jì)算機(jī)視覺(jué)領(lǐng)域的突破性框架,具備實(shí)時(shí)的端到端目標(biāo)檢測(cè)能力,通過(guò)提供結(jié)合效率和準(zhǔn)確性的強(qiáng)大解決方案,延續(xù)了YOLO系列的傳統(tǒng)。據(jù)悉,YOLOv10在各種模型規(guī)模上都實(shí)現(xiàn)了SOTA性能和效率。例如,YOLOv10-S在COCO上的類(lèi)似AP下比RT-DETR-R18快1.8倍,同時(shí)參數(shù)數(shù)量和FLOP大幅減少。與YOLOv9-C相比,在性能相同的情況下,YOLOv10-B的延遲減少了46%,參數(shù)減少了25%。北京快速目標(biāo)檢測(cè)目標(biāo)檢測(cè)的算法可以定制嗎?
無(wú)人機(jī)搭載如光電吊艙等帶有攝像頭的設(shè)備后,達(dá)到了實(shí)現(xiàn)智能識(shí)別的硬件條件,但是傳統(tǒng)的攝像頭只能獲取圖像,并不具備AI識(shí)別的功能。無(wú)人機(jī)AI識(shí)別算法的處理器還是在于模仿人眼一樣進(jìn)行視覺(jué)處理,然后AI進(jìn)行智能提取和分析圖像,再和訓(xùn)練模型進(jìn)行快速比對(duì),從而在無(wú)人機(jī)快速飛行的過(guò)程中做到實(shí)時(shí)目標(biāo)識(shí)別。首先,要想實(shí)現(xiàn)目標(biāo)識(shí)別需要的硬件支持就是AI圖像處理板。圖像處理板通過(guò)算法的賦能,就能夠?qū)δ繕?biāo)區(qū)域的物體進(jìn)行AI識(shí)別分析,從而做出判斷。由于無(wú)人機(jī)作業(yè)的環(huán)境復(fù)雜,因此對(duì)于圖像處理板的要求需要進(jìn)一步提升。成都慧視開(kāi)發(fā)的Viztra-HE030圖像處理板,采用了工業(yè)級(jí)芯片RK3588,采用先進(jìn)架構(gòu),8核(4大4?。┨幚?,算力能夠達(dá)到6.0TOPS。同時(shí),慧視光電能夠根據(jù)需求環(huán)境定制豐富的輸出接口。
多目標(biāo)跟蹤是指在連續(xù)的圖像中,通過(guò)目標(biāo)檢測(cè)算法識(shí)別出每一幀中的目標(biāo),并在時(shí)間上跟蹤它們的位置和狀態(tài)。但目標(biāo)會(huì)不斷發(fā)生尺度、形變、遮擋等變化,而且還會(huì)有目標(biāo)出現(xiàn)和消失的情況,再加上視頻采集端的相機(jī)所處環(huán)境可能受到外界影響導(dǎo)致抖動(dòng)的情況(例如無(wú)人機(jī)高空檢測(cè)),就會(huì)給多目標(biāo)跟蹤造成一定的困難。由于我們不能控制目標(biāo),所以只能從視頻采集端維護(hù)跟蹤的穩(wěn)定性。因此,成都慧視針對(duì)于多目標(biāo)檢測(cè)跟蹤抖動(dòng)丟失的優(yōu)化方法是:1.改進(jìn)目標(biāo)檢測(cè),使用更加魯棒的目標(biāo)檢測(cè)算法。2.增強(qiáng)特征描述,利用深度學(xué)習(xí)提取更高級(jí)別的語(yǔ)義特征,這些特征對(duì)于小范圍內(nèi)的視角變化具有更好的不變性3.改進(jìn)運(yùn)動(dòng)模型,在算法中加入對(duì)攝像頭運(yùn)動(dòng)的估計(jì),通過(guò)補(bǔ)償攝像頭運(yùn)動(dòng)來(lái)減小目標(biāo)真實(shí)運(yùn)動(dòng)與預(yù)測(cè)之間的差距。4.數(shù)據(jù)關(guān)聯(lián)策略,設(shè)計(jì)更靈活的數(shù)據(jù)關(guān)聯(lián)算法,允許更大的距離閾值來(lái)匹配候選目標(biāo)。無(wú)人機(jī)AI檢測(cè)能夠比人更快發(fā)現(xiàn)火源。
傳統(tǒng)的吊艙只能如上述那樣工作,而要打造更加智能化的邊海防無(wú)人機(jī)巡邏,則可以在光電吊艙中植入高性能的圖像處理板,通過(guò)目標(biāo)識(shí)別、檢測(cè)算法的賦能,就能夠讓無(wú)人機(jī)實(shí)現(xiàn)目標(biāo)識(shí)別檢測(cè)、目標(biāo)鎖定跟蹤等功能。為了進(jìn)行有效結(jié)合,成都慧視開(kāi)發(fā)了多塊高性能的具備圖像處理能力的光電吊艙。例如慧視VIZ-100T三軸三光目標(biāo)定位吊艙,集10倍光學(xué)變倍可見(jiàn)光相機(jī)、640×512高分辨率紅外相機(jī)、測(cè)程1.2km半導(dǎo)體激光測(cè)距機(jī)于一體,在邊海防巡邏時(shí)能夠晝夜成像工作。三軸高穩(wěn)定精度平臺(tái)框架能夠有效保障畫(huà)面的清晰穩(wěn)定,并對(duì)目標(biāo)點(diǎn)位的定位。吊艙內(nèi)置我司自主開(kāi)發(fā)的高性能AI圖像處理板Viztra-HE030,該板卡采用瑞芯微旗艦級(jí)芯片RK3588,能夠在算法的作用下實(shí)現(xiàn)高空目標(biāo)識(shí)別檢測(cè)、鎖定跟蹤人、車(chē)、船等目標(biāo),再通過(guò)和地面巡邏人員協(xié)調(diào)統(tǒng)一,就能夠打造邊海防的智能化體系。無(wú)人機(jī)巡檢可以用成都慧視開(kāi)發(fā)的圖像處理板。上海企業(yè)目標(biāo)檢測(cè)技術(shù)
圖像識(shí)別檢測(cè)能夠彌補(bǔ)雷達(dá)檢測(cè)的不足。北京快速目標(biāo)檢測(cè)
一些化工園區(qū)、石油煉廠等需要在極其安全的環(huán)境中作業(yè),因此對(duì)于園區(qū)的巡檢工作十分關(guān)鍵。在長(zhǎng)時(shí)間的工作中,園區(qū)的生產(chǎn)設(shè)備會(huì)出現(xiàn)被腐蝕、老化、磨損,給生產(chǎn)帶來(lái)了風(fēng)險(xiǎn),一旦檢查疏忽,后果不堪設(shè)想。無(wú)人機(jī)搭載紅外光電吊艙能夠遠(yuǎn)距離檢查設(shè)備,避免直接接觸,實(shí)現(xiàn)對(duì)關(guān)鍵點(diǎn)的變倍放大觀察,發(fā)現(xiàn)已存在或者潛在的泄漏、損壞,有效減少安全事故。另外無(wú)人機(jī)體積小巧、重量輕盈,能夠在復(fù)雜環(huán)境中靈活穿梭。通過(guò)遠(yuǎn)程操控,無(wú)人機(jī)可以避免人工巡檢過(guò)程中可能遇到的風(fēng)險(xiǎn),確保人員安全。北京快速目標(biāo)檢測(cè)