售前電話
135-3656-7657
售前電話 : 135-3656-7657
眾所周知,安防視頻監(jiān)控系統(tǒng)不僅需要對前端實時監(jiān)控,還需要對已存儲的海量視頻進行檢索和回放。視頻內(nèi)容檢索技術包括對監(jiān)控視頻運動目標檢測、特征提取、相似度匹配等多項技術,是通過計算機對視頻的內(nèi)容進行自動分析、提取特征信息制成索引等處理。當用戶查詢所需的內(nèi)容時,系統(tǒng)自動返回與檢索需求最相近的圖像或者視頻片段。例如,可以通過檢索目標照片,方便地檢索到該目標在監(jiān)控區(qū)域內(nèi)的所有活動的錄像;或基于目標的重要特征(如顏色、大小、形狀等)檢索指定時間、活動范圍內(nèi)的錄像資料,從而大大提高安防視頻監(jiān)控系統(tǒng)的檢索效率和應用效能。
視頻在現(xiàn)有的各種數(shù)據(jù)形式中,具有巨大的數(shù)據(jù)量、復雜的數(shù)據(jù)結(jié)構以及獨有的時空特性。時空特性可以用來表征內(nèi)容屬性:空間上,視頻可以區(qū)分為各個獨立的物件;時間上,則表現(xiàn)為各自的運動特性。
視頻數(shù)據(jù)包含低層次的視覺特性信息,以及高層次的語義內(nèi)容屬性,其中視覺特性信息包含有顏色、形狀、紋理及運動等屬性:而語義內(nèi)容屬性包含有人物、地點、事件及情節(jié)等方面。此外,低層次的視覺特性可以通過模型知識庫的推理過程,自動生成高層次的語義內(nèi)容信息,其關系如圖7-6所示。
圖7-6視頻數(shù)據(jù)特性
安防視頻監(jiān)控產(chǎn)生的視覺資源是海量的,這些持續(xù)膨脹的視覺資源帶來了相當嚴重的問題,大量的數(shù)字資源因無法對其進行及時有效的處理,而致使采集到的視頻資源閑置。在大視頻數(shù)據(jù)集合中,選擇滿足某些約束的視頻子集是視頻檢索中的一個中心問題,也是安防視頻監(jiān)控系統(tǒng)必須具備的關鍵功能之一。本節(jié)介紹視頻內(nèi)容檢索技術的基本概念、視頻內(nèi)容檢索系統(tǒng)結(jié)構,以及視頻內(nèi)容檢索的幾個關鍵技術。
視頻內(nèi)容檢索技術的基本概念 1.視頻內(nèi)容檢索的含義所謂檢索,是指存儲與檢索檔案信息的過程。視頻檢索主要包含兩層含義。
(1)檢查搜索,即從廣泛的存儲信息中查找相應信息。視頻檢索的這第一層意義,就是計算機接收用戶輸入的查詢數(shù)據(jù),并在視頻數(shù)據(jù)庫中查詢相匹配的數(shù)據(jù),它和文本、圖像、音頻等的檢索基本在過程上是相同的,但是由于查詢的數(shù)據(jù)和被查詢的數(shù)據(jù)的差異,在相應檢索技術上有很大差別。
(2)索引,為大量的存儲信息建立索引,以便于瀏覽。視頻檢索的這第二層意義,就是計算機自動或手動載入視頻數(shù)據(jù)庫,并且自動或半自動地為視頻數(shù)據(jù)庫建立索引,從而可以進行視頻數(shù)據(jù)瀏覽的過程。
2.常用的視頻檢索方法常用的視頻檢索方法有基于文本標注信息的視頻檢索和基于內(nèi)容的視頻檢索兩種。
(1)基于文本標注信息的視頻檢索?;谖谋緲俗⑿畔⒌囊曨l檢索是一種基于關鍵詞的檢索方法,其過程或步驟如下。
該搜索方式能夠有效地檢索結(jié)構化的文本信息,但是應用于視頻檢索會存在以下幾個方面的問題。
①視頻數(shù)據(jù)自身包含有大量信息,用手工的方法來標注視頻數(shù)據(jù)的關鍵詞費時費力。
②因視頻數(shù)據(jù)具有相當復雜的低層視覺特征和高層語義特征,從不同的人對同一視頻語義的認識存在有相當大的差別,這樣就會導致關鍵詞標注存在多義性。
(2)基于內(nèi)容的視頻檢索。基于內(nèi)容的視頻檢索(Content Based Video Retrieval,CBVR)是指利用對視頻數(shù)據(jù)從低層到高層的處理、分析和理解等手段獲得視頻內(nèi)容,并根據(jù)視頻數(shù)據(jù)中的場景、幀、鏡頭和運動對象和圖像數(shù)據(jù)中的顏色、形狀、紋理等特征在大規(guī)模數(shù)據(jù)庫中找到滿足特定的視覺特征描述的圖像的過程。它需要利用圖像處理、模式識別、計算機視覺、圖像理解、信息檢索、數(shù)據(jù)挖掘、認知科學、人工智能、人機交互等領域的相關研究成果。
3.視頻內(nèi)容檢索的幾個基本詞概念及特點(1)視頻內(nèi)容檢索的幾個基本詞的概念。
①幀。幀指代一副靜態(tài)圖像,是構成視頻的最小視覺單位。