手機應用中感知圖像相似度的平均散列
解決什麼問題
共享圖像或其他多媒體文件的習慣可能會使用戶進入存儲空間不足的問題。另一個問題是並非所有這些過程保存的圖像都是唯一的。 一些或許多圖像可能是相同的圖像或在感知上相似。
用什麼方式解決
更好的方法是我們可以構建一個應用程序來搜索和比較那些感知上相似的圖像,然後將結果提供給用戶。
引用
許多研究像[1]-[6]一樣,建立圖像的哈希值,在視覺上表示圖像。
如 [3]、[6]-[8] 和許多其他應用程序,出於安全目的,使用此散列來檢查圖像完整性。
在[9]中,展示了基於人和機器感知的圖像相似性評估中的一些重要因素。
根據[9]的決定因素之一是圖像顏色。 顏色成為感性判斷圖像的關鍵。
直方圖方法及其變體在許多使用它的應用程序或系統中都取得了成功 [10]。
然而,像[10]中直方圖的用法是建立圖像特徵的索引,以便以後在相似性度量中使用。
已經提出了另一種解決方法,其中之一是在 [11] 中,通過構建圖像的哈希值,這是一個感知哈希值。
在得到的散列上,然後可以使用相似性測量方法來找到代表兩個圖像的兩個散列的距離,從而可以確定兩個圖像在感知上是否不同[11]。
在[11]中還研究了基於離散餘弦變換(DCT)、基於Marr-Hildreth、基於徑向方差和基於塊平均值的三種不同感知哈希方法的基準。
結果表明基於塊平均值的方法在速度上是最好的[11]。
還有一個分類的感知圖像散列,如 [12] 中所述。
首先,基於統計的方案,用於[1]、[2]、[7]。該類別通過計算空間域中的統計數據(如均值、方差、圖像塊的較高矩和直方圖)來構建哈希。
第二,基於關係的方案,用於[8]、[13]。該類別通過使用 DCT 或離散小波變換 (DWT) 係數的一些不變關係來構建哈希。
第三,基於coarse表示的方案,在[3]-[6]中使用,該類別使用整個圖像的coarse信息,如低頻的顯著小波係數分佈和傅立葉變換係數。
第四,基於低級特徵的方案,用於[14]、[15]。 該類別通過檢測圖像的突出特徵點來構建哈希。 該類別對原始圖像進行 DCT 和 DWT 變換,直接使用其係數構建哈希。
圖像散列方法的變化持續增長,如 [16] 所述,因為它在安全性和圖像相似性方面的應用在各種平台上。
我們在本研究的應用中使用的方法與[17]中使用的方法類似,但我們利用更簡單的感知散列方法結合漢明距離函數進行相似度測量,以降低移動設備的計算成本。
提出問題、困難
然而,像[10]中直方圖的用法是建立圖像特徵的索引,以便以後在相似性度量中使用。 這意味著這種方法需要一個預處理步驟,這不太適合在計算能力有限的設備(如手機)中應用。 [12]中簡要描述了四種不同類別的圖像散列方法。
主要挑戰是難以找到在低計算能力設備中具有良好性能且精度結果可接受的方法。
本文描述性的
在感知圖像哈希中,哈希應用的方法與安全中使用的哈希(如 MD5 和 SHA)略有不同。
在像密碼學這樣的安全性中,圖像的結果散列對其內容很敏感,即使更改一點圖像也可能導致非常不同的散列,但在感知圖像散列中,結果散列在相同圖像上僅略有不同。這給了我們計算圖像相似度距離的機會。
原因之一是找到一種技術,可以讓機器像人類的感知一樣識別感知相似的圖像。