横山貴紀
電気通信大学 大学院情報システム学研究科
著者らが研究している画像検索システムを紹介する。 従来から研究されている画像検索システムの多くでは、 画像の特徴抽出と、それに基づく類似性の判断の、大きく分けて二つの処理が必要である。それらに対し、著者らのシステムでは圧縮符号を用いることで特徴抽出の過程を無くした。また、構図の類似性に基づいた類似検索を行うことができる特色を有している。
研究を行っているシステムでは、フラクタル画像圧縮を用いている。
フラクタルとは自己相似性を持つ対象物を指す用語である。一般に、画像中には第1図中に示されている白枠で囲まれた領域のような、相似な部分を有している。この相似領域を特徴と見なし圧縮を行っている[1]。
フラクタル画像圧縮が生成する符号には、画像中の相似領域の対応関係が記録されている。符号を特徴と見なす立場ではあるが、より特徴的な部分を抽出する目的で、第2図のように、圧縮符号から代表写像ベクトルを生成している。
以上で得られる代表写像ベクトルを、画像の特徴と見なしている。
特徴である代表写像ベクトルは、主な領域の相似関係を表現する。相似な領域の対応関係は、画像が大きく変動しない限り、その変化は少ない。この性質を反映した、第3図で示すような、平面上のベクトルの構成を考慮する類似性の指標を考案した。
二つの画像から得られた代表写像ベクトルについて、それぞれのベクトルに最も近い距離にあるものを選択し、その対を作る。もし、両者の画像が同じベクトルの構成を持っていた場合、1対1のベクトルの対だけが構成される。しかし、両者に違いがある場合、ベクトルの対が乱れ、1対1のベクトルの組数は減少していく。
つまり、画像間の類似性は(1対1に対応するベクトル数)/(画像が持つベクトル数)の比率で表現することが可能となる。ベクトルの構成が一致すれば1になり、異なるにつれて1よりも小さな値となる。
この指標の特性を、実画像を用いて実験した結果が第4図である。中心を軸に拡大した画像と、拡大前との画像を比較している。第4図(a)はそれぞれの拡大率の画像から得られる代表写像ベクトルである。拡大を行っても、ベクトルの形成が大きく異なることがない様子を確認できる。拡大前の画像と拡大率ごとの画像との間で求めた類似度をプロットしたものが第4図(b)である。この例では1.6倍程度の拡大率まで高い類似性を示す結果となった。
同様に回転、輝度変動、ノイズの付加等についても実験を行った。その結果、画像の構図が崩れない程度の、一定の範囲内の変動であれば、類似であると判断できることを確認している[2]。
デジタルカメラで撮影した画像(グレースケール8bit、320x240 pixel)を960枚用意した。撮影対象は風景や建物、人形などの静物である。これらの画像を圧縮し、圧縮符号によるデータベースを事前に作成する。
実験ではデータベース中の任意に選んだ1枚を質問画像として検索を行った。1回の検索につき、全ての画像との類似度を算出するため、PentiumIII(550MHz)のDual CPUのPC上(OSはLinux 2.2.17)で約6秒前後の処理時間が必要であった。
第1表はその実験結果であり、左に質問画像 、右に検索結果得られた質問画像を除く上位4件を示している。この結果から、前述の類似性の指標が、異なる画像群に対して、質問画像の構図に基づく類似検索が行えることを確認することができる[3]。
本稿では、著者らが研究している類似画像の検索システムを紹介した。圧縮符号を用いることで特徴抽出を無くす点と、符号の特性に応じた類似性判別の処理を中心に説明し、質問画像の構図に基づく検索結果が行えることを示した。