|
最近は類似画像検索といっても目新しいものではなくなりましたが、類似画像検索以外のVisualSeekerの特徴は「高速高精度な検索」、「検索履歴のグラフ構造表示」、「複数画像検索」です。「複数画像検索」は別のブログで解説されているので、ここでは説明を省略します。「検索履歴のグラフ構造表示」は検索履歴の画像間で類似するものを線で結合しグラフ構造として見せるUIです。履歴を表示するだけでなく、画像の特徴量空間を二次元に表示していることにもなり、画像表示には効果的なUIではないかと考えています。 では、ここでは「高速高精度な検索」を実現している検索インデックスに関して少し説明します。 画像から抽出した特徴量を高速に検索するには、特徴量空間を検索する空間インデックスが必要になります。空間インデックスには大きく分けて多次元空間インデックスと距離空間インデックスの2種類があります。多次元空間インデックスは次元を意識したインデックスであり、空間で定義された距離関数に対してインデックスのアルゴリズムが定義されます。したがって、一般に距離関数が変わるとインデックスのアルゴリズム自体を変えなくてなりません。最近よく耳にするLSHもこれに属します。 一方、距離空間インデックスは次元を意識せず、どのような距離関数でも適用できます。画像から抽出される特徴量は多様であり、精度を上げるには色の特徴量では色差式に基づく距離を使う方が良く、テクスチャの特徴量ではL1-距離(市街地距離)を使ったりします。多様な距離関数を利用する場合には必然的に多次元空間インデックスが適用できなくなります。したがって、VisualSeekerでは距離空間インデックスを利用しています。 距離空間インデックスは適用範囲が広い分、次元数が増えると極端に速度が落ちる、いわゆる、次元の呪いの影響をより強く受けます。そこで、画像検索への応用としてはあまり見かけないグラフ構造型のインデックスに着目し研究開発を実施してきました。このグラフ構造型のインデックスはLSHなどと同様に近似検索(検索結果を近似しているので漏れの生じる可能性がある検索です)となりますが、次元の呪いの影響を受けにくいので、VisualSeekerでは高速かつ高精度の検索を実現できました。 このインデックスでは画像数が増加しても検索時間の増加が比較的少ない傾向があるので今後ウェブ上の大量の画像を検索することにも挑戦したいと考えています。
|

- >
- コンピュータとインターネット
- >
- インターネット
- >
- その他インターネット
