Yahoo! JAPAN研究所 公式ブログ

研究成果や研究員の日々の活動を紹介します

全体表示

[ リスト | 詳細 ]

記事検索
検索
画像検索関連の研究開発を担当している研究所の岩崎と申します。Yahoo!ラボで類似画像検索のVisualSeekerを去る6/10にリリースしました。

最近は類似画像検索といっても目新しいものではなくなりましたが、類似画像検索以外のVisualSeekerの特徴は「高速高精度な検索」、「検索履歴のグラフ構造表示」、「複数画像検索」です。「複数画像検索」は別のブログで解説されているので、ここでは説明を省略します。「検索履歴のグラフ構造表示」は検索履歴の画像間で類似するものを線で結合しグラフ構造として見せるUIです。履歴を表示するだけでなく、画像の特徴量空間を二次元に表示していることにもなり、画像表示には効果的なUIではないかと考えています。

では、ここでは「高速高精度な検索」を実現している検索インデックスに関して少し説明します。

画像から抽出した特徴量を高速に検索するには、特徴量空間を検索する空間インデックスが必要になります。空間インデックスには大きく分けて多次元空間インデックスと距離空間インデックスの2種類があります。多次元空間インデックスは次元を意識したインデックスであり、空間で定義された距離関数に対してインデックスのアルゴリズムが定義されます。したがって、一般に距離関数が変わるとインデックスのアルゴリズム自体を変えなくてなりません。最近よく耳にするLSHもこれに属します。

一方、距離空間インデックスは次元を意識せず、どのような距離関数でも適用できます。画像から抽出される特徴量は多様であり、精度を上げるには色の特徴量では色差式に基づく距離を使う方が良く、テクスチャの特徴量ではL1-距離(市街地距離)を使ったりします。多様な距離関数を利用する場合には必然的に多次元空間インデックスが適用できなくなります。したがって、VisualSeekerでは距離空間インデックスを利用しています。

距離空間インデックスは適用範囲が広い分、次元数が増えると極端に速度が落ちる、いわゆる、次元の呪いの影響をより強く受けます。そこで、画像検索への応用としてはあまり見かけないグラフ構造型のインデックスに着目し研究開発を実施してきました。このグラフ構造型のインデックスはLSHなどと同様に近似検索(検索結果を近似しているので漏れの生じる可能性がある検索です)となりますが、次元の呪いの影響を受けにくいので、VisualSeekerでは高速かつ高精度の検索を実現できました。

このインデックスでは画像数が増加しても検索時間の増加が比較的少ない傾向があるので今後ウェブ上の大量の画像を検索することにも挑戦したいと考えています。
Yahoo! JAPAN研究所 研究員のステイチ・ゾランと申します。
研究所では、画像・動画検索分野の研究を担当しています。

今回は今月公開された類似画像検索VisualSeekerの一つの機能である複数画像による検索を実現する技術を紹介したいと思います。

一般の類似画像検索では一つの画像を与えて類似する画像を検索します。
ただし、ユーザが欲しい画像を一つの画像で表現できない場合があります。
例として、富士山の写真を見たいユーザは、雪が積もった富士山の写真を指定した場合、雪が積もっていない富士山の写真が検索されない可能性が高くなります。
こういった場合、複数の画像(雪が積もった富士山の写真と積もっていない写真の両方)を指定することによって、ユーザは欲しい画像をより正確に表現できるようになります。

「複数画像による検索」機能を実現する方法はいくつかあります。
既存の手法では、画像間の類似度を判断するときの基準(画像の色、輪郭線、模様、など)を調整することによって最終的な検索結果リストを取得します。
それに対して、VisualSeekerでは、検索の高速性を生かし、ユーザが選択した複数の画像を個別に検索し、その検索結果リストを統合して最終的な検索結果リストを生成しています。
最終的な検索結果リストを生成するときに、各検索結果の、
・ユーザが選択した各画像との類似度
・個別の検索結果リストにおける順位
の両方を考慮することによって、複数の画像で表現されている、複雑な検索条件に合う画像も的確に検索することが可能になります。

「複数画像による検索」技術の基本的な仕組は、類似画像検索以外の検索(商品やウェブ検索など)にも
適応することができるので、今後、皆さまのフィードバックをいただきながら、さまざまな応用を検討していく予定です。

イメージ 1

スタッフのA子です。久しぶりのブログ更新となります。

Yahoo! JAPAN研究所にて生まれた技術は、さまざまなYahoo! JAPANのサービスに導入されています。
今回は2009年3月にYahoo! BEAUTYコスメ検索に導入されました「LUIGI」という技術を紹介したいと思います。
ちなみに、ライブラリの名前 LUIGI(ルイージ)の由来は「類似(るいじ)」から来ています。

「LUIGI 」は類似文字列検索のために研究開発したライブラリです。
「ダイヤリー」と「ダイアリー」のような数文字異なる単語や、「クラブ」と「倶楽部」のような読みは同じだけど表記が異なる単語などを高速に探し出せます。現在はコスメ検索のほか、テレビ番組検索にも導入されています。

実際にはお客様が入力したキーワードでの検索結果がゼロ件であった場合に、この「LUIGI」の機能を呼び出し、入力キーワードと近い単語を提示する仕組みとなっています。この技術により、タイプミスやうろ覚え表現でも最終的に検索目的を果たすことができるようになります。

また、テレビ番組検索を例にあげますと、特にバラエティ番組では片仮名、平仮名、漢字、ローマ字表記が混在した独特な番組名が多く、お客様が入力したキーワードとのずれにより検索結果が出てこないことがありました。このようなときに「LUIGI」が力を発揮しています。

この技術は今後もさまざまなサービスに導入していく予定です。どうぞご期待ください。


■Yahoo! BEAUTYのコスメ検索。誤って検索ワードに「寝入るケア」と入力してしまっても・・・
https://blogs.yahoo.co.jp/IMG/ybi/1/86/64/yjlab_blog/folder/1028721/img_1028721_16947615_3
△ 入力キーワードに近い候補を「LUIGI」がレコメンドします。

新しい研究員が入社

イメージ 1

△新研究員歓迎会の様子@ミッドタウン近くの居酒屋さん


久々の投稿となります。スタッフのA子です。

桜の美しい季節も終わり、日に日に暖かく過ごしやすくなってまいりました。
さて、この4月をもちまして、研究所は設立3年目を迎えることとなりました。
まだまだ短い歴史ではありますが、研究員たちの取り組みは徐々に実を結びはじめています。
学会での論文発表やYahoo! JAPANのサービスとして実際にお客様につかっていただいている技術もあり
ます。今後このブログを通じ、Yahoo! JAPANのサービスに導入された研究所うまれの技術を紹介していき
たいと思います。どうぞご期待ください。

さて、4月といえば、入学式や入社式など新しい出会いや生活がスタートする季節ですね。
Yahoo! JAPAN研究所にもこの4月に新しい研究者が入社いたしました。
研究所の新メンバーとなったのは「電子商取引におけるメカニズム設計」の研究員です。
あらたな研究員が加わり、研究所の研究テーマ数も10テーマと二けたの大台に突入しました。
3年目の今年、心新たによりいっそう研究活動に注力したいと思っています。
今後ともどうぞよろしくお願いいたします。

イメージ 1

    ▲ 鳥取砂丘(鳥取市福部町)

Yahoo! JAPAN研究所で自然言語処理研究をやっています山下と申します。よろしくお願いします。

日本における自然言語処理研究の学会である「言語処理学会」の年次大会が、3月第一週に鳥取大学で開催されました。

今回はさまざまな研究者による研究発表を聴講してきただけでなく、チュートリアル(その分野のトピックについて基礎から研究動向までを解説する講演)も行いました。私は1トピックとして、「ウェブサービスを利用した自然言語処理研究」というタイトルでYahoo! JAPAN の提供しているウェブ検索などの API について基礎と応用案を講演させていただきました。

ウェブ検索のインデックスに用いるために集められたテキストデータは、大量の自然言語文コーパスとみなすことができます。このようなデータは言語現象の調査や単語頻度や言語パターンを用いたテキストマイニングなどさまざまな用途に応用できます。
しかし、スパムサイトやコピーサイトのようなノイズとなるデータもウェブ上には多数あるため、単純にウェブ検索を用いるだけではなく、ちょっとした工夫が必要になります。そのあたりのチップスを含め、実際にウェブサービスを内部で用いているサイトなどを事例として紹介しました。詳細は年次大会の資料などで見ることができますので、興味のある方はぜひ。

余談ですが、学会開催期間中の空き時間に砂丘を見てきました。
あたり一面砂だらけの世界を堪能しました。一生一度は見ておきたい場所ですね。



プライバシー -  利用規約 -  メディアステートメント -  ガイドライン -  順守事項 -  ご意見・ご要望 -  ヘルプ・お問い合わせ

Copyright (C) 2019 Yahoo Japan Corporation. All Rights Reserved.

みんなの更新記事