Yahoo! JAPAN研究所 公式ブログ

研究成果や研究員の日々の活動を紹介します

ブログ記事

[ リスト | 詳細 ]

記事検索
検索
Yahoo! JAPAN研究所 研究員のステイチ・ゾランと申します。
研究所では、画像・動画検索分野の研究を担当しています。

今回は今月公開された類似画像検索VisualSeekerの一つの機能である複数画像による検索を実現する技術を紹介したいと思います。

一般の類似画像検索では一つの画像を与えて類似する画像を検索します。
ただし、ユーザが欲しい画像を一つの画像で表現できない場合があります。
例として、富士山の写真を見たいユーザは、雪が積もった富士山の写真を指定した場合、雪が積もっていない富士山の写真が検索されない可能性が高くなります。
こういった場合、複数の画像(雪が積もった富士山の写真と積もっていない写真の両方)を指定することによって、ユーザは欲しい画像をより正確に表現できるようになります。

「複数画像による検索」機能を実現する方法はいくつかあります。
既存の手法では、画像間の類似度を判断するときの基準(画像の色、輪郭線、模様、など)を調整することによって最終的な検索結果リストを取得します。
それに対して、VisualSeekerでは、検索の高速性を生かし、ユーザが選択した複数の画像を個別に検索し、その検索結果リストを統合して最終的な検索結果リストを生成しています。
最終的な検索結果リストを生成するときに、各検索結果の、
・ユーザが選択した各画像との類似度
・個別の検索結果リストにおける順位
の両方を考慮することによって、複数の画像で表現されている、複雑な検索条件に合う画像も的確に検索することが可能になります。

「複数画像による検索」技術の基本的な仕組は、類似画像検索以外の検索(商品やウェブ検索など)にも
適応することができるので、今後、皆さまのフィードバックをいただきながら、さまざまな応用を検討していく予定です。

イメージ 1

スタッフのA子です。久しぶりのブログ更新となります。

Yahoo! JAPAN研究所にて生まれた技術は、さまざまなYahoo! JAPANのサービスに導入されています。
今回は2009年3月にYahoo! BEAUTYコスメ検索に導入されました「LUIGI」という技術を紹介したいと思います。
ちなみに、ライブラリの名前 LUIGI(ルイージ)の由来は「類似(るいじ)」から来ています。

「LUIGI 」は類似文字列検索のために研究開発したライブラリです。
「ダイヤリー」と「ダイアリー」のような数文字異なる単語や、「クラブ」と「倶楽部」のような読みは同じだけど表記が異なる単語などを高速に探し出せます。現在はコスメ検索のほか、テレビ番組検索にも導入されています。

実際にはお客様が入力したキーワードでの検索結果がゼロ件であった場合に、この「LUIGI」の機能を呼び出し、入力キーワードと近い単語を提示する仕組みとなっています。この技術により、タイプミスやうろ覚え表現でも最終的に検索目的を果たすことができるようになります。

また、テレビ番組検索を例にあげますと、特にバラエティ番組では片仮名、平仮名、漢字、ローマ字表記が混在した独特な番組名が多く、お客様が入力したキーワードとのずれにより検索結果が出てこないことがありました。このようなときに「LUIGI」が力を発揮しています。

この技術は今後もさまざまなサービスに導入していく予定です。どうぞご期待ください。


■Yahoo! BEAUTYのコスメ検索。誤って検索ワードに「寝入るケア」と入力してしまっても・・・
https://blogs.yahoo.co.jp/IMG/ybi/1/86/64/yjlab_blog/folder/1028721/img_1028721_16947615_3
△ 入力キーワードに近い候補を「LUIGI」がレコメンドします。

新しい研究員が入社

イメージ 1

△新研究員歓迎会の様子@ミッドタウン近くの居酒屋さん


久々の投稿となります。スタッフのA子です。

桜の美しい季節も終わり、日に日に暖かく過ごしやすくなってまいりました。
さて、この4月をもちまして、研究所は設立3年目を迎えることとなりました。
まだまだ短い歴史ではありますが、研究員たちの取り組みは徐々に実を結びはじめています。
学会での論文発表やYahoo! JAPANのサービスとして実際にお客様につかっていただいている技術もあり
ます。今後このブログを通じ、Yahoo! JAPANのサービスに導入された研究所うまれの技術を紹介していき
たいと思います。どうぞご期待ください。

さて、4月といえば、入学式や入社式など新しい出会いや生活がスタートする季節ですね。
Yahoo! JAPAN研究所にもこの4月に新しい研究者が入社いたしました。
研究所の新メンバーとなったのは「電子商取引におけるメカニズム設計」の研究員です。
あらたな研究員が加わり、研究所の研究テーマ数も10テーマと二けたの大台に突入しました。
3年目の今年、心新たによりいっそう研究活動に注力したいと思っています。
今後ともどうぞよろしくお願いいたします。

イメージ 1

    ▲ 鳥取砂丘(鳥取市福部町)

Yahoo! JAPAN研究所で自然言語処理研究をやっています山下と申します。よろしくお願いします。

日本における自然言語処理研究の学会である「言語処理学会」の年次大会が、3月第一週に鳥取大学で開催されました。

今回はさまざまな研究者による研究発表を聴講してきただけでなく、チュートリアル(その分野のトピックについて基礎から研究動向までを解説する講演)も行いました。私は1トピックとして、「ウェブサービスを利用した自然言語処理研究」というタイトルでYahoo! JAPAN の提供しているウェブ検索などの API について基礎と応用案を講演させていただきました。

ウェブ検索のインデックスに用いるために集められたテキストデータは、大量の自然言語文コーパスとみなすことができます。このようなデータは言語現象の調査や単語頻度や言語パターンを用いたテキストマイニングなどさまざまな用途に応用できます。
しかし、スパムサイトやコピーサイトのようなノイズとなるデータもウェブ上には多数あるため、単純にウェブ検索を用いるだけではなく、ちょっとした工夫が必要になります。そのあたりのチップスを含め、実際にウェブサービスを内部で用いているサイトなどを事例として紹介しました。詳細は年次大会の資料などで見ることができますので、興味のある方はぜひ。

余談ですが、学会開催期間中の空き時間に砂丘を見てきました。
あたり一面砂だらけの世界を堪能しました。一生一度は見ておきたい場所ですね。

はじめまして。2008年4月にYahoo! JAPAN研究所に入社しました音声認識研究者のTです。まだまだ研究者としては駆け出しで、音声認識技術をどうやってウエブサービスにつなげられるかを日々試行錯誤しています。
また研究員として積極的に社外に出て情報収集をしています。国際会議や国内研究会に参加したり、他のIT企業関係者や大学職員と交流したりすることで新しい研究の「種」を得ることも研究活動において重要です。

先日(2/13)、早稲田大学で開催された経済産業省の音声認識プロジェクト最終報告会に傍聴参加してきました。会場(小野記念講堂)が音声認識専門家で満席に近いほどの盛況ぶりでした。

本プロジェクトの趣旨は「情報家電のための音声認識技術の研究開発」です。業界を代表する企業が参加しているだけあり目に見える成果が出ていました。音声と雑音の判別、雑音除去、高速・高精度デコーダ、多言語対応、言語モデルの適応、認識システムの性能予測など、技術的な貢献が多々ありました。さらに会場では、カーナビ、音源分離、音声インタフェース、音声コマンドを使ったバーチャル世界における人間の制御などのデモもあり、大変有意義な報告会でした。

システム的な観点から興味深かったのは、音声インタフェースおよびアプリケーション開発過程の効率化を目的とした双方向型開発パラダイムです。音声アプリケーション開発者がユーザからフィードバックを収集し、それらを音声認識技術者に伝達することで、開発過程にユーザの視点を十分に盛り込むことができるようになりました。また、音声認識システムの構成要素と音声言語資源を共有し、蓄積したログデータを管理して規則的なシステム更新を行うことで、開発サイクルの短縮や性能改善効果も期待できそうです。

ユーザインタフェースの観点から興味深かったのは、リモコンマイクを用いた家電制御です。ハンズフリー音声認識は未だ困難な課題ですが、ユーザがテレビリモコンに似た装置を協力的に利用することで、一般家庭における音声インタフェースの可能性が広がります。また住所の音声入力も、ゲームコントローラを併用して使いやすく工夫されていました。これらの成果からもわかるように、音声インタフェースの利便性は着実に向上しています。

これからの音声認識技術は研究者だけのものではなく、一般消費者の日常生活をより便利で楽しくする、そのような道が開けていくのかもしれません。 みなさんのご意見、ご期待を大切にし、今後さらに便利な音声インタフェースの研究開発に取り組んで行きたいと思います。


プライバシー -  利用規約 -  メディアステートメント -  ガイドライン -  順守事項 -  ご意見・ご要望 -  ヘルプ・お問い合わせ

Copyright (C) 2019 Yahoo Japan Corporation. All Rights Reserved.

みんなの更新記事