Yahoo! JAPAN研究所 公式ブログ

研究成果や研究員の日々の活動を紹介します

全体表示

[ リスト ]

イメージ 1

    ▲ 鳥取砂丘(鳥取市福部町)

Yahoo! JAPAN研究所で自然言語処理研究をやっています山下と申します。よろしくお願いします。

日本における自然言語処理研究の学会である「言語処理学会」の年次大会が、3月第一週に鳥取大学で開催されました。

今回はさまざまな研究者による研究発表を聴講してきただけでなく、チュートリアル(その分野のトピックについて基礎から研究動向までを解説する講演)も行いました。私は1トピックとして、「ウェブサービスを利用した自然言語処理研究」というタイトルでYahoo! JAPAN の提供しているウェブ検索などの API について基礎と応用案を講演させていただきました。

ウェブ検索のインデックスに用いるために集められたテキストデータは、大量の自然言語文コーパスとみなすことができます。このようなデータは言語現象の調査や単語頻度や言語パターンを用いたテキストマイニングなどさまざまな用途に応用できます。
しかし、スパムサイトやコピーサイトのようなノイズとなるデータもウェブ上には多数あるため、単純にウェブ検索を用いるだけではなく、ちょっとした工夫が必要になります。そのあたりのチップスを含め、実際にウェブサービスを内部で用いているサイトなどを事例として紹介しました。詳細は年次大会の資料などで見ることができますので、興味のある方はぜひ。

余談ですが、学会開催期間中の空き時間に砂丘を見てきました。
あたり一面砂だらけの世界を堪能しました。一生一度は見ておきたい場所ですね。

閉じる コメント(3)

顔アイコン

>詳細は年次大会の資料などで見ることができますので、興味のある方はぜひ。

大会には参加していないのですが、ウェブ上で資料を参照することはできないのでしょうか?

2009/3/24(火) 午後 5:11 [ - ]

顔アイコン

私もサイトなどを事例とゆうのに興味があったのですが、その年次大会の資料とやらは、一体どこで見ることができるのですか?

2009/3/26(木) 午後 11:15 [ 山形 旅人 ]

顔アイコン

>nokuno様、山形様
横からですが、言語処理学会会員です。言語処理学会の年次大会資料は、PDF化されてCD-ROMにて現地で配布されますが、Web上にはアップロードされません。
バックナンバーは、非会員でも学会事務局にメールで連絡すれば、購入可能なようです。山下氏は、チュートリアル枠で発表されたので、
http://nlp2009.anlp.jp/#tutorial
下記のページの「チュートリアル資料」を購入すればよいのではないかと存じます。
http://www.nak.ics.keio.ac.jp/NLP/guide/backnum.html
(文字化けする場合は、エンコードをiso-2022-jpにしてください。)

ご参考になれば幸いです。

2009/3/27(金) 午前 4:47 [ ***** ]



プライバシー -  利用規約 -  メディアステートメント -  ガイドライン -  順守事項 -  ご意見・ご要望 -  ヘルプ・お問い合わせ

Copyright (C) 2019 Yahoo Japan Corporation. All Rights Reserved.

みんなの更新記事