|
▲ 鳥取砂丘(鳥取市福部町)
Yahoo! JAPAN研究所で自然言語処理研究をやっています山下と申します。よろしくお願いします。
日本における自然言語処理研究の学会である「言語処理学会」の年次大会が、3月第一週に鳥取大学で開催されました。
今回はさまざまな研究者による研究発表を聴講してきただけでなく、チュートリアル(その分野のトピックについて基礎から研究動向までを解説する講演)も行いました。私は1トピックとして、「ウェブサービスを利用した自然言語処理研究」というタイトルでYahoo! JAPAN の提供しているウェブ検索などの API について基礎と応用案を講演させていただきました。
ウェブ検索のインデックスに用いるために集められたテキストデータは、大量の自然言語文コーパスとみなすことができます。このようなデータは言語現象の調査や単語頻度や言語パターンを用いたテキストマイニングなどさまざまな用途に応用できます。
しかし、スパムサイトやコピーサイトのようなノイズとなるデータもウェブ上には多数あるため、単純にウェブ検索を用いるだけではなく、ちょっとした工夫が必要になります。そのあたりのチップスを含め、実際にウェブサービスを内部で用いているサイトなどを事例として紹介しました。詳細は年次大会の資料などで見ることができますので、興味のある方はぜひ。
余談ですが、学会開催期間中の空き時間に砂丘を見てきました。
あたり一面砂だらけの世界を堪能しました。一生一度は見ておきたい場所ですね。
|