記事登録
2008年08月06日(水) 12時00分

検索の進化型!?  「テキストマイニング」って何だ?R25

情報量が日々増え続けていくウェブの世界。その数の多さに、検索してもあまり関係のない情報にたどり着いてしまうなんてこともたまにあったり…。

どうすれば、必要な情報を効率的に検索できるのか? その答えのひとつとして、最近「テキストマイニング」という技術が注目されています。あまり耳慣れない言葉ですが、いったいどんな技術なのでしょう?

テキストマイニングを利用したウェブマーケティングを行うブログウォッチャーの言語解析スペシャリスト ・村山紀文さんに伺うと…。

「テキストマイニングとは簡単にいえば、文章の特徴を見つけ出す手法。一般的なキーワード検索は、その単語を含むサイトを引っかける手法なので、内容までは絞れず目的外の情報にたどり着くこともありますが、テキストマイニングは文章の内容をコンピュータが解析するので、必要な情報を絞って集めることができるのです」

文章の内容をコンピュータが解析!? それは、どんな方法で?

「基本は統計です。テキストマイニングは主に企業が利用するサービスですが、例えば、ある化粧品会社が自社製品のネット上での評価を調べようとした場合。まずはブログや掲示板のコメントなど、文章中の製品名の頻出度を調べ、次にその前後に並ぶ言葉との関連性を見ます。そこに“使いやすい”や“安い”などの言葉があれば好評で、その逆の言葉が並んでいれば不評ということをコンピュータに覚えさせるわけです。その評価例をコンピュータが記憶することで、以後、その製品についての文章をウェブ上で見つけた場合、書かれている内容を判断し、評価を振り分けてくれるのです」

このような文章解析の研究は10年くらい前から行われていたそうですが、近年、ブログの普及などウェブの情報量が飛躍的に増え、その取捨選択が困難になってきたことにより、テキストマイニングに注目が集まるようになったのだとか。

現在ではスパムメールのフィルタリングに利用されるなど、意外と我々にも身近になりつつあるこの技術。将来的に、僕らのネット生活に直接関わりを持つこともあるのでしょうか?

「まだまだ研究段階ですが、テキストマイニングの応用により『渋谷のウマいラーメン屋ってどこ?』なんて質問にパッと答えてくれるような“自然文検索”が可能になるかもしれませんよ」

それはスゴい!! もしかしたらテキストマイニングって、この先、僕らにとってなくてはならない存在になるのかもしれませんね!
(R25編集部)

※コラムの内容は、フリーマガジンR25から一部抜粋したものです

【関連記事・情報】
検索の進化型!?  「テキストマイニング」って何だ?の詳細情報
メーカーは値上げ続々なのに、デフレが終わらないワケは?  (2007.12.13)
いま話題のイスラム金融の基礎知識を学んでみた!  (2008.02.21)
メーカー各社が大増産!「ターボ」がアツい理由とは?  (2008.05.15)

http://headlines.yahoo.co.jp/hl?a=20080731-00000001-rec_r-sci