22時34分17秒 [Web関連]
CNET Japanでは、2006年のネット業界の展望について語った記事が数本UPされてました。2006年の検索業界について語られてた記事では、ブログ検索について言及されてました。
◆展望2006:SEMと検索技術で見る2006年のサーチ業界
記事曰く、これまでのブログ検索は、単に対象をブログに限定しただけで検索手法や検索結果の提供方法に関しては、従来の検索機能をそのまま活用しただけだったと。今後は、ブログならではの検索手法や結果の表示方法が出てきて、もっと活用されるようになるんじゃないかとのこと。
ブログって、1つの話題で1つのエントリ(=ページ)が構成されることが多いですよね。だから、ブログが生成するページってのは、「そこで何が語られているのか?」が比較的解釈し易いページになると思います。で、現在、国内だけに限定しても相当数のブログが存在するわけで。これは、テキストマイニングの材料としてはかなりおいしいんじゃないかと思うのですよね。
例えば、あるキーワードについて語られているブログ(のエントリ)について、そのキーワードについて、肯定的な意見を述べているのか、それとも否定的な意見を述べているのかを判別することができれば、それで、なんか製品の反応チェックとか、流行チェックとかできそうな気がするのですよね。
…ああ、まあそれは形態素解析してから肯定的・否定的な表現を見つけるみたいな作業だから、テキストマイニングとは言わんのだろうか?…言ってもいいのかな?(^^;)
まあ、テキストマイニングってのは、大量のデータを調べてみたら何か有用な情報が見つかる(抽出できる)んじゃないか?みたいな話だから、「膨大な量の解析しやすいデータ」がたくさんある(環境がある)という点で、何かいろいろできそうな気がします。
こういうのって、ジャストシステムが強そうだなあ。ジャストシステムのConcept Base(コンセプトベース)をブログに活用したら相当いろんな情報が抽出できそうな気がするんだけど。
以前、大学の某研究会でデモを見たとき、「こりゃすげえ!」と思ったもんね。さすが、日本語処理を相手にしてでかくなった企業だけのことあるなと思ったですよ。ちょっと感動しました。(同時に、この分野での太刀打ちは可能なんだろうか?とも激しく疑問に思いました。:笑)
実は、今から2年前、まだ「ブログ」という言葉が今ほど流行ってなかった頃、うちの先生が学内ベンチャーを立ち上げるという話をしてまして、そこで、テキストマイニングを使った検索機能のあるブログシステムの構築について提案したことがあったんですよね。そういえば。(笑)
ブログ検索って、ほんとに最近の話だから(もっともそれらの開発自体はもっと前から行われてただろうけど)、2年前にホントにスタートしてれば、なんか結構いいことできてたかもなあ(笑)…と思ったり。(まあ結局、ベンチャー立ち上げる気はさらさら無かったようなので、話も無かったことになってますが。)
今後は、単純にブログに書かれてる内容を検索するってだけじゃない活用方法もたくさん出てきそうです。さっきも言ったけど、「1ページ1話題」である可能性が高いブログってのは、「何が書かれてんのか?」とか「何を言ってんのか?」ってのが、(他の一般的なウェブページと比べると)解析し易いと思うし。(多くのブログはXHTMLで、比較的いい感じのマークアップ(^^;)がされてるという点も。)
このネタはかなりおもしろそうなんですけどねー。できあがったサービスには需要もありそうだし。どんなものでも。(^^;)
ただ、このネタを独力でするには限界がありそうな気もしますが。テキストマイニングって、とっかかりの掴み所がないというか、形態素解析から始めないといけないのが面倒くさいというか(笑)、全体的に取りかかりにくいイメージがあるよーな気もしないでもないです。
「2006年にはおもしろいサービスがでてきそうです。」とか言えば綺麗にまとまりそうな気もするんだけど、開発側にいる人間としてはそんなまとめ方じゃダメなんですよねえ。^^;
「でてきそう」じゃなくて「作る!」と言わなくちゃダメなわけで。
「流行キーワード」みたいなのは、ブログ検索サイトとか(でなくても)でよくあるけど、そこから1歩進んで、そのキーワードに対して肯定的意見が何件、否定的意見が何件、…とか出るとかなりおもしろいよね。
まあ、具体的にどうすれば作れるか、今すぐに思いつけたりはしないのだけど。(笑)
この日記へのコメントはお気軽に! コメント数:0件
コメント数: 0件