1月18日、独立系のIT調査・コンサルティング会社のITRが、「ITR Market View:DBMS/BI市場2012」の販売を開始した。そして、この報告書にある調査結果の1つとして、テキスト・マイニングに関する市場状況について発表している。2010年度の国内テキスト・マイニング市場の出荷金額は24億6,000万円、前年比で11.3%増加したとのこと。増えている理由としては、企業において従来テキスト・マイニングが利用されてきたアンケート分析やビジネステキスト分析に加え、FacebookやTwitterなどのソーシャルメディアの情報を分析したいというニーズが高まっているからであろうと予測している。その結果、2011年度もテキスト・マイニング市場はさらなる拡大が予測されている。
テキスト・マイニング市場シェアで興味深いのは、シェアトップ4のうち3社が国産製品だということ。シェアトップは、野村総研のTRUE TELLERシリーズでおよそ40%を占めている。国産が強い背景には、やはり日本語を分析したいという要件が入ってくるからなのだろう。日本語のテキスト・マイニングとなると、海外産のツールではなかなかカバーしきれないところがあるのだろう。とはいえ、ITRのアナリストの生熊さんも予測しているけれど、これだけ拡大が予測される領域なので、今後はOracleやMicrosoftなどの大手ベンダーが本格参入してくることは間違いないだろう。そうなったときに、現在シェア上位を占めている日本勢が、リードを保つことができるのか。
製品の分析機能ももちろん優位性を保つためには重要だろうけれど、既存のデータベースとの連携、ソーシャルネットワークからの効率的なデータの抽出などにテキスト・マイニングの周りにある機能の充実度、さらにはそれらを使いこなすためのコンサルティング能力などが、顧客の採用条件に大きく左右するのではないだろうか。あとは、大手の体力に任せたプロモーション、営業活動というものも微妙にシェアに影響しそうな予感。
とはいえ、テキスト・マイニングでは国産勢に一日の長があるわけなので、各社競争に打ち勝って、日本産ソフトウェアの良さをむしろ海外に向けて発信してもらいたいと思うところ。
ちなみに今回販売されるITRの報告書には、このほかにもリレーショナルデータベース、BI製品などの市場分析結果も掲載されている。こういった分野の市場動向が気になる方は、購入してみてはいかがだろうか。価格は紙に印刷されたレポート版が14万7,000円と、ちょっと個人では手が出ないかもしれないが、部門で1冊いかがだろうか。
ジャストシステムと言えばワープロソフトの「一太郎」。学生時代には、ずいぶんとお世話になった。ここ最近私が利用しているのは、日本語入力ソフトのATOK。MacにもWindowsにも、利用するPC環境のすべてにインストールして使っている。AndroidのスマートホンもATOKだ。唯一使っていないのがiPhoneとiPad、これら用のATOKが発売されたらすぐにでも欲しいところだ。
もう1つ私が利用しているのが、文書構成ツールのJustRight!。文章を書く機会が多いので、これも必須のツール。Mac版がないので、これを使うためだけに仮想化ソフトを入れてWindowsを動かしている次第。できることならJustRight!については、クラウド版が出てくれればいいのになぁと思っている。
さてさて、そんなジャストシステムがデータベース製品の提供を開始したので紹介しておきたい。それが、ノンプログラミングWebデータベースソフトの「UnitBase 2.0」だ。これ、最初からバージョン番号が2.0なのはなぜかなと思ったり。一昔に流行った次の世代のサービスや製品を表す「XXX2.0」というネーミングってことではないよね?
これ、いわゆる小難しいリレーショナルデータベースではなくて、どちらかといえばMicrosoft AccessやFileMakerのようなデータベースと競合するような製品である。ドラッグ&ドロップで簡単に入力フォームを構築でき、条件検索の機能なども豊富に用意されている。さらにデータベースのデータを簡単にグラフ化できる機能もあるので、ちょっとしたBI的なレポーティングにも利用できるかもしれない。簡単なワークフローを設定して、承認の仕組みを取り込むなんてこともできるようだ。
データベースと銘打っているので、ユーザーのアクセスコントロールやバックアップ/リカバリーなどの基本的な管理機能も持っている。OracleやSQL Serverを導入するほどではないけれど、きちんとデータを管理、処理したいといったニーズに、容易に対応できるものとなっているようだ。製品の発売日は2月29日。すでに、サイトからダウンロードして無償試用版の利用が可能だ。
DBOnlineでは、これまでOracleやSQL Server、あるいは最近流行のNoSQL製品などの、どちらかといえばハイエンドにポジショニングされるデータベース製品を中心に取り上げてきた。とはいえ、多くの企業においては、もっとカジュアルに、AccessやFileMakerなどのデータベースを使いこなしているはず。近いうちに、それらカジュアルなデータベース製品の最新状況がどのようになっているのかもフォローしたいと考えている。このカジュアルなデータベースの領域にもう1つあるのが、クラウドサービスとして提供されるデータベースだろう。こちらについても、近いうちに特集として取り上げる予定だ。
( EnterpriseZine「成長中のテキスト・マイニング市場で日本勢が元気な理由」より)
*テキストマイニング【text mining】
定型化されていない文章の集まりを自然言語解析の手法を使って単語やフレーズに分割し、それらの出現頻度や相関関係を分析して有用な情報を抽出する手法やシステム。マイニング(mining)とは「発掘」という意味で、テキストの山から価値ある情報を掘り出す、といった意味が込められている。データマイニングの手法の一種である。
営業日報や自由記述のアンケート、コールセンターでの顧客とオペレータのやり取りの記録、メーリングリストのログなど、自然文の蓄積の形で存在する業務関連データは多く存在する。これらは意味のある形で数値化や定型化することが難しく、担当者が一つ一つ目を通して分析するのは時間ばかりかかってしまい効率的に活用することが難しかった。
テキストマイニングでは膨大に蓄積されたテキストデータを単語やフレーズに分解し、これらの関係を一定のルールに従って分析することにより、単語間の関係や時系列の変化などを抽出する。これにより、業務上の問題点を把握したり、製品の評価を調べたり、特に多い問い合わせやクレームを見出したり、これらが時系列にどう変遷しているかを調べたりすることができる。
ATOK 2012 for Windows [プレミアム] 通常版クリエーター情報なしジャストシステム
ATOK 2012 for Windows [ベーシック] 通常版クリエーター情報なしジャストシステム