個人や企業が生み出すデータの量は28億テラ(テラは1兆)バイトを超えた。1テラバイトは朝刊1千年分というから天文学的な量だ。そんな「ビッグデータ」を解析し、ヒト、モノ、カネと並ぶ新たな資源にしようとする技術が広がる。目指す先は人間が迷ったり、間違えたりしなくなる世界。経済や社会、日々の生活はどう変化するのだろう。
企業に眠る「社内ビッグデータ」。ずしりと背中に覆いかぶさっているのは、米国だ。
「とうとう人間が処理できる水準を超えた」。UBIC社長の守本正宏(47)は3年前、顧客から渡されたハードディスクの容量がテラバイトを超えたとき確信した。同社は企業内のデータを調査して裁判の証拠を集める「訴訟支援企業」だ。
訴訟支援はいまや60億ドル産業。生み出したのは裁判で互いに相手が求める証拠を開示する米国の制度「ディスカバリー」だ。米裁判所で電子メールが証拠として認められるようになったのは約20年前。2006年には電子的証拠も開示対象とする「eディスカバリー」も制度化された。
電子データの量を文書に直すと1ギガ(ギガは10億)バイトでメール1万通分。大規模訴訟では数百テラバイトのデータから証拠を探す必要があり、怠れば訴訟は確実に不利だ。「決定的証拠の9割が電子メール」とされるカルテル事件でも米司法省から膨大なデータを求められる。
こうして米国の法廷は瞬く間にデータ解析にたけたエンジニアが活躍する産業となった。インド出身のダルメッシュ・シンガラ(45)もそこに飛び込んだ一人。02年に妻と訴訟支援会社を設立。「企業内のデータから目的の資料を探すシステムを提供している」
変化は副作用ももたらす気配だ。1つは訴訟費用の高騰。米国で糖尿病治療薬を巡り3千件を超す裁判を起こされた武田薬品工業は昨年度、80億円を裁判費用に投じたがかなりの部分はディスカバリー対応とされる。
機械が人間の仕事を奪う可能性も出てきた。大量の文書から証拠を探す作業は人海戦術だったがeディスカバリーはデータを絞っても50万ファイルは残る。人手での対応はとても不可能だ。
中には過去の裁判を人工知能に学ばせ、証拠を探させる企業も現れた。いつか弁護士に代わりコンピューターが書面を書く日が来るか。高度な専門知識に守られた法廷にも転機が訪れている。