【生かせ!知財ビジネス】VALUENEXの戦略(中)

 ■強みは文書の高次元処理

 VALUENEX(バリューネックス、VNX、東京都文京区)の創業者、中村達生社長は同社の実像を「アルゴリズム開発企業だ」と強調する。同開発企業やその活動を担うデータサイエンティストの本場は米国であり、中村社長は2014年2月、米シリコンバレーに「VALUENEX」を設立。その後、最初に日本で立ち上げた会社「創知」の名称も「VALUENEX」に統一した。米国企業として英国、スイスにも拠点を設け、世界展開を視野に入れた布石を打ち始めている。

 同社のアルゴリズムとは何か。最も特徴的なのは「高次元解析アルゴリズム」だ。サービス第1号の知財分析ツール「TechRadar(テックレーダー)」に搭載された文書間の類似性を測るアルゴリズムである。

 一般的なアルゴリズムでは、類似性を検証する元になる文書(クエリー)と比較の対象になる各文書を1対1の関係で計算し、類似性の順位を決める。専門的な表現では「2つの文書のベクトル(向き)の内積を出す」と言う。各文書のベクトルは、クエリーと各文書の中で使われている共通の単語の頻度などを基に計算している。

 一方、テックレーダーの高次元解析アルゴリズムでは、クエリーと1つの文書の間だけではなく、全文書間の内積を出す。文書数が何千、何万と増えれば、比較する回数は指数的に増えるが全文書間の関係を構造的に明確化できる。この結果、正確で精緻な、同社特有の俯瞰(ふかん)解析図(クラスターマップ)が描ける。

 中村社長は「全文書間の関係を正確に知るには、実は全単語の関係も計算する。計算量は一般的ツールと比べて10の9乗(10億)レベルで増える。現在は6000万個の単語を含む空間距離を計算できるようになった。専門的には『6000万次元処理』という」と説明する。

 当然、ハードウエア側に大きな負荷がかかるが、ゲノム解析で使う並列処理を導入して解決した。

 数学や統計の知識がないと、アルゴリズムを理解することはなかなか難しい。中村社長はアルゴリズム開発企業の最も重要な点を「嘘をつかないこと。特に素人に論理上、数学的に間違っているのに平然と商売してはならない。それはこの分野が社会に認められていくかどうかのカギになるだろう。当然、世界の専門家は見ている」と強調した。(知財情報&戦略システム 中岡浩)