特許検索技術と高精度特許調査サービスなどを提供するプロパティ(東京都新宿区)はこのほど、日英中の3言語に対応する特許検索用シソーラス(辞書)を開発した。11月以降、ウェブから利用できる特許同義語辞書システム「iPSY」(イプシィ)」として販売する。
シソーラスとは語彙を集めた辞書のことで、一般には同義語辞書または類義語辞書をさす。語彙には通常、複数の表現がある。また、同義語や類義語には文章上の言い回しや使い方によって近接して使われる語彙がある。シソーラスには同義語、類義語、語彙の近接関係の情報などが含まれている。
シソーラスがあれば、コンピューターを使って特許の機械翻訳をする場合、より正確な翻訳が可能になる。語彙や文章を使って類似の文章を検索する際には、検索精度が向上する。
プロパティは約1年前から情報通信研究機構(NICT)と連携。同社が保有するパテントファミリーデータ(同じ特許出願から派生する各国出願データ)の中から、過去10年分に及ぶ日本語、英語、中国語のデータを抽出してNICTへ提供。NICTはそれらを統計的手法で分析し、1000万語規模の日英中3言語間の翻訳用対訳辞書データを作成した。
同社は、NICTから同データの利用ライセンスを受けて、ウェブ上での翻訳用対訳辞書システムを構築したのに加えて、日本特許翻訳との共同で同データを土台にしたシソーラスの開発に取りかかっていた。
同社の小川公人社長は「グローバル化が進む中、シソーラスは、多言語を扱う機械翻訳用としてだけでなく、特許検索システムや特許文献を読み込んで分析するデータマイニングツールの機能強化のために、そして人工知能(AI)を使った類似特許分析や先行文献調査など、さまざまな分野で活用ができると考えている」と話している。