仕事で使えるAIリテラシー

「グーグルの猫」にみる大量データの重要性 AI開発には質への理解も不可欠 (1/3ページ)

高田朋貴
高田朋貴

 AI(人工知能)の開発サービスを提供しております、株式会社SIGNATE(シグネイト)の高田朋貴と申します。AIを開発・運用するために必要な人材の条件や、AIを適切に活用していくためにビジネスパーソンが身につけるべきリテラシーについて紹介していく本連載。第3回は、AI開発に必要不可欠な「データ」の重要性についてお話させていただきます。

 「猫」を見分けられるAIの誕生は革命だった

 最近のAIブームは「第3次」と言われています。AIは1960年代に第1次、1980年代に第2次ブームが到来しました。

 「人工知能」という言葉が初めて登場したとされる1956年から、技術的なブレークスルーがあるたびにAIはブームを迎えてきたわけですが、コンピューターの処理能力が不十分だったり、複雑な計算を効率的に行うための理論的な裏付けが足りなかったりしたことから、どちらのブームも長続きしませんでした。

 しかし、今回の第3次AIブームは過去よりも長く続いています。しかも年を追うごとに盛り上がりは増すばかりです。

 その背景にあるのが、ディープラーニングに代表される革新的な技術の誕生と、大量のデータ(ビッグデータ)の利活用が容易になってきたことです。

 今や「AIの開発には膨大な量のデータの収集が必要」という認識は、多くの人に共有されるようになってきました。一方、「では、なぜAI開発に大量のデータが欠かせないのか?」という質問に、ちゃんと答えられる人は少ないように感じます。

 そもそも、AIはなぜ大量のデータを必要とするのでしょうか。これはひとえに、第3次AIブームを支える「機械学習」という技術が大きく関わっています。

 機械学習をざっくり説明すると、大量のデータを分析することで、AI自身が知識を獲得していくための仕組みと言えます。大量のデータの中に見つかる“パターン”をAIが自ら学んでいくことで、その学習結果を元に予測や分類を行うことができるようになるのです。その中で、今もっとも注目されている手法が、ディープラーニングです。

 ディープラーニングの革新性を有名にした「Google(グーグル)の猫」という研究成果があります。これはGoogleが、2012年に「AIが猫の写っている画像を見分けられるようになった」と発表し、大きな話題となったことを指しています。

 一般の人からすれば、「AIが猫を見分けられるからって、それのどこがすごいの?」と思うかもしれません。しかし、これはAIの進化にとって非常に大きなブレークスルーだったのです。

 機械が自らデータのパターンを学び、分類する

 機械学習の特徴は、AIが大量のデータから“パターン”を見つけることにあります。画像認識であれば、大量の画像から共通した要素(特徴)をコンピューターが自ら抽出して、分類し、その結果を元に「これは犬」「これは猫」などと判断していきます。

 実は、「機械が『犬』と『猫』を正確に見分けられるのか?」というのは、AI研究において長年の課題でした。

Recommend

Ranking

アクセスランキング

Biz Plus