近年、ハイブリッドAIというAIが注目を集めています。もっともハイブリッドAIという言葉の定義にはっきりしたものはなく、あるときは、
1.理論知識型AI+データ駆動型AI (AL ハイブリッドAI)
であったり、またあるときは
2.物理モデル+機械学習 (ハイブリッドAI|物理学と機械学習を組み合わせたAIが産業界を変革する)
であったりします。
ただおおよそ、共通に意味するところでいえば
人間が持っている明文化できるような論理的な知識+データを用いた機械学習
というハイブリッドでしょう。人間の脳にたとえて言うと、
人間が持っている明文化できるような論理的な知識が左脳なら、
データを用いた機械学習が右脳、
といえ、さらに誤解をおそれずに例えれば
ハイブリッドAIは、人間でたとえると左脳と右脳が協調して問題を解決するAI
…でしょうか。
さて昨今機械学習系AIの活用が盛んですが、もう70年にもおよぼうとするようなAIの歴史の中で、機械学習がこれほどまでに脚光を浴びるようになったのは、おそらく、2012年に画像認識のコンテストにおいてトロント大学のチームが深層学習(ディープラーニング)を使ったモデルで圧倒的なパフォーマンスをあげたことにはじまるのではないかと思います。これ以降、機械学習、特に深層学習は画像認識はもちろん、音声認識、自然言語処理などでめざましい成果をあげていることはご存じのとおり。
しかし今、成果をあげている、この機械学習に基づくAI…第3世代AIと言われますが、この第3世代AIと言われる機械学習にもデメリットが見えてきました。これには、前にも書きましたが、以下の項目などがデメリットとしてあげられています。
- 学習に大量の教師データや計算資源が必要であること
- 学習範囲外の状況に弱く、実世界状況への臨機応変な対応ができないこと
- パターン処理は強いが、意味理解・説明等の高次処理はできていないこと
上記のパターン処理に関して言えば、実際に第3世代AIで成功している分野の多くは、画像認識など論理で割り切れない分野です。たとえば人間が画像を見て猫と認識するという場合に、
猫は猫
であり、別に、ひげがあるとか、目が猫だとか意味づけをもって猫だと判断しているわけではありません。見たその場で猫だと判断して、ひげがあるとか、目が猫だとかは必要あれば後付けで理屈をつけるというだけです。
実は深層学習による画像認識も人間と同様で○○だから猫というわけではなく、たくさんの猫の画像を見て学習し、
猫は猫
と認識するようになります。
第3世代AIは、このように意味づけを越えたパターンの認識が得意であるといったところに特徴があり、非常に即応的で、逆にこれが熟考を要する論理には弱いというデメリットにもつながっているわけです。
さて、この第3世代AIの論理面での弱さに対して論理の仕組みを取り入れて対応していこうという動きが、XAI(説明可能なAI)であったり、ハイブリッドな第4世代のAI(理論知識型AI+データ駆動型AI)であったりするわけです(この項続く)。
コメント