AIは”浜田ゴリラ”を何と認識するのか? 〜序章〜

AIは”浜田ゴリラ”を何と認識するのか? 〜序章〜

どうもこんにちは塚本です!

本日からシリーズモノとして, AIやDeep Learningのお話をしていきたいと思います.
今日は”AI”編とさせていただきます.

そして,
アイキャッチ画像の通称”浜田ゴリラ”をAIは何と認識するのか?
こちらは最後の方まで引っ張ろうとおもいます.

2年程前の学生時代に研究していたテーマなので,
ところどころ情報が古いかもしれません.

情報理論やアルゴリズムとデータ構造などを履修している学生さんのレポート製作の助けになれればともおもいます.

AIってなんだ?

AIとは”Artificial Intelligence”の略称で, 人間の知的能力をコンピュータで実現するもののことです.

人工知能というワードの歴史は実は古く, 1960年代にまで遡ることができます.

最近では,AIや人工知能といった単語が独り歩きしていて
誤用されているような気がします.(※あくまで主観です)

第一次人工知能ブーム

第一次ブームは 1960 年代に起こった「推論と探索」に関するブームです.
推論と探索というのはあるルールとゴールが決められているゲームの中で,コンピュータがなるべくゴールにたどりつけるように選択肢を選んでいくものです.
この推論と探索によって人工知能はパズルや迷路を解いたり,数学の定理を証明をしたり,チェスを指したりといった知的な活動を行えるようになりました.

第一次ブームの推論と探索では一見,知的な活動を行えるようになりました.
しかし,これはあくまで 適用範囲はルールとゴールが厳密に決まっている枠組みの中での話であり,
ルールが記述しきれず,またルールやゴールが曖昧である現実世界では全く役に立ちません.
(ちなみにこの時期の人工知能が解く,ゲームのような問題の事をトイプロブレム(おもちゃの問題)と呼びます.)
このようなことが露呈し始めた事と当時流行していたパーセプトロンというアルゴリズムの限界が示されたことなどにより第一次AIブームは終結し,1970年代に一回目の冬の時代に突入していきます.

第二次人工知能ブーム

第一次AIブームは,トイプロブレム(おもちゃの問題)しか解けないという欠点のため終結しました.
そこで現実の問題を解くために考え出されたのがエキスパートシステムです.

エキスパートシステムとは,専門家(エキスパート)の知識 をコンピュータに移植することにより現実の複雑な問題を人工知能に解かせようとするものです.
例えば,専門医の知識をコンピュータに移植すれば,患者の症状から病名を特定することができます.

「頭が痛いですか?」,「倦怠感はありますか?」などといった質問をしていき
「頭が痛ければ A~E の病気の可能性がある」,「倦怠感がないのであれば B,D の二つの病気の可能性が高いだろう」といった具合です.

エキスパートシステムはルールをため込んで「もしこういう状況なら,こういう対応をしろ/こういう選択肢が答えになるはずだ」という判断を行うことで問題を解決していきます.
しかし,これを実現するには専門家のありとあらゆる知識を教え込まなければいけなく,さらに多数の ルールを教えている間に互いに矛盾するようなルールも出てきてしまいます.

コンピュータは杓子定規なふるまいしかできないため,矛盾したルールにぶつかるとそこで止まってしまうのです.
また,教えていない例外的な事例が出てくるとコンピュータは対処できません.

そんなこともあり,1990年前後から2回目の冬の時代に突入していきます.

第三次人工知能ブーム

現在,第三次人工知能ブームが起きています.
深層学習(ディープラーニング)というブレイクスルーとともに広がってきています.

これまでの人工知能は,ごく表層的なパターン認識や,記号化された情報を扱うことしか出来ませんでした.
そして人工知能に正解のパターンを教えるのは人間の役目でした.

たとえばコンピュータ囲碁の場合,最初は「こういう盤面は優勢」「この盤面は劣勢」というように人間が判断して優勢な盤面をコンピュータに教える必要がありました.

人間が勘で「なんとなく,こう」と掴んでいることを, コンピュータは得意の繰り返し処理で泥臭いがはるかに正確な数字で「手筋の良し悪し」を判断できるようになりました.
(コンピュータに全ての手を計算させて評価値をつけていけば理論上は強いAIができそうですよね)
しかし他の分野においては,この「読み解き方」の構築,特徴量の抽出方法を考えるのが 非常な難題であり,また同時に,超えられない壁でもあったのです.

ところがディープラーニングはこの「特徴量の抽出」つまり「情報の読み解き方」そのものを人工知能が学習によって導き出します.
つまり,ディープラーニングは無数の情報を学習し,概念そのものを見つけ出すことができるものなのです.

ざっくりいうと…

「推論と探索」は迷路をとくゲーム

探索の基本は画像のようなノードになります.
それをどのような手順で探っていけば目的のノードへ辿り着けるかというようなものです.

基本のアルゴリズムには”幅優先探索”や”深さ優先探索”などが挙げられます.

気になった方は「アルゴリズム 木構造」とかで勉強してみてください.

「エキスパートシステム」は ああ言えばこう言う おもちゃ

世界初のエキスパートシステムは Dendral といい,1965年にその開発が行われました.
この Dendral から派生したものが Mycin(マイシン)です.

Mycin は 1972 年に開発された,細菌感染の診断をするもので,
スタンフォード医学部でも調査によると約65%の正解率を誇りました.

これは「専門医の診断」80%の正解率には及ばないものの,「細菌感染の専門家でない医師」よりは優秀な成績でした.
専門医ほどではないですが,それなりに有用なシステム として活用できそうな Mycin ですが,実用で導入されることはありませんでした.

理由としては,やはりシステムを用いての「誤診」に対して誰が責任を負うのか,といった倫理や法律面での壁が立ちふさがったからです.
これは,人工知能が人間の仕事を代替するためにも整備されていなければならない今に続く課題と言えます.

また,エキスパートシステムの特徴として
あらかじめ「if ~ then」を大量に用意しておく必要があります.

Deep Learningは自動で色々やってくれる

Deep Learningについては次週の記事で詳しく書こうと思っています.

あなたはこの画像をみて何と思いましたか?
正解はカブトムシです.正確にはヘラクレス?
わかんなくても,虫ということはわかりましたよね??

それってなんで分かるんですか?
人が「カブトムシ」とみて「カブトムシ」と認識できるってコンピュータからみるとすごいことなんです.

人間は,まず何かを見たときに特徴を抽出します.
その中で,これまで学んだ特徴を照らし合わせ,近いものを関連付けてカブトムシと判断しています.

このような脳内の神経回路網とそのプロセスを模倣したのがニューラルネットワークというロジックであり,
これを多層にして組み合わせていくと,,,おまちかねのDeep Learningとなっていきます.

書いているといくらでもかけちゃうので今日はここまで!
次回は”Deep Learning”編です!