インドの天才少年、タンメイ君がカンファレンスで講演した。
機械学習で「地動説」は生まれない。天才少年が「AIは存在しない」と主張する理由
若干15歳で、IBMチャンピオン(IBMのテクニカルコミュニティに優れた貢献をしてきた人)として世界を飛び回っているらしい。
レベルが違う!
若干15歳で、IBMチャンピオン(IBMのテクニカルコミュニティに優れた貢献をしてきた人)として世界を飛び回っているらしい。
レベルが違う!
こどもにAIや機械学習を教える際に、良い刺激になりそう。
そしてAIの再定義
AIを「Artificial Intelligence」ではなく、人間の知性を拡張する「Augmented Intelligence」すなわち「拡張知能」と呼ぶべきだ、と語った
拡張知能の概念は、少し前からあった。
さらばAI、これからは「拡張知能」と呼ぶ時代がやってくる
この語り口だと、自力でたどり着いたのかも。
しかし、大分機械学習は万能感がある内容ですね。
機械学習も一つ使い方を間違えると、イノベーションを阻害するかもしれないと感じたのでちょっとメモ程度にまとめてみます。
例えば、星や惑星の軌跡を予想する機械学習を作ったと考えてみましょう。
今までの大量の星や惑星の移動データがあれば、過去のデータから位置が「予測」できるはず
機械学習では、天動説も地動説も考えることなく、ただ単純にデータだけを見て、過去との比較で「正解」と思わしきものが出てくる。
人間にとってみれば、「正解」が出てきさえすれば、とりあえず問題は解決するでしょう。
問題とは何か。
以下のサイトが、天文学の歴史を分かり易くまとめていたのでご紹介します。
なぜ「天動説」でなく「地動説」なのか?文系でもわかる天文学の歴史
でも機械学習で頑張れば、大問題も解決!
。。。何かおかしいですね。
機械学習で行うことは、(実施する時点でその時代や人が)法則性が見えないものを、機械で過去データをもとに「確からしい」答えを出すことであって、本来正しい計算式がわかれば、機械学習は使う必要がないはずです。
大航海時代にもし機械学習があったとすると、天動説がだめだと分かった時点で、「法則がわからないから機械学習で対策だ」ということで、問題が解決してしまったとしたら。。。
永遠に「地動説」は生まれないとしたら。。。
機械学習万能説も、実は、本当の計算式があるはずなのに、それを見つける動機を無くす要因になってしまうかもしれません。
また、機械学習に読み込ませるデータ自体の質も、気を付けないといけません。
収斂進化という言葉は聞いたことがあるでしょうか。
別な動物だけど、進化するなかで、同じような姿・特徴がでてきた生物のことです。
そっくりだけど別の動物! 収斂進化した動物たちのまとめ
たとえば、以下の4つの動物を例に考えてみましょう。
・アナグマ
・タヌキ
・アライグマ
・ハクビシン
このうち、生物の研究で「タヌキ」だけが、まだ研究途中で「アライグマ」と同じと思われていたとしましょう。
・アナグマ
・アライグマ(タヌキ)
・ハクビシン
やった、アライグマを判別できた
実際はタヌキを「アライグマ」として判別しているので、正確には「誤り」です
本来は「データの中に別なものがあるかもしれないから、データ自体を見直そう」が正しいアプローチですが、これを行うには生物学の知識が必要で、一般の人には対応できません。
タンメイ君が、最後のほうで、レット症候群を患う「ブー」という名の女性について、心音による機械学習で、「ブー」が何を考えているのかを当てようとしている話が出てきます。
ということで、正解は母親の言葉のみ。
母親は「ブー」のことをどれほどわかっているのか。もちろん嘘は言わないと思いますが、「ブー」の遠慮や母親の「誤解」で、正解が出せてないケースがないか。。。不安になりました。
15世紀ごろには、年月が経ったことと、観測技術が向上したことで、プトレマイオスの天動説もこまかなズレが生じるようになりました。天動説をもとにした計算だと、実際とずれてしまっていたようですね。
これは占星術師にとって、また暦をつくる人にとって、そして大航海時代に星の位置だけをたよりに海をわたる人にとって、大問題でした。
でも機械学習で頑張れば、大問題も解決!
。。。何かおかしいですね。
機械学習で行うことは、(実施する時点でその時代や人が)法則性が見えないものを、機械で過去データをもとに「確からしい」答えを出すことであって、本来正しい計算式がわかれば、機械学習は使う必要がないはずです。
大航海時代にもし機械学習があったとすると、天動説がだめだと分かった時点で、「法則がわからないから機械学習で対策だ」ということで、問題が解決してしまったとしたら。。。
永遠に「地動説」は生まれないとしたら。。。
機械学習万能説も、実は、本当の計算式があるはずなのに、それを見つける動機を無くす要因になってしまうかもしれません。
また、機械学習に読み込ませるデータ自体の質も、気を付けないといけません。
収斂進化という言葉は聞いたことがあるでしょうか。
別な動物だけど、進化するなかで、同じような姿・特徴がでてきた生物のことです。
そっくりだけど別の動物! 収斂進化した動物たちのまとめ
たとえば、以下の4つの動物を例に考えてみましょう。
・アナグマ
・タヌキ
・アライグマ
・ハクビシン
このうち、生物の研究で「タヌキ」だけが、まだ研究途中で「アライグマ」と同じと思われていたとしましょう。
・アナグマ
・アライグマ(タヌキ)
・ハクビシン
3種類を識別するための機械学習を開始します。画像は4つの動物で学習させてますが、タヌキをアライグマとして学習させます。
恐らく、アナグマとハクビシンは正解率が高く学習できて問題ないと思いますが、アライグマとタヌキはどうなるでしょう。
なにしろ、違うものと「同じ」として学習させています。
ここでは2つの問題が発生します。
1.正解率が悪い場合
大多数の人はこう考えるでしょう
「学習データが足りない、もしくは良くない。もっとデータを集めないと」
2.正解率が良い場合
大多数の人はこう考えるでしょう
実際はタヌキを「アライグマ」として判別しているので、正確には「誤り」です
本来は「データの中に別なものがあるかもしれないから、データ自体を見直そう」が正しいアプローチですが、これを行うには生物学の知識が必要で、一般の人には対応できません。
タンメイ君が、最後のほうで、レット症候群を患う「ブー」という名の女性について、心音による機械学習で、「ブー」が何を考えているのかを当てようとしている話が出てきます。
唯一母親だけがブーの身振りなどから、彼女の言わんとすることを理解できたからだ。
ということで、正解は母親の言葉のみ。
母親は「ブー」のことをどれほどわかっているのか。もちろん嘘は言わないと思いますが、「ブー」の遠慮や母親の「誤解」で、正解が出せてないケースがないか。。。不安になりました。