フィジカルAIが示す人間理解の進化

AIはニューロネットワークを構築することで、急激な進化を遂げました。

このブログでもたびたび取り上げていますが、「人間の脳の仕組みの研究」によってLLMが誕生し生成AIが登場したとも言えます。

生成AIの威力は大きく、「AIを使わない選択肢はない」と言われるまでになりました。

一般的にも利用されるようになる中で、注意として上げられているのが、記号接地問題です。

LLMが生成するものは、あくまで単語の予測であり、その意味を理解しているわけではないという問題です。

それを解消する可能性のある研究が「フィジカルAI」です。

前置き

この記事は、以下の3つのサイトの内容を元に書いていきます。

LLMの“次に来るAI”? NVIDIAが推進する「フィジカルAI」とは何か、識者に聞いた‐ITMediaAI+
AIにおける古い考え方「世界モデル」が再注目されている理由とは?‐GigaZine
OpenAI、AGI競争でロボティクス研究を加速‐WIRED

これらのページに出会ったころ、ちょうど自律神経についての本を読んでいました。

人間が身体を動かすには、何らかの刺激を神経が受け取り、脳がその情報を処理し、反応を選び該当する神経に伝達することによります。

このような神経の働きにより、私たちは現実世界の出来事や物理法則を処理し、それに沿った行動を起こせるわけです。

実際に身体を動かすのは運動神経ですが、内蔵など止まったらまずいものを動かすのが自律神経です。

すごくざっくりですが、私達は脳と神経によって、現実世界で行動を起こし影響を与えているわけです。

「なにを当たり前のことを?」

そのとおりですね。自分も書いていてそう思います。

しかし、冒頭で書いた通りAIの研究は「人間の脳の仕組み」を研究し再現することで現在の進化を経ています。

つまり、私達が無意識で行っている言葉選びを再現したものが、現在のテキスト生成AIなわけです。

物体認識は私達の目と脳の関係であり、それが何であるかをAIは学習により確率の高い方を選択します。

LLMの仕組みを応用することで、画像や動画などテキスト以外も生成できるようになりました。

その結果、破壊的なイノベーションとして利活用が広まっているわけです。

そんなAIの弱点が、高度で複雑なモノを生成できても、AI自身は何を生成しているのかは理解していないということです。

これが、自律思考型のAI(AGI)の開発の壁になっているとされていました。

その壁を破るのが「フィジカルAI」ではないかと言われています。

フィジカルAI

AIが現実世界に影響を及ぼすには、物理世界を理解し、予測し、動作を制御する必要があります。

そのための研究が「フィジカルAI」です。

現実そのものを理解したうえで。

動画生成AIなどの利用によって、1秒後の世界(映像)を予測し。

現実の物理法則に従い動作を制御する。

このような流れとロボットを組み合わせて、現実で動作するAIの構築を目指します。

現在はAIエージェントの構築が主流のようですが、この流れは予測に活用できそうですね。

意思決定するAIと、動画を生成して予測するAI、動作を提案するAIなどを組み合わせるのかなぁとか。

で、実際にAIを積んでいるロボットが、物を運んだり歩いたりするのかと。

そんなことを考えてワクワクしました。

この流れが、人間の脳と神経の仕組みに似ているような気がしたのです。

車の「かもしれない運転」のように、私達は普段の動作から「こうしたらこうなるだろう」のような予測を無意識でしています。

しかも、当然であって逆らうことができないものとして理解している物理法則に従ってです。

先程の「当然のこと」がこれらに当たります。

失敗や間違いを繰り返して、学習し。

動作の精度を高めるのも私達人間です。

AIは現実世界で行うと破壊的な問題を引き起こす可能性があるので、シミュレーションで学習するわけですが。

それが、「世界モデル」というもので、現実世界の因果関係を学び内的に再現して学習を行うAIです。

このように、AIが現実世界を感じ取り、自らの動きを予測・調整する働きが。

私達が無意識で行っている、五感から得た外部の情報を脳が処理し、信号を神経で伝達することで身体を動かすことに似ているなぁと思い。

今度はそこらへんの無意識の研究なのかなぁとか。

そんなことを考えていたら、更に人間の理解が進むような気がしてきました。

人間の「動作」を変えるかも

正直、フィジカルAIについての記事を書くかは迷いました。

自分は研究者ではないので、その情報を楽しんだり考えたりするぐらいしかできないからです。

知識の浅い状態で書いても良いものか⋯と。

しかし、生成AIの登場によって仕事の質が変わった(または変わる)のは事実です。

以前に書いた記事のように、思考の代替により脳が拡張され、本来集中すべきことに脳のリソースを割くことができるようになり。

それが、人間として本来取り組むことです。

つまり生成AIでこれだけの衝撃があるのであれば、フィジカルAIの衝撃はそれを超える可能性があります。

AIが現実に影響を及ぼすことで、「動く」という事自体を考え直し、再定義しないといけないかもしれないからです。

思考や業務手順といったもので、すでにAI前提の流れになっている中で。

今度は「考える」「作成する」に加えて「動かす」というものが加わります。

ある意味では身体を拡張できるようになるかもしれないのです。

フィジカルAIに近い部分だと、自動運転が実現すれば人間として良い生活リズムを保ちながら、移動することができるでしょう。

何らかの製造に係る部分であれば、神経をすり減らしていた作業を代替させることができるかもしれません。

そのような、動作を変える可能性があるのです。

ある意味では今のうちにAIとの協働を当たり前にし、フィジカルAIの導入も当たり前にできるように「予測」しておかないと行けないかもですね。

そのようにして、今度は私達が当たり前にしている「行動」について理解を深める必要があるかもしれません。

そういった意味では、心理学や精神医学、行動経済学や社会学といった人文系の学問の重要性が高まるのかなとか思ったりします。

まずはAIの利活用から

すごく浅くて申し訳ないですが、フィジカルAIについてのポエムでした。

AIが現実世界において行動することで、どのようなことが起きるのか。

期待と不安⋯というのが正直なところではありますが、期待の方が大きいですかね。

そして、人間の行動⋯というか、人間の魅力をしっかりと理解するタイミングが近づいているのかもしれません。

さらに日本の強みが活かせる分野でもあるようなので。

それについては、また今度書いてみようかと思います。

このブログや記事の内容について、疑問に思っている事はありますか?

もしあれば、どんなことでも構いませんので、コメントを残していただくか、問い合わせフォームよりご連絡ください。

著者プロフィール
ぽんぞう@勉強中

はじめまして、「ぽんぞう@勉強中」です。
小企業に一人情報部員として働いている40代のおじさんです。IT技術での課題解決を仕事にしていますが、それだけでは解決できない問題にも直面。テクノロジーと心の両面から寄り添えるブログでありたいと、日々運営しています。詳しくはプロフィールページへ!