生成AIとの付き合い方が変わった話①|「AIとは?」に対する個人的な考え
ChatGPTが2023年の11月にリリースされてから、様々な目に着くところでAIサービスが提供されるようになりました。
Webサービスのようなものからアプリでの活用、AI搭載スマホの登場など、気がついたら私達の生活に欠かせないレベルの技術となっています。
そして、「文章が生成できる!」とか「画像が生成できる!」とか「スライドをAIが作ってくれる!」など。
AIができる事が増え続け、その精度の競い合いになっているようにも感じます。
技術は浸透しなければ、大きな変化には繋がらないので、できることが多いのは良いことです。
また、浸透するには「便利!」とか「楽しい!」というポジティブな印象が必要です。
が、実際に使ってみると、思うような出力を得ることができなかったり。
「できる!」と言われてたことができない、もしくは、求めるクオリティのものではなかったり。
そこから楽しんで使い続けることができれば良いんですが、プロンプトエンジニアリングなどのAIの扱い方も多少勉強が必要だったりします。
そうすると、「なんだできないじゃん」となってしまいやすいかなと。
このように書いている自分自身が、実際にそのように感じたこともあり。
今回の記事を書くことにしました。
ざっくりとしたこの記事の結論を書くと、「AIができることよりも、AIとどう付き合うかの方が大事」ということです。
あくまで、個人での利用という観点で書いて行きますが、自分は特にAI研究者でもAI開発者でもない、単なるAI利用者なので。
軽い気持ちで流し読んでいただければと。
AIの捉え方が変わった一言
この記事のタイトルにしたことですが、自分自身はAIとの付き合い方を変えるきっかけがありました。
それは、AI関連の情報を集めていると必ず名前が上がってくる、東大の松尾教授の一言でした。
「人工知能の研究は、人間の脳の研究である」
どの媒体でこの言葉を聞いたかは覚えてないんですが、この一言が強烈に印象に残り今でもAIを利用する時に思い出すほどです。
冒頭で書いた事ですが、生成AIの便利さを伝えるために、「できる」ことが主に伝えられています。
これは当然なんですが。できることや使う方法を想像させられなければ、利用してもらう、サービスを購入してもらうことはできませんし。
ですが、そうなるとAIが使われていようがいまいが、想像したことが「できる」「ツール」として受け入れてしまうと思います。
「ツール」つまり道具なので、自分の期待通りに使えなければ、「使えない道具」もしくは「使いにくい道具」として二度と使わなくなってしまう可能性があります。
通常の道具であれば、それでも一定程度の成果が出るように、取り扱い説明書が用意されていますが。
AIは広く利用されるようになったとは言え、使い方はまだ人それぞれという感じもします。
なので、自分自身、松尾教授の言葉を聞いた頃には、ChatGPTなどのツールを思い通りに使うことができず、使うことから離れていた時期でした。
思った通りの出力を得られなかったり、同じ出力の繰り返しになったり。
プロンプトエンジニアリングを少し勉強してみても、期待通りの出力にならなかったり。
そんなことを繰り返しているうちに、「面白い」「楽しい」が「めんどくさい」に変わっていた頃です。
ところが、「人間の脳の研究」という言葉と、興味半分で流し読みしていたAIの技術に関する記事に書いてあった情報がリンクし、自分の中でのAIの認識が変わりました。
そもそも、ディープラーニングで利用されるのは、人間の脳の神経回路を模倣して学習するモデルなので、人間の脳の行動を考えるとしっくり来たという感じです。
脳の活動を考えてみる
簡単に書くと。
「人間が生まれながらに持っていて、無意識レベルで行っている脳が関係する活動を再現するための研究がAIの研究であり、それを人間が知覚できるレベルまで技術発展したものが今のAIである。」
という感じです。
ChatGPTなどの言語モデルは、入力に対して関連の強い単語を予測して文章を出力しています。
これは、私達が普段話す時に無意識で言葉や単語を選び、相手に伝わるように話しているのを再現していると言えます。
画面に表示されるような感じでは無いとしても、聞かれた事を理解し、それに対する適切な解答となる単語を思い出して、口にするということを無意識でやっています。
例えば、英会話がわかりやすいかもしれませんが。
英語で考えて話せるようになる前の少し話せるレベルだと。
①英語で聞かれたことを受け止め、頭の中で日本語にする
②解答を日本語で考え、その日本語の意味となる英単語を思い出す
③その英単語が適切に伝わるように、文法に当てはめる
④できた英文を口にする
という流れではないかと。少なくとも、昭和後期生まれの自分は(今では話せませんが)そんな感じでした。
日本語にしても、単語を思い出せないと話が詰まったり、思い出すために「えー」と言って間を繋ぎます。
で、流石に脳が持つ全ての機能を一つのAIで表現することはできないので。(将来はできるかもですが。)
視覚機能っぽい物体認識・物体検出。
言語機能っぽい言語生成。
聴覚の音声認識に発音の音声生成。
というように、機能ごとにAIが研究されているんだと思います。
まぁ一つの機能を実現するのに、様々な要素が絡み合って出来上がっているので。
人間の脳はすごいなと思います。
個人的に導き出した「AIとは?」に対する考え
ここまで書いてきてあれですが、AIの定義を見直してみると。
「推論・判断・認識など、人間と同じ知的な処理能力を持つ機械」と定義されています。
そして、自分が考えて納得したことなのであれですが、人間が無意識で行っている脳の動きがあります。
それらを合わせて、AIによって人間は「第2の脳」を手に入れたと考えるようになりました。
今まで人間が本人の脳でやっていた演算を任せられる外部装置みたいな印象です。
言い換えれば、脳で行っていた作業を役割分担する相手ができたということですが。
先程の英会話の流れで説明すると。
①英語で聞かれたことを受け止め日本語にするのをAIが行う
②解答を日本語で人間がAIに伝えると、AIがその意味となる英単語を探す
③AIその英単語が適切に伝わるように、文法に当てはめる
④AIが英文を出力するので人間が口にするか、AIが音声処理までしてくれる
という感じです。
会話ということで考えれば、人間がすべきことは、聞かれた事に対して返答することです。
それが、言語が変わることで、他の言語に翻訳するというある意味不要な処理をしなければなりませんでした。
そのために、英語をアルファベットから独自の表現まで学び。
口の開き方や舌の使い方を覚え発音を身につけることで、ようやく言語の違う人と会話ができるという状態でした。
勉強することでの達成感や、コミュニケーションを取れたことへの喜びというものはあるかもしれません。
しかし、会話という行動で考えれば、人と人が話すことが目的なので、本来他の言語に翻訳するという活動は不要なものだとも言えます。
人種や国というものを無視するような言い方ですが、会話の目的を達成するための壁で、特殊技能として翻訳が必要だったわけです。
つまり、日本語から英語に変換するという知的な処理は、本来やらなくても良いはずのものであるとも言えます。
でも、実際に言語の違いがある以上、避けて通ることができないので。
その翻訳の処理、または発音に至るまでAIに任せることで、本来集中したい会話の内容を作ることに、人間が集中できるようになるのです。
自分はこのように、人間が本来使いたい(または、使うべき)脳力に集中するために、AIを「第2の脳」として活用するのが、今は良いと思うようになりました。
範囲は拡がるでしょう
この記事を書いている時点でのChatGPTはGPT4というモデルが利用されています。
自分が使い始めた頃は、GPT3というモデルでした。
回答の精度や速さが変わったとは感じますが。
それ以上に、普段の話し言葉に近いプロンプトでも期待する出力をしてくれるように感じ。
より便利になったなぁと実感しています。
私達が普段から物事を考える時は、話し言葉で考えています。
「〇〇だよなぁ〜。ということは✕✕の方が良いよね。でも□□という方法もあるかも?」
という感じです。
なので、AIを相手に考えをまとめていくことが、より自然な脳内で考えていることに近づいていると言えます。
少し前までは、機械的に区切ったりしないと、うまくAIに伝えることはできませんでしたが。
もちろん、今でもプロンプトエンジニアリングの手法は有効に変わりはありません。
が、やはり普段のままの方がノイズが入りにくく、考えもまとまりやすいです。
つまり、プロンプトを考えなければ行けなかった脳力も、AIにある程度任せられるようになったとも言えます。
このように「第2の脳」であるAIも「できる」範囲が拡がり、より「第2の脳」に近づくと思います。
簡単にまとめると
長くなってしまったので、簡単にまとめると。
生成AI(に限らずではあるんですが)の出力は、人間がやる予定だった知的処理をAIが変わりに行ってくれた結果と言えます。
なので、知的処理を人間が行った方が良い(もしくは、人間じゃないとできない)ことと、人間じゃなくても良い(=AIに任せる)ものに分けることが、AIの利活用につながる考え方です。
広告や宣伝の「できる!」に対して、楽しんだり、逆に幻滅したりという。
一時的な感情に振り回されない、これから利活用が進む社会での知恵・・・というより、マインドセットでしょうか。
これが、個人でもAIを自分から効果的に活用していく考え方だと思っています。
また、この記事の中ではChatGPTなどの言語モデルの生成AIを中心に書いてきましたが、他の用途のAIモデルでも同じことが言えます。
そうすると、「人間が力を注ぐべきところはどこなのか?」という疑問が湧いてきますが。
ここらへんで一旦区切り、続きは次回にしようと思います。
これからの社会に必須のAIの知識を身につけるのにG検定はおすすめです
[itemlink post_id="327″]