新たな可能性を開く、ChatGPTに代表される生成AI
ChatGPTが世界中で注目のまとだ。日本でもニュースなどでたくさん取り上げられているので、ほとんどの人は知っていると思うが、米国での状況を含め、私のコメントも加えて、今回は書いてみたい。ChatGPTは自然言語で質問に答えてくれるので、まず、「ChatGPTとは、どんなものか?」と聞いてみよう。返ってきたのは、以下のとおり。
「ChatGPTとは、OpenAIによって開発された自然言語処理の技術であり、巨大なデータセットを学習して人間のように自然な言語でコミュニケーションを行うことができるコンピュータープログラムです。
ChatGPTは、深層学習アルゴリズムであるTransformerを基盤としており、数千万の文書やWebページから学習された巨大なニューラルネットワークを使用して、人間のような自然な対話を生成することができます。ChatGPTは、独自の文章を生成することもできますが、主にユーザーとの自然な対話を行うことができることが特徴です。
ChatGPTは、様々な分野で活用されています。例えば、カスタマーサポート、教育、健康管理、テキスト生成、音声認識などがあります。ChatGPTは、人工知能や機械学習の分野で最も進んだ技術の1つであり、今後ますます多くの分野での応用が期待されています。
ただし、ChatGPTは完璧ではありません。たとえば、情報の信頼性が低い場合や、適切な文脈に基づいた回答が必要な場合には限界があります。また、ChatGPTは、プログラム自身によって制御されているため、意図しない行動を示すことがあります。したがって、ChatGPTを使用する際には、慎重かつ適切な注意を払う必要があります。
総じて、ChatGPTは、人間との自然な対話を行うことができる技術であり、様々な分野での応用が期待されている最先端の自然言語処理技術の1つです。」
と、こんな感じで質問に答えてくれる。質問の続きをすると、それに対しても前のやり取りを記憶していて、答えてくれる。質問に答えるだけでなく、テーマを与えれば、文章を作ってくれたり、詩を書いてくれたりもする。AIの中の、Generative
AI(生成AI)と呼ばれる種類のものだ。もともと英語用に作られているので、英語対応が一番得意だが、日本語を含め、すでに70の言語をサポートしており、さらに増えているとのことだ(ChatGPTからの返事による)。
ChatGPTは、米国サンフランシスコにあるOpenAIという、もともとは2015年に設立された非営利団体(Nonprofit
organization)が開発したものだが、2019年に営利目的の会社に変わり、その後Microsoftを含め、ベンチャーキャピタルなどから出資を受け、昨年11月末に一般ユーザーに公開された。そして、あっという間に人々に使われ始め、ユーザー数は、最短記録で1億人に達した。一般公開と言っても、まだ研究開発中ということで、エラーがあるかもしれない、フィードバックがほしい、と注意書きがあり、いわゆるベータ版の扱いだ。
それにしても、使ってみると、とても便利だ。もちろん間違いや返事に時間が多少かかるなど、いろいろな問題も発生しているが、これはベータ版なので、仕方ない。ここ数年、ブロックチェーンやメタバースなど、大きな話題になるものが出てきているが、私は、今回のChatGPTに代表される生成AIの到来は、これらのものよりも、もっと世の中にインパクトの大きなものと感じている。ブロックチェーンやメタバースも、今後それなりに伸びてくる分野だと思うが、その使われる範囲は、少なくともしばらくの間は、ある程度限られた分野になるように思うが、生成AIは、最初からかなり広い分野での活用が予想できる。生成AIを使ったものとしては、文章作成だけでなく、イラストなど、画像を作るものもある。OpenAIでもイラストレーションを作るDALL-E2というシステムをすでに公開している。
新しい技術が世の中に出てきたとき、多くの場合、まず大きな騒ぎが起き、その技術によって世の中が大きく変わるという話が出て、その後しばらくすると課題や、実現に時間がかかるということがわかり、いわゆるハイプカーブを描いて騒ぎがおさまり、ある程度落ち着いた発展段階に進む。今回の場合、いくつかの課題が早々に言われだし、むしろそれを織り込みながら、早い時期から大きな発展をするように感じる。私は、新しい技術に対して世の中が大きく騒ぐとき、どちらかというと冷静に見ている傾向が強いが、今回の生成AIは、冷静な目で見ても、大きく世の中に影響を及ぼすものと感じる。
いくつかすでに出てきている課題についてみてみよう。まず、ChatGPTに質問してみたが、答が間違っていることがある、という問題は、扱うデータの量と質にかかわる問題で、今後データが整って行けば解決されていく問題も多い。ただし、使っている技術(large language
model)の性格上、100%正確な答が返ってこない可能性は残る。しかし、これはこのツールをどう使うかによってかなり解決できるもので、要は何も知らないことについて質問した場合には、答が合っているかどうかわからない不安があるが、その分野に知識をもった人が、アイディアや知らないことを発見するための「助言」として使えば、生産性を大きく上げるツールとして、今でも使うことができる。文章作成で言えば、ChatGPTにドラフトを書いてもらい、それをベースに必要な修正を人間が加える、ということで、かなり生産性が向上する。
誤回答の問題があるため、ChatGPTのようなものがサーチエンジンにすぐにとってかわる、という話には簡単になりそうにない。実際、Googleは何年も前から同様の技術を研究開発しており、2021年にはそのデモを見せていたが、OpenAIに先を越され、あわてて自社で研究開発している生成AI技術を使った自然言語によるサーチを行うBardをこの2月に発表したが、そのデモで間違った答が出てきてしまい、株価が7%低下してしまった。Microsoftは、自社のサーチエンジンBingにOpenAIの技術を搭載したものを発表し、限られたユーザーに提供を始めたが、こちらも間違った答や、おかしな返事が返ってくるなどの問題が出てしまった。サーチエンジンに、この技術が本格的に使われるまでには、しばらく時間がかかりそうだが、Googleが90%以上を占めるサーチエンジン市場に、今後変化が起こる可能性はある。
次の課題は、このシステムが大量のコンピューティング・パワーを必要としている点だ。具体的には、1つの質問に対してキーワード・サーチをかける場合に比べ、7倍程度かかるという。これは、より安価で高速なコンピュータ(またはソフトウェアの改良)による解決とともに、ビジネスとして成立させるためには、これまでのサーチエンジンのような無料広告モデルではなく、有料モデルにする必要性が出てくると予想される。実際、ChatGPTはすでに月$20のChatGPT
Plusを発表し、混雑時でもより早く応答できるサービスの提供を始めている。
3つ目の課題は、生成AIが作った文章などは、誰のものか、という問題だ。オリジナルのものに似たものを生成AIに作られた場合、著作権問題に発展する可能性もあり、実際、そのような訴訟も始まっている。また、学校でエッセイを書く宿題に、ChatGPTで書いてもらったものを提出された場合、採点する側で判断できるかという問題も出ている。OpenAIも、それを判別するソフトウェアを提供しているが、まだ精度は高くない。このため、米国のニューヨークを含むいくつかの学区では、ChatGPTを当面使用禁止にしている。このあたりは、法律的、倫理的な問題がからみ、社会としてどのように対応するかの検討が早急に必要となる。
4つ目の課題は、使うデータによって、回答が間違っている可能性だけでなく、思想などに偏りが起こる可能性があること、また、偏った思想や間違った情報を与えて、人々をその方向に扇動するように使われる可能性がある点だ。また、生成AIの技術を使うことにより、悪意のあるソフトウェアを安易に開発できる可能性も指摘されている。これらは、生成AIに限らず、AI技術全般に潜む、以前からある問題で、AIを使う場合、そしてAIから出た結果を評価する場合の問題として、引き続き対応が迫られている。
生成AIには、いろいろな課題もあるが、すでに見えている課題も多く、それを理解しながら、どれだけ有効に使えるかが、個人そして企業の生産性向上に、大きく影響する。また、OpenAIは、この技術をAPI(Application Programming
Interface)として他社に提供する予定とのことなので、この技術を使いながら、特定な分野での文章作成などをするツールが、次々と出てくると予想される。今後、生成AI技術の進化とともに、新たなビジネスが、いくつも出てくると期待される。
黒田 豊
2023年3月
ご感想をお待ちしています。送り先はここ。