「Chat GPT」 から 「Chat GPT-4」へ

GPT-4とGPT-3.5の違い

OpneAIという会社が開発し、2022年11月に発表した自然言語AIモデル「Chat GPT」には、GPT-3.5という機能が搭載さています。
そのGPT-3.5がGPT-4へとバージョンアップされた「Chat GPT-4」が、2023年3月にはやくもリリースされました。

噂されていたいくつかの機能は実現されていませんが、GPT-3.5に比べ大幅に改善されています。

創造性

GPT-4がGPT-3.5より明らかに優れている点の一つに、入力した ※プロンプト に対し、より創造的な応答が可能になった点です。
GPT-3.5でも従来の技術からしてみれば非常に創造的でしたが、GPT-4ではさらにそのレベルが向上しています。

※プロンプトとはここではChatGPTに入力する文字(質問)のことになります。


【ChatGPT】AI活用に必須の「プロンプト」って何?例文付きで徹底解説! | PROMPTY (bocek.co.jp)

与えたプロンプトに対してより高度なレベルの創造性が求められると、GPT-3.5に比べGPT-4のほうが明らかに優れた結果を返します。
具体的には、2つの言語をミックスさせて文章を出力させたい場合、GPT-4ではミックスできますが、GPT3.5では一行を一つの言語で出力し、次の行をもう一つの言語で出力する、といった結果になります。

画像入力(ビジュアル入力)

GPT3.5ではテキストでのプロンプトしが受け付けていませんでしたが、GPT-4では画像入力もできるようになりました。
手書きの数式がら4K画像まで、ほぼどんな画像でも解析し、説明を返してくれます。
自然言語モデルでもあり、画像認識モデルでもあります。
一例ですが、作りたいホームページ、ブログなどのWEBサイトを手書きのラフで作成し、そのラフをiPhoneで撮影したものを
GPT-4に入力したところ、画像と一致するウェブサイトを作るためのプログラミングコードを生成したのです。

安全性

より安全な応答をするようにGPT-3.5からの改善点があります。
GPT-3.5ではユーザーの操作や質問を解析し、不具合を見つけ出し、修正を試みるという、
安全対策の一部をあとから付け足しているような状態でした。
GPT-4では、既に多くの安全対策が初めから実装されています。
OpneAIによるGPT-4のテクニカルレポートでは、GPT-3.5が有害な回答を生成する確率は6.48%であるのに対し、GPT-4では0.73%まで減少しています。

信頼性

GPT-3.5の欠点の一つに、不正確な情報を生成することがあります。AI技術の専門用語で「ハルシエーション」と呼ばれる
AIが幻覚をみているような状態で、生成する情報が信頼性に欠けていることがありました。GPT-4でもハルシエーションはおこりえますが、
GPT3.5にくらべて19%から29%低くなりました。これは、格段に回答の正確さが増したといえます。

コンテキスト・ウィンドウとコンテキスト・サイズ

コンテキスト・ウィンドウとは、Chat GPTとのやり取りの中で、どれだけ多くのデータを、どれだけの長さでメモリーに保持できるかということです。
GPT-4では入力したプロンプトにの指示を、より長い時間、より正確に記憶できるようになりました。
GPT-3.5ではやりとりが進むにつれて本題から逸れたり、意味不明な回答を生成することもありましたが、このコンテキスと・ウィンドウが改善されたため、問題が軽減されました。
GPT-3.5では約5,000文字の処理性能だったのに対し、GPT-4では約25,000文字を処理できるようになっており、 したがって、GPT-4では長いコンテンツの作成や文書分析ができるように進化しています。

今後の展望

「GPT-4」は2023年4月現在、月額課金サービス「ChatGPT Plus」のユーザーのみ「GPT-4」を選択できます。
通常の会話ではそこまで違いが見受けられませんが、試験問題やベンチマークテストにおいて、従来のモデルよりも高い成績を収めています。模擬司法試験では、受験者上位10%の成績を記録しました。

GPT-4がGPT-3.5に比べ飛躍的に性能が向上しているのは間違いありません。
今後は今以上に経済や産業に影響を与えていくことは、容易に想像できます。