2024年5月13日にCPT-4oが公開されました。
「人間の会話と同じ速度で実行できる」と言われており、精度も大幅にアップしていると言われています。
弊社スタッフも試してみたところ、凄まじい速度で答えが返ってきてくることを確認できました!
画像認識の精度も上がったことで
・画像の文字起こし
・制作物のテストやエラーチェック
・コーディングの高速化
など、さまざまな活用方法を模索しています。
今回は、試していた中で、GPT3.5から特に変わったと思う部分を紹介したいと思います!
1.比較的新しい情報に対する回答
GPT-3.5の場合
GPT-3.5は「2022年1月」までの情報を学習しているようです。
そのため、それ以降の情報には答えてくれません。
Llamaについて聞いてみても、そっけない態度で返されてしまいました…
GPT-4oの場合
GPT-4oは「2023年10月」までの情報を学習しているようです。
Llamaについて聞いてみると、
こちらでは前提条件・手順から解説してくれています。
2022年以降に出てきた情報について調べる場合には、GPT-4oの利用を検討してみると良いかもしれません。
2.テキスト付画像の生成
既存の画像をベースに、テキスト付の画像を作ってもらいます。
【プロンプト】
【画像】
なお、GPT-3.5は画像の取り込み・生成ができないため、Copilotと比較してみました。
Copilotの場合
文字は出力してくれましたが、元のイラストとは大分異なっている印象です。
GPT-4oの場合
髪の毛や服の色が多少変わっていたりしますが、ある程度は元の人物の特徴を捉えていそうな気はします。
文字については「change」のスペルが間違っていますね。
とは言え、プロンプトを調整すればもっと良くなりそうです。
なお、ダウンロードした画像ファイル名に画像生成のプロンプトが記載されており、
「A cute anime-style girl with gray cat ears and long gray hair, wearing a white blouse with frills and a black bow, and a black skirt」となっていたので、
アップロードした画像から、画像生成プロンプトを再生成しているのかもしれません。
※なお、日本語での生成も試してみましたがうまくいきませんでした。
プロンプトを無視することも何度かあったため、
画像を作成するという目的では、画像生成AIであるMidjourneyに分があると言えるかもしれません。
無料で使う方法
無料でGPT-4oを使用する方法ですが、
実は何も設定しなくても自動的にGPT-4oで回答してくれるようになっており、
一定回数を使用すると、GPT-3.5での回答に変更されるという感じになっています。
では、回答内容がGPT-4oになっているのかを確認する方法ですが、
回答文の右下のアイコンをクリックします。
GPT-4oにチェックが付いていれば、GPT-4oが使用できているという事になります。
一定回数を超えると、下記画像のように通知が来るようになっており、
その時間まではGPT-3.5で回答されるようになっています。
何度も利用したい、という方はプラン変更を検討しましょう!