GPT-4o(オムニ)を使って約1週間。感じたことをまとめてみました(5月20日更新)

ネット店長育成塾 塾長の高林努です。2024年5月14日からChatGPTの最新版「GPT-4o」が発表され、早速利用可能になりました。ちなみに4oの「o(オー)」は「すべて」「全方位」を意味するオムニの頭文字をとったものです。現時点ではフォーオーっていう人が多い感じです。

約1週間GPT-4oを使ったり、世の中のyoutubeや執筆記事など読ませて頂いた、自分なりの感想をまとめてみました。何が変わったか?イメージでいうと

「本ばかり読むで学ぶぽっちゃり寡黙なおじさんが、スマホやヘッドホンからも学ぶスリムで感情表現豊かなビジネスパーソンに変化した」

感じです。上記画像はGPT-4oの画像生成を使って表現してみましたがいかがでしょうか?

GPT-4oは、有料版で使えます(無料版でも使えますが…詳細は後述)。OpenAI社が発表当日に話していたすべての機能が使えるようになった風に見えますが、実は、まだ一部しか実装されていないようです。これは世の中での利用状況を踏まえつつ、徐々に人々が慣れていくのを見つつ浸透させていく意味合いがあると言われています。

GPT-4oにはたくさんの機能強化が発表されていますが、私なりに、主に把握しておきたい5つの視点を極力専門用語を使わずにまとめてみました。

GPT-4oの特筆すべき5つの特徴

  1. 圧倒的に処理速度が速くなった。プログラムが軽くなり、スリムになった。電気代も大幅に節約できる(はず)
  2. 画像、音声、テキストを総合的に覚えて回答するようになった。これまでは画像や音声も一度テキストに変換して覚えていたが、これからは見たまま、聞こえたまま覚えるようになった。人間の脳に似た覚え方をするようになった。
  3. 感情表現ができるようになった。音声や映像データを覚えるようになった結果、感情の起伏や抑揚なども表現できるようになった。
  4. スマホアプリが充実する。速度が向上し、人間的な覚え方ができ、その結果感情も表現できるようになったので、より対話が充実するようになった。
  5. 無料版でもGPT-4oが使える。つまり、最上位版をお試し体験できるようになった。GPT-3.5だと「なーんだ、こんなもんか…」となるかもしれない。それを避けるためのプロモーション戦略ではないだろうか。

ただし今のところ、感情表現は未実装、アプリでの音声対話も未実装な感じです。無料版でログインしてもGPT-4oが使える人と使えない人がいるようです。私も新しいアカウントを作ってみましたがGPT-3.5しか使えなかったです。

あとはGPT-4oを実装以後、画面デザインや使い勝手が若干違っているようです。私も整理しきれていないところが多々あるので、もう少し使い込んでまたアップデートしていきます。

ところで、どの生成系AIが良いの?ChatGPTとGemini どれがいいの?

よく聞かれるのが「様々な生成系AIサービスがあるがどれが良いの?」という質問です。特にChatGPTとGeminiはどっちが良いの?と聞かれます。正直、私たちのような通常の利用者であれば、どれでもよいと思います。

生成系AIは私たちにとって「心強い部下」であることは、ChatGPTでもGeminiでもMicrosoftのCopilotでも変わらないと思います。若干それぞれの回答結果に癖やこだわりがあると思いますが、どの部下たちもちゃんと作業指示をすれば70-80%程度の回答結果は確実に出してくれます。私はChatGPTから使いだしたこともあるので、ChatGPTを業務で多く使っているのは事実です。ただし、ChatGPTがサービス停止しているときとか、反応がちょっとおかしい時はGeminiやCopilotも使います。作業指示内容はそれほど変えていないですが、十分に良い回答をしてくれます。

その上で、自分なりの解釈を加えるとGeminiを提供しているGoogle社はAndroidというデバイスを保有しています。その上でGoogleは検索サービス、YouTubeなどの動画データ、さらにはアナリティクスやサーチコンソールなどのWebサイトの行動データなども大量に保有しています。Gmailなども圧倒的な利用者数を誇ります。ブラウザもChromeが全世界でも圧倒的なシェアです。それを考えると、Google社が今後、生活者にとって使いやすいサービスを実現しやすい環境であるとは思います。

他方、ChatGPTを提供しているOpenAIは、Googleと比較されると弱みは十分に理解しており、デバイスやサービスを持っている企業、MicrosoftやAppleとも連携を強化する流れだと思います。

一つの企業が全部のサービスを保有することがオープン化される社会において本当に強いのか?と言われると疑問点もありますが、日本国内においては、Geminiの方がいろいろなサービスで今後優位になっていくのかも?と思っています。しかし、繰り返しますが、ネットショップ運営で使う位の範囲では、どれも同じだと思っています。

だったら私は昔から使っているChatGPTを主軸に使っていこうと思っているという話です。


そして、先週アップした以下のスマホアプリを使った動画は、実はまだGPT-4oの機能ではなかったのです。間違った情報を提供してしまい大変申し訳ありませんでした。

しかし、これはこれでChatGPTの音声利用においてとても参考になる動画だと思うのでそのまま残しておきます。繰り返しますがGPT-4の機能ままの状態で撮影したものになりますのでご注意ください。サービスがバージョンアップされてGPT-4oの機能になったらまた同じような動画を作ってアップしたいと思います。

画像をどこまで理解するか?試してみた動画

自宅の部屋で撮影した顔写真をアップロードしてみました。ChatGPTは顔の表情だけでなく、映り込んだエアコンなどの細かい部分も認識しました。また、映った人の国籍など倫理的に敏感な質問に対しては「回答しない」など人として適切に対応しており、高い倫理観を持っていることがわかりました。

顔画像を読み込んでどれくらい画像解釈しているか?対話してみる(GPT-4oの機能未実装状態で撮影)

ChatGPTを英語の先生役として試してみた動画

私の英語力(英検3級レベル)でも、非常に親切で優しい英語の先生としてサポートしてくれました。英語の勉強をもっと頑張ろうと思いました。Do you have a pet?が聞き取れない私がちょっと情けないですが…汗 ぜひ笑覧ください。

小学生レベルの英語力の私の英会話の先生になってもらう (注意:GPT-4oの機能未実装状態で撮影)

今後もどんどん使っていきます。情報発信もしていきます。

GPT-4oの登場により、AI技術はますます進化し、私の生活やビジネスの中でその存在感を増しています。新しい機能や強化された性能により、より多様な場面で活用できるようになります。もっと多くの人が生成系AIを使ってほしいと感じていますが、なかなか利用されないのはなぜだろうといつも不思議に思います。

生成系AI自体の選択肢が増え、それぞれに独自の強みがありますが、自分の用途やニーズに最適なツールを選ぶことが重要です。私は引き続きChatGPTを主軸に使いつつ、他のAIツールも適宜活用していく予定です。

AI技術の進化はまだ始まったばかりと言われています。今後も新しい機能やサービスの登場に注目し、その進化を楽しみながら使っていきたいと思います。

皆さんもぜひ、自分に合ったAIツールを見つけて、日常や仕事に役立ててほしいです。

ChatGPTに関する使い方の基本や考え方、講演実施レポートなど、ネット店長育成塾の塾長高林努がChatGPTに携わっていることを色々と執筆していますのでぜひほか記事もごらんください。

この記事を書いた人

高林 努

東京でネットビジネスに約20年従事。
IMJグループ、電通レイザーフィッシュ、クラウドワークスでは、大手企業のインターネットビジネスの事業立案から実践構築までを担当。
2017年「地元鳥取を元気にしたい!」という思いから、(株)ダブルノットを設立。
地域を越えて日本全国に商品をアピールする“地産外商”を掲げ、ネット店長の育成に尽力。鳥取県八頭町、兵庫県豊岡市でデジタル人材育成を実施中!