最近はすでに定着してきた感のある人口知能(AI)ですが、定着を進めてきたのはOpenAI(オープンエーアイ)の開発・発表したChatGPTです。
OpenAI(オープンエーアイ)は、アメリカ合衆国の人工知能(AI)の研究・開発・普及を目的として活動している非営利団体とその子会社である営利法人から構成される企業です。
ChatGPTはその名が示すとおり、対話型のチャットポッド(身近で言うとLiNEのようなものです。)として作られており、プロンプトとよばれる入力(質問)に対して回答をAIがします。
AIといってもよくできており、いままでのものとは数段の差がありました。間違った答えに間違っていると指摘すると修正して答えてくれます。
この記事ではChatGPTの基盤のGPT-4というバージョンについて解説していきます。
ChatGPTのGPT-4とは?
GPT-4の-4はバージョンを表します。最初に公開されたChatGPTではGPT-3.5となってますが、公開時にすでに-3.5ですから公開されていないバージョンが存在するということです。
では、GPTというのは何を表すのでしょうか?GPTは3つの単語の頭文字をとっています。それはGenerative・Pretrained Transformerです。それぞれの意味は:
-
- Generative 生成するという意味で、GPTは素晴らしい文章の作成能力を持っています。
- Pretrained 学習されたモデルという意味です。AIは機械学習やその他の方法でトレーニングということを行いますが、その結果として訓練されたモデルというものが出来上がります。
- Transformer GPTはTransformerというアーキテクチャを採用しています。Transformerは、自然言語処理において革命的な進歩をもたらしたニューラルネットワークのモデルです。
※ニューラルネットワークとは人間の脳神経ニューロンを数理モデルにしたものです。
簡単に言うとよく訓練されたTransformerというアーキテクチャを持つ人工知能で、文章を解析したり生成したりできます。
実はGPTと呼ばれるものが本体で。それをチャットの形で誰でも簡単に使えるようにしたものがChatGPTです。GPT-4を使うには有料版のChatGPT Plusに加入することが必要です。
ここではその一番上位のバージョンであるGPT-4について、料金も含めて解説していかます。
※最上位のバージョンのGPT-4 truboが先日発表されていますが、GPT-4についての知識があればGPT-4 truboも同じようなものです。ちなみに今のChatGPTはGPT-3.5 turboを通常使用しています。
GPT-4とGPT-3.5の違い
GPT-3.5 | GPT-4 | |
パラメータ数 | 13.5B | 200B+ |
トークン数 | 2048 | 4096 |
モデルサイズ | 3.3 GB | TBA |
学習データ | インターネット全体 | TBA |
ファインチューニング | 非常に高速 | より高速 |
出力の品質 | 非常に高い | より高速 |
応答時間 | 早い | より早い |
GPT-4はGPT-3.5に比べ効率的なアルゴリズムを採用し、機能性や処理能力が向上しました。これにより、より高度なタスクを処理できるようになります。
また、マルチモーダルと言って画像入力にも対応しております。
マルチモーダルは、テキスト入力だけでなく画像を入力することができて画像解析をおこなって回答を得ることができます。
ここでは、その他のGPT-4の新機能の対応について解説していきます。
テキストだけでなく画像も活用できる
先程も解説しましたが、GPT-4では入力にテキスト以外に画像をプロンプトに入力できるようになりました。
また、テキストから画像を生成することもできます。
例えば、「海に佇む美少女」の絵をくださいと入力すると海に佇む美少女の絵(写真の場合あり)を表示します。
これはGPT-4が画像生成のツールDELL-E3を使って、作成をしています。
このツールは、テキストから画像を自動生成することができます。
DELL-E3は、成人向けや暴力的なコンテンツの生成を抑制して、著作侵害を受けないための対策もほどこされています。
さらにGPT-4Vというツールも存在します、このツールは音声分析や画像認識・画像変換などの機能があります。
DELL-E3は画像生成に、GPT-4vは画像入力の分析に使われます。
通常、GPT-4をChatGPT plusから使うと、これらのツールが自動で使用されて画像生成や画像入力の分析を行います。
5,000文字から最大25,000文字の長文に対応
GPT-3.5は数百文字のテキスト処理の対応していましたが、GPT-4は5,000文字から最大25,000文字の長文に入力(質問)も出力(回答)も対応できます。
このことによって、GPT-4を使う人はより複雑で広い範囲の質問ができて、GPT-4はその複雑で広い範囲の質問を理解しより精度が高く、関連性も高い回答を生成します。
例えば、工学、医学、法律などの専門的な分野において詳細な質問ができますし、その質問に対して包括的な回答を得ることができます。
さらに、長編の物語や誌、脚本などを1度で生成することもできてクリエイティブなプロセスを支援します。
また、教育の分野でも、学生や研究生がレポートや論文を書く際にGPT-4が提供するアイデアや情報を参考にすることもできます。
長文対応によって、GPT-4の活用範囲がひろがり、より多くでの分野で使用されることが予測されます。
「ハルシネーション」が大幅に低減
ハルシネーションとは、AIが事実とはことなる情報を生成することを示します。
あたかもAIが、幻覚をみているのではないのかということでこの言葉を使います。
長く使っていると勘違いしてしまいますが、AIはあくまでも自分で考えて回答してるわけでなく、プログラミングされたアーキテクチャ(仕組み)によって、大量のデータから回答を作り出します。
AIにデータを与えて、回答をより精度の高いものにすることを学習するといいますが、この学習が多いほどハルシネーションは減ります。
GPT-3.5よりもGPT-4は発表されたのが新しいので、データがより多くなってますし、回答を作り出すアーキテクチャ(仕組み)が新しくなっています。
そのことによって、GPT-4はGPT-3.5よりもかなりハルシネーションが起こる頻度が減っています。
※2024/4月の時点でさらに精度の高いGPT-4 turboが発表されています。
日本語で高い精度での回答が可能になった
前節でも説明しましたが、AIはデータを大量に学習(トレーニング)することで精度が上がります。
GPT-4は、GPT-3.5に比べてデータ量が大幅に増加し、文化的背景を持つテキストや多様な言語から学習をしています。
特に日本語においては表現の微妙さや文法的な複雑さを理解して、それに適切に対応する能力が強化されました。
この進化は、日本語の自然なニュアンスを捉え、さらに人間らしい対話を実現しています。
GPT-4は、日本語の丁寧語や敬語、さらには俗語や方言まで、幅広い表現に対応して、文脈に応じた適切な言葉遣いを選択することができます。
このことによって、GPT-4を使う人は自分の意図をGPT-4へ正確に伝えることができ、GPT-4からの回答も自分の期待に沿ったものを得ることができるようになりました。
プログラミングのコードや論理的な文章の生成が正確になった
GPT-4は、GPT-3.5よりも対応するプログラミング言語が増えて、さらに精度の高いコード(プログラミングされたテキスト)を回答します。
対応する言語は、Python、JavaScript、Ruby、Goなどです。
例えば、「Pythonで、リスト内のすべての偶数を合計する関数を作成してください。リストはユーザーからの入力を受け取り、合計値を出力する必要があります。」と質問します。
そうすると、次の回答を得られます。
def sum_even_numbers
(number_list):
# Calculate the
sum of even numbers
in the list
return sum(number for
number in number_list if
number % 2 == 0)
# Example usage:
# Assuming we have
a list of numbers
numbers = [1, 2, 3, 4,
5, 6, 7, 8, 9, 10]
# Call the function
and print the result
print(f"The sum of
even numbers
in the list is:
{sum_even_numbers
(numbers)}"
このようにコードを回答してくれますが、このコードか実行してみて正しく動くかどうかは検証が必要となります。
更に前節までに説明しましたが、長文の対応やアーキテクチャの進化によって、より論理性の高い一貫性の高い文章の回答が得られるようになってます。
このことにより、教育やビジネスにおいての文章の作成において、効率や品質の向上をもたらしています。
料金
下記の表は料金の比較になります。GPT-4を使うにはChatGPT Plusを使う必要があります。
ChatGPT(GPT-3.5) | ChatGPT Plus(GPT-4・GPT-4turbo) | COPILOT(GPT-4) | POE(GPT-4) | |
料金 | 無料 | 月 20ドル | 無料 | 無料 |
制限 | 無し | 3時間ごとに40回 | 1日で300回 | 1日に1回 |
他のAIも使用できる | × | × | × | 〇 |
COPILOTは、Microsoftの提供してるアプリで、最新のBing AIとなるAIチャットです。
POEはQuora(クオーラ)という会社が提供しているAIアプリです。
他にも海外では、無料でGPT-4を使えるチャットやアプリがありますが、突然に終了したり危険性もあるのでここでは紹介しません。
また、ある特定の期間だけ、日本のチャットやアプリでもGPT-4を無料で使える場合サービスをおこなっていることもありますが、不定期なのでここでは紹介できません。
さらに、GPT-4のAPIを使うには、別に課金があります。
※APIについては後ほど説明しますが、他のアプリ(ソフトウェア)からGPT-4を利用できるようにする仕組みです。
この場合は1000トークンにつきいくらという金額が決まっています。
GPT-4 API | 32k GPT-4 API | GPT-4 turbo API | |
料金 | 入力 $0.03/1000 出力 $0.06/1000 | 入力 $0.06/1000 出力 $0.12/1000 | 入力 $0.01/1000 出力 $0.03/1000 |
トークンの長さ | 最大8000 | 最大32000 | 最大128,000 |
1トークンは1文字のことなのですが、英語の1文字なので日本語の1文字では2〜3トークンと数えられます。
日本語で「本日の天気はどうですか?」と質問して、GPT-4が「晴れです」と答えると次の計算になります。
仮に日本語を2.5トークンと仮定する場合
入力は12文字なので、12×2.5トークン=30トークン
出力は4文字なので4×2.5トークン=10トークン
1トークンにつきいくらという計算なので、日本語の場合は文字数=トークンとはならないということです。
以上のことより先程の日本語の例では
入力に、30×(0.03/1000)=$0.0009
出力に、10×(0.06/1000)=$0.0006
になり、合計で$0.0015の課金がされるということです。
なお、GPT-4 APIでは、使用する登録をしてから5ドル分だけ無料で使えるという特典があります。(2024/4時点)
※以前は、18ドルでした。
GPT-4 APIの利用手順
まず初めにAPIとは何かを説明します。APIはアプリケーション・プログラミング・インターフェースの略です。
アプリケーションはパソコン・スマホで動作するソフトウェアのことですが、APIはアプリケーションまたはソフトウェアの間でやり取りをする場合の窓口になります。
アプリケーションを開発する際に、別のアプリケーションとやり取りする時にAPIを使ってプログラミングを行います。
つまりはGPT-4を自社のアプリケーションで使用するためには、GPT-4のAPIを使うということです。
APIを使うには、まずAPIキーというものが必要です。ここではそのやり方を解説します。
OpenAIアカウントの作成
ChatGPTやChatGPT plus、またはAPIを利用する時には、OpenAIのアカウントを登録して利用できるようにします。
これはまず最初に必要な重要なことです。
OpenAIのアカウントを作成するには2つの方法があります。ChatGPTのページかOpenAIのプラットホームページかどちらからでも登録ができます。そのまますぐにAPIキーを取得する場合は、OpenAIのページから始める。ChatGPTを使ってみたいならChatGPTのページから登録しましょう。
****ChatGPTのページから登録する*****
1.まずはメールアドレスと携帯の電話番号を用意します。
2.ChatGPTの登録ページ
を開きます。
3.右上にある「TRY CHATGPT」ボタンを押下(マウスでクリック)します。
4.左下にある「Sign up」ボタンを押下(マウスでクリック)します。
5.メールアドレスとパスワードを入れて、登録します。
6.登録したメールアドレスに、確認メールが届きます。メールアドレスに記載のURLをクリックして有効化します。
7.氏名・生年月日を登録します。
8.携帯の電話番号を登録して、認証コードを送信します。
9.携帯に認証コードがSMSで送られてくるので、認証コードを登録して使用できます。
*****OpenAIのプラットホームから登録する*****
1.OpenAIのプラットフォームを開きます。
2.中央にある「Get started」をボタンを押下(マウスでクリック)します。
3.メールアドレスとパスワードを入れて、登録します。
4.登録したメールアドレスに、確認メールが届きます。メールアドレスに記載のURLをクリックして有効化します。
5.氏名・生年月日を登録します。
6.携帯の電話番号を登録して、認証コードを送信します。
7.携帯に認証コードがSMSで送られてくるので、認証コードを登録して使用できます。
GPT-4が利用できるか確認
次にはGPT-4が使えるか確認します。
前提としてGPT-4のAPIを使うには、ChatGPT plus(有料)に加入しているか、または支払い方法を登録している必要があります。
※ChatGPT plus(有料)に加入していても、APIを使用すると料金がかかります。料金についてはすでに解説しています。
支払い方法の登録は、
1.OpenAIプラットホーム/docs/overviewを開きます。
2.右上のLOGINをクリックします。
3.登録したメールアドレスとパスワードでログインします。
4.ログインしたら、左側一番上の花のようなアイコンをクリックします。
5.メニューが表示されます。
6.メニューから「Settings」→「Billing」という文字をクリックする
7.「Billing settings」ページが表示されます。
8.緑色の「Add payment details」ボタンを押下(マウスでクリック)します。
9.「Individual(個人)」か「Company(会社)」かを選択する画面が出てきます。
10.どちらかを選ぶと両方ともクレジットカードの登録画面が開きますので、それぞれ個人の情報か会社の情報をいれて登録します。
では確認してみましょう。
1.まずはOpenAIプラットホーム/docs/overviewを開きます。
開いている場合はそのままでいいです。
2.左側一番上の花のようなアイコンをクリックします。
3.メニューが表示されます。
4.メニューから「PlayGround」という文字をクリックする。
5.右上の「Model」の上下矢印をクリックする。
6.GPT-4が表示されていればOKです。
APIキーの取得
次にAPIキーの取得をします。
APIキーというのは自社のプログラムからAPIをつかってGPT-4とやり取りをしますが、
その時に、APIには入力をおくる・出力をもらうなどのいくつかの命令というか指示する構文があります。
※詳しくはOpenAiのAPIリファレンスを参照してください。
しかし、APIを使うには車を動かすのと同じで使用する人が持っている個別のキーが必要となります。
なので、OpenAIのプラットホームで、そのAPIのキーというものを生成して取得します。
1.まずはOpenAIプラットホーム/docs/overviewを開きます。
開いている場合はそのままでいいです。
2.左側一番上の花のようなアイコンをクリックします。
3.メニューが表示されます。
4.メニューから「APIkeys」という文字をクリックする。
5.APIkeysの画面が表示されます。
6.「Create New secret key」ボタンを押下(マウスでクリック)します。
7.用途によっていくつかのAPIキーを作っておくことができるので名前をいれます。
※名前をいれなくてもキーは生成されます。
8.「Create secret key」ボタンを押下(マウスでクリック)します。
9.画面で、「Create New secret key」ボタンの上に作成されたAPIキーの一覧が表示されます。(生成した新しいキーが一覧に追加されます。)
10.一覧のキーの左側にキーをコピーするアイコンボタンがあるので、使う時はコピーして使います。
以上でAPIキーが作成できました。
GPT-4にできること
ChatGPT plusを使ってGPT-4を使えるのですが、ではGPT-4を使って何ができるのでしょうか?
GPT-4が出来ることは自然な言語を使ってのテキストの生成・翻訳・要約・質問に応答するなど多くの機能があります。
またすでに解説しましたが、プログラムのコードを生成したりプログラムを直したりできますし、専門的な教育・創造的な執筆さえできます。
GPT-4 は入力(プロンプト)で指示することにより、小説・誌なども創作活動することができます。
ここではGPT-4でできることを掘り下げていきます。
極めて人間に近い対話が可能
GPT-4は大量のテキストデータを学習して、人間の言葉の複雑な多様性に対応してあたかも人間と話しているようなことが出来ます。
例えばプロンプトに回答の仕方として人格を設定して、あたかも実在する人物と雑談することもできます。
恋愛の対処となる異性の設定をすると、まるで異性と話しているかのような会話もできます。
GPT-4が意識や感情を持っているかのように回答させることも可能で質問を続けていると本当の人間と話しているかのような錯覚に陥ることもあります。
また、自分の悩み相談や株はどう買えばよいかなどの相談もできます。
※限界はあってどの株を購入すればよい具体例は回答できませんが、ヒントはくれます。
そのようにあたかも人間と話しているかのような会話は可能です。
※会話と言っても本当は質問に回答しているだけです。
ブレインストーミング
プレインストーミングはあまりにも有名で、説明する必要もないとおもいますが、通常は何人か集まって自由な意見を言って意見には反論はせずにどんどんアイデアを出していくことです。
GPT-4を使っても、GPT-4にいくつかのアイデアを出してもらい、それをさらに深めたり、自分もアイデアを出したりしてプレインストーミングを行えます。
例えば、プロンプトで「新しいビジネスを考えて見ましょう」と入れて質問すると次のような回答がきます。
※実際はもっと長いですが、省略しています。
サステナブルな商品のサブスクリプションサービス
オンライン教育のプラットフォーム
健康とウェルネスに特化したアプリ
ローカル体験のマーケットプレイス
AIを活用したビジネス分析ツール
の回答を得られます。さらに別の角度から質問したり、もっと追加して回答をもらったり、ひとつひとつについて深く回答をもらうことができます。
プログラミング
先程から解説していますが、GPT-4でプログラムのコードを教えてもらうこともできます。
また、コードを提示して問題点を指摘して修正してもらうことも可能です。
実際にやってみます。
プロンプトに「GPT-4でPython・Java・C#でハローするプログラムをください」と入力して質問します。
以下が回答です。
Python:
print("ハロー")
Java:
public class HelloWorld {
public static
void main(String[] args) {
System.out.println("ハロー");
}
}
C#:
using System;
class HelloWorld {
static void Main() {
Console.WriteLine("ハロー");
}
以上は簡単なプログラムでしたが、それぞれの言語のコードを回答してくれます。
次にJavaの間違ったプログラムを修正してもらいます。
プロンプトに「次のJavaのプログラムを修正してください」+以下のコードをプロンプトに入れて質問します。
public class HelloWorld {
public main(String[] args) {
System.out.println("ハロー");
}
}
そうすると、 以下の回答がされます。 もちろんです。以下が修正したJavaプログラムです:
public class HelloWorld {
public static
void main(String[] args) {
System.out.println("ハロー");
}
}
AI で生成されたコード。ご確認のうえ、慎重にご使用ください。
main メソッドに static を追加しました。これはJavaで必要です。
また、main メソッドが小文字であることを確認してください。
このプログラムを実行すると、コンソールに「ハロー」と表示されます。
簡単な例ですが、修正をおこなってくれています。
GPT-4は他のプログラム言語Javascript・C++・Goなどにも対応しています。
文章の添削・校正
文章の添削・校正はGPT-4の得意とするところです。
簡単な例をやってみます。
〇添削をやってみます。
プロンプトに以下の質問をします。
以下が回答になります。
この文章はすでに良く書けていますが、もしビジネス文書やフォーマルな場で使用する場合は、以下のように少し丁寧な表現に変更することができます:
“`plaintext こんにちは、私の名前は太郎と申します。 “`
「と申します」は「です」と比べてより丁寧な自己紹介の表現です。
これにより、相手に対する敬意を示すことができます。
ただし、日常会話やカジュアルな文脈では元の文章の方が自然かもしれません。
文脈に応じて適切な表現を選んでください。
〇校正についてもやってみます。
プロンプトに以下の質問をします。
以下が回答になります。
校正を行いました。
以下が改善後の文章です: 「彼女は新しいプロジェクトに取り組むことになり、そのことに非常に興奮しています。」
この文章では、次の点を修正しました: – 不要な読点を削除して、文章をより読みやすくしました。
– 「わくわくしている」を「興奮しています」に変更して、よりフォーマルな表現にしました。
– 文末を敬語にすることで、丁寧な印象を与えています。
文章の意図や文脈に応じて、さらに適切な表現があるかもしれませんので、その点も考慮してください。
他にも校正が必要な文章があれば、お気軽にお送りください。
簡単な例でしたが、GPT-4で文章の添削や校正ができました。
実際はもっと長い文章でも可能です。
文章や概念の要約
GPT-4は長文の文章や概念から要点だけを抜き出して要約することが出来ます。
長い学術論文や、ニュース記事などや複雑な概念を、読む人が理解しやすい形にまとめることができます。
例を見てみましょう。
以下の質問をプロンプトに入力します。
以下が回答になります。
グローバル経済は技術革新、国際貿易の増加、人口動態の変化により大きく成長してきましたが、環境問題や社会的不平等などの新しい問題も引き起こしています。
簡単な例でしたが文章が要約されています。
実際はもっと長い文章を要約することができます。
リサーチ、論点の洗い出し
先程も解説しましたが、GPT-4は莫大なデータベースを持っていてそこから迅速に素早く質問にあった回答をします。
そのことによって使用する人は必要なデータを素早く見つけ出し、その情報によってさらに分析や研究をおこなえます。
また、GPT-4のデータベースは、複数の情報源からのデータを収集しているので、使う人はより信頼性の高い情報を得ることができます。
論点の洗い出しについては、使用する人が記事や論文などを書く時に、関連する議論や論点を提示することができます。
このことにより使用する人はより効果的に論点を組み立てることができて、論理的な議論を展開できます。
さらにGPT-4は多言語に対応していますので、他の言語でも論点の洗い出しすることができて、グローバルな視点での記事や論文が書けます。
アイデアの提案
先程、プレインストーミングのところでも解説しましたが、GPT-4はアイデアの提案ができます。
アイデアはビジネスや論文に関することだけでなく、夜の献立や生活全般のことなども回答が得られます。
例えば次のような質問をすると
次のような回答を得られます
夜ご飯の献立には、季節の食材を活かしたメニューがおすすめです。
例えば、春なら新鮮なアスパラガスを使った料理や、桜海老のパスタなどが良いでしょう。
夏には冷たいそうめんや酢の物でさっぱりと、秋にはきのこ類を使った温かい鍋物、冬には根菜を使った煮物やおでんが体を温めてくれます。
ここでは、春にぴったりの「桜海老と菜の花のパスタ」のレシピをご紹介します。
### 桜海老と菜の花のパスタ **
材料(2人分):** –
パスタ 200g
– 桜海老 50g
– 菜の花 1束
– にんにく 1片 –
オリーブオイル 大さじ2
– 塩 適量 – 黒こしょう 適量
– レモン汁 少々
**作り方:**
1. パスタは塩を加えたお湯でアルデンテに茹でます。
2. 菜の花は茎の硬い部分を取り除き、塩茹でして冷水にとります。
3. フライパンにオリーブオイルとみじん切りにしたにんにくを入れ、香りが出るまで炒めます。
4. 桜海老を加えてさっと炒め、茹で上がったパスタと菜の花を加えます。
5. 塩、黒こしょうで味を調え、レモン汁を加えて混ぜ合わせます。 このレシピは春の香りが楽しめる一品で、桜海老の甘みと菜の花のほろ苦さが絶妙にマッチします。
簡単にできるので、忙しい日の夜ご飯にも最適です。ぜひお試しください。
このように生活全般に関するアイデアも回答をもらうこともできます。
また、小説や誌、さらには漫才のネタなどもアイデアをもらうことができます。
ロボットと人間による交流のストーリーを描く漫画の画像のアイデアをくださいと質問すると、以下のよう画像で答えてくれます。 ※アイデアなので、そのままは漫画に使えないかとはおもいます。
GPT-4の注意点
いいことだらけのようなGPT-4ですが、やはり世の中に完璧なものがないように欠点というか注意点があります。
使っているとまるで人間とほんとに会話しているように勘違いしてくるのですが、先程に解説したとおりAIというものは膨大なデータを集めて、そこから回答をしています。
なので、ひとつのソフトウェアといえますので、限界や不具合などがやはり存在します。
ここではそれら限界や不具合などについて解説していきます。
使用回数に上限がある
ChatGPT plusのGPT-4はとても優秀で多くの人が使うとためにアクセス数が増えるがために回答が遅くなりました。
そこで、多くの人が使えるようにするために、OpenAIはChatGPT plusでGPT-4を使うのに時間的な制限をつけました。
ちなみにGPT-3.5(現在2024/4ではGPT-3.5 turboも存在します。)は使用する上限はありません。
当初は3時間で50回までとされましたが、その後25回までとされたのですが、現在(2024/4)openAIの公式ページでは40回とされています。
上限回数がすぎると、警告メッセージが表示されます。
但し3時間経てばまた、リセットされますので通常使用では問題はないかと思います。
最新情報の取得ができない
何度も解説していますが、AIは膨大なデータを集めてそのデータを機械学習させて素早く迅速に回答ができるようにしています。
そのため、データの精度や情報が新しいことがAIには求められています。
しかし、GPT-3.5もGPT-4も2021年9月までのデータを使用しています。
そのために最新のニュースや情報については回答がおかしくなることがあります。
または、その問題には答えられませんと回答されます。
例えば、「2023年の大リーグはどこが優勝しましたか」
と聞くと
2023年の大リーグはヤンキースが優勝しました。
と回答してきます。本当は、テキサスレンジャーズです。
そのように新しいニュースや情報には弱いところがあります。
※最新では、2023/3月までのデータに対応したGPT-4 turboが発表されています。
ユーザーが入力した指示を誤解する可能性がある
先程、解説したとおり2021年以降に起こったことに対してはGPT-4は変な回答をすることがあります。
また、他にも抽象的な指示や曖昧な質問には答えられません。例えば「面白いものをみせて」と質問すると、面白いというのは人によって変わるので、質問した意図と違うものを回答する可能性があります。
また、「空が落ちてくる」というような表現に対しては、冗談や比喩的な例えをそのまま、字の解釈して受け取るため誤った回答をします。
他にも長い対話や複雑なシナリオには、意図した回答が得られないかもしれません。
また、あたり前ですが、「ピザを買ってきて」とか行動を伴うような質問や、「儲かる株を教えて」などの予測的な質問には答えることができません。
また、他にも抽象的な指示や曖昧な質問には答えられません。例えば「面白いものをみせて」と質問すると、面白いというのは人によって変わるので、質問した意図と違うものを回答する可能性があります。
GPT-4の能力と限界を意識して、使う人は適切な質問をすることが求められます。
専門度が高すぎる内容は出力できない
GPT-4はあらゆる情報を持っていて、数々の質問に答えられますが、専門度が高すぎる内容についてはその回答に限界があります。
専門度が高いデータは、トレーニングデータとしてGPT-4は持っていないからです。
※トレーニングデータとは、データを機械学習で記録しているデータベースのことです。
高度な専門知識は、実際の経験や専門家の洞察が必要になってくるので、あくまでも情報をテキストベースで持っているGPT-4では限界があります。
それよりも一般的な問題によリ多く答えられるようにした方が、多くの人にサービスを提供できます。
専門的なAIは特化したAIとして、別に作られることが望ましいです。
最近では、株の売買に特化したAIなども開発され使われています。
そのように今後、専門的なAIは多く出てくることが予想されます。
セキュリティに課題がある
AIはデータを集めてそれを機械学習するのですが、そのためそのデータ自体のセキュリティがまず問題となります。
データの中に個人情報が含まれないようにフィルタリングをかけるのですが、集めてデータが公開してはいけないものである可能性は常にあります。
また、悪意のある使用者が問題のある質問をして、不適切な内容を回答する危険もあります。
GPT-4は不適切な回答や個人情報に関する回答はしないように作られていますが、完全に100%ではないので問題が発生する可能性はあります。
そのため、AIの作り出す回答を常に監視して人間がチェックし、修正する必要があります。
また、GPT-4自体がソフトウェアなのでサイバー攻撃やウィルスによる浸食などを常に警戒し、最新のセキュリティをかけることが求められます。
これらの問題は、GPT-4固有な問題ではなくAI全体が抱えるセキュリティの課題なので、今後ますます対策を強化していくことは必要です。
GPT-4は自社のアプリケーションに導入できるか?
性能が向上したことで、利用者の増加が予想されるGPT-4ですが、APIを用いて自社のアプリケーションにも導入することはできるのでしょうか?
2023年3月時点ではアプリケーションには導入できない
2023年3月14日に発表されたばかりのGPT-4は、一部の大企業をのぞいて現時点ではまだAPI(Application Programming Interface)として利用することはできません。そのため、ChatGPTをAPIとして利用するには現行モデルであるGPT-3.5を使う必要があります。ただし、GPT-4をAPIとして利用するための待機リスト(waitlist)は公開されているため、こちらに登録しておくことでいち早くGPT-4のAPIを利用できるようになる可能性は高くなります。
※2024/4の時点では、利用は誰でもできるようになっています。
APIを用いて導入することができる
GPT-4のAPI導入は既存のアプリケーションや新開発のアプリケーションにGPT-4を組み込むことが可能です。
現行のGPT-3.5とGPT-4の性能の違いは明らかであるため、既にChatGPTを導入している企業であっても、GPT-4へのアップデートは将来的に必要とされるでしょう。
GPT-4の将来性
GPT-4を導入することで、ビジネスシーンにおいてさまざまな進化が期待されます。
その将来性について確かめましょう。
カスタマーサポートの向上
GPT-4の高度な会話機能を利用し、AIチャットボットをカスタマーサポートに活用することで、顧客からの質問に素早く正確に回答し、まるでコンシェルジュのようなパーソナライズドされた自然な会話を楽しむ未来も予想されます。
画像入力や動画入力による質問
先程、説明しましたが、画像・動画入力の機能があります。写真で撮影した映像を解析してチャットボットが会話を返してくれるようになるでしょう。
例えば、画像をAIに解析させて面白いところを見つけさせるといったユーモアのある使い方も可能になります。
翻訳機能の向上
他言語での対応を予定しているGPT-4では、翻訳機能も向上するため、外国人のお客様にも母国語でスマートに回答されることが期待されます。
外国人のお客さまが多く、対応に時間がかかっていた企業にGPT-4を導入することで効率的でグローバルな接客が可能になります。
倫理的な問題と規制が課題である
様々な機能で進化を続けるGPT-4は、倫理的な問題や規制について議論され続けることが予想されます。
プライバシーへの配慮、個人情報保護、捏造した情報の拡散など、GPT-4を含めた大規模言語モデルにはさまざまなリスクが潜んでいるからです。
そのため、企業や開発者はGPT-4の導入にあたって、社会的な責任を持ち、適切な倫理規範やガイドラインを遵守することが求められる可能性が高くなります。
また、政府や業界団体による規制策や、AI技術に関する国際的な取り決めについても議論されるでしょう。
将来的にGPT-4を導入してビジネスは進化する
GPT-4は旧型のGPT-3.5に比べて自然言語処理の能力が飛躍的に進化しています。
GPT-4のAPIの導入によって高機能な双方向コミュニケーションをローコストで実現させることでしょう。
そのため、GPT-4の最新情報をチェックし導入できるように準備しておくことが重要です。
一方で、技術の進化は、歴史を見ても倫理的な問題と規制が常に論じられています。
GPT-4を導入する企業や開発者はその点も考慮しなくてはならないでしょう。
アプリケーションへの組み込方法
GPT-4をアプリケーションに組み込みのはまず、APIキーの取得をおこないます。
※APIキーの取得については、すでに解説いたしました。
その後、APIはこのように設定して使えという手順やリクエストの仕方などが規定されていますのでopenAIの公式サイトのAPIドキュメントを読んで確認しましょう。
また、各プログラム言語によって書き方が違いますので各プログラム言語のドキュメントも確認します。
セキュリティの対策も忘れてはいけないことになります。HTTPSを使った暗号化などインターネット通信のセキュリティ対策についての学習も必要です。
その後は以下で説明する手順で開発を進めていきます。
テストとデバッグ
アプリケーションにGPT-4を組み込んだら、適切に機能しているかテストし、必要に応じてデバッグを行います。
GPT-4の挙動を調整するために、APIリクエストのパラメータを変更することができます。
例えば、プログラム言語のPythonの場合は、temperatureパラメータを調整することで、生成されるテキストのランダム性を制御することができます。
本番環境へのデプロイ
テストとデバッグが完了したら、アプリケーションを本番環境にデプロイします。
デプロイ方法はアプリケーションの種類や使用するインフラストラクチャによって異なりますが、一般的には、ソースコードをリポジトリにプッシュし、本番環境に適用するプロセスを経ることが一般的です。
パフォーマンスのモニタリングと最適化
本番環境でのGPT-4のパフォーマンスをモニタリングし、必要に応じて最適化を行います。
APIリクエストの数やレスポンスタイムを監視し、エラーや遅延が発生した場合は原因を特定し、改善策を実施します。
また、APIのコストを抑えるために、リクエストの頻度やトークン数を調整することも検討できます。
継続的な改善とアップデート
アプリケーションの使用状況やユーザーフィードバックを収集し、GPT-4の利用方法やパラメータを継続的に改善していきます。
また、OpenAIから新しいバージョンのGPTやAPIがリリースされた際には、アップデートを適用し、最新の機能や改善点を取り入れることが重要です。
これらの手順を経て、GPT-4をAPIを通じてアプリケーションに導入することができます。
ただし、各プロジェクトやアプリケーションの要件に応じて、手順の詳細や実装方法は異なる場合がありますので、適切な対応が必要です。
GPT-4のまとめ
GPT-4はOpenAIが開発した人口知能です。-4はバージョンを表します。GPT-4はGPT-3.5よりも性能が向上していることを説明しました。
AIは膨大なデータを機械学習(トレーニング)によって記録して、それ使ってを迅速に適確に回答します。GPT-4は、GPT-3.5よりもデータが増えて、回答のしかたもさらに迅速に適確になっています。GPT-4を使うには、ChatGPT plusを使う必要があります。ChatGPT plusは有料で月額20ドルかかります。
GPT-4を自社のアプリケーションに組み込むこてができますが、その場合APIキーを取得することが必要です。APIによる入力(質問)や出力(回答)には、GPT-4 plusの利用料金とは別料金がかかります。
GPT-4の利点について解説しました。GPT-4は画像入力の解析や、画像出力にも対応しています。GPT-4は、いくつかのプログラム言語に対応していて、プログラムのコードを生成することができます。
※作られたプログラムのコードは、検証が必要です。GPT-4は利点ばかりではなく、注意点もあることも説明しました。
jiteraではGPT-4やAIを使ったシステムの開発や導入支援も行っているので、 GPT-4に関する質問や案件のご相談などがある場合は株式会社Jiteraへの問い合わせください。
お問合わせはこちら->jitera