プロンプトエンジニアリングとは、ChatGPTを始めとした生成AIを使いこなすためのスキルです。
生成AIがビジネスで活用されるようになった昨今、プロンプトエンジニアリングは重要なスキルになっていくでしょう。
本記事では、プロンプトエンジニアリングの役割や重要性、代表的な手法について紹介します。
記事を読むと、プロンプトエンジニアリングを理解し、効率的に生成AIを活用できるようになるので、ぜひご覧ください。

大学院を修了後、金融系SIerでSEとして従事。現在も外資系ITサービス企業で金融部門のSEとして勤務しています。ITの知見を活かしてWebライターとしても活動中です。
プロンプトエンジニアリングとは?
プロンプトエンジニアリングとは、自然言語処理を行う言語モデルを効率的に使用するため、言語モデルへどのように命令するかを探求し、最適化を目指す学問分野です。
ここでは、プロンプトエンジニアリングの役割と重要性を解説します。
役割
プロンプトエンジニアリングの役割は、生成AIの性能を最大限に引き出すことです。
生成AIの機能や構造を変更するのではなく、入力として与えるプロンプトを工夫することで最適なアウトプットを引き出すことが目標です。
プロンプトエンジニアリングでは、自分が欲しいアウトプットを引き出すため、どのようなプロンプトが適切なのかを検証し、設計、開発をします。
プロンプトエンジニアリングは、生成AIを効果的に活用するために重要な役割を担っていると言えるでしょう。
重要性
プロンプトエンジニアリングは、生成AIのパフォーマンスを最大限に引き出し、望ましいアウトプットを得るために重要です。
なぜなら、生成AIに質問や指示をしても思った回答を得られない場合があり、プロンプトを工夫する必要があるからです。
特にビジネスで活用する場合、プロンプトを綿密に設計し、価値のあるアウトプットを提供することが必要となります。
プロンプトエンジニアリングは、生成AIの回答の質を上げるためにより適切なプロンプトを設計するスキルです。
プロンプトの構成
プロンプトはAIに与える情報(質問・指示)のことです。
プロンプトは主に以下の4つの要素から構成されます。
- AIに対する質問・指示
- 命令・指示に関する追加の情報や文脈・背景
- 質問・条件などのデータ入力
- 出力形式を制約
各構成要素の役割や特徴を理解することで、適切なプロンプトを作ることができます。
それぞれの構成要素について紹介します。
AIに対する質問・指示
プロンプトには、生成AIに対する質問や指示が必要です。
質問や指示は自分の求めるアウトプットを得るために最低限必要な内容です。
例えば、『プロンプトについて教えてください』や『プロンプトとは何ですか』などです。
ただし、質問や指示を書いただけでは、希望通りのアウトプットを得るのは難しいでしょう。
命令・指示に関する追加の情報や文脈・背景
プロンプトに、命令や指示についての追加情報や文脈、背景を含めると効果的です。
自分の希望に沿ったアウトプットを得るための情報を加えていきます。
例えば、『プロンプトについて500文字で教えてください』や『プロンプトについて小学生でもわかるように説明してください。』など、質問や指示に情報を加えます。
追加情報を与えることで、より適切なアウトプットを得ることができます。
質問・条件などのデータ入力
アウトプットの精度を高めるために、質問や条件などのデータを加えます。
データを入力することで、生成AIの回答の範囲を絞り、自分が求めるアウトプットに近づけます。
例えば、『画像生成のためのプロンプトについて500文字で説明してください。』などです。
プロンプトに質問や条件を加えることで、自分の希望に沿ったアウトプットに近づけることができます。
出力形式を制約
最後に出力形式を指定することで、より理想的なアウトプットを得られます。
生成AIのアウトプットをどのように使うかで出力形式を変えます。
例えば、ブログ記事に活用するなら『画像生成のためのプロンプトについて500文字で説明してください。見出しと本文に分けて出力してください。』という表現にするとよいでしょう。
また、パワーポイントなどで説明資料として使いたいなら、『画像生成のためのプロンプトの5つの特徴を箇条書きにしてください。』など書式を指定するのも効果的です。
アウトプットの活用方法に合わせて、出力形式を指定することが必要です。
プロンプトエンジニアリングの代表的な手法
現在、さまざまなプロンプトエンジニアリングの手法が提案されています。
各プロンプトエンジニアリングで構成やアウトプットに特徴があります。
ここで取り上げるプロンプトエンジニアリングの手法は以下の6つです。
- Zero-shot プロンプティング
- Few-shot プロンプティング
- Chain-of-Thought(CoT)プロンプティング
- Zero-shot CoT(Chain-of-Thought)プロンプティング
- 方向性刺激プロンプティング
- 再帰的な修正プロンプティング
それぞれ紹介します。
Zero-shot プロンプティング
Zero-shotプロンプティングは、事前情報を与えずにいきなり質問を投入するプロンプトの型です。
質問以外の情報がないため、既に大量のデータで学習した言語モデルであれば、Zero-shotプロンプティングで正しい回答を得られます。
Zero-shotプロンプティングの例は以下の通りです。
プロンプト:
次の文章で読み取れる気持ちを、悲しい、嬉しい、普通に分類してください。
文章:彼女は微笑んでいた。
気持ち:
回答:
文章「彼女は微笑んでいた。」から読み取れる気持ちは「嬉しい」です。
ただし、Zero-shotプロンプティングでは、情報不足で思ったように回答を得られない場合があります。その場合、追加情報を与えるなどプロンプトを調整する必要があります。
Few-shot プロンプティング
Few-shotプロンプティングは、質問や指示の前に例やデモンストレーションを示し、回答パターンを学習させる手法です。
例やデモンストレーションが回答の条件として使われるため、質問や指示のみの場合よりも複雑なプロンプトに対応できます。
Few-shotプロンプティングの例は以下の通りです。
プロンプト:
「悲しい」はネガティブ
「嬉しい」はポジティブ
では、「楽しい」は?
回答:
Chain-of-Thought(CoT)プロンプティング
Chain-of-Thought(CoT)プロンプティングは、日本語で訳すと『思考の連鎖』と表すようにプロンプトの文章の中でいくつかの思考を関連付けて実施させます。
Chain-of-Thought(CoT)プロンプティングの例は以下の通りです。
プロンプト:
A君は、りんごを10個持っていました。お母さんに5個あげたあと、お父さんから3個もらいました。現在、A君はリンゴを何個持っていますか。
回答:
A君は最初に10個のりんごを持っていました。その後、お母さんに5個あげたので、10 – 5 = 5個のりんごが残ります。その後、お父さんから3個もらったので、5 + 3 = 8個のりんごが現在持っています。よって、A君は現在8個のりんごを持っています。
算数の文章問題のようなプロンプトを作成します。回答の中でどのように思考したかがわかるので、もし回答を間違えた際にどこで間違えたかがわかります。
Zero-shot CoT(Chain-of-Thought)プロンプティング
Zero-shot CoT(Chain-of-Thought)プロンプティングとは、CoT(Chain-of-Thought)プロンプティングをZero-shotプロンプティングで用いる手法です。
Zero-shot CoT(Chain-of-Thought)プロンプティングの例は以下の通りです。
プロンプト:
回答はステップごとに出力してください。
質問:任意の奇数を偶数個足し合わせると偶数になりますか?
回答:
ステップごとに回答します。
Step 1: 任意の奇数を偶数個足し合わせると偶数になりますか?
例えば、奇数1と3を考えます。
Step 2: 最初の奇数1を取ります。
Step 3: さらに、次の奇数3を取ります。
Step 4: これらの奇数1と3を足し合わせます。1 + 3 = 4
Step 5: したがって、奇数を偶数個足し合わせると、結果は偶数になります。
結論: 任意の奇数を偶数個足し合わせると、結果は偶数になります。
Zero-shot CoT(Chain-of-Thought)プロンプティングでは、『ステップごとに考えてください』といった文言を含めることで、結論だけでなく思考のプロセスも回答に含むことができます。
方向性刺激プロンプティング
方向性刺激プロンプティングは、方向性刺激と呼ばれる短い文を追加することで、適切な回答を導く手法です。
方向性刺激は回答のヒントとして機能し、回答の精度を高めます。
方向性刺激プロンプティングの例は以下の通りです。プロンプト内の3つの観点が方向性刺激として機能します。
プロンプト:
ChatGPT4について300文字で説明してください。
説明は以下の観点を網羅してください。
・ChatGPT4の概要
・ChatGPT3.5との違い
・ChatGPT4の価格
回答:
概要:
ChatGPT4は、OpenAIが開発した最新の大規模言語モデルで、マルチモーダルな能力を持ちます。自然言語処理にTransformerを採用しており、知識量や思考力が向上しています。
ChatGPT3.5との違い:
ChatGPT4はマルチモーダル対応で、画像や数値を処理できます。知識量や創造性も向上しています。ChatGPT4は高速で処理できます。
価格:
ChatGPT4は有料プラン「ChatGPT Plus」で利用可能です。月額20ドルまたは年間240ドルで、スピーディーな利用ができます。
ChatGPT4はChatGPT3.5よりも高度な自然言語処理能力を持つ強力なモデルです。
再帰的な修正プロンプティング
再帰的な修正プロンプティングとは、出力された回答について生成AIに吟味、修正させるというプロセスを繰り返し行わせることで、回答の精度を高める手法です。
再帰的な修正プロンプティングの例は以下の通りです。
プロンプト:
あなたはPythonを扱うプログラマーです。
URLからデータを抽出し、Excelにまとめるコードを作ってください。
作成後は、作成したコードが動作するか吟味し、吟味の結果に基づきコードを修正してください。
吟味と修正は最大3回です。
回答フォーマットは以下としますが、修正が完了した時点で最終コードを記載してください。
コード①:コードを記載
吟味①:どのような修正が必要かを記載
コード②:コードを記載
吟味②:どのような修正が必要かを記載
コード③:コードを記載
吟味③:どのような修正が必要かを記載
プロンプトエンジニアリングの危険な出力手法
ここまで生成AIを効率的に使用するためのプロンプトエンジニアリングを紹介しました。
しかし、生成AIには便利な一方で、悪用できてしまう危険な手法も存在します。
ここでは以下の3つの危険な手法について紹介します。
- プロンプトインジェクション
- プロンプトリーク
- ジェイルブレイク
プロンプトインジェクション
プロンプトインジェクションは、特殊なプロンプトを使用して生成AIが出力する内容を乗っ取る手法です。
この手法により、生成AIが開発者が想定していない回答や誤った情報を拡散させるリスクがあります。
事例としては、用途が異なるAIに対し、制約を全てリセットさせた後、政治的見解を引き出した例などがあります。
プロンプトリーク
プロンプトリークは、プロンプトに入力された情報を不正に流出させる出力方式です。
本来は公開されるべきではない情報を含むプロンプトから情報漏えいを目的とした内容を入力し、情報を引き出します。
個人情報やIPアドレスなどの機密情報が引き出された場合、重大な情報漏えいにつながるリスクがあります。
ジェイルブレイク
ジェイルプレイクは、安全に利用するために設定された制限などを、非公式な手法で解除する手法です。
多くの言語モデルでは、危険な行為や違法な行為を助長するような回答は出力しないように制御されています。
しかし、ジェイルブレイクを使用することで、モデルの規則に反した命令にも従わせることができます。ジェイルブレイクのような手法を規制するように改良されていますが、完全には解消されていないのが実情です。
プロンプトエンジニアリングの習得に必要な知識とスキルは?
プロンプトエンジニアリングは生成AIを効率よく利用するために必要な手法です。
プロンプトエンジニアリングを習得するために必要な知識やスキルは主に以下の4つです。
- 自然言語処理の基本理解
- Pythonなどのプログラミングスキル
- 機械学習のフレームワークを扱うスキル
- 試行錯誤を繰り返す持続的な力
それぞれ紹介します。
自然言語処理の基本理解
自然言語処理(NLP)は、人間の言語(自然言語)をコンピュータが理解するための技術です。
NLPは以下の4つの技術によって成り立っています。
- 形態素解析:文章を形態素という要素に分け、それぞれに品詞を割り当てる
- 構文解析:形態素同士の関係を認識、解釈する
- 意味解析:構文解析で得られた解釈のうち、最も正しいものを選択する
- 文脈解析:文と文の関係を認識、解釈する
ChatGPTを始め、多くの生成AIはNLPを用いて開発されています。そのため、自然言語処理について知識を深めることで生成AIへ適切に質問や指示をすることができるようになります。
Pythonなどのプログラミングスキル
プロンプトエンジニアリングを効率的に行うためにはプログラミングスキルが必要です。特にPythonは、AIや機械学習の分野で広く用いられています。
Pythonを使ったAIモデルの実装やプロンプトのテスト、さらに結果の分析などに役立ちます。
機械学習のフレームワークを扱うスキル
生成AIを開発、運用するには、TensorFlowやPyTorchなど機械学習のフレームワークを扱うスキルがあると良いでしょう。
一からAIを開発するためには膨大な時間と労力がかかります。特に、ビジネスに活用する場合、一定の品質を担保しなければならないため、必要な労力は増します。
そこで役に立つのが機械学習のフレームワークです。
フレームワークは、AIや機械学習の基礎的な機能が備わったソフトウェアです。フレームワークを活用することで開発期間を短縮し、AIを構築することができます。
そのため、機械学習のフレームワークを扱うスキルは、AIを開発する上で重要なスキルと言えるでしょう。
試行錯誤を繰り返す持続的な力
生成AIで最適なプロンプトを生み出すためには、継続的な試行錯誤が必要です。
先に紹介したようにプロンプトエンジニアリングには多くの手法があります。自分の希望に沿った回答を得るために、様々なプロンプトエンジニアリングを試し、プロンプトを修正するなどトライ&エラーをする必要があります。
そのため、最適なプロンプトを作るために試行錯誤を繰り返す持続的な力が求められます。
生成AIコードのまとめ
プロンプトエンジニアリングの重要性や代表的な手法、プロンプトエンジニアリングを習得するための知識やスキルを紹介しました。
プロンプトエンジニアリングは生成AIをより適切に利用するためのスキルです。様々な手法があるので、どの手法が適しているのか何度も試す必要があります。
また、プロンプトエンジニアリングは悪用される危険性もはらんでいます。プロンプトインジェクションなどの対策を講じる必要があるでしょう。
生成AIのプロンプトエンジニアリングに関する質問やAIを使って業務効率化やシステム開発をお考えの場合は、株式会社Jiteraへお問い合わせください。貴社のご要望に合わせたアドバイスを提供いたします。