Llama 3とは、2024年に発表されたばかりの大規模言語モデル(LLM)です。
現在は英語データによる学習がされているため、英語を活用したビジネスのサポートにピッタリのツールといえます。
今回の記事では、Llama 3の特徴や前モデルとの違い、費用や使い方などを詳しくご紹介します。
高校からHTML/CSS/COBOL/C++/Rubyに触れ、システム管理やCMSなど幅広く網羅。建築士から転身し、Webメディアの制作を主軸とした会社を設立。ITパスポート所有。趣味は建築物巡り。
Llama 3とは
Llama 3(ラマスリー)とは、Metaによって開発され、2024年4月に発表された大規模言語モデル(LLM)です。
LLMは、大量のデータと深層学習(ディープラーニング)の技術によって構築されたAIモデルを意味し、人間が扱う言語を理解・生成します。
Llama 3はLLMの最新のバージョンで、旧バージョンのLlama 2よりも言語理解能力や生成能力が向上しています。
Meta AIにも搭載されているLlama 3は、ChatGPTやClaudeへのキャッチアップを図るとされており、現在注目されているLLMです。
Llama 3と前モデルLlama 2の違い
Llama 3は、前モデルのLlama 2と比較していくつかの進化がありますが、大きく変化しているのは次の2つです。
Llama 2 | Llama 3 | |
データセット | 2兆トークン | 15兆トークン |
コンテキストウィンドウ | 4Kトークン | 8Kトークン |
まず、Llama 3はデータセットの数が、2兆トークンからおよそ7倍の15兆トークンに増加しました。トークンとは、言語データの最小単位のことで、数が多いほど豊富な知識を持っていることを意味します。
また、コンテキストウィンドウのサイズが4Kトークンから2倍の8Kトークンに増加しました。コンテキストウィンドウとは、一度に処理できるテキストの量を指します。トークンが多いほど、長い文章や複雑な内容の文章が処理できることを意味します。
Llama 3はLlama 2と比べて長文の理解や生成が得意になったことで、複雑な内容の文章でもスムーズに処理できるようになりました。
上記の2点以外にも、Llama 3では返答の多様性と整合性が向上しています。学習内容が改善されたことで情報の正確性が上がり、多様かつ正しい返答を生成できるようになりました。これまでのバージョンよりも自然で信頼性の高い対話ができるようになっています。
また、次のような学習手法を行い、Llama 2と比較して約3倍もの学習効率を上げました。
- 教師あり微調整(SFT)
- 棄却サンプリング(リジェクションサンプリング)
- 近接方策最適化(PPO)
- 直接選好最適化(DPO)
Llama 3の主な特徴
Llama 3には、2つのモデルがあること、オープンソースで幅広く活用できること、英語に特化していること、Meta AIでも利用されていること、類似ツールと比べて高精度であることの5つの特徴を持ちます。
ここでは、それぞれの特徴について詳しくご紹介します。
8Bおよび70Bのモデルがある
Llama 3は、8Bおよび70Bのモデルがあります。具体的な違いは次のとおりです。
モデルサイズ | パラメーター数 | 主な用途 |
8B | 80億 | 軽量なタスク、リソースの制約がある環境 |
70B | 700億 | 高いレベルの言語理解、生成、大規模のデータ処理 |
2つのモデルは、パラメーター数に違いがあります。そのため、ユーザーは用途に合わせたモデルの選択が可能です。
8Bモデルは軽量なタスクや限られたリソース環境に適しているため、スピードが求められるシーンにピッタリです。
一方で、70Bモデルは、よりレベルの高い言語理解と生成能力を持つため、大規模なデータ処理を行いたい際に使用されます。
オープンソースで幅広く活用できる
Llama 3はオープンソースとして提供されているため、幅広い活用が期待されています。オープンソースとは、無償で公開されているプログラムコードのことです。
ユーザーはLlama 3を使って新しいアプリケーションや研究を進めることができるため、AI技術の発展に貢献できます。
オープンソースであることのメリットは次のとおりです。
- 透明性の向上
- コミュニティによる迅速なバグ修正
- 新機能の追加
ただし、Llama 3はオープンソースですが、目的を問わず使用、再利用、修正、再配布などができるソフトウェアを意味する『オープンソフトウェア』ではありません。
そのため、プログラムコードは公開されていますが、利用するためには特定のライセンス条件が付くことがあります。
英語に特化している
Llama 3は、英語によるトレーニングデータが95%を占めているため、英語による言語理解や生成のレベルが非常に高くなっています。
英語によるデータが多いことで、次のメリットが生まれます。
- 英語版のアプリケーションで高い効果を発揮
- 英語コミュニケーションが必要なビジネスをサポート
- 英語を使った作業を効率的にサポート
Meta AIにも利用されている
Llama 3はMeta AIにも利用されており、Metaが運営しているFacebookやInstagramなどのSNSにも活用されています。
サービスが強化されることで、次のような高度な機能を使えるようになります。
- コンテンツの生成
- フェイクニュースの判断
- カスタマーサポートの自動化
Meta AIは主に英語圏を対象としているため、日本ではサポートされていない点に注意してください。
しかし、今後はバージョンアップにより英語以外の言語にも対応するとされており、さらなる利便性の向上が期待されます。
類似ツールと比べて高精度である
Llama 3は類似ツールと比較して高精度である特徴があります。
実際にMetaの公式サイトのパフォーマンス比較表を見ると、類似ツールのGemma 7B – it、Mistral 7B Instruct、Gemini Pro 1.5、Claude 3 Sonnetとの数値の違いが一目瞭然です。
一部のベンチマークで類似ツールに劣る点はありますが、トータルで見るとLlama 3のパフォーマンスは優勢といえます。
Llama 3の費用やライセンスについて
Llama 3は基本的に無料で利用できるオープンソースです。条件によってはライセンスが必要になるケースがあります。
ここでは、詳しい費用やライセンスについてご紹介します。
基本的には無料で商用利用も可能
Llama 3は、基本的に無料で利用できるオープンソースです。そのため、企業や個人の開発者が費用を気にせずに最新のAIを活用できる魅力があります。
気軽に導入して、自社のサービスに高いレベルの言語処理機能を追加できます。
また、Llama 3は商用利用も可能です。新しいビジネスモデルやアプリケーションを作成する際に導入して、開発に利用することができます。
月間アクティブユーザー7億人以上で申請が必要
商用利用では一部制約があるため注意が必要です。
開発したサービスやアプリケーションの月間アクティブユーザーが7億人以上いる場合には、特別なライセンスのリクエストが必要になります。
利用状況を適切に管理して安定したサービスを提供するためです。
申請方法は簡単で、条件に該当する場合に申請書を提出してサービスの概要や用途を説明します。これに対してMetaが利用の許可を判断し、ライセンスを発行する流れです。
Llama 3を簡単に使う方法
Llama 3を簡単に使う方法はいくつかありますが、Grop(Llama 3を動作できるAI専用チップ)を使う方法がおすすめです。
ここではGropを使う方法を詳しくご紹介します。
Gropにサインインする
まずはGropを開きましょう。
ページ左下の『Sign in to Grop』をクリックし、メールアドレス(またはGoogleアカウント)からログイン/新規登録ができます。
先ほどクリックした『Sign in to Grop』の部分が、自分のアカウント名になっていれば、サインイン完了です。
Llama 3を簡単に始められるため、まずはお試し感覚で触ってみてください。
Llama 3モデルを選択する
右上のメニューを開くと、さまざまなツールが選択できるプルダウンが出てきます。ここで、Llama 3 70bまたは8bを選択すると、Llama 3を使い始められます。
Llama 3を活用するメリット
Llama 3の活用は、開発コストの削減、英語分野と相性が良い、さまざまなプラットフォームに対応するなどのメリットにつながります。
ここではメリットについて一つずつご紹介します。
開発コストの削減が期待できる
Llama 3の最大のメリットは、開発コストの削減が期待できる点です。
オープンソースとして無料で提供されているため、一定の条件に当てはまらない限りライセンス料を支払う必要がありません。
コストが限られている小規模企業や、個人でも最新のAI技術に触れられ、高度な言語処理機能を自社のサービスに簡単に導入できます。
また、ライセンス料がかからない分、その他の予算として回すことができます。
マーケティングや人材育成などにリソースを割くことが可能になるため、開発コストを削減しながら高品質の製品を実現したい場合におすすめです。
コーディングなどの英語分野と相性が良い
Llama 3は、英語によるトレーニングデータが95%を占めているため、英語を使用するコーディングやアプリケーションの作成などとの相性はバッチリです。
英語の文章を理解したり生成したりする能力が高いため、開発において強みを発揮します。
英語を使った開発を効率的に進められるため、生産性が向上し、グローバルなビジネスをサポートします。
また、英語分野と相性が良いことで、最新の情報に素早くアクセスできる点も強みです。効率的な開発やプロジェクトの進行が円滑になることが期待できます。
さまざまなプラットフォームに対応する
Llama 3はさまざまなプラットフォームに対応するメリットもあります。
例えば、以下の環境で使用できます。
- ウェブアプリケーション
- モバイルアプリケーション
- デスクトップアプリケーション
- クラウドサービス など
また、Llama 3 は、AWSやGoogle Cloud、Microsoft Azureなどのプラットフォームと簡単に統合可能です。
多くのプラットフォームと統合することで、カスタマーサポートの自動化の実現やチャットボットの開発、自動記事生成など、クリエイティブな作業が効率化できます。
自社のプラットフォームに合わせた環境でLlama 3を活用することができるため、より高度なAIサービスの展開につながります。
Llama 3の日本語学習モデルを使うには
Llama 3は英語に特化しているため、英語を使わない人にとってはやや使いにくく感じる可能性があります。
そこでおすすめのツールが、Llama 3の日本語学習モデル「Llama 3 Youko 8B」です。
日々進化を続けているAI業界で英語圏の技術に追随するために、rinnaによって開発されました。
Llama 3 8Bをもとに、日本語と英語の学習データ220億トークンを用いて事前学習済みです。すでにMetaのLlama 3 Community Licenseの下で公開されているため、ライセンスに従って利用できます。
性能は、日本語言語モデルのベンチマークである『Stability-AI/lm-evaluation-harness』の9タスクの平均スコアで評価されており、Llama 3のスコアが59.82であるのに対し、Llama 3 Youko 8Bは66.15という高いスコアを記録しました。
Llama 3の性能がそのまま日本語モデルにも引き継がれていることがわかります。
Llama 3の今後について
Llama 3は、今後も開発の行方が注目されており、バージョンアップによってどのような変化が起こるかが見どころです。
すでに400Bモデルが開発されている点と、多言語対応の拡大が予想されていることで、大きな注目を浴びています。
ここでは、この2つについて詳しくご紹介します。
400Bモデルが開発されている
現在公開されている8B、700Bモデルに加えて、400Bモデルが開発されています。
400Bモデルでは、4,000億のパラメーターを持つ大規模言語モデルとなり、現在のモデルをはるかに超える処理能力と精度になるでしょう。
複雑なタスクや長文の言語生成が可能になることが予想されるため、応用できる範囲が拡大することが期待されます。
高度な自然言語理解やリアルタイムでの翻訳、複雑な問題解決など、現在よりもさらに進化したモデルとして活躍するでしょう。
多言語対応の拡大が予定されている
今後は多言語に対応したバージョンが開発される予定です。現在は英語がメインですが、30を超える非英語データの利用が進んでいます。
多言語対応が拡大すれば、さまざまな言語環境で利用することができるため、グローバルなビジネスもサポートします。
ビジネスで英語以外の言語を扱う場合でも、利便性の高いサービスを提供することが可能になるでしょう。
まとめ:Llama 3は無償オープンソースの強みを活かした発展に期待がかかる
今回の記事では、2024年にMetaが発表した新AIのLlama 3をご紹介しました。
オープンソースで幅広く利用できるため、ビジネス開発においてコスト削減したい企業や気軽に最新のAI技術に触れたい人など、多くの人におすすめのツールです。
さらにバージョンアップしたLlama 3が開発される予定なので、今後の進化にも注目です。
Llama 3をはじめとするAIツールに関してお困りではありませんか?
株式会社Jiteraでは、生成AIの活用のノウハウを活かしてお客様の課題を解決するサポートを行なっています。
AIツールに関することや導入方法、その他お困りのことがありましたら、ぜひJiteraにご相談ください。