Llama 3とは?Metaの最新AIを徹底解説!日本語データ用モデルも紹介

Llama 3とは、2024年に発表されたばかりの大規模言語モデル(LLM)です。

現在は英語データによる学習がされているため、英語を活用したビジネスのサポートにピッタリのツールといえます。

今回の記事では、Llama 3の特徴前モデルとの違い費用や使い方などを詳しくご紹介します。

Nao Yanagisawa
監修者 Jitera代表取締役 柳澤 直

2014年 大学在学中にソフトウェア開発企業を設立

2016年 新卒でリクルートに入社 SUUMOの開発担当

2017年 開発会社Jiteraを設立
開発AIエージェント「JITERA」を開発

2024年 「Forbes 30 Under 30 Asia 2024」に選出

執筆者 yukina_writer

高校からHTML/CSS/COBOL/C++/Rubyに触れ、システム管理やCMSなど幅広く網羅。建築士から転身し、Webメディアの制作を主軸とした会社を設立。ITパスポート所有。趣味は建築物巡り。

\エキスパートが回答!/
この記事に関する質問はこちら
記事に関するご質問以外にも、システム開発の依頼やAIの導入相談なども受け付けております。

    会社名必須
    必須
    必須
    Eメール必須
    電話番号必須
    ご依頼内容必須

    Llama 3とは

    Llama 3(ラマスリー)とは、Metaによって開発され、2024年4月に発表された大規模言語モデル(LLM)です。

    LLMは、大量のデータと深層学習(ディープラーニング)の技術によって構築されたAIモデルを意味し、人間が扱う言語を理解・生成します。

    Llama 3はLLMの最新のバージョンで、旧バージョンのLlama 2よりも言語理解能力や生成能力が向上しています。

    Meta AIにも搭載されているLlama 3は、ChatGPTやClaudeへのキャッチアップを図るとされており、現在注目されているLLMです。

    Llama 3と前モデルLlama 2の違い

    Llama 3は、前モデルのLlama 2と比較していくつかの進化がありますが、大きく変化しているのは次の2つです。

    Llama 2 Llama 3
    データセット 2兆トークン 15兆トークン
    コンテキストウィンドウ 4Kトークン 8Kトークン

    まず、Llama 3はデータセットの数が、2兆トークンからおよそ7倍の15兆トークンに増加しました。トークンとは、言語データの最小単位のことで、数が多いほど豊富な知識を持っていることを意味します。

    また、コンテキストウィンドウのサイズが4Kトークンから2倍の8Kトークンに増加しました。コンテキストウィンドウとは、一度に処理できるテキストの量を指します。トークンが多いほど、長い文章や複雑な内容の文章が処理できることを意味します。

    Llama 3はLlama 2と比べて長文の理解や生成が得意になったことで、複雑な内容の文章でもスムーズに処理できるようになりました。

    上記の2点以外にも、Llama 3では返答の多様性整合性が向上しています。学習内容が改善されたことで情報の正確性が上がり、多様かつ正しい返答を生成できるようになりました。これまでのバージョンよりも自然で信頼性の高い対話ができるようになっています。

    また、次のような学習手法を行い、Llama 2と比較して約3倍もの学習効率を上げました。

    • 教師あり微調整(SFT)
    • 棄却サンプリング(リジェクションサンプリング)
    • 近接方策最適化(PPO)
    • 直接選好最適化(DPO)

    Llama 3の主な特徴

    Llama 3には、2つのモデルがあることオープンソースで幅広く活用できること英語に特化していることMeta AIでも利用されていること類似ツールと比べて高精度であることの5つの特徴を持ちます。

    ここでは、それぞれの特徴について詳しくご紹介します。

    8Bおよび70Bのモデルがある

    Llama 3は、8Bおよび70Bのモデルがあります。具体的な違いは次のとおりです。

    モデルサイズ パラメーター数 主な用途
    8B 80億 軽量なタスク、リソースの制約がある環境
    70B 700億 高いレベルの言語理解、生成、大規模のデータ処理

    2つのモデルは、パラメーター数に違いがあります。そのため、ユーザーは用途に合わせたモデルの選択が可能です。

    8Bモデルは軽量なタスクや限られたリソース環境に適しているため、スピードが求められるシーンにピッタリです。

    一方で、70Bモデルは、よりレベルの高い言語理解と生成能力を持つため、大規模なデータ処理を行いたい際に使用されます。

    オープンソースで幅広く活用できる

    Llama 3はオープンソースとして提供されているため、幅広い活用が期待されています。オープンソースとは、無償で公開されているプログラムコードのことです。

    ユーザーはLlama 3を使って新しいアプリケーションや研究を進めることができるため、AI技術の発展に貢献できます。

    オープンソースであることのメリットは次のとおりです。

    • 透明性の向上
    • コミュニティによる迅速なバグ修正
    • 新機能の追加

    ただし、Llama 3はオープンソースですが、目的を問わず使用、再利用、修正、再配布などができるソフトウェアを意味する『オープンソフトウェア』ではありません。

    そのため、プログラムコードは公開されていますが、利用するためには特定のライセンス条件が付くことがあります。

    関連記事
    OSS(オープンソースソフトウェア)とは?メリットや注意点からソフト一覧まで紹介
    OSS(オープンソースソフトウェア)とは?メリットや注意点からソフト一覧まで紹介

    英語に特化している

    Llama 3は、英語によるトレーニングデータが95%を占めているため、英語による言語理解や生成のレベルが非常に高くなっています。

    英語によるデータが多いことで、次のメリットが生まれます。

    • 英語版のアプリケーションで高い効果を発揮
    • 英語コミュニケーションが必要なビジネスをサポート
    • 英語を使った作業を効率的にサポート

    Meta AIにも利用されている

    Llama 3はMeta AIにも利用されており、Metaが運営しているFacebookInstagramなどのSNSにも活用されています。

    サービスが強化されることで、次のような高度な機能を使えるようになります。

    • コンテンツの生成
    • フェイクニュースの判断
    • カスタマーサポートの自動化

    Meta AIは主に英語圏を対象としているため、日本ではサポートされていない点に注意してください。

    しかし、今後はバージョンアップにより英語以外の言語にも対応するとされており、さらなる利便性の向上が期待されます。

    類似ツールと比べて高精度である

    Llama 3は類似ツールと比較して高精度である特徴があります。

    実際にMetaの公式サイトのパフォーマンス比較表を見ると、類似ツールのGemma 7B – itMistral 7B InstructGemini Pro 1.5Claude 3 Sonnetとの数値の違いが一目瞭然です。

    一部のベンチマークで類似ツールに劣る点はありますが、トータルで見るとLlama 3のパフォーマンスは優勢といえます。

    Llama 3の費用やライセンスについて

    Llama 3は基本的に無料で利用できるオープンソースです。条件によってはライセンスが必要になるケースがあります。

    ここでは、詳しい費用やライセンスについてご紹介します。

    基本的には無料で商用利用も可能

    Llama 3は、基本的に無料で利用できるオープンソースです。そのため、企業や個人の開発者が費用を気にせずに最新のAIを活用できる魅力があります。

    気軽に導入して、自社のサービスに高いレベルの言語処理機能を追加できます。

    また、Llama 3は商用利用も可能です。新しいビジネスモデルやアプリケーションを作成する際に導入して、開発に利用することができます。

    月間アクティブユーザー7億人以上で申請が必要

    商用利用では一部制約があるため注意が必要です。

    開発したサービスやアプリケーションの月間アクティブユーザーが7億人以上いる場合には、特別なライセンスのリクエストが必要になります。

    利用状況を適切に管理して安定したサービスを提供するためです。

    申請方法は簡単で、条件に該当する場合に申請書を提出してサービスの概要や用途を説明します。これに対してMetaが利用の許可を判断し、ライセンスを発行する流れです。

    Llama 3を簡単に使う方法

    Llama 3を簡単に使う方法はいくつかありますが、Grop(Llama 3を動作できるAI専用チップ)を使う方法がおすすめです。

    ここではGropを使う方法を詳しくご紹介します。

    Gropにサインインする

    まずはGropを開きましょう。

    ページ左下の『Sign in to Grop』をクリックし、メールアドレス(またはGoogleアカウント)からログイン/新規登録ができます。

    先ほどクリックした『Sign in to Grop』の部分が、自分のアカウント名になっていれば、サインイン完了です。

    Llama 3を簡単に始められるため、まずはお試し感覚で触ってみてください。

    Grop公式サイト

    Llama 3モデルを選択する

    右上のメニューを開くと、さまざまなツールが選択できるプルダウンが出てきます。ここで、Llama 3 70bまたは8bを選択すると、Llama 3を使い始められます。

    Llama 3を活用するメリット

    Llama 3の活用は、開発コストの削減英語分野と相性が良いさまざまなプラットフォームに対応するなどのメリットにつながります。

    ここではメリットについて一つずつご紹介します。

    開発コストの削減が期待できる

    Llama 3の最大のメリットは、開発コストの削減が期待できる点です。

    オープンソースとして無料で提供されているため、一定の条件に当てはまらない限りライセンス料を支払う必要がありません。

    コストが限られている小規模企業や、個人でも最新のAI技術に触れられ、高度な言語処理機能を自社のサービスに簡単に導入できます。

    また、ライセンス料がかからない分、その他の予算として回すことができます。

    マーケティングや人材育成などにリソースを割くことが可能になるため、開発コストを削減しながら高品質の製品を実現したい場合におすすめです。

    コーディングなどの英語分野と相性が良い

    Llama 3は、英語によるトレーニングデータが95%を占めているため、英語を使用するコーディングやアプリケーションの作成などとの相性はバッチリです。

    英語の文章を理解したり生成したりする能力が高いため、開発において強みを発揮します。

    英語を使った開発を効率的に進められるため、生産性が向上し、グローバルなビジネスをサポートします。

    また、英語分野と相性が良いことで、最新の情報に素早くアクセスできる点も強みです。効率的な開発やプロジェクトの進行が円滑になることが期待できます。

    さまざまなプラットフォームに対応する

    Llama 3はさまざまなプラットフォームに対応するメリットもあります。

    例えば、以下の環境で使用できます。

    • ウェブアプリケーション
    • モバイルアプリケーション
    • デスクトップアプリケーション
    • クラウドサービス など

    また、Llama 3 は、AWSやGoogle Cloud、Microsoft Azureなどのプラットフォームと簡単に統合可能です。

    多くのプラットフォームと統合することで、カスタマーサポートの自動化実現チャットボットの開発自動記事生成など、クリエイティブな作業が効率化できます。

    自社のプラットフォームに合わせた環境でLlama 3を活用することができるため、より高度なAIサービスの展開につながります。

    Llama 3の日本語学習モデルを使うには

    Llama 3は英語に特化しているため、英語を使わない人にとってはやや使いにくく感じる可能性があります。

    そこでおすすめのツールが、Llama 3の日本語学習モデル「Llama 3 Youko 8B」です。

    日々進化を続けているAI業界で英語圏の技術に追随するために、rinnaによって開発されました。

    Llama 3 8Bをもとに、日本語と英語の学習データ220億トークンを用いて事前学習済みです。すでにMetaのLlama 3 Community Licenseの下で公開されているため、ライセンスに従って利用できます。

    性能は、日本語言語モデルのベンチマークである『Stability-AI/lm-evaluation-harness』の9タスクの平均スコアで評価されており、Llama 3のスコアが59.82であるのに対し、Llama 3 Youko 8Bは66.15という高いスコアを記録しました。

    Llama 3の性能がそのまま日本語モデルにも引き継がれていることがわかります。

    Llama 3 Youko 8B

    Llama 3の今後について

    Llama 3は、今後も開発の行方が注目されており、バージョンアップによってどのような変化が起こるかが見どころです。

    すでに400Bモデルが開発されている点と、多言語対応の拡大が予想されていることで、大きな注目を浴びています。

    ここでは、この2つについて詳しくご紹介します。

    400Bモデルが開発されている

    現在公開されている8B、700Bモデルに加えて、400Bモデルが開発されています。

    400Bモデルでは、4,000億のパラメーターを持つ大規模言語モデルとなり、現在のモデルをはるかに超える処理能力と精度になるでしょう。

    複雑なタスクや長文の言語生成が可能になることが予想されるため、応用できる範囲が拡大することが期待されます。

    高度な自然言語理解リアルタイムでの翻訳複雑な問題解決など、現在よりもさらに進化したモデルとして活躍するでしょう。

    多言語対応の拡大が予定されている

    今後は多言語に対応したバージョンが開発される予定です。現在は英語がメインですが、30を超える非英語データの利用が進んでいます。

    多言語対応が拡大すれば、さまざまな言語環境で利用することができるため、グローバルなビジネスもサポートします。

    ビジネスで英語以外の言語を扱う場合でも、利便性の高いサービスを提供することが可能になるでしょう。

    まとめ:Llama 3は無償オープンソースの強みを活かした発展に期待がかかる

    今回の記事では、2024年にMetaが発表した新AIのLlama 3をご紹介しました。

    オープンソースで幅広く利用できるため、ビジネス開発においてコスト削減したい企業気軽に最新のAI技術に触れたい人など、多くの人におすすめのツールです。

    さらにバージョンアップしたLlama 3が開発される予定なので、今後の進化にも注目です。

    Llama 3をはじめとするAIツールに関してお困りではありませんか?

    株式会社Jiteraでは、生成AIの活用のノウハウを活かしてお客様の課題を解決するサポートを行なっています。

    AIツールに関することや導入方法、その他お困りのことがありましたら、ぜひJiteraにご相談ください。

    株式会社Jitera

    コスト削減も課題解決も同時に実現

    「JITERA」で迅速
    ソフトウェア開発

    開発を相談する
    おすすめの記事

    その他のカテゴリー

    email-img
    メルマガ登録
    JITERA社内で話題になった生成AIトレンドをいち早くお届けします。
    Thank you!

    Jiteraのメールマガジン登録が完了しました。