2024年8月1週目:社内で話題になった「生成AIトレンド・ニュース」

こんにちは!Jiteraの岩崎です。

もう40度が目の前ですね、皆さん体に気をつけてくださいね。

では今週もこの一週間で社内で話題になった生成AIトレンドについて説明します。

Black Hat USA 2024で生成AIのセキュリティリスクが議論される

Black Hat USA 2024 | Cyversity

Black Hat USA 2024は、サイバーセキュリティの専門家が集まる世界的なカンファレンスで、今年は8月3日から8月8日までラスベガスのMandalay Bay Convention Centerで開催されました。このイベントでは、生成AI(生成型人工知能)のセキュリティリスクについても多くの議論が行われました。

AIサミット

特に注目されたのは、Black Hat USA 2024の一環として開催されたAIサミットです。このサミットでは、最新の技術や戦略について学び、実践的なセッションを通じて知識を深めることができました。

議論された主なセキュリティリスク

生成AIに関連するセキュリティリスクについて、以下の点が議論されました:

  • データのバイアスと公平性: AIモデルが訓練されるデータセットに含まれるバイアスが、生成されるコンテンツにどのように影響するか。データのバイアスは、特定のグループに対する偏見を引き起こす可能性があり、公平性の問題を生じさせます。
  • AIの悪用: サイバー攻撃者が生成AIを利用してフィッシングメールや偽情報を生成し、どのようにしてセキュリティシステムを突破するか。生成AIは、リアルな偽情報を簡単に作成できるため、攻撃の手口が高度化しています。
  • AIの透明性と説明責任: AIシステムの意思決定プロセスの透明性を確保し、説明責任を持たせる方法。透明性がないと、誤った意思決定や不正な利用が見過ごされるリスクがあります。
  • AIシステムの脆弱性: AIモデル自体の脆弱性を特定し、それを悪用する攻撃手法とその防御策。AIシステムの脆弱性を突かれると、攻撃者がシステムを制御したり、誤ったデータを生成したりすることが可能です。

主要なセッションとスピーカー

Microsoftは、AIを活用したサイバーセキュリティオペレーションと脅威インテリジェンス研究に関する専門知識を共有しました。特に注目されたのは、MicrosoftのCorporate Vice PresidentであるAnn Johnson氏による基調講演で、AIを利用したセキュリティの最新のベストプラクティスについて議論されました。また、MicrosoftのAI Red Teamは、AIシステムの開発ライフサイクルにおけるRed Teamingの実践についてのホワイトペーパーを発表し、AIシステムのセキュリティリスクを低減するための具体的な手法を紹介しました。

Whisper Medusa

Whisper-Medusaは、音声認識技術の分野で注目を集めている新しいAIモデルです。このモデルは、OpenAIのWhisperをベースにしていますが、いくつかの革新的な特徴を持っています。

Whisper-Medusaの特徴

  • 高速性能: Whisper-Medusaは、従来のWhisperモデルと比較して約50%高速に動作します。これにより、リアルタイムでの音声認識や大規模なデータ処理が可能になります。
  • マルチヘッドアテンション: 革新的な「マルチヘッドアテンション」アーキテクチャを採用しており、一度に複数のトークンを予測することができます。これにより、音声認識の精度と速度が大幅に向上します。
  • 精度の維持: 速度が向上しているにもかかわらず、元のWhisperモデルと同等の精度を維持しています。高精度な音声認識が求められるビジネス用途や医療分野などでの活用が期待されます。
  • トークン予測: 現在のバージョンでは10個のトークンを同時に予測できますが、将来的には20個のトークンを予測できるバージョンの開発が計画されています。これにより、さらに高速かつ詳細な音声認識が可能となります。
  • オープンソース: モデルの重みとコードはMITライセンスの下でオープンソース化されており、GitHub上で公開されています。これにより、研究者や開発者が自由にモデルを利用し、改良を加えることができます。

Graph RAGの一般利用可能に

Graph RAG(Graph Retrieval-Augmented Generation)は、従来のRAG(Retrieval-Augmented Generation)アプローチを強化するために、グラフデータベースを利用する手法です。ナレッジグラフを活用して、LLM(大規模言語モデル)に対してより豊富なコンテキスト情報を提供することで、質問応答の精度と関連性を向上させることができます。

Graph RAG: Unleashing the Power of Knowledge Graphs with LLM | by NebulaGraph Database | Medium

Graph RAGの概要

  • 構造化データの提供: グラフデータベースから取得した構造化されたエンティティ情報をLLMに提供し、より深い洞察を得ることを可能にします。これにより、単なるテキストデータよりも詳細で信頼性の高い情報を提供できます。
  • コンテキストの豊富さ: 各レコードがコンテキスト的に豊富な表現を持つため、特定の専門用語やドメインに対する理解が深まります。これにより、質問応答の精度が向上し、より具体的で適切な回答が得られます。
  • 統合アプローチ: 標準的なRAGアプローチと組み合わせることで、テキストコンテンツの広範さとグラフ表現の構造と正確さの両方を活用できます。これにより、より包括的な情報提供が可能となります。

一般利用可能性

Graph RAGは、以下のような形で一般利用が可能となっています:

  • オープンソースの提供: Microsoftは、Graph RAGのコードとソリューションアクセラレータをGitHubで公開しており、ユーザーはこれを利用して自分のデータセットに対する質問応答システムを構築できます。
  • プラグインと統合: OntotextのGraphDBは、Graph RAGの実装を迅速かつ効率的に行うための多くの統合機能を提供しています。特に、GraphDBのSimilarityプラグインやChatGPT Retrieval Plugin Connectorを使用することで、ベクトルデータベースにコンテンツをインデックス化し、高精度のクエリを実行できます。

利用シーンとメリット

  • カスタマーサポート: 製品マニュアルや既知の問題集から最新の情報を参照し、ユーザーの問い合わせに的確に回答します。
  • 社内FAQ: 社内ナレッジベースを活用し、社員の問い合わせに簡潔に回答します。
  • マーケティング&セールス: 最新の製品カタログや営業資料を参照し、顧客の質問に最適な情報を提示します。

Brev AI

Brev.ai - 最新の製品情報、最新の価格とオプション 2024 - GptDemo.Net

Brev AIは、テキストから音楽を生成する無料のオンラインAI音楽生成ツールです。以下にBrev AIの主な特徴と使用方法をまとめます:

主な特徴

  • 無料でオンライン利用可能: ログインなしで誰でも無料で利用できます。
  • テキストから音楽生成: ユーザーが入力したテキスト説明から音楽を生成します。例えば、「勇者が冒険の旅に行くテーマ曲」といった具体的な指示を与えることができます。
  • Suno V3.5技術搭載: 高品質な音楽生成を可能にする最新のAI技術を使用しています。この技術により、生成される音楽は多様でクリエイティブなものとなります。
  • 多様な音楽スタイル: レゲエ、エレクトロニック、クラシックなど様々なジャンルの音楽を生成できます。ユーザーの好みに合わせて、様々なスタイルの音楽を提供します。
  • カスタマイズオプション: 歌詞、スタイル、タイトルなどを調整可能です。これにより、ユーザーは自分のニーズに合った音楽を作成できます。

使用方法

  1. Brev AIのウェブサイトにアクセスします。
  2. 「無料で音楽を生成」ボタンをクリックします。
  3. 曲の説明を入力欄に記入します(例:「勇者が冒険の旅に行くテーマ曲」)。
  4. 必要に応じて、インストゥルメンタル(歌詞なし)オプションを選択します。
  5. 「音楽を生成」ボタンをクリックします。
  6. 生成された音楽を確認し、必要に応じて調整します。
  7. 満足できる結果が得られたら、音楽をダウンロードします。

日立が開発した文章に“多重電子透かし”を入れる技術

日立製作所は7月29日、AIが生成した文章に多重電子透かしを搭載する技術を開発したと発表しました。この技術を使うことで、人間が書いた文章なのか、AIが生成した文章なのかを見分けられるというものです。この研究を主導した、同社の研究開発グループ先端AIイノベーションセンタの永塚光一企画員は「世界で初めて、AI生成文章に二重、三重と多重に透かしを入れられる技術を開発した」と話しています。

仕組み

文章に電子透かしを入れる仕組みは“単語をグループ分けする”というものです。例えば、AIが生成できる単語をランダムに2つのグループに分けて、文章を作る際に“できるだけ特定のグループの単語を文章に入れる”ように細工を施します。人間が書いた文章であれば、2つのグループの単語がそれぞれ半分ほどの割合で入りますが、AI生成文章では指定したグループの単語の割合が高くなるため“AIが生成した可能性が高い文章”と判断できます。

一見すると普通の文章に見えるため、透かしが入っているのかは分かりません。しかし、グループ分けをする際に事前に決めていた“鍵(パスワード)”を使うことで、それぞれの単語がどのグループに入っているか分かり、透かしとして検出できる仕組みです。鍵によってグループ分けも異なるため、AIごとに鍵を設定することで“どのAIが生成した文章なのか”も区別可能です。

技術の進展

この技術は、米メリーランド大学の研究チームが2023年8月に発表したものを基に、日立がさらに進めて世界で初めて三重以上の透かしを入れる技術を開発しました。多重に透かしを入れる仕組みは、グループ分けをさらに細分化していくことにあります。できるだけ文章に入れるように定めたグループの中から“特に入れてほしい単語”のグループを新たに作り、その単語が入っている比率で、より精度高くAI生成文章なのかを判断できるようにします。

 

課題と展望

この技術には課題もあります。鍵を持っている人物のみが透かしを作成・検出できるが、もしこの鍵が漏えいしてしまうと不特定多数の人物が透かしを再現できるようになってしまいます。しかし、多重電子透かしの場合は、1つ目の透かしの鍵が漏えいしてしまっても、2つ目以降の透かしから生成元の判別ができます。

また、文章量が短い文章では十分な数のグループ分けができず、検出精度が下がります。現状では、300単語程度の文章ならば二重透かしを入れられるという他にも、透かしの対象になる単語が増えてしまうことで、文章として成立しないものを生成するなど質の問題や、特定のグループの文章を意図的に増やすことで透かしを無効にすることが技術的に可能である点なども、現状の課題として挙げられています。

永塚企画員は「この技術の原理的には、言語による精度の違いはほとんどなく、英語でも日本語などの言語の他、自然言語ではない言葉にも適用できる」と説明しています。楽譜などの音符にもこの技術を適用することで、AI生成かどうかを判断することも可能です。

「この技術を使うことで、ニュースやSNSの投稿がAI製のものなのかの判断が可能になる。他にも、教育現場であれば学生のレポートがAI製なのか分かるなど、AIの不正利用防止に役立てられる」と永塚企画員は述べています。

29日時点では、この技術はまだ製品化はしておらず、今後も研究を進めて事業化などを検討する方針です。生成AIによるフェイクニュースの氾濫する事態を受け、世界各国で法整備が進む中であるため、日立としても「(この技術を)国際組織に働きかけないと効力を発揮できない」という認識で、世界全体の社会的要請に合わせて技術開発を進めたいという考えです。


今週はBlack Hat USA 2024で議論された生成AIのセキュリティリスク、Whisper Medusaの新しい音声認識技術、Graph RAGの一般利用可能性、Brev AIの音楽生成ツール、そして日立が開発した文章に“多重電子透かし”を入れる技術についてご紹介しました。

Jiteraでは、要件定義を書くだけでAIが開発をしてくれるシステム開発AIエージェントを運営しています。生成AIを活用したシステム・アプリの開発のご支援も行っております。生成AIに関するささやかな疑問や、開発に関するお問い合わせがあれば、こちらよりお気軽にご相談ください。

来週も、Jitera社内で話題になったAIトレンドを発信していくので、お楽しみに!

コスト削減も課題解決も同時に実現

「JITERA」で迅速
ソフトウェア開発

開発を相談する
おすすめの記事

その他のカテゴリー

email-img
メルマガ登録
JITERA社内で話題になった生成AIトレンドをいち早くお届けします。
Thank you!

Jiteraのメールマガジン登録が完了しました。