精度が高いと評判!画像生成AI「NovelAI Diffusion」とは?料金やStable diffusionとの違い、活用事例などを紹介

年々爆発的に新規開拓され続ける生成AIサービスたち。
それに伴ってビジネスシーンでも積極的に活用され始め、最先端だったツールやサービスもいまや個人で利用できるほど身近なツールとなりました。

こちらの記事では生成AIの中でも特に注目を集める画像生成AIサービス「NovelAI Diffusion(NovelAI)」について、解説していきます。
本記事をお読みいただくことで、NovelAIの特徴、ビジネスシーンでの利用方法、他サービス(Stable Diffusion)との細かな違いといったポイントが学べます。
また、実際にNovelAIの利用例を公開しながら注意点や料金の設定まで含めて解説していきますので、はじめて生成AIに触るといった方にもわかりやすい内容となっています。

それでは解説を始めていきましょう。

Nao Yanagisawa
監修者 Jitera代表取締役 柳澤 直

2014年 大学在学中にソフトウェア開発企業を設立

2016年 新卒でリクルートに入社 SUUMOの開発担当

2017年 開発会社Jiteraを設立
開発AIエージェント「JITERA」を開発

2024年 「Forbes 30 Under 30 Asia 2024」に選出

アバター画像
執筆者 猫暮 てねこ

システムエンジニア(SE)、プログラマー、ウェブサイト作成業務、ネットワークエンジニアなどを経験。 現在、フリーマルチライターとして活動中。最近はAI活用方面に没頭中。

\生成AIのエキスパートが回答!/
生成AIの導入について無料相談する
記事についての気軽な質問や、生成AI の導入・活用の仕方などお気軽にご相談ください。

    会社名必須
    必須
    必須
    Eメール必須
    電話番号必須
    ご依頼内容必須

    NovelAI Diffusionとは何か?


    NovelAI Diffusionとは、Anthropic社が開発したAI生成サービスのことです。
    もともとNovelAIは、小説/ライター向けテキスト生成機能がメインのAIサービスとしてリリースされました。

    その後、生成AI技術の発展により『NovelAI Diffusion Anime』という画像生成サービスが追加で実装され、日本の利用シーンにおいては主にこちらの画像生成のサービスを指すことが多い印象です。
    プロンプトと呼ばれるテキスト入力規則に従って指示することで、ごく僅かな時間での美麗で高品質な画像の生成が可能となっています。

    画像生成AIの分野において最も注目されているサービスであり、頻繁なアップデートと細部まで作り込まれたカスタマイズ性が魅力です。

    NovelAI Diffusionの概要


    NovelAI Diffusionは、日本国内において画像生成AIの新しい地平を切り開いた元祖です。
    他の画像生成AIと同じく即座に画像を生成できる一方で、画像の質と多様性を両立させています。
    画像生成の質が非常に高く、細部までリアルに再現され指示に基づいた忠実な描写が可能です。
    さらに、プロンプトの自動学習能力も比肩するものがないほど高く、特定の画家の名前を指定するだけで類似した画風の作品を生み出すことさえできるほど高性能です。

    反面、ビジネスシーンでの利用においては、直接的なプロンプト入力によって生み出された画像は版権問題に抵触するおそれがあります。
    利用上の注意を熟読すること、クリエイターへの権利侵害がないようにするなど、画像生成AIサービスにおける課題について細心の注意を払いましょう。

    また、画像生成に付随するメタデータが充実しているのも特徴です。
    例えば、文字情報やプロンプトなどから画像の生成過程を詳細に分析し、メタデータの項目を微調整することでイメージにより近い画像に近づけることが可能になります。

    小説生成ツールとしても便利なNovelAIではありますが、本記事では主に画像生成サービスであるNovelAI Diffusionに焦点を絞って解説していきます。

    NovelAI Diffusionの技術的特徴

    NovelAI DiffusionはDiffusion Model(拡散モデル)Transformerという2つの技術を組み合わせています。

    Diffusion Model(拡散モデル)は、ノイズ付加→ノイズ除去の一連の過程を経て画像を生成する手法です。一般にステップ数(イテレーション)と呼ばれる単位での管理をしています。
    ステップ数を増やすほど、プロンプトに忠実なハイクオリティな画像の生成が期待できます。
    しかし、より厳密で具体的なプロンプトが必要とされ、思い描いた画像を出力する難易度も格段に上がります。
    手始めにサンプルを作成する場合は、ステップ数を増やさずにデフォルト(または推奨される数)で作成するとより自然な仕上がりが期待できます。
    この技術は一般にDDPM(Denoising Diffusion Probabilistic Models)と呼ばれ、本項の対象であるNovelAIを始めとしたさまざまな画像生成AIサービスで利用されています。

    Transformerは自然言語処理で使われる技術で、深層学習のモデルの一つです。

    この技術により、私達の打ち込んだテキストや文脈を自然に解釈して画像生成に反映します。
    特定の要素を強調したり、より抽象度の高い解釈(恥ずかしい、楽しい、悲しいなど)まで、まるで人と対話するような精度での実装が可能です。
    さらに「ネガティブプロンプト」の設定にも対応しており「画像に反映させないでほしい要素」を指定することで、不必要な情報をあらかじめカットしておくこともできます。

    これら2つの技術を統合させることで、精巧な画像を実現できるのがNovelAI Diffusionの最大の特徴です。
    また、画像生成モデル自体の規模も大きいことから、参考とする画像情報を大量に取り込んでおり、違和感の少ないあらゆる画風の再現が可能となっています。
    同時に、NovelAI Diffusionのポテンシャルを引き出すためには、相応の知識が必要とされるサービスでもあります。

    最新モデルV3の機能

    NovelAI Diffusion Anime V3は2023年5月にリリースされた最新バージョンで、従来のV2からさまざまな機能強化がなされています。
    画像生成の質と拡張性が大幅に改善され、さらに高解像度の画像生成が可能になりました。
    7種類のモデルサイズが新たに用意され、利用シーンに応じて使い分けられます。

    小サイズ、通常、大サイズと大きさが異なり、品質とコストのバランスを取れます。

    特に注目すべきはsmea(Sinusoidal Multipass Euler Ancestral)と呼ばれる追加機能で、1024p × 1024p以上の高解像度生成の品質と一貫性をより向上させることができます。
    ただし、メタデータのカスタマイズ項目が増えており厳密な調整が求められます。

    画像生成に関する知識も必要となりますし、理想の画像を出力するためのリトライ数も増えることでしょう。
    V2以前のバージョン選択も可能なため、求める画像のクオリティに応じて旧モデルに切り替えるのも一つの手です。

    NovelAI DiffusionとStable Diffusionの違い


    NovelAI DiffusionとStable Diffusionはともに注目の画像生成AIモデルですが、いくつかの違いがあります。

    まず、Stable Diffusionはオープンソースで無料で利用ができ、サービス自体に組み込んだりローカルな環境に落とし込めるメリットがあります。
    NovelAI Diffusionは有料サービスではありますが、ブラウザ上での直感的な操作を得意としています。技術的な要件をさほど満たす必要がなく、金額にさえ問題がなければ気軽に利用できると言えます。

    次に、画像生成の質ではNovelAI Diffusionの方が圧倒的に高品質で、カスタマイズ性にも優れます。
    細かい描写から抽象度の高い画風までリアルに再現できます。
    NovelAIは様々なサイズのモデルから選択でき、ユースケースに合わせて使い分けられますが、一方、Stable Diffusionは1つのモデルサイズのみです。

    NovelAIとStableの比較

    NovelAIとStable Diffusionを比較すると、それぞれ長所短所があります。

    Stable Diffusionの長所は、無料で利用でき、オープンソースでモデルの改変や学習データの追加もできることです。
    また、開発コミュニティも大規模で様々な拡張機能が公開されています。

    短所は、画像生成の質がNovelAIに及ばず、ある程度の画質の荒さは否めません。
    また、研究者向けにチューニングされた側面があり、一般ユーザーには使いにくい面もあります。

    Stable Diffusion 項目
    メリット
    • 無料で利用可能
    • オープンソースでモデルの改変や学習が可能
    • ローカル環境で実行できる
    • 大規模な開発コミュニティがあり拡張性が高い
    デメリット
    • 画像の品質がNovelAIに及ばない
    • 研究者向けの側面が強く、一般利用は不向き
    • 単一のモデルサイズのみ
    • 画像生成プロセスのメタデータが乏しい
    • 企業による本格的な商用利用は難しい

    NovelAIの最大の長所は画像生成の品質であり、細かい指示を与えても精密に反映されます。
    企業向けに設計されているため、利用用途に合わせて最適なモデルを選択できます。

    短所は有料サービスのため、料金が必ずかかることです。画像生成ごとにブラウザへの入力や、クラウド環境から呼び出す構築が必要となります。
    生成自動化といった分野においては専用のAPI開発をする手間があり、可用性の面でStable Diffusionよりは劣ります。

    NovelAI 項目
    メリット
    • 画像の品質が非常に高い
    • 大規模モデルで詳細な指示にも対応可能
    • 様々なモデルサイズから選択できる柔軟性
    • 専門家向けにチューニングされている
    • 画像生成プロセスが詳細に記録されたメタデータ
    • 企業による本格的な商用利用が可能
    デメリット
    • 有料のサブスクリプションサービス
    • ローカル環境で実行できないクラウドベースのみ
    • オープンソースではないので改変が難しい

    NovelAIとStable Diffusion、どちらを選ぶべきか

    NovelAIとStable Diffusionのどちらを選ぶべきかは、利用目的と優先事項によって異なります。

    Stable Diffusionを選ぶべきケースとしては、以下のようなものが考えられます。

    • 研究開発目的で使う場合
    • モデルの改変や学習データの変更を行いたい場合
    • 画像生成の質よりも無料で使えることを重視する場合
    • 個人的な用途で画質があまり問題にならない場合

    一方、NovelAIを選ぶべきケースは次のようなものでしょう。

    • 商用サービスの開発など、高品質な画像生成が必須の場合
    • 多様なユースケースに対応したモデル選択ができることが重要な場合
    • 利用頻度が高く、リアルタイム生成が求められる場合
    • 開発リソースに余裕があり、有料サービスを利用できる場合

    無料で研究開発を行うのであればStable Diffusionが良いといえます。
    しかし、商用サービスで初めて生成AIを取り扱うといったケースであれば、NovelAIを選ぶほうが技術的トラブルが少なく済むと考えられます。

    コストと生産性を考慮に入れたうえで、選択することをオススメします。

    NovelAI Diffusion関連システムの受託開発のご依頼はお気軽にどうぞ!
    Jiteraが無料で技術相談に乗ります!
    お気軽にご相談ください!

      会社名
      メールアドレス
      ご相談内容

      NovelAI Diffusionの無料版と有料版


      NovelAI Diffusionは、無料版と、さまざまな付加機能が利用できる有料サービスが提供されています。
      無料版では、画像生成AI機能は試用できません。
      NovelAIのメイン機能である小説作成機能を無料で利用できるのみとなっています。なお利用回数も50回限りです。

      NovelAIでは「Anlas」という専用の通貨を購入することで画像生成機能が利用可能となります。

      「Anlas」は定量課金より購入できる方針の他、月額のプランや、一ヶ月大容量の使い切りプランなどが用意されています。用途と必要な機能に合わせて最適なプランを選ぶことが重要でしょう。
      継続的な生成サービスをビジネス利用する場合、サービスの規模に比例して利用料金が加算されていく点を念頭に置いておきましょう。

      高解像度の設定やプロンプトの無制限化など多くの高度な機能を利用できますが、メタデータを増やすことで1枚あたりの画像生成に消費する「Anlas」も増えていく特徴もあります。

      無料版の機能と限界

      前述した通り、NovelAI Diffusionの画像生成サービスは無料で利用できません
      NovelAIには、AIによる小説生成機能を試用できる無料版のみが存在しています。

      出力文字数に上限はありますが、ユーザーが物語の概要を入力するだけで続きを自動生成してくれます。
      本格的な長編小説執筆には向きませんが、アイデア出しの補助ツールとして活用したり、記事執筆への補助として機能を体験してみるのには最適です。生成AIの中では入門的な位置づけでしょう。

      日本語への対応もしており、おおよそ1分で400文字程度の生成が可能となっています。
      しかし物語があらぬ方向にすすんだり、不自然に場面が転換したりなど、ニュアンスやプロンプトの微調整は必須だと感じました。
      筋の通った物語の大量生成という観点での利用は難しいため、あくまでプロット作成の補助として活用が見込めるでしょう。

      有料版の追加機能と価格

      NovelAI Diffusion専用通貨である「Anlas」を購入することで全ての機能を利用することが可能です。

      参考までに下記に定量料金設定を記載します。(1ドル=130円として計算)

      Anlas数 価格(USD/円) 1$あたりのAnlas数
      2,000 $4.79/622円 417anals/1$
      5,000 $8.19/1,064円 610anals/1$
      10,000 $13.99/1,819円 714anals/1$

      機能を確かめたい場合、手始めに2000anlasの定量購入をオススメします。
      設定やメタデータ項目によって変動はしますが、2000anlasあれば約100枚の画像生成が可能です。
      定量課金の他、月額のサブスクリプションプランがあり、機能とリソースの量に応じて金額が変わります。

      次にサブスクライブの定額課金について記載します。

      プラン名 Tablet Scroll Opus
      料金(月額) $10/月(USD) $15/月(USD) $25/月(USD)
      月あたりの補充Anlas 1000Anlas 1000Anlas 10000Anlas
      トークン数 3072トークン 6144トークン 8192トークン
      トークンデータ トークン数 ~12288 トークン数 ~24576 トークン数 ~32768

      トークン数とは主にAIの記憶容量と考えてもらって構いません。
      トークン数が多いほど過去のスクリプトを参照したり、参照画像のデータ量を増やし適切な画像生成を補助します。

      3つのプランを比較した時、Opusが圧倒的大容量を誇っています。継続的な利用を考えている場合はOpusが最良の選択肢となるでしょう。
      気をつけたいのが、anlasはあくまで月あたりの「補充」であって「追加」ではありません
      例えば、Opusプランで前月に3000anlas残したまま次月に引き継いでも、13000anlasとならずに上限の10000anlasとなりますので利用の際はご注意のほどを。

      続いて画像生成時に消費するAnlasについて記載します。

      画像生成サイズ 1枚あたりの消費Anlas(text2image) 1枚あたりの消費Anlas(image2image)
      デフォルトサイズ(1024 x 1024) 20Anlas 14Anlas
      大サイズ(1472 x 1472) 51Anlas 36Anlas
      壁紙(1920 x 1080) 48Anlas 38Anlas
      デフォルトサイズ+ 高解像設定 36Anlas 25Anlas

      こちらの表は「text2image」(テキストからの画像生成)「image2image」(オリジナルの画像+テキストから画像生成)での生成ケースの料金を一部抜粋したものです。
      用意した参考画像からプロンプトに従って改変を行う「image2image」では、元の画像がある分、消費anlasが少なめになります。

      一例として、まず「text2image」から画像を生成。生成した画像の中からイメージに一番近い画像を選び、「image2image」でより理想の画像に近づけていくと、コストを抑えつつ大量の画像を作成できます。
      サブスクリプションを登録することで高機能な生成AI機能を十分に活かし、本格的な制作現場での利用が可能となります。
      ぜひ検討してみましょう。

      AI導入に関することはJiteraにご相談ください!

      NovelAI Diffusionの活用事例

      ホームページ制作会社のおすすめランキング!東京・大阪・福岡・名古屋の大手会社を一覧で比較!
      NovelAI Diffusionは多種多様な業界で幅広く活用されており、枚挙にいとまがありません。
      マーケティング業界では広告画像の作成や商品のビジュアライズに役立ちます。
      デザイン業界では、イラストやロゴ、製品デザインなどのアイデア出しに。
      芸術分野では、アーティストの創作のサポートツールとして注目を集めています。
      ゲーム業界でもキャラクターデザインや背景画像の生成に使われ、素材同士の合成や補正など、少ないリソースでも無限の可能性を見せてくれます。

      本記事では、特にさかんな下記3つの活用事例について、詳しく解説していきます。

      • アニメ制作補助
      • NFTでの販売(Non-Fungible Token)
      • コンテンツ製作

      せっかくですので、実際にNovelAIにて作成した画像をサムネイルに添えて紹介していきましょう。

      アニメ制作補助


      NovelAI Diffusionはアニメ制作の現場でも大いに役立ちます。キャラクターデザインや背景画像の制作工程で活躍が期待できます。
      上記画像はオフィスの風景を指定しつつ、アニメで用いられそうなワンシーンを想定して作成しました。

      例えば、NovelAI Diffusionにキャラクターのコンセプトや特徴をプロンプトで入力すれば、それに基づいた多様なデザイン案が生成されます。
      加えて、デザインから元となる画像を抽出し、「image2image」でさらに画像の改良を図ることができるため、差分の作成や修正フェーズが最小限で済む、といったメリットがあります。背景画像の制作にも活用できるでしょう。

      ロケーション設定や風景のイメージをプロンプトで指定すれば、そのまま利用できるクオリティの背景画像が生成されます。
      多数の背景画像が一括で作れるので、制作リードタイムとコストの大幅な削減にもつながります。

      ただし、人物の正確な描写については十分なプロンプトでない場合、ノイズ(不自然な手の造りや、物が宙に浮くといった不自然な配置)が発生する可能性もありますので、人の手による確認と細かな修正は必須でしょう。

      NFTでの販売


      NovelAI Diffusionで生成した画像は、NFT(Non-Fungible Token)としてデジタルアートの販売に活用できます。
      この販売形態の場合は、NFTマーケットプレイスで仮想通貨と交換してのビジネス活用がメインとなります。
      上記画像は、ビジネスシーンやオフィスを表すアイキャッチを想定して作成してみました。

      誰でも高品質なデジタルアートを生成できるため、新たなNFTアーティストといったジャンルもビジネスシーンにおいて需要が増しています。
      例えば、特定の画像に対して大量の差分を作成→納品といったビジネス形態において、NovelAI Diffusionに精通したプロンプター(入力するテキストを選別し、理想に近い画像生成を行うスキルを持った人)は、大量のバリエーション画像を生成して一気にNFTマーケットに投入することが可能です。

      クリエイターと提携しスタジオワークを待つよりも、NFTマーケットにおいて展開されている画像を購入・利用するビジネスモデルが有効になる場合も多いでしょう。
      ただし、画風や盗作といった著作権に関わるグレーゾーンもまだ整備されきっていない分野ですので、商業利用の際は慎重な検討も必要です。

      コンテンツ制作


      NovelAI Diffusionはマーケティングやメディア領域のビジュアルコンテンツ制作にも最適です。
      広告バナー画像や動画のサムネイル画像、記事用のイラスト画像などを手軽に作れます。
      上記画像は、IT系ビジネス新書やライトノベルの挿絵を想定して作成してみました。

      例えば、コンセプトに合った雰囲気のバナー広告画像をすぐに生成できます。
      複数のデザイン候補を対比しながら絞り込み、最適なものを選んでいくのでデザインの修正サイクルも短縮できます
      また、動画サムネイル画像も同様です。シーンに合わせて様々なサムネイル画像を生成可能です。視聴者の目を引く斬新なデザインを複数量産したり、再生回数を増加にも一役買ってくれることでしょう。

      NovelAI Diffusionは、多種多様なビジュアルコンテンツの制作プロセスを効率化し、マーケティングのみならず様々な製作現場で活躍が見込めます。
      まずは1枚、試しに作成してみるところから始めてみてはいかがでしょうか。

      NovelAI Diffusionを商用利用する際の注意点


      NovelAI Diffusionを商用で利用する際は、いくつかの注意点があります。

      まず第一に、生成した画像の著作権についてです。
      NovelAIの規約では、生成物の知的所有権はユーザーに帰属しますが、同時に学習データの権利者からの権利侵害クレームのリスクは常に考えられます。
      そのため、商用利用する際は、生成物を十分に確認し、権利侵害の可能性がないかチェックする必要があります。

      次に、モデルの出力バイアスについても注意が必要です。
      Diffusionモデルは学習データに基づいておりバイアスが発生する可能性があります。
      人種、性別、宗教などについて不適切な出力をする場合があり、商用サービスではこれらのバイアスに対して慎重な対応が求められます。
      また、画像生成の倫理面での配慮も重要です。過激で暴力的または露骨な性的コンテンツなどの出力は控えるべきでしょう。

      ユーザーに不適切なコンテンツを提示しないよう、出力コンテンツのモニタリングやフィルタリングが必要不可欠
      フィルタリングについては「ネガティブプロンプト」を厳密に設定して、不必要な要素を出力しないようコントロールすることが重要です。
      NovelAI Diffusionはその性質上、実写よりもアニメ調の出力が多くなる傾向にありますが、これらが既存の作品に類似してしまったり、同じ構図が出力されてトラブルになるケースも後を絶ちません。
      そのまま商業展開することのないように、かならず人の手や人の目によるチェックを工程に加えておく必要があります。

      NovelAI Diffusionは優れた技術ですが、商用利用における課題、適切に管理する体制など、画像生成の有識者による意見を常に取り入れることが不可欠でしょう。

      NovelAI Diffusionでクリエイティビティを高めましょう!


      NovelAI Diffusionを単なる画像生成AIサービスとして利用するだけでも十分楽しい体験なのですが、生成AIは人のクリエイティビティを加速させていくものです。

      プロンプトを入念に考えて入力し、独創的な画像をどう生成するか。
      そして生成した画像をどう活用するかは、人の手の委ねられます。
      そこから新たなアイデアが生まれ、クリエイティブな活動のさらなる発展につなげる事ができます。

      また、イメージと言語の相互作用により、ヒトとAIが協調しながら創作を行うことも、こういったサービスの面白い点です。
      AIが生成したイメージからインスピレーションを得て言語的な表現を生み出し、さらにそれを元にAIが新たなイメージを出力するというサイクルを繰り返すことで、AIとヒトが刺激し合いながらクリエイティビティを増幅させていくことが出来ます。

      NovelAI Diffusionを利用することで、プロのクリエイターのように優れたコンテンツを生み出せるはずです。

      当社jiteraでは、クライアントに合った開発手法や体制の構築をサポートいたします。

      小さなスタートから、御社のビジネスを確実に前に進めるシステムをともに作り上げていきましょう。
      また、最新のAI技術であるGPT-4を活用したシステム開発や導入支援も行っております。

      生成AIとGPT-4の組み合わせなど、AIを用いた開発について何かご相談やご質問がありましたらJiteraへお気軽にお問い合わせください。

      AIの最新動向を踏まえた最適なソリューションをご提案いたします。

      コスト削減も課題解決も同時に実現

      「JITERA」で迅速
      ソフトウェア開発

      開発を相談する
      おすすめの記事

      その他のカテゴリー

      email-img
      メルマガ登録
      JITERA社内で話題になった生成AIトレンドをいち早くお届けします。
      Thank you!

      Jiteraのメールマガジン登録が完了しました。