年々爆発的に新規開拓され続ける生成AIサービスたち。
それに伴ってビジネスシーンでも積極的に活用され始め、最先端だったツールやサービスもいまや個人で利用できるほど身近なツールとなりました。
こちらの記事では生成AIの中でも特に注目を集める画像生成AIサービス「NovelAI Diffusion(NovelAI)」について、解説していきます。
本記事をお読みいただくことで、NovelAIの特徴、ビジネスシーンでの利用方法、他サービス(Stable Diffusion)との細かな違いといったポイントが学べます。
また、実際にNovelAIの利用例を公開しながら注意点や料金の設定まで含めて解説していきますので、はじめて生成AIに触るといった方にもわかりやすい内容となっています。
それでは解説を始めていきましょう。
2014年 大学在学中にソフトウェア開発企業を設立
2016年 新卒でリクルートに入社 SUUMOの開発担当
2017年 開発会社Jiteraを設立
開発AIエージェント「JITERA」を開発
2024年 「Forbes 30 Under 30 Asia 2024」に選出
NovelAI Diffusionとは何か?
NovelAI Diffusionとは、Anthropic社が開発したAI生成サービスのことです。
もともとNovelAIは、小説/ライター向けテキスト生成機能がメインのAIサービスとしてリリースされました。
その後、生成AI技術の発展により『NovelAI Diffusion Anime』という画像生成サービスが追加で実装され、日本の利用シーンにおいては主にこちらの画像生成のサービスを指すことが多い印象です。
プロンプトと呼ばれるテキスト入力規則に従って指示することで、ごく僅かな時間での美麗で高品質な画像の生成が可能となっています。
画像生成AIの分野において最も注目されているサービスであり、頻繁なアップデートと細部まで作り込まれたカスタマイズ性が魅力です。
NovelAI Diffusionの概要
NovelAI Diffusionは、日本国内において画像生成AIの新しい地平を切り開いた元祖です。
他の画像生成AIと同じく即座に画像を生成できる一方で、画像の質と多様性を両立させています。
画像生成の質が非常に高く、細部までリアルに再現され指示に基づいた忠実な描写が可能です。
さらに、プロンプトの自動学習能力も比肩するものがないほど高く、特定の画家の名前を指定するだけで類似した画風の作品を生み出すことさえできるほど高性能です。
反面、ビジネスシーンでの利用においては、直接的なプロンプト入力によって生み出された画像は版権問題に抵触するおそれがあります。
利用上の注意を熟読すること、クリエイターへの権利侵害がないようにするなど、画像生成AIサービスにおける課題について細心の注意を払いましょう。
また、画像生成に付随するメタデータが充実しているのも特徴です。
例えば、文字情報やプロンプトなどから画像の生成過程を詳細に分析し、メタデータの項目を微調整することでイメージにより近い画像に近づけることが可能になります。
小説生成ツールとしても便利なNovelAIではありますが、本記事では主に画像生成サービスであるNovelAI Diffusionに焦点を絞って解説していきます。
NovelAI Diffusionの技術的特徴
NovelAI DiffusionはDiffusion Model(拡散モデル)とTransformerという2つの技術を組み合わせています。
Diffusion Model(拡散モデル)は、ノイズ付加→ノイズ除去の一連の過程を経て画像を生成する手法です。一般にステップ数(イテレーション)と呼ばれる単位での管理をしています。
ステップ数を増やすほど、プロンプトに忠実なハイクオリティな画像の生成が期待できます。
しかし、より厳密で具体的なプロンプトが必要とされ、思い描いた画像を出力する難易度も格段に上がります。
手始めにサンプルを作成する場合は、ステップ数を増やさずにデフォルト(または推奨される数)で作成するとより自然な仕上がりが期待できます。
この技術は一般にDDPM(Denoising Diffusion Probabilistic Models)と呼ばれ、本項の対象であるNovelAIを始めとしたさまざまな画像生成AIサービスで利用されています。
Transformerは自然言語処理で使われる技術で、深層学習のモデルの一つです。
この技術により、私達の打ち込んだテキストや文脈を自然に解釈して画像生成に反映します。
特定の要素を強調したり、より抽象度の高い解釈(恥ずかしい、楽しい、悲しいなど)まで、まるで人と対話するような精度での実装が可能です。
さらに「ネガティブプロンプト」の設定にも対応しており「画像に反映させないでほしい要素」を指定することで、不必要な情報をあらかじめカットしておくこともできます。
これら2つの技術を統合させることで、精巧な画像を実現できるのがNovelAI Diffusionの最大の特徴です。
また、画像生成モデル自体の規模も大きいことから、参考とする画像情報を大量に取り込んでおり、違和感の少ないあらゆる画風の再現が可能となっています。
同時に、NovelAI Diffusionのポテンシャルを引き出すためには、相応の知識が必要とされるサービスでもあります。
最新モデルV3の機能
NovelAI Diffusion Anime V3は2023年5月にリリースされた最新バージョンで、従来のV2からさまざまな機能強化がなされています。
画像生成の質と拡張性が大幅に改善され、さらに高解像度の画像生成が可能になりました。
7種類のモデルサイズが新たに用意され、利用シーンに応じて使い分けられます。
小サイズ、通常、大サイズと大きさが異なり、品質とコストのバランスを取れます。
特に注目すべきはsmea(Sinusoidal Multipass Euler Ancestral)と呼ばれる追加機能で、1024p × 1024p以上の高解像度生成の品質と一貫性をより向上させることができます。
ただし、メタデータのカスタマイズ項目が増えており厳密な調整が求められます。
画像生成に関する知識も必要となりますし、理想の画像を出力するためのリトライ数も増えることでしょう。
V2以前のバージョン選択も可能なため、求める画像のクオリティに応じて旧モデルに切り替えるのも一つの手です。
NovelAI DiffusionとStable Diffusionの違い
NovelAI DiffusionとStable Diffusionはともに注目の画像生成AIモデルですが、いくつかの違いがあります。
まず、Stable Diffusionはオープンソースで無料で利用ができ、サービス自体に組み込んだりローカルな環境に落とし込めるメリットがあります。
NovelAI Diffusionは有料サービスではありますが、ブラウザ上での直感的な操作を得意としています。技術的な要件をさほど満たす必要がなく、金額にさえ問題がなければ気軽に利用できると言えます。
次に、画像生成の質ではNovelAI Diffusionの方が圧倒的に高品質で、カスタマイズ性にも優れます。
細かい描写から抽象度の高い画風までリアルに再現できます。
NovelAIは様々なサイズのモデルから選択でき、ユースケースに合わせて使い分けられますが、一方、Stable Diffusionは1つのモデルサイズのみです。
NovelAIとStableの比較
NovelAIとStable Diffusionを比較すると、それぞれ長所短所があります。
Stable Diffusionの長所は、無料で利用でき、オープンソースでモデルの改変や学習データの追加もできることです。
また、開発コミュニティも大規模で様々な拡張機能が公開されています。
短所は、画像生成の質がNovelAIに及ばず、ある程度の画質の荒さは否めません。
また、研究者向けにチューニングされた側面があり、一般ユーザーには使いにくい面もあります。
Stable Diffusion | 項目 |
メリット |
|
デメリット |
|
NovelAIの最大の長所は画像生成の品質であり、細かい指示を与えても精密に反映されます。
企業向けに設計されているため、利用用途に合わせて最適なモデルを選択できます。
短所は有料サービスのため、料金が必ずかかることです。画像生成ごとにブラウザへの入力や、クラウド環境から呼び出す構築が必要となります。
生成自動化といった分野においては専用のAPI開発をする手間があり、可用性の面でStable Diffusionよりは劣ります。
NovelAI | 項目 |
メリット |
|
デメリット |
|
NovelAIとStable Diffusion、どちらを選ぶべきか
NovelAIとStable Diffusionのどちらを選ぶべきかは、利用目的と優先事項によって異なります。
Stable Diffusionを選ぶべきケースとしては、以下のようなものが考えられます。
- 研究開発目的で使う場合
- モデルの改変や学習データの変更を行いたい場合
- 画像生成の質よりも無料で使えることを重視する場合
- 個人的な用途で画質があまり問題にならない場合
一方、NovelAIを選ぶべきケースは次のようなものでしょう。
- 商用サービスの開発など、高品質な画像生成が必須の場合
- 多様なユースケースに対応したモデル選択ができることが重要な場合
- 利用頻度が高く、リアルタイム生成が求められる場合
- 開発リソースに余裕があり、有料サービスを利用できる場合
無料で研究開発を行うのであればStable Diffusionが良いといえます。
しかし、商用サービスで初めて生成AIを取り扱うといったケースであれば、NovelAIを選ぶほうが技術的トラブルが少なく済むと考えられます。
コストと生産性を考慮に入れたうえで、選択することをオススメします。
お気軽にご相談ください!
NovelAI Diffusionの無料版と有料版
NovelAI Diffusionは、無料版と、さまざまな付加機能が利用できる有料サービスが提供されています。
無料版では、画像生成AI機能は試用できません。
NovelAIのメイン機能である小説作成機能を無料で利用できるのみとなっています。なお利用回数も50回限りです。
NovelAIでは「Anlas」という専用の通貨を購入することで画像生成機能が利用可能となります。
「Anlas」は定量課金より購入できる方針の他、月額のプランや、一ヶ月大容量の使い切りプランなどが用意されています。用途と必要な機能に合わせて最適なプランを選ぶことが重要でしょう。
継続的な生成サービスをビジネス利用する場合、サービスの規模に比例して利用料金が加算されていく点を念頭に置いておきましょう。
高解像度の設定やプロンプトの無制限化など多くの高度な機能を利用できますが、メタデータを増やすことで1枚あたりの画像生成に消費する「Anlas」も増えていく特徴もあります。
無料版の機能と限界
前述した通り、NovelAI Diffusionの画像生成サービスは無料で利用できません。
NovelAIには、AIによる小説生成機能を試用できる無料版のみが存在しています。
出力文字数に上限はありますが、ユーザーが物語の概要を入力するだけで続きを自動生成してくれます。
本格的な長編小説執筆には向きませんが、アイデア出しの補助ツールとして活用したり、記事執筆への補助として機能を体験してみるのには最適です。生成AIの中では入門的な位置づけでしょう。
日本語への対応もしており、おおよそ1分で400文字程度の生成が可能となっています。
しかし物語があらぬ方向にすすんだり、不自然に場面が転換したりなど、ニュアンスやプロンプトの微調整は必須だと感じました。
筋の通った物語の大量生成という観点での利用は難しいため、あくまでプロット作成の補助として活用が見込めるでしょう。
有料版の追加機能と価格
NovelAI Diffusion専用通貨である「Anlas」を購入することで全ての機能を利用することが可能です。
参考までに下記に定量料金設定を記載します。(1ドル=130円として計算)
Anlas数 | 価格(USD/円) | 1$あたりのAnlas数 |
2,000 | $4.79/622円 | 417anals/1$ |
5,000 | $8.19/1,064円 | 610anals/1$ |
10,000 | $13.99/1,819円 | 714anals/1$ |
機能を確かめたい場合、手始めに2000anlasの定量購入をオススメします。
設定やメタデータ項目によって変動はしますが、2000anlasあれば約100枚の画像生成が可能です。
定量課金の他、月額のサブスクリプションプランがあり、機能とリソースの量に応じて金額が変わります。
次にサブスクライブの定額課金について記載します。
プラン名 | Tablet | Scroll | Opus |
料金(月額) | $10/月(USD) | $15/月(USD) | $25/月(USD) |
月あたりの補充Anlas | 1000Anlas | 1000Anlas | 10000Anlas |
トークン数 | 3072トークン | 6144トークン | 8192トークン |
トークンデータ | トークン数 ~12288 | トークン数 ~24576 | トークン数 ~32768 |
トークン数とは主にAIの記憶容量と考えてもらって構いません。
トークン数が多いほど過去のスクリプトを参照したり、参照画像のデータ量を増やし適切な画像生成を補助します。
3つのプランを比較した時、Opusが圧倒的大容量を誇っています。継続的な利用を考えている場合はOpusが最良の選択肢となるでしょう。
気をつけたいのが、anlasはあくまで月あたりの「補充」であって「追加」ではありません。
例えば、Opusプランで前月に3000anlas残したまま次月に引き継いでも、13000anlasとならずに上限の10000anlasとなりますので利用の際はご注意のほどを。
続いて画像生成時に消費するAnlasについて記載します。
画像生成サイズ | 1枚あたりの消費Anlas(text2image) | 1枚あたりの消費Anlas(image2image) |
デフォルトサイズ(1024 x 1024) | 20Anlas | 14Anlas |
大サイズ(1472 x 1472) | 51Anlas | 36Anlas |
壁紙(1920 x 1080) | 48Anlas | 38Anlas |
デフォルトサイズ+ 高解像設定 | 36Anlas | 25Anlas |
こちらの表は「text2image」(テキストからの画像生成)と「image2image」(オリジナルの画像+テキストから画像生成)での生成ケースの料金を一部抜粋したものです。
用意した参考画像からプロンプトに従って改変を行う「image2image」では、元の画像がある分、消費anlasが少なめになります。
一例として、まず「text2image」から画像を生成。生成した画像の中からイメージに一番近い画像を選び、「image2image」でより理想の画像に近づけていくと、コストを抑えつつ大量の画像を作成できます。
サブスクリプションを登録することで高機能な生成AI機能を十分に活かし、本格的な制作現場での利用が可能となります。
ぜひ検討してみましょう。
AI導入に関することはJiteraにご相談ください!
NovelAI Diffusionの活用事例
NovelAI Diffusionは多種多様な業界で幅広く活用されており、枚挙にいとまがありません。
マーケティング業界では広告画像の作成や商品のビジュアライズに役立ちます。
デザイン業界では、イラストやロゴ、製品デザインなどのアイデア出しに。
芸術分野では、アーティストの創作のサポートツールとして注目を集めています。
ゲーム業界でもキャラクターデザインや背景画像の生成に使われ、素材同士の合成や補正など、少ないリソースでも無限の可能性を見せてくれます。
本記事では、特にさかんな下記3つの活用事例について、詳しく解説していきます。
- アニメ制作補助
- NFTでの販売(Non-Fungible Token)
- コンテンツ製作
せっかくですので、実際にNovelAIにて作成した画像をサムネイルに添えて紹介していきましょう。
NovelAI Diffusionを商用利用する際の注意点
NovelAI Diffusionを商用で利用する際は、いくつかの注意点があります。
まず第一に、生成した画像の著作権についてです。
NovelAIの規約では、生成物の知的所有権はユーザーに帰属しますが、同時に学習データの権利者からの権利侵害クレームのリスクは常に考えられます。
そのため、商用利用する際は、生成物を十分に確認し、権利侵害の可能性がないかチェックする必要があります。
次に、モデルの出力バイアスについても注意が必要です。
Diffusionモデルは学習データに基づいておりバイアスが発生する可能性があります。
人種、性別、宗教などについて不適切な出力をする場合があり、商用サービスではこれらのバイアスに対して慎重な対応が求められます。
また、画像生成の倫理面での配慮も重要です。過激で暴力的または露骨な性的コンテンツなどの出力は控えるべきでしょう。
ユーザーに不適切なコンテンツを提示しないよう、出力コンテンツのモニタリングやフィルタリングが必要不可欠。
フィルタリングについては「ネガティブプロンプト」を厳密に設定して、不必要な要素を出力しないようコントロールすることが重要です。
NovelAI Diffusionはその性質上、実写よりもアニメ調の出力が多くなる傾向にありますが、これらが既存の作品に類似してしまったり、同じ構図が出力されてトラブルになるケースも後を絶ちません。
そのまま商業展開することのないように、かならず人の手や人の目によるチェックを工程に加えておく必要があります。
NovelAI Diffusionは優れた技術ですが、商用利用における課題、適切に管理する体制など、画像生成の有識者による意見を常に取り入れることが不可欠でしょう。
NovelAI Diffusionでクリエイティビティを高めましょう!
NovelAI Diffusionを単なる画像生成AIサービスとして利用するだけでも十分楽しい体験なのですが、生成AIは人のクリエイティビティを加速させていくものです。
プロンプトを入念に考えて入力し、独創的な画像をどう生成するか。
そして生成した画像をどう活用するかは、人の手の委ねられます。
そこから新たなアイデアが生まれ、クリエイティブな活動のさらなる発展につなげる事ができます。
また、イメージと言語の相互作用により、ヒトとAIが協調しながら創作を行うことも、こういったサービスの面白い点です。
AIが生成したイメージからインスピレーションを得て言語的な表現を生み出し、さらにそれを元にAIが新たなイメージを出力するというサイクルを繰り返すことで、AIとヒトが刺激し合いながらクリエイティビティを増幅させていくことが出来ます。
NovelAI Diffusionを利用することで、プロのクリエイターのように優れたコンテンツを生み出せるはずです。
当社jiteraでは、クライアントに合った開発手法や体制の構築をサポートいたします。
小さなスタートから、御社のビジネスを確実に前に進めるシステムをともに作り上げていきましょう。
また、最新のAI技術であるGPT-4を活用したシステム開発や導入支援も行っております。
生成AIとGPT-4の組み合わせなど、AIを用いた開発について何かご相談やご質問がありましたら、Jiteraへお気軽にお問い合わせください。
AIの最新動向を踏まえた最適なソリューションをご提案いたします。