インテル® Arc™ GPU上のGenAIにおけるComfyUIとFooocusの比較

コンテンツ別 |

人気のある2つの安定した拡散ツールは、これ以上ないほど異なっている。

昨年の夏、インテル・アークGPUに対応したPC上で動作する3つの安定した拡散ツールについての記事を掲載した。そして、AIと同じように、多くのことが進歩した。ありがたいことに、インテルのソフトウェアフレームワークと拡張機能によって、高速LCM LoRasのような最新の機能がインテルArc GPUで実行できるようになっただけでなく、6ヶ月前よりも多くのGenAIツールでサポートされるようになりました。

この記事では、Stable Diffusionに追加された2つのウェブイについて説明します。どちらもこれまで見てきたものより強力で、ユーザーのタイプによっては、どちらかを選ぶのが正しい選択でしょう。

しかし、これらの新しいツールはこれ以上ないほど異なっている。複雑さとユーザーエクスペリエンスに関しては、両極端に位置している。Fooocusはシンプルなインターフェイスで、設定変更はしばしばあなたのために行われる。一方、ComfyUIはノードシステムのパワーを持ち、無限の設定とカスタムワークフローを可能にする。

各ツールの詳細と特徴については、以下のビデオをご覧ください。どちらのツールも、ディスクリートのIntel Arc GPUを使用しても問題なく動作します。インストールとサポートの詳細は以下のリンクから。

Fooocus WebUI:  FooocusのWebuiは、高度な画像拡散機能とシンプルなトーンダウンされたインターフェイスが融合した、最も興味深いものです。 Fooocusは、ユーザーが手作業で行う多くのステップを自動化することで、他とは一線を画している。 新しいモデル、リファイナー、その他のテクニックがジェネレーティブAIに追加されるにつれ、Fooocusは作業をより簡単にするよう働きかけている。例えば、Fooocus には JuggernaughtXL モデルが自動的に付属しています。これは、リアルで映画のような、コンセプトアートのような画像を生成するのに最適な多目的モデルです。 また、Fooocus はリファイナーを追加するような機能を自動化するので、出力がよりクリーンで詳細になります。 また、SDXLとSDXL with LCMを切り替えるときは、ボタンを1つクリックするだけです。他のほとんどのUIでは、切り替え時に少なくとも3~5回の設定変更を行うことになります。 最後に、Fooocusはどのツールよりも優れた画像入力機能を備えており、特にアウトペインティングでは、元の画像になかったコンテンツを追加して画像をあらゆる方向に拡張できます。

UI-Image-1

要するに、ユーザーフレンドリーで、非常に直感的に使え、しかもパワフルな機能とカスタマイズが思いのままにできるものをお望みなら、このウェブイはうってつけだ。 

際立った特徴

  • シンプルでクリーンなインターフェイスで、圧倒されることなく、とても直感的。
  • SDXL出力。 デフォルトでは、すべての画像生成は高解像度です。
  • インテリジェント・コンフィギュレーションでは、最適かつフールプルーフなコンフィギュレーション・オプションを提供します。
  • Juggernaut SDXLモデルでインストールします。(CivitAIのHugging Faceからダウンロードする必要はありません。)
  • 強力で使いやすいアウトペインティングとインペインティング機能。
  • シンプルなチェックボックスで、画像生成の3つの速度/品質を設定できます:高速(20サンプル)、高品質(60サンプル)、超高速(8サンプルLCM高速LoRa)
  • 出力を特定のルックやスタイルに向けるスタイル・オプション
  • 隠された、しかしアクセス可能な高度な開発者向け機能により、デフォルトを上書きし、出力を微調整することができます。

インストール方法とディスカッション・スレッド インテル Insiders Discordにて(ディスクリートGPUのみ)

ComfyUI: もう一方では、画像生成ツールComfyUIの人気が高まっている。私のようにStable Diffusionの動画をよく見ていると、多くのYouTuberがA1111からComfyUIに移行しているのを見かけます。 このツールは、設定をいじったり、現在のGenAIテクノロジーでできることの限界に挑戦するのが好きな人に最適です。パワフルなWebUIであり、私たちはこのツールがあなたのために何ができるのか、ほんの表面を掻いただけです。

UI-Image-2

ComfyUIが他のツールと異なる点は、ビジュアルノードシステムを使用して、画像やビデオをどのように生成したいかを定義することです。 Unreal EngineやBlender、Unityに馴染みのある方であれば、ノードシステムはコーディングを必要としないビジュアルプログラミング手法です。 これは、あるノード関数の出力を接続し、別のノード関数の入力にプラグインすることで行われます。 出力は、異なる処理を行う複数のノードに接続することができ、処理の流れを作成します。 Comfyには、画像入力、テキスト入力、モデル入力、LoRaエンコーディング、ControlNetプリプロセッサなどのノードがあります。

コミュニティはまた、カスタムノードを作成し配布します。これにより、ComfyUI外の他のアプリケーションがこのノードシステムで動作し、画像生成に機能を追加するためのプラグインのようなアーキテクチャが可能になります。 カスタムノードは、ウェブカメラや、フィルターや画像処理に影響を与える画像エディタのようなアプリケーションを可能にするかもしれません。

さらに、ノードのワークフローは、将来のために保存して再読み込みしたり、JSONイメージとして配布したりすることができるため、ビジュアルワークフローをUIスペースに直接ドラッグ&ドロップして高速に読み込むことができます。 このUIは、コーディングスキルを必要としない拡張可能な開発プラットフォームに急速になりつつある。

際立った特徴

  • 複雑で強力なノードベース・システム
  • コードを記述することなく、設定可能なコントロールと機能の広範で深いセット
  • SD 1.5とSDXLをサポートし、カスタム、チェックポイント、LoRas、VAE、リファイナーなどをサポート。
  • ノード・クリエイターのエコシステムが成長中。rd 高度なツールマネージャ、プロセッサとメモリ使用率、ビデオとウェブストリーム入力など、パーティ製アプリの統合
  • ControlNet、インペインティング/アウトペインティング、高速LCM LoRa、アニメートディフ、SDビデオ、フェイススワップをサポート

インストール方法とディスカッション・スレッド インテル Insiders Discordにて(ディスクリートGPUのみ)

インテル® Arc GPU上でこれらのツールが実際に動作する様子は、上のビデオでご覧ください。また、インテル® Arcおよびインテル®ハードウェア上のAIに関する詳細については、以下をご参照ください。継続的なコンテンツと参加については インテル インサイダーズ Discord コミュニティ そこで私やインテルの関係者がコミュニティと会話を交わす。