ComfyUI のインストールと使いこなしに必要な Diffusion モデル概要入門

今回は、 ComfyUI をインストールし、 自分で簡単なワークフローを構築するために必要な Diffusion モデルの概要について説明します。 なお、以下の文書の想定読者は、 コンソールでコマンドを叩く程度の IT リテラシーを持っていることを前提にしています。 インストール先は Windows, Linux, Mac どれも対応しています。 ComfyUI インストール ComfyUI は Python で開発されています。 今現在 Python のインストールは uv で行なうのがもっとも簡単・便利で早いので、 まずは uv のインストールから始め

Windows で RTX5070 TI を使った ComfyUI のパフォーマンス

先日 AI モデル開発検討用に RTX5070 TI を購入した。 せっかく、お高い GPU を買ったので色々とローカル AI ツールを試している。 ローカル AI ツールは様々な用途の AI があるが、 とりあえず一番面白そうな画像生成 AI ツールを試す。 画像生成 AI ツールも色々あるが、自由度と分かり易さと更新頻度から ComfyUI を選択。 なお、自分は開発系の作業は windows 専用のアプリ開発でない限りは、wsl を利用している。 ComfyUI も wsl で作業したいところだが、気になるのはパフォーマ

clang が fatal error: 'cmath' file not found でビルド失敗する

pip でとあるモジュールをインストールしようとしたところ、 次の clang のエラーでインストールが失敗した。 fatal error: 'cmath' file not found 今回は、このエラーの対応方法の話。 原因 pip のモジュールインストールは、python スクリプトのインストールだけでなく、 C 言語等の別言語で開発されているライブラリのビルドも行なう。 このビルドにおいて、C 言語は C コンパイラ、 C++ 言語は C++ コンパイラが当然利用される。 では、このコンパイラに何か使われるか?

Tensorflow で crop_and_resize を使うと onnx 変換で中間レイヤーの入力 shape 未確定エラーする

今回のネタはかなり細かい話なので、前提の説明が必要になる。 調べた結果を最初に書いておくので、それ以降は興味のある人向け。 TL;DR tensorflow の crop_and_resize を使ったモデルを onnx 変換する時は opset 14 以上 を使え crop_and_resize とは AI を使って画像からオブジェクトを検出し、 そのオブジェクトを識別する際の実現方法は次の2つに分かれる。 解析対象の画像を入力してオブジェクトの検出と、識別をそれぞれ別々に行なう2つのモデルを用意する 解析対象の画像を入力し、1つ

(KP41病) 新しく PC を組んだら頻繁に画面フリーズと BSOD が発生→原因は CPU

このところ、 新しく PC を組んだことに関連するネタばかり書いているが、 多分今回で最後になる。 状況 新しく組んだ PC は、直後から非常に不安定だった。 現象としては以下が発生する。 不定期に画面の更新が止まり、ブラックアウト、あるいは、ホワイトアウトし、 2秒程度経過すると元の画面に戻る 不定期に OS が BSOD (ブルースクリーンでリブート)になる なお、次の画像はその BSOD のイベントログ表示画面のスクショを切り取った画像だが、 見る