今日のAI画像生成のお相手は「FLUX(フラックス)」じゃ。前回(Day 010)の挑戦で、「Expand」ボタンを使うと、プロンプトをええ感じに設定画面に反映してくれることを学んだからのう。今日もさっそくプロンプトを入力してから「Expand」ボタンをポチ!じゃ。
FLUXで1回目の逆さ富士の風景画作成
河口湖の穏やかな水面に、完璧な鏡面反射(逆さ富士)を映し出す、超写実的で映画のような富士山の風景。 手前には、鮮やかなピンクの桜と、瑞々しく赤い牡丹(ぼたん)が満開に咲き誇っている。傍らには、伝統的な赤い五重塔が優雅に佇んでいる。 空は息をのむような夕暮れのグラデーションで、天の川と輝く星々が見える。透き通った水の中を、色とりどりの鯉が優雅に泳いでいる。 高精細、8K解像度、広角、アスペクト比 16:9。
実際に送った英語
Hyper-realistic, cinematic landscape of Mount Fuji with a perfect mirror reflection (inverted Fuji) on the calm surface of Lake Kawaguchi. In the foreground, vibrant pink cherry blossoms and lush red peonies are in full bloom. A traditional red five-story pagoda stands elegantly on the side. The sky is a breathtaking twilight gradient with a visible Milky Way and glowing stars. Colorful koi fish are swimming gracefully in the crystal-clear water. High detail, 8k resolution, wide angle, aspect ratio 16:9.

おお、今日もええ感じに分割してくれたんじゃないか?
そして今日、おばあの目についたのは「Guidance Scale(ガイダンス・スケール)」と「Number of Inference Steps(推論ステップ数)」っちゅー項目じゃ。

Geminiの解説がわかりやすかったので、ここにも載せるぞ。Geminiいつもありがとう。
1. Guidance Scale(ガイダンス・スケール)
これは、**「AIがどれだけおばあちゃんの言うこと(プロンプト)を忠実に聞くか」**という、「頑固さ」の指標じゃ。
- 数字が小さい(3.0〜5.0): AIが「おばあちゃんの指示もわかるけど、わしもちょっとアレンジしてみるわ!」と自由に描く。絵は自然で綺麗になりやすいが、指示したものが消えることもある。
- 数字がちょうどいい(7.0〜9.0): おばあちゃんの指示をしっかり守りつつ、AIらしい美しさも保つ「黄金バランス」じゃ。
- 数字が大きい(15.0以上): AIが「絶対におばあちゃんの言う通りにするぞ!」と必死になりすぎる。色がどぎつくなったり、画像がバキバキに荒れたり(「焼ける」と言うんじゃ)することがある。
おばあちゃんへのアドバイス: FLUX 1や2なら、まずは 3.5〜5.5 くらいが推奨されることが多いぞ。他のAIより低めの数字でも、しっかり言うことを聞いてくれる賢い子なんじゃ。
2. Number of Inference Steps(推論ステップ数)
これは、**「AIが何回筆を入れて、画像を仕上げるか」**という、「描き込みの回数」のことじゃ。
AIは最初、テレビの砂嵐みたいなノイズから絵を作り始めるんじゃが、そのノイズを何回かけて取り除くか、という回数じゃな。
- 回数が少ない(10〜20): 「速描き」じゃ。すぐ完成するが、細かいところがボヤけたり、書き込みが足りなかったりする。
- 回数がちょうどいい(25〜40): 丁寧に仕上げた「清書」じゃ。風景画ならこれくらいあると、桜の花びら一枚一枚まで綺麗に描けるぞ。
- 回数が多い(60以上): 「超・丁寧」じゃが、回数を増やせば増やすほど良くなるわけじゃない。時間はかかるし、あまりやりすぎると逆に変な線が入ることもある。
おばあちゃんへのアドバイス: FLUXなら 20〜30ステップ あれば、もう十分すぎるほど綺麗な絵が完成するぞ!
設定の裏側を知ると、AIが一生懸命筆を動かしている姿が目に浮かぶようじゃ。働かせすぎもよくないんじゃな。ちなみに「おばあちゃん」とは、わしのことじゃ。
今回ののGuidance Scaleは「3.5」、Number of Inference Stepsは「28」じゃから、Geminiのおすすめの範囲内じゃな。それでは、ついに実行するぞ。

おお!花が左右対称に配置されていて、人工っぽさはあるが、逆にそれが安定した印象を与えるのう。逆さ富士も上下対称だからか、とにかく安定しているという印象をおばあは受けたぞ。まるで万華鏡を覗いているような、計算し尽くされた美しさじゃな。
今週毎日思っとるが、素人のおばあでもここまでの画像が作れるなんて、本当にAIの進歩はすごいのう。
画像生成の仕方がちょっとずつわかってきたところで、来週は生き物のAI画像生成に挑戦しようかのう。