生成AIまんがのクオリティを劇的に上げるテクニック!(1/2)

目次
画像生成AIは楽しい!だけど少々問題もあるよね~?
高性能・高品質なPCが、一般市場に出回るようになって久しい今日この頃ですが、近頃「生成AI(Generative AI)」なるものが世間を大いに賑わしています 。
例えば、どんなに世情に疎い人であっても、「ChatGPT」なるサービス名くらいは聞いたことがあるのではないでしょうか。聞いたことない人はこれから聞いて下さい。
さて、ChatGPT(GPT-4o)」の画像生成機能によって、お手軽簡単にイラストが生成できるようになりました。更に、皆さんご存じの「スタジオジ〇リ風」の生成画像が作れてしまう!という事がニュースとなり、話題となりました。
実際「ジ〇リ風」以外にも、様々な漫画やアニメの「〇〇風」の画像が作れてしまうようです。また、元絵を用意して、生成したい画像を、元絵風に加工することも可能です。
喜びのあまり、たくさんの「〇〇風」画像を生成していくと、ある時期から違和感を覚える場面も出てきます。
「なんか、生成した、画像のクオリティ、低くね?」問題です。
筆者が「ChatGPT」でまず、最初に生成した女の子のイラストがこちら。

それなりに描けているとは思うのですが、線も太いし、なんだか大ざっぱ感は否めません。
ちなみに、つい最近生成した女の子のイラストがこちら。

全く同じ「ChatGPT‑4o」で描かせた絵です。最近の生成結果と比較すると、雲泥の差がありますよね。
ここだけの話、テクノロジーに詳しい人は、誰もが皆「stable diffusion」という画像生成AIを自分のPC上にインストール後、ゴリゴリにカスタマイズして、どSKBな絵を生成させて悦に浸っている訳なのですが、今や素人御用達的な「ChatGPT」も、実はプロンプトを工夫することにより、かなりの高品質な画像を生成できるポテンシャルを持っているのです。
そこで今回は、筆者が経験上得た、生成AIまんがのクオリティを劇的に上げるテクニック!を公開いたします。ひと昔前なら企業秘密がウンタラクンタラで、その手に詳しい漫画家は、ノウハウを秘伝としていたんでしょうけれど、別にこだわりもないので、まあこんな時代ですから気前よく共有しちゃいましょう。
「絵柄の一貫性」が保てるようになって一層使い勝手が良くなったChatGPT

さて、「ChatGPT‑4o(別名 GPT‑Image 1)」が搭載された2025年3月25日のアップデートから、なんと「絵柄の一貫性」が保てるようになりました。それまでのバージョンは、
「このキャラクターデザイン、好みだな!このキャラクターで、違うポーズをさせてーッ!」
……ということが出来ませんでした。それまでのバージョンでは、同じ絵柄で別ポーズを再現することが難しかったのです。生成指示を出す度にランダムにキャラクターが生成されてしまい、いわゆるカワユス女の子が、こっち向いてニッコリ系の一枚絵の生成以外に、あまり使い道がなかったのでした。
この「絵柄の一貫性」アップデートにより、お気に入りのキャラクターが生成できたら、その絵柄を維持しながら、別の映像を生成出来る様になりました。しゅごい!……更にテキスト込みの画像生成まで可能になりました。ようするにこれは……。
「吹き出し付きの複数コマ漫画が描けるようになった」
ということです。つまり絵を描くのが面倒で仕方がない、筆者のような自称・漫画家(描かないなら漫画家名乗るなよ、という意見もありますが)にとっては、かなーり便利なシロモノです。
その結果、こんな感じの連続漫画がChatGPT単体で生成できるようになりました。今回、一度も液タブやペンタブを使用せず、すべてAIで生成しています。

まだ若干、文字化けをするようですが、この辺については後述いたします。
デフォルトのままでは使い勝手が悪い、ChatGPTの画像生成機能をブラッシュアップする方法!

さて、生成AIで漫画作品を制作しようとすると、皆さんおおむね、以下のような悩みに直面することになるのではないかと思います。
なぜか画面が黄色っぽくなる
キャラクターの線がぼやけて崩壊する
同じはずのキャラなのに顔・髪型・服装がバラバラ
これは単なるAIの「気まぐれ」ではなく、プロンプトや構成の設計に原因があるケースが大半です。本記事では、これらの問題を徹底的に防止するための具体的なテクニックを、実践に基づいて解説致します。
画面が黄色くなるのを防ぐには?《ホワイトバランス補正術》
画像が黄色くなるって、どんな感じでしょうか。ズバリ言ってしまうと、「ジ〇リ風」の絵を生成した時の色味です。ちょっと黄色というか、温かみのある色彩と言えば聞こえは良いですが、正直クセ強すぎますよね。生成した画像に更に修正をかけると、更に更にどんどん黄色くなってしまいます。
ちなみに、タイトル画の女の子をメッセージボックスにドラッグアンドドロップをして、「ジ〇リ風にして」と生成指示を出すと、この様な画像を出しやがりました。しかしまあ、モロですねえ、絵のタッチがハヤオ汁120パーセントですな。良きかな(©オクサレ様)。

実は生成AIでは、デフォルトで暖色(黄色・セピア系)に寄りやすい傾向があります。特に室内光や自然光を設定した場合に、この傾向が顕著です。そこでそれを回避して、本来の鮮やかな色調にしたい場合、以下のプロンプトを追加すると効果的です。
色温度を明示指定する
→「5500K(昼白色)」または「daylight color temperature (5500K)」などを明記。
色調指定で補助
→「クールトーンの自然光」「黄ばみのない光」「ニュートラルな白色光」
禁止キーワードも活用
→「avoid yellowish tones」「no sepia filter」「no warm color bias」
例文
daylight color temperature (5500K), neutral white light, avoid yellow tint, no warm filter, simulate outdoor daylight
上記のプロンプトを適用の上、同じ絵を再生成させると、このような感じになりました。ちゃんとした色調に戻ってくれました。
※勝手にウィンクして、雲まで追加してくれていますが、そこはまあ、見なかったことにします。ChatGPTは、結構勝手にこんな余計なことをするヤンチャ坊主(ユーザーの意図を超えた要素を追加すること)です。

描線の劣化・ぼやけ・崩壊を防ぐには?《描線強調術》
生成AI画像では、背景に気を取られるとキャラの線画がぼやけたり、輪郭が崩壊することがあります。その場合、この様なプロンプトで指示を出すと良いでしょう。
「繊細な描線」「明瞭な線画」と明記
「アニメ塗り(セル塗り)」「強いコントラスト」もセットで
写真風や水彩風は避ける
例文
anime cel shading, crisp lineart, ultra-fine lines, high contrast between shadows and highlights, avoid painterly or watercolor style
先ほどの画像にこのプロンプトを適用すると、この様になりました。如何にもイマドキのアニメ風になりましたねえ。こういう絵柄が好きか、嫌いか。それは貴方次第です(ドヤッ)。かろうじて、片方の鼻の穴を描くという、最低限の「ジ〇リ風」の矜持は、まだ維持しているようです(なんの矜持だ)。

キャラの一貫性を保つには?《設定統一術》
同じキャラの生成指示を出しているにも関わらず、複数の漫画コマを生成していくと、コマごとに顔・髪型・服装がブレる場合があります。それはプロンプトの一貫性の指示が不足しているためです。
そこで、以下のテクニックが有効になります。
一度作ったキャラ設定を明文化してテンプレ化
→お気に入りの女の子(女の子に限りませんが)の画像が生成出来たら、そのキャラクターの「年齢・髪型・髪色・瞳色・眼鏡の有無・服装・体型」や「住所・氏名・電話番号(うそ)」などを記載して、「プロンプトを生成して」と指示を出し、今後はコマを生成する度に、そのプロンプトを追記する、もしくは、その画像を「添付画像を参考にして生成して」と指示をする、もしくは画像添付とプロンプトの追記の両方を行う、というやり方です。
例えばお気に入りの可愛い女の子の画像が、なんだかんだで、うっかり以下みたいに生成できちゃったとします。

この画像を、ChatGPTのメッセージボックスにドラッグアンドドロップして、「詳細なプロンプトを生成して」と指示を出すと、以下のような回答が帰ってきました。
詳細プロンプト(日本語)
キャラクター設定:
25歳くらいの若い女性
明るい赤髪のボブカット(前髪あり、毛先がふわっと広がる自然な毛流れ)
肌は明るめで滑らか、健康的な印象
瞳は茶色、大きくて艶があり、目力がある
笑顔で、元気で爽やかな表情
服装・衣装:
白い半袖のセーラー服(夏服)
紺色の襟(ライン入り)+赤いスカーフ
スカーフは大きめのリボン状にきちんと結ばれている
制服は現代的で清潔感があり、しわや影の描写も丁寧
画風・スタイル:
現代的なアニメ風イラスト(セル画調)
線画は非常に繊細で丁寧(毛先や衣服の輪郭まで精密に描写)
塗りはアニメ塗り(セル塗り)で陰影は明瞭
肌・髪・服すべてにやや高めの彩度で発色が鮮やか
光源は正面~やや上(自然光風)、影の落ち方も正確
構図・画角:
キャラクターは正面向きのバストアップ(胸より上)
ポーズは自然体で、腕は画面外
視線はまっすぐ正面を向いており、見る者と目が合う構図
照明・色調:
ホワイトバランスは正確、色温度は昼光色(約5500K)相当
黄ばみやセピア調は一切なく、クール〜中立のナチュラルな雰囲気
全体として清潔感があり、明るくポジティブな印象
※キャラクターの生成の「年齢」についてですが、実は19歳未満(特に児童・未成年)の画像生成には、厳しいガイドラインと自動フィルターが設けられています。
「子ども」「未成年」「10代」などのワードを使った生成は拒否・警告が出やすい
水着や肌の露出、特定のポーズ、写実的な表現は特に厳しいフィルターがかかる
日本語・英語問わず規制ワードやプロンプトへの検出が入る
顔の幼さや体型などの特徴で自動的に年齢制限判定が働く場合がある
従って、筆者の場合は、可愛い女の子を生成する際、大前提として登場人物の年齢設定を25歳に設定して生成しております。これ以上だと老け顔になるし、これ以下だと急に等身が下がったり、子供っぽくなるような私感です。19歳未満の設定だと、基本セクシーポーズでビキニも着てくれなくなります。これは由々しき問題です。ただこれは、あくまで個人的な経験則です。
そして別途、新規で三面図を作っておくのはお薦めです。ChatGPTは、背面を描く時に結構テキトーに描く癖がある様なので。例えばお気に入りの女の子のバストアップ画像を添付して、以下の指示を出します。
汎用「三面図」生成用プロンプト(日本語)
キャラクターデザイン資料用の三面図。左から順に「正面」「横(右向き)」「背面」の3つの構図を、キャラクターが直立・無表情で整列した状態で並べる。髪型・顔・体型・衣装などすべての角度で完全に一致していること。三面図として資料性が高く、線画や形状に一切の誤差や崩れがないように描かれている。背景は無地の白。レイアウトは三面図用に整った横並びで、清潔で明確な構成。
英語版(ツール汎用向け)
A character design reference sheet showing a three-view turnaround: front view, side view (facing right), and back view. The character should be standing straight with a neutral expression in all three views. Hair, face, body proportions, and outfit must remain perfectly consistent across all angles. Presented in a clean, technical format with a white background, aligned horizontally. Highly accurate and suitable for professional design documentation, with no distortions or mismatches.
うまく生成出来れば、以下の様な三面図の完成です。

筆者の場合は、生成したいコマのプロンプトに、都度「バストアップ画像」+「三面図」+「キャラクターの詳細プロンプト」を追記しています。ここまですれば、コマ毎にコロコロとキャラクターデザインが変わることは「結構」なくなります。
ようするに、そのキャラクターの「年齢・髪型・髪色・瞳色・眼鏡の有無・服装・体型、その他色々」を、都度クドいくらい指定しろ、っちゅう事です。
もしくは、先述のプロンプトの後に、「これから作る全ての画像に、このプロンプトを適用して」という指示を出す方法もありますが、何コマか続けて画像を作成すると、AIは初期設定をちょいちょい忘れてしまうみたいです。面倒でも全コマ、都度、キャラの一貫性を保つプロンプトや参考画像の添付を行った方が良いでしょう。
ちょっと残念な話ですが、キャラクターに表情や動きを、少しオーバー気味につけてしまうと、ChatGPTはすぐそのキャラクターをデフォルメしてしまいます。リアルなキャラクターデザインでは、あまり派手な演技をさせることが出来ないようです。これは今後のバージョンアップで何とかして欲しい所ですね。そもそもコマ漫画を作るように出来ていないシステムで、無理に漫画作成をさせているせいなのかもしれませんが。
連続コマ漫画の整合性を保つ《コマ間リンク術》
生成AIでは、各コマが毎回「初期状態」で描かれるため、キャラや背景、小物の見た目や位置が勝手に変わることがよくあります。
このブレを防ぐには、「毎コマごとに前回の状態を明示的に引き継ぐ」ことが重要です。
小物の形や色が変わる
→形状・色・大きさ・配置を毎コマ明記する。
例:「黒い円柱型の小型カメラ。三つの丸いレンズが側面と上面に。手のひらサイズ」「前のコマと同じデザイン」。
重要な小道具は画像で記録・参照
→一度生成した小道具などは画像で保存し、「この添付画像と同じ形状」とプロンプトで参照させる指示を出す。
背景の雰囲気や構造が変わる
→「前コマと同じ教室の内装」「机の位置と構図は変えない」「光源の位置も同じ」など、空間の固定化を明示。
持っていた物が勝手に消える/変わる
→「ノートPCを開いたまま手元にある」「ケーブルが繋がったまま」「〇〇を手に持った状態を継続」など状態遷移をプロンプトに反映させる。
筆者がよく使う手としては、前のコマの画像を参考画像として添付した上で、変化がある箇所だけプロンプトで表現して、「それ以外は全てそのままで」とプロンプトを記載してしまう方法です。結構使える手です(時々裏切られることもありますが)。
キャラクターを背面から描くと、左右が逆になる問題への対処《背面構図対策》
さて、キャラクターが並んで描かれている画像を一枚生成できたとします。

その後、「カメラを背面に移動して画像を生成して」と指示を出すと、こうなります。

そうです、ChatGPTはアホなので、カメラを背面に向けても、左右をそのままにしてしまうのです。従って、
背面構図の際は、左右反転の指示をあえて明記する。もしくは都度左右の並びを直接指定する
「背面時は左右を逆に」というルールをプロンプトに組み込む
といった工夫が必要になります。「カメラを背面に移動して、背面時は左右を逆にして、画像を生成して」と指示をすると、正しい並びになりました。

動きのあるシーンで迫力が出ないときの対策《モーション演出術》
動きのあるシーンなのにキャラが止まって見える場合は、動きの軌道を明示する演出が不足しています。ChatGPTでは、以下の演出効果を利用可能。迫力ある画面作りに利用しましょう。
【迫力を出すためのプロンプト要素一覧】
動き・スピード感の演出
motion blur(モーションブラー)
speed lines(スピード線、流線)
impact frames(衝撃フレーム、瞬間の静止)
dynamic pose(動的ポーズ、躍動感ある構え)
exaggerated perspective(誇張された遠近感/パース)
衝撃・爆発・臨場感の演出
explosions(爆発)
debris flying(飛び散る破片)
shockwave effect(衝撃波)
dust clouds(砂煙、土埃)
lens distortion(レンズ歪み、魚眼寄り)
cinematic lighting(シネマティックなライティング)
エフェクト背景・集中線
radial burst background(集中線、放射エフェクト)
vibrating lines(振動線)
impact aura(衝撃オーラ)
light rays(光線/ライティングエフェクト)
chromatic aberration(色収差、アナログ風のズレ)
描画スタイル指定(演出強調)
high contrast shading(強めの陰影)
thick lineart with dynamic strokes(太めの線画+動きのある筆致)
anime cel-shading with dramatic tones(アニメ塗り+劇的な影)
【全部盛りプロンプト例(日本語・画像生成向け)】
「アニメ風のバトルシーン、キャラクターが激しい動きで攻撃している構図。モーションブラー、スピード線、集中線、衝撃波、破片が飛び散り、爆発や土煙も発生。極端な遠近感の誇張、魚眼風のパース。陰影は強く、厚い線画で力強く描かれ、シネマティックな自然光。カメラにはレンズの歪みや色収差が入り、エフェクト盛りのアクション演出。ダイナミックなスタイルで。」
女の子二人の格闘させるプロンプトに、上記の全部盛りのプロンプトを追加したら、こんなん出来ました。ちょっとやり過ぎかも?

日本語の文字が文字化けする問題、見づらい問題への対処《フォント対策》
ChatGPT(GPT-4o)は、日本語テキスト付き画像も生成可能とされていますが、現状では文字化けや、文字欠けが頻発するため、実用するにはやや不安定です。AIが日本語を正しく表示できない原因は以下の通りです。
そもそも英語が基本のサービスなので、日本語の理解度があまり無い
文字化けしたり見づらくなる原因として、背景に同化してしまっている
フチ文字や影がなくて可読性が低い
まあ,雰囲気としてはこんな感じの表記になることがママあります。

文字化けに関しては、当面はChatGPTによる生成は諦め、可能であれば、Photoshopなどで後から文字入れをした方が良いでしょう。残念!
まあいずれこの辺は、ChatGPTのバージョンアップにより、徐々リオンに解消していくのではないかと思います。
それでも何とか文字も一緒に生成したいという我儘ボディな性癖の人の場合は、
欠けを防ぐ:「no text clipping」「full readable text」
表記位置・サイズも調整:「smaller font size」「centered below the character」
とったプロンプトを追記して、トライアンドエラーを繰り返して根気強く生成していくしかありません。文字が画像をはみ出して表示してしまう場合もあるので、フォントサイズをあらかじめ小さく指定しておいても良いでしょう。
文字が見づらい場合は、
文字を白色+黒影付きで明記:「white text with black outline」
といったプロンプトを追記することで、可視性が上がります。例えばこんな感じの仕上がりになります。

参考文献
Wikipedia/生成的人工知能
Wikipedia/ChatGPT
Wikipedia/Stable Diffusion
AIじゃないよ_/ChatGPT-4o 画像生成機能完全ガイド:完璧な指示追従&キャラ同一性維持&文字描写が可能