カスタムモデル作成のベストプラクティス

最終更新日 : 2025年11月2日

カスタムモデルを効果的に準備し作成するためのベストプラクティスについて学びます。

強力なユースケースの選択

ユースケース

高評価

低評価

ライフスタイル写真

  • 明確で焦点の合った人物
  • 自然な照明と自然な表情
  • 様々なポーズと構成
  • シンプルまたは柔らかくぼかした背景
  • ぼやけた、または、ピクセル化された画像
  • 過度なフィルターや極端な色調補正
  • 混雑したシーンや気が散る背景
  • 顔が小さすぎてはっきりと見えないグループショット

人物の写真撮影

  • シャープで、明るいクローズアップおよび中距離ショット
  • 様々なポーズ、表情、衣装
  • 一貫した照明と環境
  • 簡素な背景または柔らかくぼかした背景
  • 顔が小さすぎる、または、部分的に隠れている
  • 濃いシャドウ、または、強いライティング
  • 類似したショットが多すぎる
  • ぼやけた、または、低品質の画像

静物写真

  • 均等で、バランスの取れたライティングおよびシャドウ
  • 一貫したスタイルとカラーパレット
  • 多様な構成とアレンジ
  • メインの被写体へのシャープな焦点
  • 低品質やぼやけた画像
  • ロゴやパッケージのある商品写真
  • 注意を散らす小道具や背景
  • 無関係または主題から外れた被写体

イラストのようなキャラクター

  • 正確な解剖学的構造とプロポーション
  • 一貫したスタイルとレンダリングの品質
  • 多様なポーズと表情
  • 視覚的な雑然さのない明確なディテール
  • 低品質または未完成のイラスト
  • 一貫性のないスタイルやレンダリング
  • ポーズや遠近法のバリエーションの不足
  • 注意を散漫にする背景や無関係な要素

アイコノグラフィ

  • 明確で一貫性のあるアイコンスタイル
  • 中~高の複雑さのデザイン
  • 一貫したライティングとカラーパレット
  • オブジェクトに焦点を当てた簡素な構成
  • 低品質やぼやけたアイコン
  • 無関係または主題から外れたコンセプト
  • 一貫性のないスタイルやレンダリング手法
  • 過度に具体的な色やデザイン要素

ブランドイラスト

  • 正確な解剖学的構造とプロポーション
  • 一貫したスタイルとレンダリングの品質
  • 多様なポーズと表情
  • 視覚的な雑然さのない明確なディテール
  • 低品質または未完成のイラスト
  • 一貫性のないスタイルやレンダリング
  • ポーズや遠近法のバリエーションの不足
  • 注意を散漫にする背景や無関係な要素

3D グラフィック

  • 一貫した遠近法とプロポーション
  • 統一されたスタイル、ライティング、レンダリングの品質
  • 多様な構成とアングル
  • 明確で整然としたデザイン
  • 低品質または未完成のレンダリング
  • 一貫性のないスタイルや遠近法
  • アングルや構成のバリエーションの不足
  • 注意を散らす要素や無関係なオブジェクト

新しいブランド表現イラスト

  • 全体で力強く一貫したブランドスタイル
  • 余白のあるすっきりとした構成
  • 表情豊かでブランドに即したキャラクターとシーン
  • バランスの取れたライティングのクリーンなレンダリング
  • スタイルの混在や視点の不一致
  • 焦点が不明確な混雑したシーン
  • ブランドに即していない小道具や無関係なビジュアル
  • 不完全または低品質のイラスト

新しいコンセプト

  • 視覚的に独特で完成度の高いコンセプト
  • 一貫した構造、ライティング、細部
  • 強いフォルムと明確なシルエット
  • クリーンなレンダリングの高品質な画像
  • 繰り返しの形状または微細な変化
  • 注意を散らす背景や細部
  • 不完全または低品質のレンダリング
  • レンダリングスタイルやエフェクトの混在

高品質な画像を使用する

  • JPG または PNG ファイルを使用します。
  • 達成したいブランド固有のスタイルやコンセプトの被写体を表す、少なくとも 10~30 枚の高品質の画像を選択します。
  • スタイルや被写体を表す様々な画像のセットをキャプチャします。
  • 各画像のファイルサイズは、50 MB を超えないようにしてください。
  • 画像の解像度が 1024x1024 ピクセルより高く、最大 16:9 の縦横比(横長)または 9:16 の縦横比(縦長)が設定されていることを確認します。 
  • 縦横比をトレーニングデータセットと一致させます。 トレーニングセットが縦長であり、正方形の画像を生成する場合、生成時に切り取られる問題が発生します。 
  • サンプル画像を切り抜いて、最も重要な視覚要素に集中します。 例えば、人物やキャラクターが遠くに写っていて顔や体が小さい画像は除外してください。
  • 一貫した美的感覚を保ちながら、様々な視点および背景を表す画像を含めます。
  • すべての画像に白い背景があるなど、意図しないパターンが含まれていないことを確認してください。
  • ポートレートの背景にあるコラージュや、キャラクターが被っている帽子など、モデルに学習させたくない、注意を散らす要素を削除します。

モデルタグのレビュー

  • ブルネットのキャラクターの茶色い髪など、トレーニングするモデルの対象やスタイルの永続的な属性を含めてください。
  • タグには、キャラクターが持っているものなど、変更可能な属性を含めないでください。
  • モデルタグは最低 3 つ含めてください。

キャプションのレビュー

  • キャプションを使用してディテールを強化し、モデルで生成させるコンセプトに基づいてカスタムモデルをトレーニングします。 
  • 画像キャプションは具体的で説明的なものにし、モデルでプロンプトを使用する際に使用する言葉を使ってください。
  • すべての画像キャプションの文の構造を異なるものにします。
  • 必要に応じて自動キャプションを変更し、モデルにコンセプトの詳細を通知します。
  • Firefly のベースモデルは有名な人物や場所を知らないため、キャプションにこれらの場所の説明を含めて、潜在的な成果を高める必要があります。

トレーニングデータに合った明瞭なプロンプトを使用

  • プロンプトには、キャプションで使用した単語やフレーズと類似したものを含めてください。
  • カスタムモデルのトレーニング対象やスタイルに合った概念に従ってプロンプトを作成すると、関連性のない概念に従ったプロンプトを作成するよりも、その独自性を保つことができます(例えば、カラフルなライフスタイル写真でトレーニングされたモデルに、白黒イラストの宇宙船の作成を要求するなど)。

高度なスタイル機能を使用して画像をさらに微調整

  • 視覚的な適用量スライダーは、デフォルトでは、独自性を最適に保つために最低に設定されています。ただし、スタイル参照など、クリエイティブなユースケースでは、視覚的な適用量を上げると、より鮮やかな結果が生成される可能性があります。  
  • 被写体に構成参照を使用する場合は、背景が白い画像か、被写体を意図したポーズで描いたスケッチを選択します。