imgX-MCP-ja

imgx-mcp

作業中の AI が、プロジェクトの文脈を踏まえて画像を生成・編集する MCP サーバー。別のサービスに切り替える必要はない。プロンプトの書き方もサービスの仕様も、AI が判断する。Claude Code、Gemini CLI、Cursor、Windsurf など MCP 対応ツールで動作。


imgx-mcp の動作概要 単独サービス・API・プラグイン・MCP の比較

コンテキストを活かす画像生成

開発やコンテンツ制作の途中で画像が必要になったとき、別のサービスに切り替えると何が起きるか。記事の内容、プロジェクトの背景、ブランドの方針 —— それまで積み上げたコンテキストが途切れる。同じ情報をもう一度、別のサービスに説明し直すことになる。

imgx-mcp では、作業中の AI がすでに把握しているコンテキストをそのまま画像生成に活かす。「ここにカバー画像が欲しい」と伝えるだけで、AI が記事の内容に合った構図・スタイルを判断し、適切なプロンプトを組み立て、画像を生成する。レビューも編集も同じセッション内で完結する。


4 つの特徴

1

マルチプロバイダ

Gemini と OpenAI を統一インターフェースで使えます。プロバイダを切り替えても、操作は同じです。デフォルトモデルの gemini-2.5-flash-image(Nano Banana)は無料枠(10 RPM / 500 RPD、クレジットカード不要)で使えます。無料で始めて、解像度や品質が必要になったら Nano Banana 2 や Nano Banana Pro などの有料モデルにアップグレードできます。同じプロンプトで異なるプロバイダの結果を比較することも可能です。

2

テキスト指示だけで編集

マスク作成は不要です。「背景を暗くして」「人物を追加して」と、テキストで指示するだけで画像を編集できます。既存の画像ファイルを入力として渡し、変更内容をテキストで伝えます。

3

edit_last で反復編集

生成した画像を、そのまま次の編集の入力に使えます。ファイルパスの指定は不要です。生成 → 調整 → 調整 → 完成。同じセッション内で試行錯誤できます。

4

undo/redo で安全に試行錯誤

編集を重ねた後、いつでも前の状態に戻せます。undo で戻して、そこから別の方向に編集を続けることもできます。セッション単位で履歴を管理。複数の画像チェーンを切り替えて作業を再開できます。

あなた: 「この記事にカバー画像を作って。内容に合わせてお任せで」
AI:      記事の内容からスタイル・構図を判断 → generate_image

あなた: 「暖かい色調にして」               → edit_last
あなた: 「OK。images/ に保存して」          → edit_last

Skill — あなたの開発環境に画像制作のプロを

MCP サーバーが AI に画像の生成・編集能力を与える。Skill はその上に、的確に使いこなすための知識を加える。プロンプトの書き方も、モデルの仕様も、サービスごとの設定も、ユーザーが覚える必要はない。

Skill が読み込まれていない状態では、AI は強力なツールを持っていても、その活用方法を知らない。Skill を読み込むと、画像制作の専門知識が構造化された形で AI に渡り、自動的に適用される。

Skill が持つ知識:

  • プロンプト自動構築 — 「カバー画像が欲しい」と伝えるだけで、AI が Subject-Context-Style フレームワークに基づいて構造化されたプロンプトを組み立てる。何を、どこに、どう見せるかを AI が判断する
  • 24 種の編集テクニック — 雰囲気調整、構図変更、要素操作、スタイル変換の実証済みアプローチ。「暖かくして」「ぼかして」という指示を、モデルに最適な形で伝える
  • モデル自動選択 — 無料モデルから開始。無料枠の制約を超える要件が出たときだけ有料モデルへのアップグレードを提案し、何が変わるかを説明する。テキスト描画精度・背景透過・コストパフォーマンスの最適な選択肢を把握している
  • プラットフォーム別サイズ設定 — 「Twitter の OGP」「App Store のスクリーンショット」と伝えるだけで、適切なアスペクト比と解像度が選択される。SNS、OGP、アプリストア、印刷物、ブログプラットフォームをカバー
  • トレンドスタイルテンプレート — ジブリ風、アクションフィギュア箱入り、3D クレイ、ピクセルアート、ちびキャラなど。スタイル名を伝えるだけで、AI が適切なプロンプト構造を適用する
  • 複数画像の一貫性管理 — デザイントークンとキャラクター DNA テンプレートにより、スライドデッキ、SNS シリーズ、ブランドアセットの視覚的統一を複数の画像生成にわたって維持する

画像生成モデルは本来これらの能力を持っている。Skill は、その能力を専門知識なしで引き出すための仕組み。Plugin に同梱されており、単体インストールも可能。


セットアップ

MCP 対応ツールの設定ファイルに以下を追加します。

Claude Code

プロジェクトルートの .mcp.json:

.mcp.json
{
  "mcpServers": {
    "imgx": {
      "command": "npx",
      "args": ["--package=imgx-mcp", "-y", "imgx-mcp"],
      "env": { "GEMINI_API_KEY": "your-key" }
    }
  }
}

Claude Desktop

claude_desktop_config.json場所):

claude_desktop_config.json
{
  "mcpServers": {
    "imgx": {
      "command": "npx",
      "args": ["--package=imgx-mcp", "-y", "imgx-mcp"],
      "env": { "GEMINI_API_KEY": "your-key" }
    }
  }
}

Windows では "command": "cmd""args": ["/c", "npx", "--package=imgx-mcp", "-y", "imgx-mcp"] に変更してください。

API キーは Google AI Studio から取得できます(無料、クレジットカード不要。デフォルトモデル gemini-2.5-flash-image は無料枠で利用可能)。OpenAI を使う場合は env"OPENAI_API_KEY": "your-key" を追加してください。

他の環境(Gemini CLI、Cursor、Windsurf 等)の設定は使い方ガイドを参照してください。

Claude Desktop 設定ファイルの場所

OSパス
Windows%APPDATA%\Claude\claude_desktop_config.json
macOS~/Library/Application Support/Claude/claude_desktop_config.json

編集後、Claude Desktop を再起動してください。


対応環境

以下の MCP 対応ツールで動作します。

ツール種別
Claude CodeCLI エージェント
Claude Desktopデスクトップアプリ
Gemini CLICLI エージェント
Codex CLICLI エージェント
CursorIDE
WindsurfIDE
ClineIDE 拡張
Continue.devIDE 拡張
Zedエディタ

MCP に対応しているツールであれば、同じ設定方法で利用できます。


MCP ツール一覧

ツール機能
generate_imageテキストから画像を生成
edit_image既存画像をテキスト指示で編集
edit_last直前の出力をそのまま編集(パス指定不要)
undo_edit直前の編集を取り消し、前の画像に戻る
redo_edit取り消した編集をやり直す
edit_history全セッションの編集履歴を表示
switch_session別のセッションに切り替えて作業を再開
clear_history履歴を消去(セッション単位の消去・管理ディレクトリ内ファイルの削除も選択可)
set_output_dir出力先ディレクトリを変更
list_providers利用可能なプロバイダと対応機能の一覧

プロバイダ

プロバイダモデル特徴
Geminigemini-2.5-flash-image(Nano Banana)デフォルト。無料枠(10 RPM / 500 RPD、クレジットカード不要)。最大 1024px、7種アスペクト比
Geminigemini-3.1-flash-image-preview(Nano Banana 2)有料。高速、4K対応、14種アスペクト比、$0.045〜$0.151/枚
Geminigemini-3-pro-image-preview(Nano Banana Pro)有料。最高画質、4K対応、解像度制御・参照画像対応
OpenAIgpt-image-1有料。生成・編集・複数出力・フォーマット選択(PNG/JPEG/WebP)・背景透過
OpenAIgpt-image-1.5有料。gpt-image-1 比 約4倍高速・20%低コスト、テキスト描画精度向上
OpenAIgpt-image-1-mini有料。低コストモデル($0.005〜$0.036/枚)

imgx-mcp 自体は無料(MIT ライセンス)です。デフォルトモデル(Nano Banana)は無料で使えます(クレジットカード不要)。解像度や品質が必要な場合は有料モデルにアップグレードできます。ユーザー自身の API キーを使用します。

このページの OGP 画像やダイアグラムも、imgx-mcp が記事制作セッションの中でプロンプト作成・生成・編集・参照リンクの埋め込みまでを一連のフローとして実行したものです。