コーヒー屋がAI画像ツールを作った理由 – imgx-mcp

imgx-mcp 開発ストーリー — コーヒー屋が画像ツールを作った理由

京都でイベント出店専門のコーヒー店を営みながら、コーヒーアプリと開発ツールを作っています。その過程で、AI で画像を生成・編集するためのツールを作ることになりました。なぜ、小さなコーヒー屋がそんなものを作ることになったのか?

この記事に、アプリの仕組みや作り方といった技術的な話はありません。当店がどんな問題に向き合い、どう考えて形にしたのか——モノ作りの姿勢とプロセスをお伝えする記事です。


多様な画像が必要になった

コーヒーアプリの開発とマーケティング計画を進める中で、画像が必要になる場面が増えました。

ブログ記事のカバー画像、OGP 画像(SNS でリンクを共有したときに表示されるサムネイル)、図解、アプリ紹介用の素材。装飾ではなく、実務として必要な画像です。記事を書けば OGP がいるし、アプリを公開すればスクリーンショットだけでは伝わらない場面があります。

画像が必要になるたびに、作業の流れが止まりました。


コンテキスト(文脈)の断絶

当店の開発は、AI アシスタント(Claude Code)と会話しながら進めています。記事を書き、アプリを作り、仕様と設計を議論する。すべてがひとつの作業セッションの中で進んでいます。

この流れの中で画像が必要になったとき、別の画像生成サービスに切り替える必要がありました。

問題は、切り替えた瞬間にコンテキスト——それまでの作業の流れや背景情報——が途切れることでした。

開発計画、記事の意図、ブランドのトーン、前後の文脈。一緒に作業している AI はそのすべてを把握しています。しかし画像生成のために別のサービスを開くと、そこにはコンテキストがありません。開発の背景から説明し直し、記事の趣旨を伝え、どんな画像が必要かをゼロから組み立てることになります。

同じ情報を二度伝える。そのたびに精度と速度が落ちます。


プロンプト(指示文)の壁

AI に画像を生成させるための指示文——プロンプトと呼ばれるもの——を手で書くのは、思った以上に難しいものでした。

頭の中にある「こういう画像が欲しい」を言語化しても、生成結果が意図と合わないことが多い。画像生成サービスごとの仕様や設定の違いを、毎回考慮しながら指示文を組み立てます。

一方で、一緒に作業している AI は会話の文脈から「どんな画像が必要か」を理解しています。記事の内容、対象読者、ブランドの方針。その知識があるのに、画像生成には使えません。結局、自分でプロンプトを書き直すことになります。

AI が持っている文脈をそのまま画像生成に渡せたら、この手間は消える。そう考えました。


編集の往復

生成された画像が一発で意図通りになることは、ほとんどありません。

結果に満足できないとき、画像生成サービスとファイルマネージャーの間を行き来します。ダウンロードして、リネームして、別のサービスにアップロードして、パラメータを変えて再生成する。結果を確認して、また修正する。

一回一回は小さな手間でも、積み重なると無視できない摩擦になります。本来の作業——コードを書く、記事を書く——から意識が逸れていきます。


欲しかったもの

欲しかったのは、こういう仕組みでした。

一緒に作業している AI が、会話の文脈と画像生成サービスの仕様を踏まえて、適切な指示文を組み立てる。生成結果のレビューと編集は同じセッション内で行う。完成した画像は、必要な場所に直接保存される。

別のサービスに切り替える必要がない。コンテキストが途切れない。計画、設計から抜け落ちない。指示文を手で書き直す必要もない。

(作る前は…)そういうツールが見当たらなかったので、自分で作りました。それが imgx-mcp です。


技術的土台の習得

imgx-mcp を作ったもう一つの理由があります。

当店の主力製品——コーヒーアプリ 6 本と SDA Toolkit(開発支援ツール)——を世の中に届けるためには、いくつかの技術的な土台が必要でした。開発者向けの配布サービス(npm)への公開、AI ツールの拡張機能(Plugin)としての配布、AI が外部ツールを呼び出すための接続規格(MCP)への対応。これらはどれも、実際にやってみなければ身につかない類の知識です。

imgx-mcp は、その実践の場になりました。

自分が抱えている問題を解決する実用的なツールを作りながら、同時にソフトウェアを公開して届けるまでの一連の手順を習得する。ドキュメントを読むだけでは分からないことが、実際に公開してユーザーからフィードバックをもらう過程で見えてきます(使ってくれるユーザーがいれば、ですが)。

公開の手順、バージョン管理、さまざまな AI ツールとの動作確認。これらの経験は、コーヒーアプリや開発ツールを公開する際のノウハウとして蓄積されていきます。

imgX のプロトタイプ(MVP)は、数時間で完成。一般公開を目指してから、今の形になるまでに 4 日ほど。当店の開発環境が整いつつある現在、発想から実現(商用レベルでリリース)までに掛かるコストは以前に比べて数十分の一まで削減されています。


本開発を加速するサブ開発

imgx-mcp は、コーヒーアプリ開発という本筋の作業を加速するために生まれました。

画像生成の摩擦を解消しつつ、配布に当たって求められる経験を先に積む。元々は、汎用ツールとして設計したわけではなく、実際の作業の中で必要になった機能を形にした副産物でした。

ただ、“コンテキスト(文脈)の断絶”という問題は当店だけのものではありません。

AI と作業する開発者、コンテンツ制作者なら、同じ摩擦を常々感じているかもしれません。最新版では、AI を使った開発全般で使いやすい形まで完成度を高めています。はじめは自分の問題を解決するために作ったものが、同じ状況にいる人にとっても役立つものになる。そういう流れが、モノ作りの自然な形ではないかと思っています。


imgx-mcp — AI 画像の生成と編集を、コーディング環境から

GitHub / npm / 使い方

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です