Back to list
dev_to 2026年3月21日

なぜ AI コーディングツールは視覚的な精度で失敗するのか(そして、それをどう改善するのか)

Why AI coding tools fail at visual accuracy (and how we're fixing it)

Translated: 2026/3/21 4:01:24
ai-codingvisual-accuracyfigma-integrationdevopsai-tools

Japanese Translation

現在のすべての AI コーディングツールには、同じ欠陥があります。それは、コードがレンダリングされた際にどのような見た目になるのかを「見る」ことができないことです。 Figma の設計稿を受け取ってフロントエンドを構築するよう Cursor や Claude、v0 に指示を与えた場合、その AI はテキストとトークンのパターンに基づいてコードを生成します。ブラウザが実際に何レンダリングしているかを決して見ていません。これは単なる推測に過ぎません。 結果は、常に「十分近い」ものでありましたが、決して正確ではありませんでした。マージンが数ピックスオフだった。フォントの太さが一致していなかった。色がわずかにズレていた。ボーダーの円角値が近似だった。フレックスレイアウトが Figma のオートレイアウトとは異なる挙動を示していた。 一つずつ見ると不気味なほどに小さい違和感にしか思えませんが、それを全ページに積み重ねると、全体として設計と全く異なるものに見えるようになります。 私達のコ・ファウンダーと私は開発エージェントを運営していました。すべてのプロジェクトで同じパターンがありました:クライアントが Figma の設計を送ってくる、AI ツールでフロントエンドを生成する、アウトプットは 80% 正解だが、残りの 20% を手動で修正するために 1 ページあたり 3〜5 時間かかる。 私たちは数十人の他の開発者にも話をしました。エージェントからフリーランス、社内チームまで。すべての場所で同じ話でした。AI ツールは機能性の高いコード生成には驚くほど優秀ですが、視覚的な精度には全く劣りすぎます。 解決策は概念的に簡単です。レンダリングされたコードをスクリーンショットを取り、元の Figma の設計とピクセル単位で比較し、すべての不一致を特定して、それが設計に一致するまで生成ループにフィードバックを繰り返す。 私達はこれにより Visdiff を構築しました。 Figma のリンクを貼り付けてください。Visdiff は MCP を用いて、あなたが既存のコードベース内でのコード生成を行います(つまり、あなたがすでに使用しているあらゆるフレームワークやスタックと対応します)。その後、レンダリングされたアウトプットをスクリーンショットにし、Figma ソースと比較し、実際のコードが設計に一致するまで繰り返していきます。 フレームワークへのロックインはありません。学習する新しいワークフローもありません。あなたがすでに行っていることへのプラグインです。 現在ライブ状態ですし、会話は本当に興味深かったです。開発者たちはどの特定の視覚バグが最も時間の浪費を招くか共有し、デザイナーたちは開発者が間違いやすいことについて話していました。フィードバックはすでに私たちが次に何を構築するかを形作っています。 設計に合わせて AI 生成のコードを修正する時間の浪費をしたことがある人向けに、私たちはこれを構築しました。 確認して:Visdiff on Product Hunt dev.to のコミュニティから話を伺いたいです。設計からコードへのワークフローの中で最も時間の浪費を招く部分は何かと思いますか?そして、視覚フィードバックループが答えなのか、それともモデルは単独でより良くなるのかと思いますか?

Original Content

Every AI coding tool today has the same blind spot: it can't see what its code looks like when rendered. Think about it. When you give Cursor, Claude, or v0 a Figma design and ask it to build the frontend, it generates code based on text and token patterns. It has never actually looked at what the browser renders. It's guessing. The result? The output is always "close enough" but never accurate. Spacing is off by a few pixels. Font weights don't match. Colors are slightly wrong. Border radius values are approximate. Flex layouts behave differently than Figma's auto-layout. Individually these feel minor. But stack them up across a full page and the whole thing looks noticeably different from the design. My co-founder and I ran a dev agency. Every project followed the same pattern: client sends a Figma design, we use AI tools to generate the frontend, the output looks 80% right, and then we spend 3-5 hours per page manually fixing the remaining 20%. We talked to dozens of other developers. Agencies, freelancers, in-house teams. Same story everywhere. The AI tools are incredible at generating functional code, but terrible at visual accuracy. The fix is conceptually simple. Take the rendered code, screenshot it, compare it pixel-by-pixel to the original Figma design, identify every mismatch, and feed the differences back into the generation loop until it matches. That's what we built with Visdiff. You paste your Figma link. Visdiff generates the code within your existing codebase through MCP (so it works with whatever framework and stack you already use). Then it screenshots the rendered output, diffs it against the Figma source, and keeps iterating until the code actually matches the design. No framework lock-in. No new workflow to learn. It plugs into what you're already doing. We're currently live and the conversations have been really interesting. Developers sharing which specific visual bugs waste the most of their time. Designers talking about what developers always get wrong. The feedback is already shaping what we build next. If you've ever wasted hours fixing AI-generated code to match a design, we built this for you. Check it out: Visdiff on Product Hunt I'd love to hear from the dev.to community. What part of the design-to-code workflow wastes the most of your time? And do you think visual feedback loops are the answer, or will the models just get better on their own?