Back to list
dev_to 2026年4月25日

GStack: Claude Code を完全なエンジニアチームに変える

GStack: Turn Claude Code Into a Full Engineering Team

Translated: 2026/4/25 4:58:49
gstackclaude-codeai-productivitydeveloper-toolsautomation

Japanese Translation

GStack をインストールした Claude Code で `/office-hours` をタイピングした時、奇妙なことが起こります。AI は助けるコーディングアシスタントの振る舞いをやめ、機能アイデアが間違いだと信じる懐疑的なプロダクトマネージャーのように振る舞うようになります。 📖 完全な記事を AgentConn で読む → そのように設計されています。そして、Garry Tan のオープンソース Claude Code スキルセットである GStack は、2026 年 3 月の公開以来 GitHub で 82,700 個のスターと 12,000 回のフォークを収集し続けています。 文脈を考えると、Garry Tan 氏は Y Combinator の大統領兼 CEO です。地球上で最も多くのスタートアップをレビューした人が、自らのコードを動かす正確な AI 開発ワークフローをオープンソースにすると、開発者は注目を向けます。さらに、Hacker News でそれを広く議論します。 このガイドでは、GStack が実際に何をするか、oh-my-openagent 他のハネスとの比較、"ただプロンプトの集合" という批判が本質を見逃す理由、そしてそれはワークフローに属すべきかどうかを説明します。 GStack は新しいコーディングアシスタントではありません。これは `CLAUDE.md` スキルの集合体であり、Claude Code に専門的な役割を与えstructuredな指示を提供します。プロジェクトにインストールし、Claude Code はエンジニアチームを模擬する 23 ツールにアクセスできるようになります。 役割は認識可能な業務機能に分けられます: Planning and Strategy `/office-hours` — 強制質問によるプロダクト査問。構築する前にアイデアを挑発します。"懐疑的な PM" の体験。 `/plan-ceo-review` — 戦略的な範囲の挑発。正しい問題解決を問いかけます。 `/plan-eng-review` — アーキテクチャとテストの挑発。技術計画の前提条件を見つけます。 `/plan-design-review` — デザインシステムの監査。ローカルでは良くながってスケーラビリティで破綻する"AI スロップ"(視覚パターン)を見つけます。 `/plan-devex-review` — 計画の開発者体験レビュー。 `/autoplan` — CEO、エンジニアリング、DevEx のレビューを順次自動的に実行。 Design and Implementation `/design-consultation`, `/design-shotgun`, `/design-html` — 様々な忠実度レベルでのデザインガイダンス。 `/review` — セキュリティ問題、バグ、アーキテクチャの問題をターゲットにしたコードレビュー。 `/investigate` — 構造化された推論による原因特定デバッグ。 Testing and Quality `/qa` — 修正がインラインで適用されたライブブラウザテスト。 `/qa-only` — コード修改なしにバグを報告。 `/cso` — OWASP Top 10 と STRIDE 脅威モデルを適用したセキュリティ監査。 Release and Deployment `/ship`, `/land-and-deploy`, `/document-release` Additional Tools `/browse`, `/canary`, `/benchmark`, `/retro`, `/codex`, `/pair-agent`, `/learn` `/codex` スキルは Claude Code の内部で OpenAI Codex を並列なレビューエンジンとして追加し、ターミナルを出さずにクロスモデルのコードレビューを提供します。 Conductor は隔絶されたワークスペースで同時に複数の Claude Code セッションを調整します。新しいアイデアで `/office-hours` を実行する 1 セッション、open PR で `/review` を行う別のセッション、機能を実装するセッション、ステージングで `/qa` を実行するセッション — それぞれ独自の git worktree とコンテキストウィンドウを持ちます。 これは GStack が一連の `CLAUDE.md` プロンプトと比較して本質的に新異的な点です。Conductor は外部のツールに wire する必要のない、ハネス組み込みのマルチエージェントオーケストレーションです。 Garry Tan 氏は 2013 年の基準値(11,417 ロジカル行/日 vs 14)と比較して、2026 年の開発速度を約 810× 向上したと報告しました。重要な条件: この指標は"ロジカル LOC"であり、単なる行数ではありません。ロジカル LOC は意味のある変化(新しい振る舞い)を測り、再フォーマットされた空白とは異なります。これが最初に表示されるより诚实な指標です。 2013 年の基準はシングル開発者の比較です。Tan 氏は自らの AI 導入前 vs 後の生産性を比較しています。制御された実験ではありませんが、诚实なデータポイントです。 すべてのワークフローが通用するわけではありません。TechCrunch の分析では、ハードウェア隣接のコードや規制されたドメインで作業する開発者が得る利益ははるかに小さいと注記しています。 最も一般的な無視:"GStack はテキストファイル内のプロンプトの束だ"。この批判は部分的に正しいが、本質をほとんど見逃しています。 個人のスキルが構造化されていることは正しいが、主に本質を見逃しています。

Original Content

The first time you type /office-hours into Claude Code with GStack installed, something strange happens. The AI stops acting like a helpful coding assistant and starts acting like a skeptical product manager who thinks your feature idea is probably wrong. 📖 Read the full version on AgentConn → That is the design. And it is why GStack — Garry Tan's open-source Claude Code skill setup — has accumulated 82,700 stars and 12,000 forks on GitHub since its March 2026 launch. For context: Garry Tan is the President and CEO of Y Combinator. When the person who has reviewed more startups than almost anyone else on earth open-sources the exact AI development workflow that runs his code, developers pay attention. They also argue about it extensively on Hacker News. This guide explains what GStack actually does, how it compares to oh-my-openagent and other harnesses, why the "it's just prompts" criticism misses the point, and whether it belongs in your workflow. GStack is not a new coding assistant. It is a collection of CLAUDE.md skills — structured instructions that give Claude Code specialist personas. Install it in your project, and Claude Code gains access to 23 tools that simulate an engineering team. The roles divide into recognizable job functions: Planning and Strategy /office-hours — Product interrogation with forcing questions. Challenges your idea before you build it. The "skeptical PM" experience. /plan-ceo-review — Strategic scope challenge. Asks whether you are solving the right problem. /plan-eng-review — Architecture and testing challenge. Finds the assumptions in your technical plan. /plan-design-review — Design system audit. Catches "AI slop" — visual patterns that look fine locally but break at scale. /plan-devex-review — Developer experience review of the plan. /autoplan — Runs CEO, Engineering, and DevEx review in sequence automatically. Design and Implementation /design-consultation, /design-shotgun, /design-html — Design guidance at various fidelity levels. /review — Code review targeting security issues, bugs, and architectural concerns. /investigate — Root-cause debugging with structured reasoning. Testing and Quality /qa — Live browser testing with fixes applied inline. /qa-only — Bug reporting without code modification. /cso — Security audit applying OWASP Top 10 and STRIDE threat modeling. Release and Deployment /ship, /land-and-deploy, /document-release Additional Tools /browse, /canary, /benchmark, /retro, /codex, /pair-agent, /learn The /codex skill adds OpenAI Codex as a parallel review engine inside Claude Code, giving you cross-model code review without leaving your terminal. The Conductor coordinates multiple Claude Code sessions running simultaneously in isolated workspaces. One session running /office-hours on a new idea, another doing /review on an open PR, a third implementing a feature, a fourth running /qa on staging — each in its own git worktree with its own context window. This is the part that makes GStack genuinely novel compared to a folder of CLAUDE.md prompts. Conductor is multi-agent orchestration built into the harness — not a separate tool you have to wire up yourself. Garry Tan reports his 2026 development pace at approximately 810× his 2013 baseline (11,417 logical lines/day vs 14). Key caveats: The metric is "logical LOC," not raw lines. Logical LOC measures meaningful changes — new behaviors, not reformatted whitespace. This is a more honest metric than it first appears. The 2013 baseline is a single-developer comparison. Tan is comparing his own pre-AI vs. post-AI productivity. Not a controlled experiment, but an honest data point. It doesn't hold for all workflows. The TechCrunch analysis notes developers working on hardware-adjacent code or regulated domains see much smaller gains. The most common dismissal: GStack is "a bunch of prompts in a text file." This criticism is partially correct and mostly misses the point. It is correct that the individual skills are structured prompts. There's no compiled code, nothing that prevents you from reading every CLAUDE.md instruction. What the criticism misses is that the value is in the system design, not the technology. The insight is architectural: separating planning from implementation, using adversarial reviewing roles, and enforcing security audits as a default step before shipping. These are software engineering principles applied to AI agent orchestration. The CTO testimonial Garry Tan shared is worth taking at face value: A security audit that runs automatically before every merge is not "just a prompt." It is a default gate that most teams skip under schedule pressure. GStack makes skipping it harder than doing it. GStack oh-my-openagent GSD cc-switch Stars 82.7K 53.9K 35K 54K Model lock-in Claude Code only Multi-model Claude Code first Model-agnostic config Specialist roles 23 skills 11 agents Spec-driven only None Parallel sessions Yes (Conductor) Yes No No Install complexity 30 seconds (paste) npm install Manual CLI install oh-my-openagent routes tasks to the best model — if you need DeepSeek for cost-sensitive tasks and Claude for hard reasoning, OmO handles the routing. GStack is entirely Claude Code native. GStack is best for: Solo developers building SaaS or web products without a senior team Early-stage startups without dedicated QA, security reviewer, or architect Developers already on Claude Code — zero-friction install Teams shipping fast who default to skipping review steps GStack is probably wrong for: Teams needing multi-model routing (OmO is better) Teams with mature code review culture (GStack replaces informal processes) Developers on OpenCode or non-Claude agents (CLAUDE.md-native) Embedded, firmware, or highly regulated domains GStack lives at github.com/garrytan/gstack. Install: open Claude Code and type Install GStack. Your first three commands: /office-hours — Challenge your current feature idea /cso — Security audit on your last commit /autoplan — CEO, Eng, and DevEx review your next technical plan GStack implements software engineering best practices — adversarial review, security auditing, design critique, spec challenge — as default steps in your Claude Code workflow. Steps that solo developers skip not because they are bad engineers but because there is nobody else in the room. If you are a Claude Code user building a product, install it. The 30-second install cost is trivially small relative to finding a single XSS vulnerability before it ships to production. The frontier in AI-assisted development is not a better autocomplete. It is a well-designed team of reviewers who catch the mistakes you were going to make anyway. Originally published at AgentConn