gstack: Garry Tan trasforma Claude Code in un team di ingegneri AI

gstack è il toolkit open source del CEO di Y Combinator che trasforma Claude Code in un team virtuale di 23 specialisti. Slash command per review, QA, deploy e sprint paralleli.

gstack: Garry Tan trasforma Claude Code in un team di ingegneri AI

Cos'è gstack e perché interessa

Garry Tan, CEO di Y Combinator, ha rilasciato gstack: un set di 23 slash command per Claude Code che trasformano un singolo agente AI in un team virtuale completo — CEO, designer, engineering manager, QA lead, security officer e release engineer. Il progetto è open source, licenza MIT, e ha superato le 56.000 stelle su GitHub in pochi giorni dal rilascio.

L'idea nasce da un'osservazione diretta. Tan cita Andrej Karpathy: «Non scrivo una riga di codice da dicembre». Peter Steinberger ha costruito OpenClaw — 247.000 stelle — praticamente da solo con agenti AI. Tan ha preso quel concetto e lo ha strutturato in un processo ripetibile.

I numeri dichiarati: 600.000+ righe di codice in 60 giorni, di cui il 35% test, lavorando part-time mentre dirige Y Combinator. In una settimana ha prodotto 140.751 righe aggiunte su 362 commit. Numeri da prendere con le pinze, ma il repository è pubblico e verificabile.

Come funziona: il ciclo sprint

gstack non è una raccolta casuale di prompt. È un processo strutturato che segue il ciclo di uno sprint reale: Think → Plan → Build → Review → Test → Ship → Reflect.

Ogni comando alimenta il successivo:

  • /office-hours — sessione di brainstorming dove l'agente sfida le premesse del progetto, estrae requisiti nascosti e genera un design doc
  • /plan-ceo-review — revisione strategica in 10 sezioni sul design doc prodotto
  • /plan-eng-review — diagrammi ASCII per data flow, macchine a stati, matrice di test e percorsi di errore
  • /review — code review automatica con fix automatici e segnalazioni che richiedono approvazione
  • /qa — QA con browser reale via Playwright, trova bug, li corregge e genera test di regressione
  • /ship — bootstrap del framework di test se mancante, coverage audit, creazione PR
  • /retro — retrospettiva con metriche su righe, commit e LOC netti
Il dettaglio più interessante è /qa. Non è un test headless generico: apre un browser reale, naviga l'applicazione, individua problemi visivi e funzionali, li corregge e scrive test di regressione. Tan lo definisce «il comando che mi ha permesso di passare da 6 a 12 worker paralleli».

Sprint paralleli e strumenti avanzati

gstack diventa potente quando lo si usa con Conductor, un orchestratore che esegue sessioni Claude Code multiple in parallelo. Tan dichiara di eseguire regolarmente 10-15 sprint contemporanei: uno su /office-hours, un altro su /review, un terzo su /qa, e gli altri distribuiti su branch diversi.

Altri comandi notevoli:

  • /design-consultation — costruisce un design system da zero, scrive DESIGN.md
  • /design-shotgun — genera varianti visive multiple per confronto
  • /codex — ottiene una second opinion da OpenAI Codex CLI, con analisi cross-model
  • /careful, /freeze, /guard — guardrail di sicurezza: avvisi prima di comandi distruttivi, lock su directory specifiche
  • /cso — audit di sicurezza OWASP + STRIDE
  • $B connect — modalità browser reale con Chrome controllato da Playwright in tempo reale
Lo stack è TypeScript (71%), Go Template (22%), Shell (5%). Richiede Claude Code, Git e Bun. Funziona anche con Codex, Gemini CLI e Cursor grazie allo standard SKILL.md.

Due considerazioni. Prima: gstack è opinionato. Impone un flusso di lavoro preciso, e questo è sia il suo punto di forza che il suo limite. Seconda: i numeri di produttività dichiarati misurano righe di codice, che è una metrica nota per essere fuorviante — ma la struttura del processo è solida indipendentemente dalle metriche.

gstackgarrytan
Vedi su GitHub →

FAQ

gstack funziona solo con Claude Code? No. Supporta anche Codex, Gemini CLI, Cursor e Factory Droid tramite lo standard SKILL.md.

Serve un abbonamento a pagamento? gstack è gratuito e MIT. Serve però un account Claude Code attivo (che ha un costo proprio).

Posso usare solo alcuni comandi senza adottare l'intero flusso? Sì, ogni slash command è indipendente. Ma il valore maggiore emerge quando si usano in sequenza, perché ogni comando legge l'output del precedente.

Hai bisogno di una consulenza?

Aiuto aziende e startup a sviluppare software, automatizzare processi e integrare AI. Parliamone.

Scrivimi
← Torna al blog