Wayfinder Router instrada query tra LLM locali e cloud

Tool CLI per routing deterministico tra modelli locali e hosted senza chiamate extra. Bilancia costi, latenza e privacy in stack Node.js/Python.

Wayfinder Router instrada query tra LLM locali e cloud

Cos'è Wayfinder Router

Wayfinder Router è uno strumento CLI open source che decide in modo deterministico se inviare un prompt a un modello locale o a uno cloud. Il repository

wayfinder-routeritsthelore
Vedi su GitHub →
è stato discusso su Hacker News. Il progetto non usa un altro modello per la decisione e funziona completamente offline dopo l'installazione.

Come analizza i prompt senza chiamate esterne

A conceptual tech illustration showing a glowing data packet being scanned and split into two distinct pathways, with abstract geometric shapes representing code blocks and mathematical structures, modern neon blue and purple color palette, 3D digital art style, no text or logos.

Wayfinder legge lunghezza, presenza di elenchi, blocchi di codice, intestazioni e termini che indicano complessità come dimostrazioni matematiche o vincoli rigidi. Da questi elementi genera un punteggio in microsecondi. Il punteggio determina il percorso: prompt semplici restano sul modello locale, quelli più difficili passano al modello cloud. Non richiede chiavi API per il routing e non introduce latenza aggiuntiva.

L'installazione avviene tramite pip o Docker. Dopo la calibrazione su propri dati di esempio, lo strumento restituisce sia il punteggio sia la raccomandazione. Lo sviluppatore decide poi se seguire o ignorare l'indicazione. Il file EXPLAINER.md del repository descrive le regole di punteggio basate su struttura testuale.

Confronto con router basati su classificatori

La maggior parte dei router esistenti chiama un modello per decidere il percorso. RouteLLM usa un classificatore addestrato su preferenze, mentre NotDiamond e Martian operano tramite API ospitate. Questi approcci aggiungono costo, latenza e variabilità. Wayfinder evita tutto questo perché la decisione è fissa e locale.

Lo svantaggio è che il punteggio strutturale può risultare meno preciso su prompt ambigui o molto specifici di un dominio. In questi casi un classificatore addestrato sul proprio dataset può superare le regole fisse. Wayfinder permette però di esportare i dati di calibrazione e di integrarli in flussi di lavoro Python esistenti senza dipendenze esterne.

Integrazione nel proprio flusso di sviluppo

A modern isometric illustration of a software architecture pipeline featuring a central router node seamlessly connecting a developer environment to two distinct server nodes via glowing data streams, clean tech aesthetic, dark mode background, no text or logos.

Chi usa Python può inserire Wayfinder prima della chiamata al modello all'interno di script di automazione. Il punteggio restituito può pilotare la scelta tra un modello locale come Llama 3.1 8B e un modello cloud come Claude 3.5 Sonnet. Il tutto avviene senza modifiche al codice che gestisce le API vere e proprie.

Per chi lavora con Next.js o Rails, lo strumento può essere esposto come microservizio locale o invocato via subprocess. Il vantaggio principale resta il controllo sui costi: le query semplici non consumano token cloud. Lo svantaggio è la necessità di mantenere aggiornata la calibrazione quando cambiano i tipi di prompt usati in produzione.

FAQ

Wayfinder Router richiede connessione internet per funzionare? No. Dopo l'installazione e la calibrazione iniziale opera completamente offline.

Posso usare Wayfinder con modelli non supportati da LiteLLM? Sì. Lo strumento restituisce solo un punteggio e una raccomandazione; la chiamata al modello resta a carico del codice dell'utente.

Quanto tempo serve per calibrare il router sui propri dati? La documentazione indica che con alcune decine di prompt etichettati manualmente si ottiene una configurazione iniziale stabile.

---

📖 Leggi anche

Hai bisogno di una consulenza?

Aiuto aziende e startup a sviluppare software, automatizzare processi e integrare AI. Parliamone.

Scrivimi
← Torna al blog