S
Shimmy v2.0
The first pure-Rust GGUF inference engine. No C. No Python.
3.3editorial
Paid· from US$20.00/mo
Launched in 2026
About
Two 5,200-token runs. Same model. SHA-identical byte output. That's a proof, not a benchmark. Shimmy v2.0 ships Airframe: pure-Rust GPU inference with hand-written WGSL compute shaders. No llama.cpp. No C. No Python. No CUDA. First production GGUF engine Rust all the way down — including the GPU shaders. Run TinyLlama, Llama 3.2, Phi, DeepSeek from GGUF. Drop-in for AnythingLLM, Open WebUI, Cursor, Zed via OpenAI or Ollama API. Windows, macOS, Linux. cargo install shimmy
Use cases
- →Executar modelos de linguagem grandes localmente com Rust puro
- →Realizar inferência de LLMs sem dependências de C ou Python
- →Implantar modelos GGUF de forma eficiente em produção
How it works
O usuário carrega um modelo GGUF e faz inferência via linha de comando ou como biblioteca Rust.
Example usage
shimmy infill --model codellama.gguf --prompt "Escreva uma função Rust para ordenar um vetor"
Pros
- +Suporte a dois runs de 5.200 tokens
- +Modelo SHA-identico byte output
- +GPU inference com hand-written WGSL compute shaders
Cons
- −Limitado a dois runs de 5.200 tokens
- −Requer conhecimento de Rust para configuração
FAQ
O que é o Shimmy v2.0?
O Shimmy v2.0 é uma ferramenta de inteligência artificial especializada em open-source e developer-tools. Two 5,200-token runs. Same model. SHA-identical byte output. That's a proof, not a benchmark. Shimmy v2.0 ships Airframe: pure-Rust GPU inference with hand-written WGSL compute shaders. No llama.cpp. No C. No Python. No CUDA. First production GGUF engine Rust all the way down — including the GPU shaders. Run TinyLlama, Llama 3.2, Phi, DeepSeek from GGUF. Drop-in for AnythingLLM, Open WebUI, Cursor, Zed via OpenAI or Ollama API. Windows, macOS, Linux. cargo install shimmy
Quanto custa o Shimmy v2.0?
O Shimmy v2.0 custa a partir de US$ 20.00 por mês. Confira o site oficial para promoções.
Quais são as melhores alternativas ao Shimmy v2.0?
As principais alternativas ao Shimmy v2.0 são: -ludr-ai-understand-any-screen, session-bridge-ai, speakcli. Compare todas as opções no FindMyAI para escolher a ideal para o seu caso de uso.