Agradecimentos¶
llama-crab não existiria sem o trabalho das pessoas e projetos
listados abaixo. Obrigado.
A fundação¶
- llama.cpp —
Georgi Gerganov e a equipe
ggml-org. O engine de inferência C/C++ quellama-crabencapsula.llama.cppé a razão pela qual podemos rodar grandes modelos de linguagem em hardware de consumidor. - GGML — a biblioteca de tensores que alimenta cada backend.
O ecossistema Rust¶
llama-crab se apoia nos ombros de uma longa lista de projetos
Rust. Destaques:
bindgen— geração automática dos bindings FFI emllama-crab-sys.cmakeecc— a cola de build C/C++.serdeeserde_json— tipos de requisição/resposta, definições de tools, o conversor JSON-Schema.anyhowethiserror— tratamento de erros.tokioeaxum— o servidor HTTP.tracingetracing-subscriber— logging estruturado.sled— o cache de prompt em disco.
Uma lista completa vive no Cargo.lock do workspace.
Os modelos¶
Os exemplos neste repositório são testados contra modelos open-weights do Hugging Face Hub. Obrigado a:
- Alibaba (equipe Qwen) — Qwen 2 / 2.5.
- Meta (equipe Llama) — Llama 3 / 3.1 / 3.2 / 3.3.
- Google (equipe Gemma) — Gemma 2 / 3 / 4.
- Mistral AI — Mistral e Mixtral.
- Microsoft (equipe Phi) — Phi-3.
- DeepSeek AI — DeepSeek-V2 / V2.5.
- Liquid AI — LFM2.5-VL.
- Beijing Academy of Artificial Intelligence (equipe BGE) — embeddings e rerankers BGE.
- Cohere — Command R / R+.
As ferramentas¶
- Material for MkDocs — o tema do site de documentação.
- Pymdown Extensions — as extensões Markdown usadas pelos docs.
- mdBook — a ferramenta de documentação anterior. Obrigado pelos anos de serviço.
A comunidade¶
Obrigado a cada contribuidor que reportou uma issue, enviou um PR ou ajudou alguém nas discussions. A lista completa vive no grafo de contribuidores.
Por onde ir a partir daqui¶
- Licença — o texto completo.
- Contribuindo — como enviar uma correção para um bug que você encontrou.
- Início — de volta à home da documentação.