Ir para o conteúdo

Agradecimentos

llama-crab não existiria sem o trabalho das pessoas e projetos listados abaixo. Obrigado.

A fundação

  • llama.cpp — Georgi Gerganov e a equipe ggml-org. O engine de inferência C/C++ que llama-crab encapsula. llama.cpp é a razão pela qual podemos rodar grandes modelos de linguagem em hardware de consumidor.
  • GGML — a biblioteca de tensores que alimenta cada backend.

O ecossistema Rust

llama-crab se apoia nos ombros de uma longa lista de projetos Rust. Destaques:

  • bindgen — geração automática dos bindings FFI em llama-crab-sys.
  • cmake e cc — a cola de build C/C++.
  • serde e serde_json — tipos de requisição/resposta, definições de tools, o conversor JSON-Schema.
  • anyhow e thiserror — tratamento de erros.
  • tokio e axum — o servidor HTTP.
  • tracing e tracing-subscriber — logging estruturado.
  • sled — o cache de prompt em disco.

Uma lista completa vive no Cargo.lock do workspace.

Os modelos

Os exemplos neste repositório são testados contra modelos open-weights do Hugging Face Hub. Obrigado a:

  • Alibaba (equipe Qwen) — Qwen 2 / 2.5.
  • Meta (equipe Llama) — Llama 3 / 3.1 / 3.2 / 3.3.
  • Google (equipe Gemma) — Gemma 2 / 3 / 4.
  • Mistral AI — Mistral e Mixtral.
  • Microsoft (equipe Phi) — Phi-3.
  • DeepSeek AI — DeepSeek-V2 / V2.5.
  • Liquid AI — LFM2.5-VL.
  • Beijing Academy of Artificial Intelligence (equipe BGE) — embeddings e rerankers BGE.
  • Cohere — Command R / R+.

As ferramentas

A comunidade

Obrigado a cada contribuidor que reportou uma issue, enviou um PR ou ajudou alguém nas discussions. A lista completa vive no grafo de contribuidores.

Por onde ir a partir daqui

  • Licença — o texto completo.
  • Contribuindo — como enviar uma correção para um bug que você encontrou.
  • Início — de volta à home da documentação.