Primeiros Passos¶

Bem-vindo ao llama-crab! Esta seção leva você de "tenho o Rust instalado" a "tenho um modelo gerando texto na minha máquina" em três passos curtos. As páginas abaixo assumem que você já tem uma toolchain Rust recente e um ambiente de build C/C++ funcional.

Instalação

Adicione llama-crab ao seu Cargo.toml, instale as ferramentas de sistema necessárias (CMake, um compilador C/C++, o SDK da plataforma para sua GPU) e escolha o conjunto certo de features do Cargo para seu alvo.
Seu primeiro programa

Um programa completo e executável que carrega um modelo, executa uma completion de texto e uma completion de chat, e imprime os resultados. Também mostramos o menor modelo possível para verificar a toolchain ponta a ponta.
Features do Cargo

Um mergulho profundo nas flags de feature que selecionam o backend (openmp, metal, cuda, vulkan, rocm, opencl, kleidiai), ativam multimodal (mtmd), o sampler de gramática (common, llguidance), o cache KV em disco (disk-cache) e algumas features de integração.
Estrutura do projeto

Onde colocar seu Cargo.toml, como conectar seus binários, como baixar um modelo e como integrar os helpers do examples/run.sh ao seu próprio fluxo de trabalho.

O que você vai precisar¶

Ferramenta	Versão	Por quê
Rust	1.88 ou mais recente (fixado em `rust-toolchain.toml`)	O crate usa features da edição 2024 e uma API `std::sync` recente.
CMake	3.18 ou mais recente	`llama-crab-sys` constrói o `llama.cpp` a partir do código-fonte via CMake.
Compilador C/C++	Qualquer um aceito pelo `llama.cpp` (clang 14+, GCC 11+, MSVC 2022, Apple clang)	Compila o código-fonte C/C++ empacotado.
SDK da plataforma	Xcode CLT (macOS), build-essential (Debian/Ubuntu) ou equivalente	Necessário pelo backend de GPU escolhido (Metal, CUDA, Vulkan, …).
Hugging Face CLI	latest	Opcional: acelera o download inicial de modelos. `pip install -U huggingface_hub`

Se você só quer ler a documentação, não precisa de nada disso. Se você quer compilar, instale as linhas acima e vá para a página de Instalação.

Ordem de leitura recomendada¶

flowchart LR
    A[Instale] --> B[Primeiro programa]
    B --> C{Do que você precisa?}
    C -->|LLM local| D[Backends & GPU]
    C -->|Embeddings| E[Guia de embeddings]
    C -->|Visão| F[Guia multimodal]
    C -->|Tools / agentes| G[Chat & tool calling]
    C -->|Produção| H[Servidor]
    C -->|Performance| I[Amostragem & cache]

Escolha o caminho que corresponde ao que você quer construir, e o índice de Guias e o índice de Funcionalidades têm resumos de uma página para cada tópico com exemplos executáveis.