运行 AI 模型

2 * NVIDIA RTX 3090

NVIDIA RTX 3090 支持 FP16（半精度浮点）运算

无审核版本的 QwQ


ollama pull huihui-ai/qwq-abliterated:32b

ollama run huihui-ai/qwq-abliterated:32b --precision fp16

优先 Llama-3.1


ollama run hf.co/mlabonne/Llama-3.1-70B-Instruct-lorablated:Q4_K_M

ollama run hf.co/bartowski/Llama-3.1-70B-Instruct-lorablated-GGUF:Q4_K_M ✅


/set system 你是一个helpful助手。
你好，你怎么样？

自动格式化： Ollama 会自动将您的输入包装在 Llama 3 所需的标记中（如 <|begin_of_text|>、<|start_header_id|> 等），您无需手动处理这些细节。