The Local LLM Index / Quantization & Formats / #134
HaujetZhao/Qwen3-ASR-GGUF
by HaujetZhao · Quantization & Formats · updated 1mo ago
将 Qwen3-ASR 的 LLM 部分导出为 GGUF,用 llama.cpp 进行加速推理。后者支持 Vulkan 和 Cuda 加速。
49
momentum
172
stars
27
forks
#134
rank