M3Ultra跑DeepSeek-R1满血版(671B)量化的LLM,单跑gg

嘉敏说科技 2025-03-15 16:38:24

M3 Ultra跑DeepSeek-R1满血版(671B)量化的LLM,单跑gguf就有15.78Tokens/s,跑MLX更有20Tokens/s...

苹果芯片的Ultra,依然很Ultra[裂开] ​​​

0 阅读:0
嘉敏说科技

嘉敏说科技

感谢大家的关注