M3 Ultra跑DeepSeek-R1满血版(671B)量化的LLM,单跑gguf就有15.78Tokens/s,跑MLX更有20Tokens/s...
苹果芯片的Ultra,依然很Ultra[裂开]
嘉敏说科技
感谢大家的关注
作者最新文章
热门分类
科技TOP
科技最新文章