CoreMLLLMCLI：在AppleNeuralEngine上运行

爱生活爱珂珂 2025-07-17 13:40:30

CoreML LLM CLI：在 Apple Neural Engine 上运行大型语言模型（LLM）的命令行演示工具。

• 支持下载并加载 CoreML 兼容的 Llama 2 7B 模型（约4GB），运行于 macOS 14 (Sonoma)。

• 针对不同 M 系列芯片（M1 Max、M2、M3 Max 等）进行性能测试，Token 生成速度最高达13.92 tokens/sec，功耗8W，展现强劲算力。

• 采用多项推理优化：利用 IOSurface-backed CVPixelBuffers 避免 CPU 与 ANE 之间数据复制，提高效率。

• 通过 4D 张量重排（Batch, Channels, 8, 8）实现卷积运算速度提升约20%，兼顾注意力机制的特殊需求。

• 模型拆分为多个小 CoreML 模型块，支持异步 KV 缓存更新，减少延迟，提升整体响应速度。

• 适合开发者在 Apple Silicon 平台上探索和实验高效本地化 LLM 推理。

详情见🔗 github.com/smpanaro/coreml-llm-cli

AppleNeuralEngine CoreML Llama2 大型语言模型 AppleSilicon 机器学习

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

早！[太阳] 早安

2

苹果机器学习框架MLX迎来CUDA后端，开启跨平台高效部署新时代！🚀🔹 核心

3

数学爱好者必备资源库！📚✨GitHub 上的【Awesome_Math_Boo

4

AI工具和模型系统提示词开源宝库！内容涵盖：🔹 7500+行代码与提示，深度解

5

Graphiti：实时构建面向AI智能体的知识图谱框架，专为动态环境设计，支持连

6

Audio Flamingo 3：NVIDIA ADLR推出的全开源大型音频语言

7

Kiro：从原型到生产的智能AI开发利器，开启规范驱动开发新时代！🚀✨🔹 需

8

CLI工具claude-code-templates助你极速配置与监控Claud

9

《深度学习数学导论(Mathematical Introduction to D

10

转发赠书携手送出3本《AI量化交易：高效构建交易策略的新路径》，截止2025.7

热门分类

科技TOP

1

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

2

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

3

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

4

iPhone17系列多给500块，你将获得：1️⃣全新一眼便知新款的外观2️⃣

5

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

6

想买手机的可以等等了，接下来几个月热闹了九月份开始到年底，这段时间是各个手机

7

小米澎湃OS3眼看小米澎湃的发布会要开了，这次升级最核心的就是手机系统，改动确实

8

中国已经拥有了北斗系统，为什么国内还在用美国的GPS？说实话，你可能不信，要是现

9

追觅官宣造车任何一个有过造车经验的传统品牌推出一个新能源品牌我都能想得到，唯独

10

李想称希望和产品分割开其实理想在产品方面已经是非常不错的了，狗蛋身边不少家庭首选

科技最新文章

1

据说华为Mate80长这样，辨识度和质感确实在线，今年的苹果17依旧差点意思，明

2

小屏党这次真的赢麻了！下个月要来的荣耀Magicicon8Mini，这配置看一

3

小米16系列背面酷似iphone17系列，背面上方是一个巨大的矩形摄像头deco

4

iPhone17最大的遗憾：没发现iPhoneAir最大的遗憾：单扬声器

5

彻底告别电量焦虑朋友们，手机没电的恐慌可以画上句号了。荣耀Magic8系列重

6

大家要的iPhone17标准版和iPhone16标准版的对比来了，升级大的地

7

荣耀吃了大补丸，堆料这么猛？好家伙钢铁侠的爆料真是吓人，荣耀Magic8Pro的

8

网友表示iPhone17标准版最值得入手，可以闭眼冲原因是屏幕上了高刷，而且

9

中国已经拥有了北斗系统，为什么国内还在用美国的GPS？说实话，你可能不信，要是现

10

荣耀CEO李健首曝了荣耀Magic8，他表示这一代的Magic8系列，不仅具有最