有一说一,稀疏/稠密和int4/int8完全是两码事......稀疏和稠密运算指的是对矩阵中零值的处理不同,在硬件设计的时候也会基于用途来针对性优化;int4和int8是模型精度,总之这两者区别还是挺大的。。。
有一说一,稀疏/稠密和int4/int8完全是两码事......稀疏和稠密运算指
海雪看汽车
2025-07-29 08:30:40
0
阅读:0