Kurtosis:敏感层分析算法说明¶
简介¶
- 概述:Kurtosis(峰度)度量用于linear范围分析:对激活采样后估计峰度,用于识别分布尖峰与尾部极端值对量化的影响,输出线性层粒度排序。
- 核心思想:超额峰度刻画相对正态的尖峭程度;分布越集中、极端值越突出,量化截断带来的相对风险往往越高。
使用前准备¶
安装 msModelSlim 工具,详情请参见《msModelSlim工具安装指南》。
原理¶
- 对层激活做排序与步进采样(控制内存与计算),在采样序列上估计峰度。
- 超额峰度常用形式:$\text{kurtosis} = \mathbb{E}[(X-\mu)4]/\sigma4 - 3$。
- 解读:峰度越大,通常表示分布越尖、对极端值越敏感;接近 0 则更接近高斯形态(实现中以具体
compute_score输出为准,用于层间排序)。
适用要求¶
- 推荐场景:需要根据激活分布的尖峰程度来识别量化敏感层,从而辅助回退或混合精度决策。
- 模型适配:无需模型适配器额外实现分析接口。
model_type支持范围参见参见《大模型支持矩阵》。
功能介绍¶
命令行示例¶
msmodelslim analyze linear \
--model_type Qwen2.5-7B-Instruct \
--model_path ${model_path} \
--metrics kurtosis \
--calib_dataset ${calib_dataset} \
--pattern "*.down_proj*" "*.o_proj*" \
--topk 15 \
--device npu
命令行参数说明¶
| 参数 | 说明 |
|---|---|
linear |
线性层敏感度分析 |
--metrics |
指定分析算法,取值为 kurtosis 时使用本算法(亦为 linear 默认 metrics) |
完整参数见敏感层分析工具使用指南参数说明。