跳转至

Kurtosis:敏感层分析算法说明

简介

  • 概述:Kurtosis(峰度)度量用于linear范围分析:对激活采样后估计峰度,用于识别分布尖峰与尾部极端值对量化的影响,输出线性层粒度排序。
  • 核心思想:超额峰度刻画相对正态的尖峭程度;分布越集中、极端值越突出,量化截断带来的相对风险往往越高。

使用前准备

安装 msModelSlim 工具,详情请参见《msModelSlim工具安装指南》。

原理

  1. 对层激活做排序与步进采样(控制内存与计算),在采样序列上估计峰度。
  2. 超额峰度常用形式:$\text{kurtosis} = \mathbb{E}[(X-\mu)4]/\sigma4 - 3$。
  3. 解读:峰度越大,通常表示分布越尖、对极端值越敏感;接近 0 则更接近高斯形态(实现中以具体 compute_score 输出为准,用于层间排序)。

适用要求

  • 推荐场景:需要根据激活分布的尖峰程度来识别量化敏感层,从而辅助回退或混合精度决策。
  • 模型适配:无需模型适配器额外实现分析接口。model_type 支持范围参见参见《大模型支持矩阵》。

功能介绍

命令行示例

msmodelslim analyze linear \
    --model_type Qwen2.5-7B-Instruct \
    --model_path ${model_path} \
    --metrics kurtosis \
    --calib_dataset ${calib_dataset} \
    --pattern "*.down_proj*" "*.o_proj*" \
    --topk 15 \
    --device npu

命令行参数说明

参数 说明
linear 线性层敏感度分析
--metrics 指定分析算法,取值为 kurtosis 时使用本算法(亦为 linear 默认 metrics)

完整参数见敏感层分析工具使用指南参数说明