nm-testing
/

DeepSeek-Coder-V2-Lite-Instruct-FP8

File size: 146 Bytes

d31fe09

DEFAULT_stage:
  DEFAULT_modifiers:
    QuantizationModifier:
      ignore: [lm_head, 're:.*mlp.gate$']
      targets: [Linear]
      scheme: FP8