Skip to content

希望支持静态量化模型(AWQ/GPTQ,配合llmc)的加载与推理 #894

@poisonwine

Description

@poisonwine

Hi LightLLM 团队,
感谢你们提供高效、轻量的推理框架。希望未来可以支持以下feature

  • 支持HuggingFace 上常见的 AWQ/GPTQ 静态量化模型推理(例如qwen系列的awq模型)。
  • 支持你们团队 LLMC 量化模型的原生加载和推理

这两个特性对于部署是非常节省时间和友好的,再次感谢你们的工作。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions