面壁智能联合清华开源端侧大模型 BitCPM-CANN
面壁智能联合清华大学及 OpenBMB 开源社区开源中国首个完全基于华为昇腾国产算力平台端到端训练的 1.58-bit 三值大模型,包含 0.5B 至 8B 四个尺寸。模型采用量化感知训练路线,推理阶段释放约 6 倍显存红利,模型能力保留率达 90%–97.2%,为端侧 AI 落地与国产 NPU 生态提供关键基础设施。
更多详情...