量子位 微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当 微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单C++PU就能跑,性能与同规模全精度开源模型…