这模型数学能力很强

#23
by pypry - opened

我的测试用例比app版豆包要强

喜欢后续出一个这个尺寸的moe版本,或者参数量再大些也可以,dense架构推理速度太慢了,跑一个用例要二三十分钟

Sign up or log in to comment