BetterMixture 挑战赛要求在给定的计算量约束下(固定绝大部分训练参数&训练 token 总数不超过 10M),通过巧妙的数据配比和智能 ...