Kimi Code Bench v2 覆盖10余种主流编程语言和完整生产技术栈,任务来自内部工程需求、线上生产事故、真实开源项目,偏后端、基础设施、性能调优、安全、前端和 ML 数据工程。 刚刚,月之暗面 Kimi K2.7 Code 正式发布,同步在 HuggingFace 开源。 token 消耗降了30% ...
编辑|杨文编程 Agent 的评测,一直是本糊涂账。SWE-bench 如今已成事实标准,几乎每家发布新模型或新 Agent 框架,都会拿出一个 SWE-bench 分数来证明自己有多强。但这些数字真的能直接横向比较吗?LLM Agent 的能力,本质上是模型和 harness 共同决定的,同一个模型换一套 harness,在 SWE-bench、Terminal-bench ...
科技行者 on MSN
AI写的代码,程序员到底怎么用? 密苏里科技大学与德雷塞尔大学联合 ...
这项由密苏里科技大学与德雷塞尔大学联合开展的研究,于2026年6月以预印本形式发布在arXiv平台,编号为arXiv:2606.06843。研究团队系统性地分析了GitHub上超过三万五千条与AI工具相关的代码注释,时间跨度从2022年12月(ChatGPT首次发布)延续至2026年3月,是目前规模最大、时间跨度最长的AI辅助编程实证研究之一。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果