今年 4 月初,Moonshot 的 kimi-cli 仓库收到了一个 PR,标题是「kimicli 用 python 是彻底的失败 立刻重构为 ts」。 结果你猜怎么着,前几天 kimi-cli 真的用 Type 重写了,只不过是以名为 ...
Codex 这个名字越来越误导人了,听着像给程序员用的,但其实是给每个人用的。 但 OpenAI 最近的产品动作表明:Codex 正在从 coding agent 变成 working agent。 所以我更关心的是 ChatGPT ...
一个来自苏黎世联邦理工的开源项目,让 FPGA 网卡开发从"刀耕火种"迈向"现代文明"。5篇CCF-A顶会加持,这可能是目前最强的开源FPGA SmartNIC平台。 先讲一个故事 假设你是一个程序员,想写一个 Web 服务。 你打开电脑,启动 VS Code,pip install flask,写几行代码 ...
用 Lovable、Replit、Bolt、Cursor、Claude Code 这类工具,你可以直接用自然语言描述:“帮我做一个客户管理系统,支持登录、添加客户、上传合同、按状态筛选。” AI 可以让不会写代码的人做出 App。 但它不能让不懂工程的人,自动拥有生产级系统。 过去一年,Vibe ...
PandaWiki 是一款 AI 大模型驱动的开源知识库搭建系统,帮助你快速构建智能化的 产品文档、技术文档、FAQ、博客系统,借助大模型的力量为你提供 AI 创作、AI 问答、AI 搜索等能力。
我们今天来聊聊大模型的 Coding Benchmark,特别是 SWE-bench Pro,深入的了解Benchmark得分到底意味着什么? 以及 能不能用Benchmark来选择模型。 随着 Claude Mythos 5/Fable 5 的发布,大家是不是也像我一样被下面这张表刷屏了? 图片 特别是 SWE-bench Pro 80.3% 的得分,可以说是 ...
大家都知道AI很火的赛道里,有一个就是vibe ...
但胡彦斌这件事恰恰说明: 真正重要的,未必是学习一个全新技能,而是把AI变成自己的能力放大器。 教师可以用AI制作课程,律师可以用AI辅助检索案例,医生可以借助AI整理资料,销售可以利用AI分析客户需求,设计师可以通过AI快速生成方案。
Fable 5接到prompt后,先自己启动子Agent(可能是sonnet这样的便宜模型)做研究,检索了超过2200条航班数据,从法国TGV到日本新干线的时刻表,再到不同国家的公路通行速度。 但这一次,他改口了。“我已经不确定自己还是不是那个巫师。我更像一个甲方。描述需求,付钱,验收。至于炼金术发生在哪里,我已经看不见了。” ...
乍看之下,这似乎是“人人都是程序员”的又一个证据: 当市场、运营和研究人员都开始调用编程智能体,当一个想法可以直接变成网站和应用,程序员与普通人的边界似乎正在消失。 相比较 Codex ...
6月8日,小红书宣布Red Skill功能全量上线。至6月30日,发布相关笔记可获20w官方流量扶持。自5月24日内测以来,话题#RedSkill# ...
使用微信扫码将网页分享到微信 要说这段时间的热门 AI 产品,Codex 必然是绕不过去的话题。 这个一开始只是给开发者用来做代码补全、项目管理、功能开发的编程平台,到现在已成长为一款适用于任何角色、工具和工作流程,且人人都能使用的生产力工具。 ▲ ...