Raschka 在图集中把各模型的专家数量、激活比例、专家隐藏层尺寸都标注出来,让稀疏程度一目了然。Hacker News 上有人感慨:“我很惊讶这些模型在结构上有多相似,主要差异就是层的大小。” ...
2026 年的前两个月,开源大模型的发布节奏已快至令人应接不暇。Arcee AI 的 Trinity Large、月之暗面的 Kimi K2.5、阿里的 Qwen3.5、智谱 AI 的 GLM-5、Cohere 的 Tiny Aya……它们的名称如流水般接踵而至,参数量从 3B 至 1T 不等,每一款都宣称是“SOTA”或者“最强开源”。 然而,如此快的更新速度,对于普通开发者而言,莫说深入研究, ...
论文名叫ARL-Tangram: Unleash the Resource Efficiency in Agentic Reinforcement Learning。作者之一,就是罗福莉。 要用GPU去做模型推理,要用CPU去执行代码,要用API去处理搜索、数据库,可能还要用浏览器进行网页操作 ...
3月16日消息,小米AI实验室研究员罗福莉,也就是很多人口中的“天才少女”,又发论文了。论文名叫ARL-Tangram: Unleash the Resource Efficiency in Agentic Reinforcement Learning。作者之一,就是罗福莉。如果只看标题,这篇论文似乎只是一个偏工程的研究:如何让AI ...
天天上班的你,有多少「摸鱼」的时间?此前,澳大利亚悉尼大学的研究人员在《Educational and Developmental Psychologist》期刊上发表了一篇题为“Rest breaks aid directed attention and learning”的研究论文,指出摸鱼可以提升工作效率,五分钟的大脑休息,可以将后续任务的表现和生产力平均提高 57%,更有利于后续的工作。
MIT 研究生用 NotebookLM 48 小时学完一学期 刷到一条推文,430 万阅读,1.5万点赞,3 万收藏。收藏数比点赞数还高一倍,说明大家不只是觉得"有意思",是真想存下来自己试。推文作者 Ihtesham Ali 说他偶然发现了一个 MIT 研究生的学习方法:用 Google 的 AI 笔记工具 NotebookLM,48 ...
在Agent席卷产业的浪潮中,越来越多企业开始将AI Agent接入研发、数据分析和自动化运维流程。但是针对Agent的安全研究给出了警示:当Agent可以访问本地接口和系统资源时,一旦权限控制不当,攻击者可能借助AI执行任意代码、窃取数据甚至接管设 ...
一学就懂 on MSN

AutoGen 架构演进全梳理

AutoGen 架构演进全梳理 ...
《hzwer 的 OpenClaw 实战完全指南:让小龙虾 24 小时值班干活》 深度使用了两周,来总结一些工作流和坑点。因为每个人遇到的问题可能不同,我也只是在我的一些任务上跑通流程,仅供参考,欢迎拍砖。 注意:本文代码块内容不是给人读的,基本是要发给小龙虾读 核心定位:OpenClaw 是 AI 的 OS Shell,通过飞书/TG 实现 24 ...
读到这里,你几乎会下意识地猜到,下一个词很可能是 big。 但你有没有想过,你是怎么做出这个判断的?你的大脑其实在瞬间做了一次“信息筛选”。它不会平均对待句子里的每一个词,而是自动挑出那些真正重要的线索。比如: elephant 很重要,因为大象通常 ...