首先,TileLang是一种专门用来 开发GPU内核的领域专用语言 ,性能上可以 对标英伟达CUDA ,DeepSeek官方推荐使用此版本做实验,在方便调试和快速迭代上有优势。
机器之心编辑部就在刚刚,DeepSeek 的 GitHub 开始了频繁更新,上线开源了一个新的代码库 Tile Kernels,同时并对 DeepEP 代码库进行了更新,上线了 DeepEP V2。距离上次 DeepSeek 悄悄更新 Mega ...
NVIDIA正式发布CUDA 13.1,并推出过去二十年来幅度最大的一次更新——CUDA Tile编程模型。这项新功能被视为CUDA平台的重大里程碑,旨在让AI开发过程变得更简单、更高效,尤其是面向最新的Blackwell架构GPU。 与传统CUDA需要程序员手动规划每个线程执行路径不同,CUDA ...
【TechWeb】NVIDIA日前正式推出CUDA 13.1版本,官方称其为自2006年平台诞生以来最大、最全面的升级。此次更新的核心在于引入了革命性的CUDA Tile编程模型,标志着GPU编程范式迈向一个更高抽象层级的新阶段。 与传统的SIMT(单指令多线程)模型不同,后者要求开发者 ...
新浪数码讯 11月23日下午消息,Tile官方公告,将以2.05亿美元的价格被一家名为“Life360”的公司收购,收购预计将于2022年第一季度完成。 Tile成立于2012年,此前是海外颇为知名的蓝牙防丢器设计制造公司,他们的产品通过蓝牙与手机连接,一旦离开某个范围,则 ...
NVIDIA近日宣布推出CUDA 13.1版本,这一更新被官方誉为自2006年CUDA平台问世以来最具突破性的升级。其核心亮点在于引入了名为CUDA Tile的全新编程模型,将GPU编程的抽象层级提升至全新高度,为开发者开辟了更高效的并行计算路径。 传统SIMT(单指令多线程)模型 ...
2026年4月的第二周,中国AI圈被DeepSeek的代码提交记录点燃。距离开源Mega MoE、FP4 Indexer不到7天,这家公司再次在GitHub甩出两枚“技术炸弹”——Tile Kernels硬件级优化库与DeepEP V2分布式训练框架。不同于多数企业聚焦模型参数的“军备竞赛”,DeepSeek的连续动作直指大语言模型最核心的底层瓶颈:当GPU算力逼近物理极限,当分布式训练被硬件资源 ...
智东西 作者 | 云鹏 编辑 | 漠影 今天,AI算力军备竞赛如火如荼,从抢芯片到囤算力,GW(吉瓦)级数据中心一座接一座拔地而起,海外科技巨头更是动辄掀起数万亿元级别的AI基建大工程。