如果你曾尝试自己搭一套 RAG(Retrieval-Augmented Generation,检索增强生成),你大概懂那种痛:要管理 embeddings(向量嵌入)、vector databases(向量数据库)、把文本正确地 chunking(切分),还得确保一切能和你的模型顺畅协作、又不至于烧钱。 好吧,Google 直接把这 ...