Cloudflare宣布Auto RAG(全托管检索增强生成服务)于2025年4月7日开放测试,该服务旨在简化情境感知AI系统在应用中的集成流程。
Auto RAG利用自有数据源与大语言模型实时结合,提高AI响应准确性,解决传统LLM知识时效性不足的问题。开发者此前需手动串联数据存储、向量数据库、嵌入模型等组件并处理索引更新,现由AutoRAG端到端托管。
> AutoRAG的核心功能为自动数据摄取、分块嵌入、向量存储于Cloudflare Vectorize数据库,以及基于语义检索生成智能响应。其流程包括:
>
> 索引构建:从支持Cloudflare R2的数据源读取文件,转换为Markdown格式(含图像视觉-语言转换)、分块并生成嵌入向量;
>
> 查询处理:接收请求后执行可选查询重写、向量检索并调用Workers AI生成答案
该服务整合Cloudflare R2、Vectorize、Workers AI和AI Gateway,支持性能监控和成本控制。测试期间实例创建与索引构建均免费,但每账户限建10个实例,单实例最多支持10万文件。未来规划扩展URL直解析、数据库结构化集成及递归分块技术。
Refer to https://blog.cloudflare.com/introducing-autorag-on-cloudflare/