刘佳楠
2026 年 6 月 9 日

长上下文之后,RAG 在做什么

RAG检索

一个常见的争论:上下文窗口都百万 token 了,还需要 RAG 吗?

我目前的理解是——需要,但分工变了:

  • 窗口再大,知识库永远更大,全量塞入既贵又慢;
  • 长上下文擅长”把相关材料读透”,检索擅长”从海量里捞出相关材料”,两者是接力关系;
  • 对产品来说真正的问题变成:哪些信息值得常驻上下文,哪些应该按需检索——本质上还是 上下文工程

先记一个结论:RAG 没有死,它从”主角”变成了”供应链”。