大模型RAG（检索增强生成）

RAG 是 "Retrieval-Augmented Generation"（检索增强生成）的缩写，是一种结合了信息检索和生成式人工智能的技术方法。它主要用于提升语言模型的性能，让模型在生成回答时能够利用外部知识库，而不是仅仅依赖预训练时的内部知识。

具体来说，RAG 工作原理通常分为两步：

这种方法的好处是可以让模型在回答时引用最新或特定领域的信息，减少“幻觉”（hallucination，即生成不准确或凭空捏造的内容）现象。RAG 被广泛应用于问答系统、聊天机器人和需要实时知识更新的场景。