RAG 是 "Retrieval-Augmented Generation"(检索增强生成)的缩写,是一种结合了信息检索
和生成式人
工智能的技术方法。它主要用于提升语言模型的性能,让模型在生成回答时能够利用外部知识库,而不是仅仅依赖预训练时的内部知识。
具体来说,RAG 工作原理通常分为两步:
检索(Retrieval):根据用户的输入(比如问题),从一个外部知识库(如文档、网页或数据库)中检索出相关的上下文信息。
生成(Generation):将检索到的信息与输入结合起来,交给生成模型(如 transformers),生成更准确、更具上下文依据的回答。
这种方法的好处是可以让模型在回答时引用最新或特定领域的信息,减少“幻觉”(hallucination,即生成不准确或凭空捏造的内容)现象。RAG 被广泛应用于问答系统、聊天机器人和需要实时知识更新的场景。