大模型RAG(检索增强生成)

半兽人 发表于: 2025-03-25   最后更新时间: 2025-03-25 19:14:48  
{{totalSubscript}} 订阅, 24 游览

RAG 是 "Retrieval-Augmented Generation"(检索增强生成)的缩写,是一种结合了信息检索生成式人工智能的技术方法。它主要用于提升语言模型的性能,让模型在生成回答时能够利用外部知识库,而不是仅仅依赖预训练时的内部知识。

具体来说,RAG 工作原理通常分为两步:

  1. 检索(Retrieval):根据用户的输入(比如问题),从一个外部知识库(如文档、网页或数据库)中检索出相关的上下文信息。

  2. 生成(Generation):将检索到的信息与输入结合起来,交给生成模型(如 transformers),生成更准确、更具上下文依据的回答。

这种方法的好处是可以让模型在回答时引用最新或特定领域的信息,减少“幻觉”(hallucination,即生成不准确或凭空捏造的内容)现象。RAG 被广泛应用于问答系统、聊天机器人和需要实时知识更新的场景。

RAG
更新于 2025-03-25
在线,5分钟前登录

查看LLM更多相关的文章或提一个关于LLM的问题,也可以与我们一起分享文章