
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第1章 RAG技术简介
RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索与生成模型相结合的技术。它通过从外部数据源中检索相关信息,并将这些信息与用户输入结合,来增强大语言模型(LLM)的生成能力。简而言之,在LLM向用户输出前,通过RAG检索用户问题的相关信息,随后将这些信息与用户问题一起输入LLM,由LLM进行输出。
RAG技术的核心在于两大组件:检索组件和生成组件。检索组件负责从外部知识库中找到与用户查询相关的文档或数据,这些相关信息随后被添加到用户的原始输入中,形成一个增强的提示。生成组件接收这个增强提示,并结合自身训练数据生成最终的回答。
RAG可以动态地从最新和更广泛的知识库中检索相关信息,提升回答的准确性和时效性,处理长上下文,并减少训练成本,从而在需要最新信息和专业知识的应用中提供更及时、更准确和更详细的回答。
一个简单的对话示例如图1-1所示。

图1-1 一个简单的对话示例