第1章 RAG技术简介_从零开始构建企业级RAG系统-QQ阅读玄幻男生网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

第1章 RAG技术简介

RAG（Retrieval-Augmented Generation，检索增强生成）是一种将信息检索与生成模型相结合的技术。它通过从外部数据源中检索相关信息，并将这些信息与用户输入结合，来增强大语言模型（LLM）的生成能力。简而言之，在LLM向用户输出前，通过RAG检索用户问题的相关信息，随后将这些信息与用户问题一起输入LLM，由LLM进行输出。

RAG技术的核心在于两大组件：检索组件和生成组件。检索组件负责从外部知识库中找到与用户查询相关的文档或数据，这些相关信息随后被添加到用户的原始输入中，形成一个增强的提示。生成组件接收这个增强提示，并结合自身训练数据生成最终的回答。

RAG可以动态地从最新和更广泛的知识库中检索相关信息，提升回答的准确性和时效性，处理长上下文，并减少训练成本，从而在需要最新信息和专业知识的应用中提供更及时、更准确和更详细的回答。

一个简单的对话示例如图1-1所示。

图1-1 一个简单的对话示例