用LangChain实现RAG：从零搭建知识问答系统

2026-6-26

RAG与LangChain：为何组合是AI开发者的利器

检索增强生成（Retrieval-Augmented Generation, RAG）是目前大模型落地中最受关注的范式之一。它通过将外部知识库（如文档、数据库）中的相关信息检索出来，作为上下文提供给生成模型，从而有效缓解大模型“幻觉”问题，并支持基于私有数据的问答。LangChain作为流行的LLM应用开发框架，提供了模块化的组件来快速搭建RAG管线：文档加载器、文本分割器、向量存储、检索器、提示模板与LLM封装。本文将从零开始，带你构建一个完整的知识问答系统。

第一步：环境准备与依赖安装

首先创建一个新的Python虚拟环境（推荐Python 3.9+），然后安装所需包：

pip install langchain langchain-community langchain-openai chromadb tiktoken pypdf

我们使用OpenAI的嵌入模型和ChatGPT作为LLM，同时使用Chroma作为本地向量数据库。如果你没有OpenAI API密钥，也可以替换为开源模型（如使用Ollama和HuggingFace嵌入）。

第二步：加载文档

假设我们有一个PDF文件（knowledge.pdf）作为知识源。LangChain的PyPDFLoader可以轻松读取：

from langchain_community.document_loaders import PyPDFLoader
loader = PyPDFLoader("knowledge.pdf")
documents = loader.load()
print(f"加载了 {len(documents)} 页")

对于其他格式（如txt、Markdown、HTML），LangChain也有对应的加载器。如果需要从网页抓取，可以使用WebBaseLoader。

第三步：文本分割（Chunking）

文档内容通常过长，不适合直接送入LLM上下文窗口。我们需要将文档切分成适当大小的块（chunks），并保留一定的重叠以保持语义连贯。使用RecursiveCharacterTextSplitter：

from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,      # 每块约1000字符
    chunk_overlap=200,    # 重叠200字符
    separators=["nn", "n", " ", ""]
)
chunks = text_splitter.split_documents(documents)
print(f"生成了 {len(chunks)} 个文本块")

第四步：创建向量存储

接下来，我们需要将每个文本块转换为向量（embedding），存储到向量数据库中以便后续检索。这里使用OpenAI的嵌入模型和Chroma：

from langchain_openai import OpenAIEmbeddings
from langchain_community.vectorstores import Chroma
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
vectorstore = Chroma.from_documents(
    documents=chunks, 
    embedding=embeddings,
    persist_directory="./chroma_db"  # 持久化到磁盘
)
vectorstore.persist()
print("向量存储创建完成")

注意：如果你使用本地模型，可以替换为HuggingFaceEmbeddings。

第五步：构建检索器

向量存储本身可以作为一个检索器。我们可以指定检索时要返回的块数（top-k），以及是否使用Similarity Score Threshold来过滤低质量结果。

retriever = vectorstore.as_retriever(
    search_type="similarity",
    search_kwargs={"k": 3}  # 返回最相关的3个块
)

第六步：设计提示模板（Prompt Template）

为了让LLM正确利用检索到的上下文回答问题，我们需要设计一个明确的提示。LangChain的ChatPromptTemplate使这一过程更加简洁：

from langchain_core.prompts import ChatPromptTemplate
template = """你是一个知识问答助手。请使用以下上下文来回答问题。如果上下文不足以回答问题，请直接说“我不知道”，不要编造信息。
上下文：
{context}
问题：{question}
回答："""
prompt = ChatPromptTemplate.from_template(template)

第七步：组合完整的RAG链条

现在我们将上述组件串联起来。使用LangChain的LCEL（LangChain Expression Language）可以优雅地构建链条：

from langchain_openai import ChatOpenAI
from langchain_core.runnables import RunnablePassthrough, RunnableParallel
# 初始化LLM
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)
# 定义处理函数：将检索到的文档格式化为字符串
def format_docs(docs):
    return "nn".join(doc.page_content for doc in docs)
# 构建RAG链条
rag_chain = (
    RunnableParallel(
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
    )
    | prompt
    | llm
)

这里我们用RunnableParallel并行执行检索和传递问题，然后将结果送入提示模板，最后调用LLM生成答案。

第八步：运行问答系统

现在我们就可以向链条提问了：

question = "LangChain中如何实现文本分割？"
result = rag_chain.invoke(question)
print(result.content)

输出：“在LangChain中，可以使用RecursiveCharacterTextSplitter类，设定chunk_size和chunk_overlap参数…” （根据你的知识文档回答）

如果需要完整的对话记忆，可以进一步集成HistoryAwareRetriever和ConversationBufferMemory，但本文先聚焦于基础RAG。

进阶优化与注意事项

选择合适的分块策略：对于结构化文档（如Markdown、代码），可以使用MarkdownTextSplitter或PythonCodeTextSplitter。
嵌入模型选择：如果数据是中文，推荐使用国产嵌入模型（如BGE、M3E）以提高检索准确性。
检索后处理：可以使用EnsembleRetriever组合多种检索方法，或加入重新排序（Re-ranking）步骤来提升质量。
成本控制：对大量文档进行嵌入会消耗API额度，建议使用本地向量数据库和开源模型。
安全性：确保检索内容不包含敏感信息，并添加必要的权限控制。

总结

本文演示了如何使用LangChain从零开始搭建一个基于RAG的知识问答系统。核心流程包括：文档加载 → 文本分割 → 向量化存储 → 检索 → 提示模板 → 生成。整个管线仅需数十行代码，大大降低了AI开发的门槛。

下一步，你可以尝试替换为本地模型（如通过Ollama部署Llama 3），或集成用户界面（如Gradio/Streamlit），从而打造一个真正可用的企业级知识库助手。RAG技术仍在快速演进，关注最新论文和LangChain更新，将帮助你的AI应用保持领先。

阅读剩余

作者：伍捌柒

链接：https://www.wubaqi.com/20260626455.html

文章版权归作者所有，未经允许请勿转载。

THE END

用Figma协作插件，设计师团队效率提升200%的实战技巧

<<上一篇

Win11隐藏的5个效率神器，90%用户不知道

下一篇>>

用LangChain实现RAG：从零搭建知识问答系统

本文手把手教你使用LangChain框架构建基于检索增强生成（RAG）的知识问答系统。从环境配置、文档加载、文本分块、向量存储到检索与生成，一步步解析核心组件与实现代码。适合有Python基础、希望将大模型能力落地到私有知识库的AI开发者。通过本教程，你将掌握RAG的完整工作流，并能在本地快速搭建一个可交互的问答系统。

2026-06-26 伍捌柒

4 0 0

ChatGPT做PPT：10分钟搞定一份精美演示文稿

你还在为做PPT熬夜加班吗？借助ChatGPT，只需10分钟就能生成一份结构清晰、内容专业的演示文稿。本文详细讲解从明确需求、生成大纲、获取幻灯片内容到搭配AI辅助工具（如Gamma、MindShow等）的全流程操作技巧。掌握这些方法后，你甚至可以批量制作多份PPT，大幅提升办公效率。适用于工作汇报、项目路演、教学课件等多种场景。

2026-06-26 伍捌柒

11 0 0

ChatGPT零基础入门：5个万能提问公式，让你的AI助手秒变超级助理

想让ChatGPT精准理解你的需求，输出高质量答案？本文专为零基础用户设计，总结5个万能提问公式：角色扮演、任务分解、格式限定、示例引导、追问深化。掌握这些公式，你就能轻松驾驭AI助手，无论是写报告、做方案、学知识还是处理日常办公，都能让ChatGPT输出专业且符合预期的结果。适合所有希望提升AI使用效率的新手。

2026-06-26 伍捌柒

11 0 0

5个鲜为人知的AI效率工具，让工作流提速50%

在AI工具爆炸式增长的今天，大多数人都只听说过ChatGPT、Midjourney这些明星产品，而许多真正能解决具体痛点的"效率利器"却藏在角落。本文挖掘了5款分别针对会议记录、图像处理、视频剪辑、音频转换和代码开发的AI工具——它们知名度不高，但每个都能在你最头疼的环节省下大量时间。无论你是办公族、设计师、视频创作者还是程序员，都能从中找到让工作流飞起来的捷径。

2026-06-25 伍捌柒

7 0 0

5款鲜为人知的AI效率工具，让办公提速

办公效率提升往往不在于工具数量，而在于能否找到真正切中痛点的利器。本文将介绍5款相对冷门却功能强大的AI工具——从自动整理会议纪要、智能生成报告，到一键优化图片排版、高效处理PDF文档。这些工具或许你从未听过，但一旦上手，就能将重复劳动压缩到分钟级别，让你有更多精力聚焦创造性工作。每款工具均经过实测，附操作要点与适用场景，帮你快速融入日常工作流。

2026-06-25 伍捌柒

4 0 0

macOS隐藏技巧：一键快速预览所有文件，效率翻倍的秘密武器

在日常使用macOS时，你是否经常需要逐个打开文件查看内容？其实，macOS隐藏了一个超实用的“快速查看”功能，只需按下空格键，就能瞬间预览文件。但你知道吗？我们还能一键快速预览文件夹中的所有文件，甚至包括图像、PDF、视频等格式。本文将带你深度探索这个被低估的效率工具，从基础操作到高级技巧，让你彻底告别低效的文件浏览方式，成为真正的Mac效率大师。无论是设计师、开发者还是普通办公用户，都能从中获益。

2026-06-24 伍捌柒

9 0 0

用AI自动整理会议纪要，轻松节省90%时间：完整实战教程

你是否还在为繁琐的会议记录而头疼？一篇高质量的会议纪要往往需要花费数十分钟甚至数小时。本教程将手把手教你如何利用AI办公工具（如通义听悟、飞书妙记、讯飞听见等）自动完成语音转文字、智能提炼要点、生成结构化纪要，实现效率飞跃。从工具选择、录音预处理到最终成稿，覆盖完整流程，助你真正节省90%时间，专注于更有价值的工作。

2026-06-24 伍捌柒

8 0 0

用AI自动分类邮件并生成智能回复：零基础搭建智能邮件助手

每天处理大量邮件让人疲惫？本文教你用AI工具（如OpenAI API + Google Apps Script）实现邮件自动分类与智能回复。从工具选型、脚本编写到实际部署，手把手带你打造个人邮件助手，提升办公效率。适合Python零基础、想尝试AI自动化的职场人士。所有步骤均可在Windows/mac系统下完成。

2026-06-24 伍捌柒

5 0 0

用AI自动整理邮件和日程，每天节省2小时

每天被成堆的邮件和混乱的日程追着跑？本文将为你揭示如何利用AI办公工具，彻底解放你的收件箱和日历。从邮件自动分类、智能回复到日程冲突检测、会议安排，再到跨平台协同，手把手带你搭建一套自动化工作流。这套方法不仅适用于上班族，更能让自由职业者和创业者每天轻松节省2小时，把时间花在真正重要的事情上。

2026-06-24 伍捌柒

5 0 0