考拉的AI树屋
← 返回博客列表
构建PDF摄取和问答系统

构建PDF摄取和问答系统

langchain文章
文章简介

PDF 文件通常包含其他来源无法获得的重要非结构化数据。它们可能相当冗长,并且与纯文本文件不同,通常不能直接输入到语言模型的提示中。在本教程中,你将创建一个能够回答有关 PDF 文件问题的系统。更具体地说,你将使用文档加载器(Document Loader)以 LLM 可用的格式加载文本,然后构建一个检索增强生成(RAG)管道来回答问题,并包含源材料的引用。