背景
传统族谱以纸质为主,信息查找困难,家族关系梳理费时。用户希望有一套智能化的工具,能够自动解析族谱文档,提取人物关系,并支持自然语言问答。
方案
构建了一套完整的 RAG(检索增强生成)流水线,从文档上传到智能问答形成闭环:
- 文档解析:支持 PDF/TXT 族谱文档上传,自动分块、向量化
- 结构化提取:异步任务机制自动提取祖先概览、人物档案、关系网络、历史事件
- 智能问答:多轮对话支持问题改写,基于向量检索的精准回答
- 可视化:家谱树形图、关系网络图、时间线三种展示方式
技术架构
| 模块 | 技术选型 |
|---|---|
| 前端 | Vue3 + Vite + Element Plus + ECharts |
| 后端 | Python + FastAPI + SQLAlchemy + SQLite |
| AI/RAG | ChromaDB 向量库 + 智谱 GLM-4 + LangChain |
| 认证 | JWT + bcrypt |
系统采用 merge/overwrite 两种模式处理文档解析结果,支持增量更新和全量覆盖。
成果
实现了垂直领域的 RAG 应用,用户上传族谱文档后,系统自动完成从文本到结构化知识的转换。多轮对话支持上下文理解和问题改写,可视化模块直观呈现家族脉络。