Appearance
WeKnora
介绍
WeKnora 是腾讯开源的、基于 RAG(Retrieval-Augmented Generation,检索增强生成)范式的企业级文档理解与检索问答框架,面向复杂异构文档场景,提供从多模态解析、向量索引、智能检索到大模型推理的端到端能力。
官网:https://weknora.weixin.qq.com/ 仓库:https://github.com/Tencent/WeKnora
核心能力
- 多模态文档理解:支持 PDF、Word、图片等,能够解析图文混排内容,抽取文本、表格与图像语义,并融合 OCR 与跨模态建模
- 模块化 RAG 流水线:解析、Embedding、向量库、检索策略与大模型推理解耦,可插拔组合与扩展
- 灵活模型与向量库接入:可对接本地大模型与向量数据库,并支持与 Ollama 等平台集成,便于切换 Qwen、DeepSeek 等主流模型
- 可信与可控:支持私有化部署与离线环境,配套全链路可视化评估与可观测能力(监控/日志),便于运维与质量保障
- 开箱即用:提供 Web UI 与标准化接口,支持非技术用户快速完成知识库构建与问答体验
架构概览
WeKnora 采用现代化模块化架构,核心链路通常包含:
- 文档解析与结构化:多模态解析与内容抽取,构建统一语义视图
- 向量化与索引:Embedding、向量索引与管理
- 检索引擎:支持多种检索策略组合(如关键词/向量/知识图谱的混合检索),并支持跨知识库检索
- 大模型推理:结合召回片段进行上下文增强生成,支持多轮对话策略配置

v0.2.0 亮点(节选)
- Agent Mode:新增 ReACT Agent 模式,可调用内置工具、MCP 工具与 Web Search,多轮迭代与反思输出更完整的总结报告
- 多类型知识库:支持 FAQ 与文档知识库类型,新增文件夹导入、URL 导入、标签管理与在线录入
- 对话策略可配置:支持配置 Agent/普通模式模型、检索阈值与 Prompt,精细控制多轮行为
- Web Search:支持可扩展的搜索引擎,内置 DuckDuckGo
- MCP 集成:通过 MCP 扩展 Agent 能力,内置
uvx与npx启动器,支持多种传输方式 - UI 与基础设施升级:工具调用过程可视化、知识库管理升级,引入 MQ 异步任务、自动数据库迁移与快速开发模式
安全与部署建议
从 v0.1.3 开始,WeKnora 引入登录认证以增强系统安全。用于生产部署时,建议:
- 在内网/私有网络环境部署,避免直接暴露在公网
- 配置防火墙与访问控制策略,降低信息泄露风险
- 保持升级到最新版本以获取安全补丁与改进
典型场景
- 企业知识管理:内部制度/流程/操作手册检索与问答
- 学术研究分析:论文检索、研究报告分析与资料整理
- 产品技术支持:产品文档问答、故障排查与指导
- 法务合规审查:合同条款检索、法规政策检索与案例分析