个人 Markdown 知识库方案设计
概述
设计让 AI 工具(Claude Code/Cursor)查询本地笔记的知识库方案。
架构设计
Markdown 文件 → AST 感知切分 → 混合索引 → MCP Server → AI 工具核心组件
- AST 感知切分 — 基于 Markdown AST 语法树切分,保留标题层级关系
- BM25 + 向量混合检索 — 关键词精确匹配 + 语义相似度,兼顾精度和召回
- 检索质量评估闭环 — 自动评估检索结果质量,持续调优
- MCP Server 封装 — 将知识库暴露为 MCP 工具,供 AI Agent 调用
为什么自研?
| 方案 | 优势 | 劣势 |
|---|---|---|
| 现有 RAG 平台 | 功能丰富 | 不理解 Markdown 结构 |
| 简单向量搜索 | 实现简单 | 关键词匹配差 |
| 本方案 | 可观测、可调优 | 需要自研 |
核心理念
关键不是用什么技术,而是构建一个 可观测、可调优 的系统。只有能度量检索质量,才能持续改进。