📚 本地知识库 — 你的文字只属于你
很多 AI 工具要求你把文件上传到云端才能使用"知识库"功能。 GPT AI Flow 不一样:你的笔记从不离开你的电脑。
本地知识库是 GPT AI Flow 所有智能功能的基石——无论是语义搜索、相关笔记发现,还是 AI 对话中的知识检索,背后都依赖它。而它最核心的承诺是:数据完全存储在你的电脑本地。
在 LLM-wiki 体系里,这一层就是 Raw sources 的摄入基础设施: 先把原始资料稳定索引,后续问答与整理才有可靠依据。
你在 Obsidian 里积累的笔记,就像藏在书架上的宝藏。但如果没有目录,需要的时候根本找不到。本地知识库做的事,就是帮你把每一篇笔记都"读懂"、整理好——这样当你用自然语言搜索、或者和 AI 对话时,系统才能真正"知道"你写过什么,给你精准的答案。
它为你做了什么?
你不需要理解"向量数据库"或"文本嵌入"这些技术名词 。你只需要知道:
开启本地知识库后,你的笔记就会变"聪明"。
| 之前 | 之后 |
|---|---|
| 搜笔记只能靠关键词 | 用自然语言描述就能找到 |
| AI 对话只有通用知识 | AI 能参考你自己写的内容来回答 |
| 笔记越多越难管理 | 笔记越多,AI 越能帮你发现关联 |
| 上传到云端才能分析 | 一切都在你电脑上,不需要联网 |
支持什么文件?
| 文件类型 | 支持程度 |
|---|---|
| Markdown 文件 | ✅ 完整支持,智能分段(按标题层级切分) |
| PDF 文件 | ✅ 自动提取文字内容 |
| 图片文件 | ✅ OCR 识别图片中的文字(支持中英文) |
智能分段
不是把一整篇文章作为一个整体来索引——那样搜索精度太低。GPT AI Flow 会按照你的 Markdown 标题结构自动分段:
# 我的文章 ← 段落 1
正文内容...
## 第一章 ← 段落 2
第一章的内容...
### 1.1 小节 ← 段落 3
小节内容...
## 第二章 ← 段落 4
第二章的内容...
每个段落独立索引,搜索时能精准定位到具体的段落,而不是只告诉你"在某篇文章里"。
补充说明:
- 分段会尽量保留标题上下文,避免“只命中一句话却看不懂出处”
- 长段落会自动切成更小片段,减少召回时的噪声
- 常见向量维度配置为 1024 或 1536,用户无需手动干预,保持默认即可
隐私与安全
这是本地知识库最重要的特性:
- 📍 数据存储位置:你的电脑本地,在 Obsidian Vault 目录内
- 🚫 不上传云端:索引文件不会被发送到任何服务器
- 🔒 不依赖外部服务:索引和搜索过程完全在本地完成
- 🗑️ 随时可删:你可以随时删除索引文件,不影响原始笔记
很多 AI 工具的"知识库"功能需要把你的文件上传到第三方服务器——你不知道数据会被如何使用、是否会被用于模型训练。GPT AI Flow 从设计之初就选择了本地优先的方案。
索引过程
首次索引
第一次开启本地知识库时,系统会扫描你的 Obsidian Vault,对所有支持的文件建立索引。
- 索引在后台进行,不会阻塞你的正常使用
- 索引速度取决于你的笔记数量和电脑性能
- 你可以随时查看索引进度
增量更新
首次索引完成后,系统会自动检测文件变化:
- 新增笔记 → 自动索引
- 修改笔记 → 自动重新索引该笔记
- 删除笔记 → 自动从索引中移除
你不需要手动触发任何操作。
断点续传
如果索引过程中应用被关闭或电脑意外重启:
- 系统会记住上次索引到的位置
- 下次启动时从断点继续,不会重复索引已完成的文件
- 不需要从头开始
索引完整性检查
系统会周期性检查索引状态,确保“文件状态”和“索引状态”一致:
- 有文件缺失索引时,自动补齐
- 有文件被删除时,自动清理旧索引
- 有文件更新但索引过期时,自动重建相关片段
和其他功能的关系
本地知识库是 GPT AI Flow 多个功能的底层支撑:
本地知识库(索引 & 存储)
├── 语义搜索 — 用自然语言找到笔记
├── 相关笔记发现 — 自动推荐关联内容
├── 遗忘笔记挖掘 — 找回旧笔记中的灵感
└── AI 对话 — AI 参考你的笔记来回答问题,而不只是通用知识
没有本地知识库,上面这些功能都无法工作。所以我们建议你在使用专业模式时第一步就开启本地知识库索引。
与 index.md / log.md 的协同
当你使用 LLM-wiki 工作流时,AI 会在需要时更新导航页(如 index.md)和过程记录(如 log.md)。
本地知识库会把这些页面也纳入索引,使后续查询能优先命中“已经整理过的结构化信息”。
常见问题
Q:索引会占用多少磁盘空间?
索引文件的大小通常是你原始笔记总量的很小一部分。例如,10,000 篇笔记的索引文件大约占用几十 MB——对现代电脑来说完全可以忽略不计。
Q:索引过程会影响电脑性能吗?
首次索引会使用一些 CPU 和内存资源,但系统会控制在合理范围内,不会让你的电脑变卡。增量更新几乎没有性能影响。
Q:我可以选择性地排除某些文件吗?
可以。你可以在设置中配置排除规则,指定不需要索引的文件夹或文件类型。
Q:更换电脑后索引还在吗?
索引文件存储在 Vault 目录内。如果你同步了整个 Vault(比如通过 iCloud 或 Git),索引文件也会被一起同步。否则需要在新电脑上重新索引——但得益于增量索引机制,这个过程通常很快。
Q:本地知识库需要联网吗?
索引和搜索过程完全不需要联网。只有在 AI 对话中需要调用大模型 API 时才需要网络连接——但那是 AI 对话模块的事情,和知识库本身无关。
下一步阅读
更多与 Obsidian、LLM-wiki、AI 写作相关的实战内容正在制作中。 请关注 小卡up 频道,和我们一起把笔记变活。
- 立即体验: 下载桌面版
- 联系邮箱: hello@gptaiflow.com
- 产品反馈:
- 💬 有问题? 查看常见问题快速解决: 点击这里
立即体验 GPT AI Flow,让你自己 Obsidian 里那些沉睡多年的笔记,重新开始生长。