📚 本地知识库 — 你的文字只属于你

很多 AI 工具要求你把文件上传到云端才能使用"知识库"功能。 GPT AI Flow 不一样：你的笔记从不离开你的电脑。

本地知识库是 GPT AI Flow 所有智能功能的基石——无论是语义搜索、相关笔记发现，还是 AI 对话中的知识检索，背后都依赖它。而它最核心的承诺是：数据完全存储在你的电脑本地。

在 LLM-wiki 体系里，这一层就是 Raw sources 的摄入基础设施：先把原始资料稳定索引，后续问答与整理才有可靠依据。

为什么要先建立知识库？

你在 Obsidian 里积累的笔记，就像藏在书架上的宝藏。但如果没有目录，需要的时候根本找不到。本地知识库做的事，就是帮你把每一篇笔记都"读懂"、整理好——这样当你用自然语言搜索、或者和 AI 对话时，系统才能真正"知道"你写过什么，给你精准的答案。

它为你做了什么？

你不需要理解"向量数据库"或"文本嵌入"这些技术名词。你只需要知道：

开启本地知识库后，你的笔记就会变"聪明"。

之前	之后
搜笔记只能靠关键词	用自然语言描述就能找到
AI 对话只有通用知识	AI 能参考你自己写的内容来回答
笔记越多越难管理	笔记越多，AI 越能帮你发现关联
上传到云端才能分析	一切都在你电脑上，不需要联网

支持什么文件？

文件类型	支持程度
Markdown 文件	✅ 完整支持，智能分段（按标题层级切分）
PDF 文件	✅ 自动提取文字内容
图片文件	✅ OCR 识别图片中的文字（支持中英文）

智能分段

不是把一整篇文章作为一个整体来索引——那样搜索精度太低。GPT AI Flow 会按照你的 Markdown 标题结构自动分段：

# 我的文章 ← 段落 1

正文内容...

## 第一章 ← 段落 2

第一章的内容...

### 1.1 小节 ← 段落 3

小节内容...

## 第二章 ← 段落 4

第二章的内容...

每个段落独立索引，搜索时能精准定位到具体的段落，而不是只告诉你"在某篇文章里"。

补充说明：

分段会尽量保留标题上下文，避免“只命中一句话却看不懂出处”
长段落会自动切成更小片段，减少召回时的噪声
常见向量维度配置为 1024 或 1536，用户无需手动干预，保持默认即可

隐私与安全

这是本地知识库最重要的特性：

你的数据，你掌控

📍 数据存储位置：你的电脑本地，在 Obsidian Vault 目录内
🚫 不上传云端：索引文件不会被发送到任何服务器
🔒 不依赖外部服务：索引和搜索过程完全在本地完成
🗑️ 随时可删：你可以随时删除索引文件，不影响原始笔记

很多 AI 工具的"知识库"功能需要把你的文件上传到第三方服务器——你不知道数据会被如何使用、是否会被用于模型训练。GPT AI Flow 从设计之初就选择了本地优先的方案。

索引过程

首次索引

第一次开启本地知识库时，系统会扫描你的 Obsidian Vault，对所有支持的文件建立索引。

索引在后台进行，不会阻塞你的正常使用
索引速度取决于你的笔记数量和电脑性能
你可以随时查看索引进度

增量更新

首次索引完成后，系统会自动检测文件变化：

新增笔记 → 自动索引
修改笔记 → 自动重新索引该笔记
删除笔记 → 自动从索引中移除

你不需要手动触发任何操作。

断点续传

如果索引过程中应用被关闭或电脑意外重启：

系统会记住上次索引到的位置
下次启动时从断点继续，不会重复索引已完成的文件
不需要从头开始

索引完整性检查

系统会周期性检查索引状态，确保“文件状态”和“索引状态”一致：

有文件缺失索引时，自动补齐
有文件被删除时，自动清理旧索引
有文件更新但索引过期时，自动重建相关片段

和其他功能的关系

本地知识库是 GPT AI Flow 多个功能的底层支撑：

本地知识库（索引 & 存储）
    ├── 语义搜索 — 用自然语言找到笔记
    ├── 相关笔记发现 — 自动推荐关联内容
    ├── 遗忘笔记挖掘 — 找回旧笔记中的灵感
    └── AI 对话 — AI 参考你的笔记来回答问题，而不只是通用知识

没有本地知识库，上面这些功能都无法工作。所以我们建议你在使用专业模式时第一步就开启本地知识库索引。

与 index.md / log.md 的协同

当你使用 LLM-wiki 工作流时，AI 会在需要时更新导航页（如 index.md）和过程记录（如 log.md）。本地知识库会把这些页面也纳入索引，使后续查询能优先命中“已经整理过的结构化信息”。

常见问题

Q：索引会占用多少磁盘空间？

索引文件的大小通常是你原始笔记总量的很小一部分。例如，10,000 篇笔记的索引文件大约占用几十 MB——对现代电脑来说完全可以忽略不计。

Q：索引过程会影响电脑性能吗？

首次索引会使用一些 CPU 和内存资源，但系统会控制在合理范围内，不会让你的电脑变卡。增量更新几乎没有性能影响。

Q：我可以选择性地排除某些文件吗？

可以。你可以在设置中配置排除规则，指定不需要索引的文件夹或文件类型。

Q：更换电脑后索引还在吗？

索引文件存储在 Vault 目录内。如果你同步了整个 Vault（比如通过 iCloud 或 Git），索引文件也会被一起同步。否则需要在新电脑上重新索引——但得益于增量索引机制，这个过程通常很快。

Q：本地知识库需要联网吗？

索引和搜索过程完全不需要联网。只有在 AI 对话中需要调用大模型 API 时才需要网络连接——但那是 AI 对话模块的事情，和知识库本身无关。

下一步阅读

AI 写作知识与视频

更多与 Obsidian、LLM-wiki、AI 写作相关的实战内容正在制作中。请关注小卡up 频道，和我们一起把笔记变活。

立即体验: 下载桌面版
联系邮箱: hello@gptaiflow.com
产品反馈:
- 腾讯问卷: 点击这里
- Google 问卷: 点击这里
💬 有问题? 查看常见问题快速解决: 点击这里

立即体验 GPT AI Flow，让你自己 Obsidian 里那些沉睡多年的笔记，重新开始生长。

📚 本地知识库 — 你的文字只属于你

它为你做了什么？​

支持什么文件？​

智能分段​

隐私与安全​

索引过程​

首次索引​

增量更新​

断点续传​

索引完整性检查​

和其他功能的关系​

与 index.md / log.md 的协同​

常见问题​

下一步阅读​