我理想中的 AI 笔记软件设计:从 Notion、Tana 与 Mem 谈起
Matrix 首页推荐
Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。
文章代表作者个人观点,少数派仅对标题和排版略作修改。
随着 Notion AI 最近对数据库功能的支持逐步升级,我试着重新订阅了一个月的 Notion AI。算上它,近期主力使用,或者试着当主力使用过的笔记 AI 还有 Tana 和 Mem,正好趁此机会对这些软件做一下梳理,并谈谈在我理想中,能够作为 copilot 的笔记/写作软件 AI 是个什么样子。
重新捡起 Notion AI 的主要原因
我曾经在 Notion AI 公测时高频率使用过一段时间,但因为 Notion AI 本身的能力和 ChatGPT 有差距,并且当时单纯只是个普通的生成式 AI,只能起到改些文章、brainstorm 等基础作用,于是就没有继续使用。但随着几个月过去,Notion AI 支持了数据库批量、auto-update等一系列功能,我重新开始尝试着订阅这个产品。
最吸引我的功能就是它能和 Notion 的数据库进行整合,批量自动化地生成 text property。Notion 作为我众多笔记/稍后读/高亮的备份所在,能够通过 AI 统一管理将会让我的笔记库更有条理。比如,目前我已经把它应用到了从 Cubox 同步到 Notion 的数据库中,通过 AI 对所有文章做了摘要。这让我更高效地管理我的数据库,同时也让我更快地找到需要的信息。
相比而言,Notion 在输入后可以直接通过 AI 改写语句、调整语调和扩写文章,以及对文章中的各种格式进行修改,当遇到写作困难时还可以让它帮我 brainstorm。尽管它的功能还不完善,尤其是缺乏检索整个数据库的功能,并且 AI 的能力相比于 GPT-4、Claude 2 等还有一定差距,但我的博客是以 Notion 为基础部署的,有相当多的写作发生在 Notion 上。而Notion 所提供给我所需的基础 AI 功能已经足够日常使用了,比如自动在数据库中生成文章摘要并自动 update、修改格式等。总之,作为一站式工具,Notion 的 AI 功能还是很值得尝试的。
其他集成 AI 功能的笔记软件 - 以 Tana 和 Mem 为例
如果我们将我们对笔记软件的使用分成前期的输入、中期的管理与检索以及后期的输出这三个阶段,就目前已有的这些软件的AI来看,还没有任何一个集成AI的笔记或者写作软件能够完美地覆盖这前后三个流程。
大部分的笔记软件所谓的集成 AI 功能,其实只是非常生硬地把生成式 AI 加入到它的笔记中去。用户能做的和在那些 AI 的本体网站里做的基本没有区别,只是单纯地进行段落/文章生成、修改格式等,并没有根据笔记软件的特点做定制。这类软件不纳入以下的讨论。
此外还有一些软件,把 AI 功能和自身做了相对深入的集成,比如上文提到的 Notion AI,它在中期的整理以及后期的输出方面能够提供相当多的帮助,前期的输入也能够提供一定的支持,却缺乏最重要的检索能力,同时受限于模型能力,在输入输出的质量上也有一定限制。
另外两个把 AI 集成得比较优秀的软件则是 Tana 和 Members。Tana AI 则在前期的输入方面特别方便,熟练掌握的话中期的整理也能够玩出各种花样。而 Mem AI 的重心则放在中期的整理以及检索,并在后期输出方面也有一定的建树。
Tana AI
Tana 使用的 OpenAI 的 API 接口,需要使用用户自己的 API 额度。对比一众在 AI 出来之后就先不管三七二十一,把 AI 生成功能加进来的笔记软件,Tana 在经过一段时间开发之后,把 AI 成功融入了自己的生态中,甚至让 AI 成为了自己的核心功能之一。
一直以来,很多人诟病 Tana 的地方就在于,虽然它的功能之强、之多在笔记软件中名列前茅,但是上手非常困难,而且其相对结构化的输入、管理模式还是让用户在进行笔记的管理时,容易产生较大的摩擦感。当然,对于笔记是否需要结构化的管理是个见仁见智的问题,这里不过多展开,但是如果能够便捷地进行结构化管理,那么应该没有多少人能够拒绝。
Tana AI 试图解决的就是这个问题。在输入阶段,Tana 可以说是目前为止最便捷的笔记软件之一了,除了文字、媒体这些常见的输入场景之外,语音输入是 Tana 的精髓所在。通过快捷指令、锁屏组件,甚至桌面客户端等多种手段,用户可以直接开始语音输入,并在 Tana 桌面端里通过自带的 whisper 转录成文字。更高阶一点的甚至可以配置 command 一键进行转录、AI 处理文字、打 supertag、移动等操作。功能齐全、并且可以高度定制化。
而在管理端,AI 也能发挥重要的角色。Tana 中的各类 field 几乎都可以通过 AI 来自动根据其内容进行自动填写。举个例子,当我在 Tana 中输入一个经济学的概念,AI 可以自动在我的「领域」field 中识别出这是个经济学的概念,填上经济学,同时根据我预设好的 prompt,在「相关概念」这一个 field 中自动生成可能和这一概念相关的其他概念,便于我进行联想,或者之后和其他概念产生 unlinked mention。
搜索方面目前 Tana 还不支持通过 AI 自动搜索笔记库里的笔记。不过听参加过线下活动的群友说,Tana 有考虑在未来的手机端采取 AI 检索的方式来帮用户寻找到最契合的笔记。
Mem.ai
和其他笔记软件相比, Mem 在成立之初就以 AI 作为自己的主要卖点,甚至获得了 OpenAI 的投资。我在年初的时候付费过一个月,最近又用了 7 天免费 Pro,算是轻度体验了一把这个软件。
Mem 最核心的功能莫过于和 AI 对话调取知识库内容并和笔记对话。就我短时间的体验来看,AI 每次都能正确搜索出正确的一些 mem,但只是一些,并不能把所有相关的 mem 都找出来。比如我有两个 mem 是关于海绵城市的,换了好几个不同的问法,AI 都只能自动调取其中的一篇,另一篇就找不出来,不知道是中文输入的原因,还是由于 AI 算法导致的。
此外,Mem 在进行笔记输出时能自动推荐相关的笔记,帮助用户根据笔记库进行联想发散。然而, Mem 在笔记的本职工作上做的并不好。各种输入途径都只支持纯文本,而且使用下来最影响使用体感的地方是对中文分词支持一般,中文搜索的时候会因为分词不良搜不出想要的内容。而且用中文标点输入有时会出现 bug,会莫名其妙换行(最近用的这次比年中好了一些)。
理想中的 AI 笔记软件
那么,一个在我想象中理想的笔记软件的 AI 是一个什么样子的呢?如上文所说,在我的想象中,它其实更相当于是一个所谓的 Copilot。我将从输入、管理与检索、输出这三个方面来简要阐释一下我的想法。
输入
在输入阶段,AI 笔记最重要的功能就是支持快速录入与处理,因此,它应当能够支持语音转文字,并支持通过默认 prompt 以及 custom prompt 对转译的文字进行处理。在此基础上,锦上添花的点是可以基于录入的内容,自动处理各类 property 或 meta data,或者根据需要扩展文章细节,调整结构和语言风格。
目前无论是 ChatGPT 还是 Poe,在语音输入和写作流程上还不够顺畅。比如在 ChatGPT 中,需要先选择一个之前的对话,然后点击按钮 Whisper 录音转文字,之后在对话中进行文本调整。过程中还很容易出现对话失忆(最近 4.0 的失忆情况越来越严重了)。Poe 调用的是苹果的语音输入,也存在识别问题,只能用第三方 whisper 键盘或者支持 whisper 的软件进行输入。这些问题使得我感到使用这些工具很繁琐,总感到心流被打断。
管理与检索
在知识管理和检索阶段,完美的 AI 笔记需要构建用户个性化的知识图谱,实现跨文档的关系连接和语义索引。同时,它可以主动推荐相关内容,以及通过自然语义问答系统来在各个客户端便捷且全面地检索信息。
输出
在输出阶段,AI 笔记能够自动生成文稿框架,协助文章写作。它需要支持理解用户写作风格和语调,同时检查逻辑错误,提出改进建议。同时,它最好也要能够支持根据已写的内容自动化推荐相关的笔记以协助写作;或者当想要调取相关信息时,能以最快捷的方式调取。
更理想的情况,可以成为个人的灵感主力,主动发现知识与知识之间的关联,提供写作灵感或者查漏补缺
在整个流程中,AI 笔记都需要具有高度的定制化。如果能充分利用用户数据自动进行个性化优化,并以 Copilot 的方式主动提供帮助,那更将会大大提升知识管理效率。当然,这需要在保障用户隐私和数据安全的前提下实现。
结语
本文中,我简要介绍了 Notion、Tana 和 Mem 的 AI 功能。他们各有优势,但同时也没有一个能在笔记的全生命流程里提供 All-in-one 的帮助。因此,具体使用哪个软件还是需要结合自身对这些流程的需要来决定。
很多人觉得 AI 在笔记中作用不大,毕竟只有自己的思考才能把笔记内化成自己的知识。但是 AI 作为一个工具,如果能极大地提高我们管理、思考笔记的效率,那么它作为一个 copilot 还是很称职的。希望已有的这些 AI 笔记软件能逐步补足自己的短板,或者有其他新的软件能横空出世,给我们带来不一样的体验。
> 下载 少数派 2.0 客户端、关注 少数派公众号,解锁全新阅读体验 📰
> 实用、好用的 正版软件,少数派为你呈现 🚀