让语音写稿成为现实:我的口述写作流分享
2021-01-12 15:35:01 Author: sspai.com(查看原文) 阅读量:260 收藏

从 blabla 到文字上屏——这是我的口述写作流

Matrix 首页推荐

Matrix 是少数派的写作社区,我们主张分享真实的产品体验,有实用价值的经验与思考。我们会不定期挑选 Matrix 最优质的文章,展示来自用户的最真实的体验和观点。

文章代表作者个人观点,少数派仅对标题和排版略作修改。


下面的截图来自于之前文章《又到一年就业季,聊聊 HR 眼中的「专业」与「就业」》,一篇我用口述写作完成的文章的底稿。正如你所见,文本中有不少口语化的表达,截图的部分总共 514 字,大多数情况下,即便是完全照着屏幕用全拼一个个码出来至少也得 5 分钟;但如果换成口述,通过语音转文字录入,同样的字数基本上可以在一半乃至于更少的时间内完成。

口述写作底稿

如果文章篇幅比较长,这种时间上的对比还会更加明显。

语音识别技术的发展,日常生活中可以用到语音转换文字的场景也越来越多,和我们朝夕相伴的输入法,如讯飞、搜狗、百度乃至 iOS 自带的输入法,都有了语音转文字功能,背后的厂商甚至还有各具特色的语音转文字产品1

这自然就让我有了借助语音转文字进行大篇幅写作的想法。

首先需要指出的就是,口述写作像我们日常纸笔写作或者键盘码字一样,口述写作同样也需要类似工具。输入法(语音转换引擎)和编辑器就像纸、笔、键盘一样不可或缺。再者,口述写作对于场景的要求相对较高一些,实际效果因场景而异。

下面分享一些我自己的口述写作经验。

基础工具选择

对于口述写作来讲,一个趁手的语音转换引擎非常重要。口述写作的过程中经常会遇到需要随时手动修改的情况,所以我最终选择了支持语音转换功能的输入法,而不是其他类型的语音转文字服务。

对于我而言,经过与各个输入法的磨合,我个人更习惯使用的是讯飞。主要基于这样两点原因:

  1. 讯飞整体对于我的口音识别效果比较好
  2. 讯飞的后期纠错、调整比较顺手

口述写作会不可避免地录入各种错别字,讯飞可以在不切换状态的情况下直接用手写对单个错别字、生僻字、人名/地名进行更正。这种方法比用拼音打字要方便得多。

除开讯飞输入法之外,搜狗输入法、百度输入法以及系统自带输入法都有语音转文字功能,大家可以根据自己的平台、使用场景等情况进行选择。

移动端的 Markdown 编辑器

来到移动端,在手机上进行口述写作胜在场景。很多的人初次遇到语音转文字也是在手机上,所以这里我把移动端放在开头。

在移动端上经过了多次的辗转尝试,我最终采用了「讯飞 + Markdown」的组合,具体而言比较常用的两种组合是「讯飞输入法 + 1writer」或「讯飞输入法 + MWeb」。

这里之所以推荐 Markdown 写作工具,主要是因为 Markdown 相对格式简单,口述写作的过程中可以更专注地「码字」,调整结构则交由简单的 Markdown 语法标记功能完成——诸如 1writer / MWeb 这样的工具都支持快速调整文本格式,它们有一组或者多组快捷键,甚至支持对这些快捷键进行自定义,极大地提升了排版体验。

当然,具体的选择还是因人而异。我此前也尝试过几个模块化编辑器,但在口述写作这个场景下,离开了键鼠的模块化编辑器并没有带给我太多(如桌面环境般)良好的体验。

至于为什么使用手写,也是出于口述写作这一场景考虑。手机屏幕毕竟太小,一旦出现语音识别有误、或者需要追加部分字词的时候,使用手机键盘调整的节奏拖沓、比较慢,和纯粹的语音录入相比,在语音、点按之间反复切换显得愈发笨拙,得不偿失。

桌面端:讯飞配飞书的双屏输出

不过手机屏幕太小影响后续调整的问题,配合桌面端倒是可以进行巧妙地解决。毕竟有时我也会在文章的主体完成之后,将其在桌面打开进行收尾调整(比如配图)。

受之前的文章《通过飞书团队协作,快速将大量英文译成中文》文章启发,我觉得可以把飞书的多人实时协作编辑文档的特性用在「自己和自己玩」上。

我的方法就是利用同一个飞书账号、同一个文档,从而来实现多端的实时同步显示。也就是说我们在飞书中进行口述写作时,电脑上会自动同步相应的文本内容。桌面端文字的显示进度与手机上一致。

飞书本身集成的模块化操作与支持 Markdown 语句的特性十分有助于提升码字的效率,而且后期可以导出 Word 文档。这些是我采用飞书的主要原因,当然你也可以尝试一下其他的模块化编辑器。使用这种方案进行口述写作时,我们大可以把手机放在电脑边,主要输入靠语音,偶尔需要调整的地方再使用键鼠直接在桌面端进行修改。

除了飞书方案之外,日常中我们也经常会见到输入法提供的「跨屏输入方案」。比如搜狗输入法等自带的跨屏输入功能。但是对我而言这只是一个备选的方案,实际体验下来这种方案体验的效果并不是太理想,经常会因为网络问题导致同步效果不佳。

搜狗输入法可以通过输入法扫码,连接实现跨屏输入。后续连接可借助手机记忆快速连接

就桌面端的方案而言,「输入法+飞书」的方案更「广谱」、跨平台性更好。手机、电脑上都可以不受输入法和平台的限制,比如使用 iPhone 与 Windows 的用户、使用 Android 与 Mac 的用户都可以正常使用。而且这种方法也不会发生像输入法「跨屏输入」把自己绑定在特定的输入法之上的情况。

当然目前这种方法有个小缺憾,它仍然需要手机的辅助,手机需要充当一个语音转换引擎的接收器。

口述写作需要注意什么?

从开始折腾口述写作至今,整体上的感受就是虽然口述并不能完全取代于键盘写作,但它可以胜任绝大部分工作,甚至在一定程度上作为主要写作工具使用。

在长期折腾的过程中,我也整理了一些注意事项供想要尝试的朋友参考:

思维的切换

在口述的过程中,需要保持书面语的思维。建议是谋定而后动,以最大限度避免口语中常见的「嗯」「啊」等语气词,以及短句子、方言和俚语。

如果实在是担心,不妨简单列一个小提纲放在一旁当作「提词器」:

提纲十分有助于防止自己的思维跑偏

英文、中文特定文字处理

口述写作中可以采用「符号」的形式来替代那些语音转换引擎不容易识别的内容。尤其是针对英文、中文中特定名词、人名等。在整篇文章结束之后统一对替换的内容进行查找、替换。

图片处理

对于插图,在口述的时候,我会使用这样的句式:「这里有张图」+「相关描述」。然后在整个文章结束之后,根据提示统一进行配图。

手机锁屏设置

在口述的时候,锁屏其实是经常容易忽略,但是会影响体验的一个点。在操作的时候,我习惯是把自动锁屏的时间调整为「5 分钟」或者常亮。这样可以省去来回切换的麻烦。

小结

其实除了上面提到的那些点之外,相比键盘打字而言,口述写作更随意,也可以更好用地利用碎片化时间。不用在意他人的眼光 —— 当你对着手机叽里咕噜的时候,别人会以为你在同他人微信聊天……

解放双手,让键盘成为辅助,这应该就是口述写作的核心目的所在。在使用口述写作这套方法一段时间后,我发现口述写作太容易上瘾了,以至于稍微有点文字就不愿意用手打字。这可能就是「说话几分钟,码字两小时」吧。

> 下载少数派 2.0 客户端、关注 少数派公众号,解锁全新阅读体验 📰

> 实用、好用的 正版软件,少数派为你呈现 🚀

© 本文著作权归作者所有,并授权少数派独家使用,未经少数派许可,不得转载使用。

jijiali


文章来源: https://sspai.com/post/64515
如有侵权请联系:admin#unsafe.sh