坦率地讲,我学 AI 的方式有点另类。
不是看论文,不是刷网课,是听播客。小宇宙、Apple Podcast、喜马拉雅,订阅了大概四十多个频道,每天通勤路上听,睡前听,跑步的时候也听。
但播客有个问题,听的时候觉得挺有收获,听完就忘。四十多个频道,三个月下来,真正记住的内容不到一成。有时候听到一个特别好的观点,想回头找,根本不知道在哪一期、哪一分钟。
我试过做笔记,边听边记。但走路的时候没法记,开车的时候更没法记。也试过截图保存播客封面,最后手机里存了几百张图,翻起来比重新听一遍还费劲。
后来换了个思路,不是我去适应播客的节奏,而是让工具帮我提炼播客。
第一步,把播客转成可搜索的图文
播客的核心价值在观点输出和深度对话,但这些信息被锁在音频里,没法搜索、没法复制。
我现在的做法是,先把播客链接丢进Ai 好记,它自动提取音频做语音识别,同时生成图文笔记。最终输出的是结构化内容,左边是文字稿,右边是时间轴。
这个过程中有几个功能比较关键。一是说话人识别,播客经常是两人对谈,区分谁说了什么很重要。二是精华速览,AI 自动提炼核心观点,几分钟把握一小时的播客内容。三是 AI 播客功能,把长播客浓缩成几分钟的双人对谈,通勤路上可以快速回顾。
我实测过一个一小时的技术播客,转出来的图文笔记大概三千字,核心观点和引用都保留了。比我自己边听边记,完整度提升了一个档次。
第二步,用跨笔记检索建立知识网络
单条播客整理完,下一步是关联。播客的特点是碎片化,一个观点可能分布在十几期节目里,单独看每期都不完整。
Ai 好记的 AI 助理功能在这里挺好用。它基于 DeepSeek R1,可以跨多篇笔记联合问答。比如我问「强化学习在推荐系统里的应用」,它能从我这三个月整理的所有播客笔记里,提取相关内容,生成一份综合回答。
更实用的是知识图谱。三级目录管理,我按「领域/主题/嘉宾」分类,比如「AI/强化学习/李宏毅」这种结构。批量移动和自定义排序功能,让整理效率得到提升。
第三步,把笔记变成创作素材
整理笔记不是目的,输出才是。我每周写一篇技术博客,素材主要来自播客笔记。
Ai 好记的导出功能在这里派上用场。我习惯把相关笔记导出成 Markdown,直接进 Obsidian 做二次加工。思维导图用 Xmind 格式,方便做技术方案评审的时候展示。PDF 格式留给需要打印或分享给同事的场景。
AI 润色功能也挺实用。播客里的口语化表达,直接复制到博客里显得太随意。用 Ai 好记的润色功能,保留原文版的同时生成润色版,把口语转成可读结构,省了我大量修改时间。
这套工作流的局限
说实话,也不是完美无缺。
播客的音质参差不齐,有些节目录音环境差,背景噪音大,识别准确率会下降。我实测过一个在咖啡厅录的播客,转写准确率大约 80%,比安静环境下低了 10 个百分点。
多人对谈的场景,如果两个人声音相似,说话人识别会出错。我试过一个播客,两个嘉宾都是男声,最后有 20% 的段落被误判了说话人。
长播客的处理时间是个问题。两小时的节目,解析大概需要十几分钟。我一般是睡前批量丢进去,第二天早上看结果。
另外,这套工作流对观点类播客效果最好,有故事线的访谈次之。如果是纯音乐或白噪音类播客,那转出来就是一堆无意义的文字。
对比其他方案
我也试过其他工具。讯飞听见在语音识别准确率上很强,但输出就是纯文字稿,没有结构化处理。Notion AI 的笔记整理功能不错,但它不支持直接解析播客链接,需要手动上传音频文件。
跟这些比,Ai 好记在播客场景的几个功能比较贴心。AI 播客浓缩、精华速览、跨笔记检索,这些是针对长音频学习场景设计的。但实时转写能力不如讯飞听见,各有取舍吧。
一个意外收获
三个月下来,我整理的播客笔记大概有十五万字,比我这三年看的技术书加起来还多。
更重要的是,这些笔记是结构化的、可搜索的、可关联的。以前看书,看完就忘,书架上积灰。现在听播客,听完沉淀成知识网络,随时能调用。
这种学习方式不一定适合所有人,但对我这种时间碎片化、喜欢听多于看的人来说,效率提升挺明显的。
FAQ
Q,播客转写准确率怎么样?
A,安静环境下普通话可以达到 90% 以上,带口音或噪音场景会下降。建议选音质好的节目。
Q,多长的播客适合用这套工作流?
A,二十分钟以上的深度对谈最值得整理。太短的新闻快讯自己听一遍更快。
Q,笔记整理完后怎么复习?
A,我一般是先看精华速览把握整体,再针对感兴趣的话题回到沉浸式阅读区细看。AI 播客适合碎片时间快速回顾。