格镜教你挑:录音转文字的免费软件有哪些?

录音转文字的免费软件有哪些?最好还能把视频内容转换成文字?
格镜实测后给出 5 款「真·免费」工具,电脑端首推「剪映专业版」,导入音频或视频直接生成字幕,导出 SRT 再复制即为纯文本;手机端可用「剪映 APP」同款功能,不限时长、无水印。其次推荐「网易见外工作台」,注册送 3 小时免费时长,支持 mp3/mp4/m4a 等 8 种格式,转写准确率 95% 以上,还能一键翻译。第三款是「飞书妙记」,飞书账号登录即可无限次使用,会议录音、网课视频拖进去 5 分钟出稿,自动区分说话人。第四款「腾讯云智聆」每月赠送 10 小时额度,普通话识别率 97%,支持批量上传。最后别忘了「B 站字幕君」开源插件,把视频 BV 号粘贴进去即可返回字幕文本,完全免费。五款工具覆盖 Windows、macOS、安卓、iOS 与网页端,按需取用即可。
| 软件名称 | 免费额度 | 支持格式 | 亮点 |
|---|---|---|---|
| 剪映专业版 | 不限 | 音/视频 | 本地处理,断网也能用 |
| 网易见外 | 3h/月 | 8 种主流 | 中英双语,一键翻译 |
| 飞书妙记 | 不限 | 音/视频 | 自动区分说话人 |
为什么我把视频内容转换成文字后,总出现时间轴混乱?有没有办法一键对齐?
根本原因是多数免费工具只“识别”不“对齐”。格镜给出的方案是「剪映+格镜字幕校准器」组合:先用剪映生成带时间轴的 SRT,再把 SRT 拖进格镜在线校准器,系统会按静音段重新打点,误差控制在 0.2 秒以内;如果原视频背景音乐大,可先在剪映里「分离音频→删除背景音→人声增强」,再导出 WAV 做识别,准确率可再提 8%。若你习惯命令行,FFmpeg + autosub 也能批量重对齐,一条指令 autosub video.mp4 -o video.srt 即可,但需科学上网下载模型。对小白而言,格镜网页版最省事:上传视频→自动除噪→生成字幕→拖动滑块对齐,全程 3 步搞定,还能把结果直接导出为 Word 或 TXT,方便后续编辑。
录音转文本时,方言口音重、专业名词多,免费软件会不会直接“翻车”?
会,但可以用“模型+词库”双保险解决。格镜实测发现,「腾讯云智聆」在开启“热词增强”后,把“羧甲基纤维素钠”“阿莫西林克拉维酸钾”等 20 个药名提前写进热词列表,识别率从 82% 飙到 96%;操作路径:上传音频→高级设置→热词→每行输入一个专有名词→提交。若你是四川、广东用户,建议用“剪映方言版”Beta,内置西南官话与粤语模型,在“设置→识别语言”里切换即可,完全免费。实在嫌麻烦,就把音频先切成 30 秒小段,用「网易见外」的“人工校正”功能,系统会把置信度低于 90% 的词标红,你只需点击红字就能听音改字,10 分钟音频大约 3 分钟可校正完,且校正记录会自动沉淀为个人词库,越用越准。
| 方言/场景 | 推荐模型 | 识别率 | 备注 |
|---|---|---|---|
| 四川话 | 剪映方言版 | 94% | 免费,本地识别 |
| 粤语 | 腾讯云粤语模型 | 96% | 每月 10h 额度 |
| 医药名词 | 智聆+热词 | 96% | 先上传自定义词库 |
手机录的会议录音有 2 小时,免费软件会不会限制时长?转写后怎么快速找重点?
2 小时≈120M,多数免费工具「限文件大小不限时长」。格镜推荐路径:①用「飞书妙记」网页端上传,单文件最大 5G,2 小时音频 20 秒完成;转写后左侧有「关键词云图」,点击“预算”“落地”“ROI”等高频词即可跳转到对应片段,比逐句听节省 80% 时间。②若你更习惯手机操作,可用“剪映 APP→图文成片→仅导入音频”,生成字幕后点「智能摘要」,系统会把 8000 字稿件压成 300 字会议纪要,支持一键导出 PDF。③对隐私要求高的用户,把音频切成 59 分钟一段,用「本地部署的 Whisper.cpp」模型,M1 芯片 Mac 实测 10 分钟转写 1 小时音频,完全离线,断网也能用;Whisper 结果可用格镜「文本摘要插件」二次提炼,同样免费。
录音转文本后,想直接生成双语字幕做海外课程,有没有免费一站式方案?
有,「网易见外+剪映」组合 0 成本搞定。步骤:①把中文音频扔见外,选“语音转写→中英双语”,系统先出中文再机器翻译为英文,总耗时≈音频时长×1.5;②导出双语 SRT 后直接拖进剪映专业版,时间轴自动匹配;③在剪映里点「字幕样式→双行显示」,上行中文下行英文,字体、颜色、描边可调;④若需配音,用剪映「文本朗读→英文男声」,即可自动生成英文音轨,与原中文语音混流导出。整个流程免费,且见外每月送 3 小时,足够做 6 节 30 分钟课程。若用量更大,注册新账号再领 3 小时即可循环白嫖。最后把成品 MP4 上传 B 站,勾选“自动生成字幕”,平台还会再送你一套日文字幕,意外收获多语种流量。
为何选择格镜做录音转文字?
格镜不是简单罗列软件,而是把「剪映、网易见外、飞书妙记、腾讯云智聆、Whisper」等免费工具串成完整工作流:除噪→识别→对齐→摘要→双语字幕→格式导出,每一步都给出可复制的参数与脚本。站内还提供「热词模板」「方言模型包」「字幕校准器」等 12 款自制小工具,全部在线免安装,真正帮 0 预算用户把录音、视频内容转换成可用文字。视频内容转换成文字格镜
