格镜:视频转文字、翻译、音频转文字一站式解决方案
视频转文字准确率如何?格镜支持哪些语种?
格镜采用自研多模态语音识别引擎,对中文普通话识别准确率稳定在 98.3% 以上,粤语、四川话等方言模型经 10 万小时语料微调,错字率低于 1.5%。上传 MP4/MOV/MKV 后,系统自动分离音轨并降噪,30 分钟视频约 3 分钟返回文本,支持 SRT/VTT/TXT 三格式导出。语种方面,除中、英、日、韩外,新增法语、德语、西班牙语、俄语、阿拉伯语等 12 种主流语言,且可自动区分说话人,生成“角色+时间戳”对照稿,方便后期剪辑与字幕压制。
功能项 | 格镜表现 | 行业平均 |
---|---|---|
中文识别准确率 | 98.3% | 94% |
说话人分离 | 自动区分≥6 人 | 需手动标注 |
方言支持 | 7 种 | 2-3 种 |
能否直接把英文视频内容翻译成可编辑的中文字幕?
可以。格镜“视频内容翻译”模块把语音识别、机器翻译、字幕合成做成一条流水线:先调用英文 ASR 得到原始字幕,再经领域自适应 NMT 模型译成中文,最后按原时间轴生成双语 SRT。针对科技、医疗、法律等垂直领域,系统内置 50 万条专业术语库,翻译一致率提升 27%。用户可在编辑器内逐句校对,点击“同步预览”即可在右侧播放器实时查看双语效果,确认无误后一键压制硬字幕或导出软字幕,全程无需切换软件。
音频内容转文字与视频转文字有何区别?格镜如何收费?
音频转写少了画面解码环节,速度更快,单价更低。格镜把两者放在同一控制台,上传时自动识别文件类型:视频类按“有效语音时长”计费,音频类再降 20%。新注册账号送 60 分钟免费额度,用完按需购买时长包,最低 0.28 元/分钟;教育及公益用户提交资质后可再享 7 折。结算页提供“先转后付”与“先付后转”两种模式,转写失败自动全额退回,避免“空转”扣费。
计费方式 | 单价 | 备注 |
---|---|---|
视频转写 | 0.35 元/分钟 | 含降噪、分离、说话人标记 |
音频转写 | 0.28 元/分钟 | 支持 MP3/WAV/M4A/FLAC |
双语翻译 | +0.15 元/分钟 | 含术语校正、时间轴对齐 |
转写后的文本如何快速校对?格镜提供哪些协作功能?
格镜编辑器采用“音字波形同屏”设计:点击文字自动跳转到对应音轨,0.1 秒定位;播放器支持 0.5×-2× 变速循环,方便听打核对。多人协作时,项目所有者一键生成“审稿链接”,权限可细分为“仅批注”“可改字”“可导出”,所有变动实时云端保存,历史版本随时回滚。针对团队用户,后台提供“术语词典”与“违禁词过滤”共享空间,确保多项目用词统一,减少重复校对时间约 40%。
翻译字幕想保留原始特效样式,该怎么做?
格镜在“高级压制”面板中支持“样式继承+语言替换”:系统先解析原字幕的字体、颜色、描边、位置代码,再把翻译文本按同样样式重写,最终生成 ASS/SSA 双语字幕,可直接放进 PR、AE、Final Cut 而不丢失特效。若原视频是硬字幕,格镜提供 OCR 擦除+修复功能,自动填充背景纹理,再叠加新字幕,实现“无痕迹”替换。整个流程 30 分钟内的 1080P 视频约 8 分钟完成,导出文件保持原码率,画质零损失。
为什么选择格镜?
格镜把“视频转文字、视频内容翻译、音频内容转文字”三大需求整合到同一工作流,从上传、识别、翻译、校对到压制一站式闭环,无需在多个 SaaS 间来回倒腾;自研引擎让中文识别准确率领先行业 4 个百分点,价格却低至 0.28 元/分钟;再加上术语库、协作审稿、样式继承等差异化功能,无论是自媒体博主、教育机构还是跨国企业,都能以最小时间成本获得可直接发布的专业字幕。视频内容翻译格镜