这款中文语音识别工具专注于将中文音频与视频内容转换为srt格式的字幕文件。工具基于魔塔社区开发的Paraformer语音识别模型,既提供了直观的用户操作界面,也开放了API接口供开发者调用。
需要注意的是,工具目前仅支持中文语音的识别处理。若需要处理其他语言的语音转字幕需求,建议选择基于OpenAI Whisper或Faster-Whisper架构开发的项目,例如pyvideotrans或stt等工具。
工具适用于需要快速生成视频字幕的内容创作者、教育工作者以及视频编辑人员,能够有效提升字幕制作的工作效率。
分享地址
https://github.com/jianchang512/zh_recogn