共 4 篇文章

标签：音频处理

开源音频处理AI Whisper WebUI支持多源字幕生成与翻译

简介 Whisper-WebUI为开源语音识别模型Whisper提供了可视化操作界面。该工具支持通过本地文件、在线视频平台、麦克风录音等多种输入方式，实现字幕生成、语音转文字、多语言翻译及音频编辑等核心功能。特色功能通过Pinokio平...

开源音频处理工具简易语音工具箱是一款基于开源语音项目开发的音频处理软件。该工具集成了音频编辑、语音识别、文字转录、数据集生成、模型训练与语音合成等多项功能。功能特色支持多种音频处理操作具备智能语音识别能力可进行语音到文字的转换提...

简介近期，一个名为ChatTTS的文本转语音项目引发了广泛关注。该项目作为开源音频处理领域的创新成果，其开发者宣称已突破技术瓶颈。该模型基于超过十万小时的中英文语音素材训练，目前在开放平台发布的版本采用了四万小时训练数据，且未经过指令微调...

Voicss是一个创新的在线AI音频处理平台，它允许用户无需下载任何软件即可享受到便捷的音频编辑服务。只需将文件拖放到网页上，用户便能轻松进行人声与伴奏的分离、消除背景噪音、创建卡拉OK曲目以及提取纯净的人声。该平台支持流行的音频格式，如M...