AI-Media2Doc 是一款功能强大的 Web 应用程序,它利用先进的 AI 技术将视频和音频资料迅速转换成多种文档格式。用户可以选择将内容转化为小红书笔记、微信公众号文章、知识笔记、思维导图或内容总结等风格。该应用的使用门槛较高,但完全开源,遵循 MIT 协议,允许用户在本地部署。
AI-Media2Doc 在保护用户隐私方面表现出色,无需进行注册或登录,所有任务记录均存储于用户设备上。应用程序的前端采用 ffmpeg wasm 技术,用户无需安装 ffmpeg 即可直接使用。支持多种文档风格,包括小红书、微信公众号、知识笔记、思维导图和内容总结等。
该程序还提供 AI 对话功能,允许用户针对视频内容进行二次问答,以及支持将结果一键导出为字幕文件。基于字幕信息的智能截图功能,可将截图插入文章中,实现图文并茂,无需依赖视觉大模型。用户还可以在前端自定义配置 prompt,以适应不同的需求。
AI-Media2Doc 支持 Docker 一键部署,并允许用户在后端设置访问密码,确保只有输入正确密码的用户才能使用该应用。
地址:
https://github.com/hanshuaikang/AI-Media2Doc