#AI开源项目推荐 subtitler
不需要上传视频到服务器,直接在浏览器端就可以语音转录成文本字幕,以及对转录的字幕编辑,生成带字幕视频的开源网站。语音转字幕利用的是 WebGPU,在浏览器端执行 Transformer + Whisper 模型(目前只能支持 tiny 和 base 模型)。视频生成是基于一个库叫 MP4Box.js,借助 Web Worker,后台重新渲染视频,再借助一个FileSystemWritableFileStreamTarget的API,流式写入本地文件。
完全不需要下载任何客户端,只需要下载模型文件到浏览器缓存,缺点是目前模型无法太大,像 Whisper Large 模型几个 G 就不行了,所以实际使用时,只能转录标准的英文视频,其他语种恐怕支持不太好,至少中文效果不行。
纯浏览器端能做这么多事已经很厉害了,未来可期!
项目地址:https://t.co/deeFACiZyg
在线试用地址:https://t.co/BIDuUtuC55
点击图片查看原图