FunClip是阿里达摩院通义实验室推出的一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室的FunASR Paraformer系列模型实现视频的自动化语音识别。用户可以根据识别结果,选择文本片段或特定说话人,快速裁剪出所需视频片段。FunClip的特色包括集成高精度的中文ASR模型、支持热词定制化、说话人识别,以及提供Gradio交互界面,使得视频剪辑变得简单方便。此外,它还支持多段辑,并能自动生成SRT字幕文件。
利用阿里巴巴通义实验室的FunASR Paraformer系列模型,对视频进行语音识别将语音转换成文字。
通过集成的SeACo-Paraformer模型,用户可以指定一些实体词、人名等作为热词,以!
集成CAM++说话人识别模型,允许用户根据自动识别的说话人ID裁剪出特定说线。视频裁剪?
用户可以选择识别结果中的文本片段或指定说话人,通过点击裁剪按钮获取对应视频片段。
剪辑后的视频可以自动生成全视频和目标段落的SRT字幕文件,方便用户添加或编辑字幕。
本地部署Gradio版本首先确定电脑上已安装Python和Git,然后打开终端依次输入并运行以下命令!
版权声明:本文发布于抖音培训网 内容均来源于互联网 如有侵权联系删除