阿里推出的,自动化AI视频剪辑工具:FunClip
说到视频剪辑,很多人可能觉得是专业人士才能干的活儿,需要花大力气学习各种剪辑软件。但是,时代在变,技术在进步,现在有个叫FunClip的工具,它就是为了让剪辑变得简单起来。FunClip是由阿里达摩院开源的AI自动视频剪辑工具,通过语音识别技术,用户可以快速选取视频中的特定片段,实现自动化剪辑。
一、FunClip的开源背景
开源,这个词可能有些人不太熟悉,简单来说,就是把自己的技术或者代码分享出来,让大家都可以用。阿里达摩院这么做,就是想把他们研发的这个AI视频剪辑工具分享给更多的人,让他们能够更方便地使用这个技术。
二、FunClip的特色功能
- 自动化语音识别
FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,这个模型在语音识别这一块可谓是佼佼者,准确度高,预测时间戳也精确,这样用户就能通过语音识别快速找到视频中的特定内容。
- 热词定制化
有时候,视频中会有一些特定的词汇是我们特别关注的,比如某个人名或者某个特定的事件。FunClip通过集成的SeACo-Paraformer模型,允许用户指定这些热词,提升这些词汇的识别准确率。
- 说话人识别
FunClip集成了CAM++说话人识别模型,这个功能让用户可以根据自动识别的说话人ID裁剪出特定说话人的视频段落,这对于需要区分不同发言人的视频剪辑来说,非常实用。
- 视频裁剪
用户可以选择识别结果中的文本片段或指定说话人,通过点击裁剪按钮获取对应视频片段。这个功能让视频剪辑变得简单,不再需要手动去拖动时间轴,节省了大量时间。
- 多段剪辑支持
FunClip还支持用户对视频进行多段剪辑,提供了灵活的编辑能力。这意味着用户可以根据自己的需要,对视频进行更加细致的编辑。
三、如何使用FunClip
- 体验方式
使用FunClip非常简单,你可以选择在线体验或者本地部署。在线体验的方式,就是直接通过提供的在线体验地址进行操作,这样的好处是不需要自己安装软件,方便快捷。
(1)在本地启动Gradio服务
如果你想在自己的电脑上使用FunClip,也可以选择本地部署方式。这种方式可能需要一些技术知识,但是一旦部署好了,使用起来也是非常顺手的。
确保本地已安装Python和Git,在电脑终端执行以下命令。
git clone https://github.com/alibaba-damo-academy/FunClip.git
cd FunClip
python funclip/launch.py
随后在浏览器中访问localhost:7860即可看到如下图所示的界面,按如下步骤即可进行视频剪辑
1.上传你的视频(或使用下方的视频用例)
2.(可选)设置热词,勾选是否使用说话人识别功能
3.点击识别按钮获取识别结果
4.将识别结果中的选段复制到对应位置,或者将说话人ID输入到对应为止
5.(可选)配置剪辑参数,偏移量与字幕设置等
6.点击“裁剪”或“裁剪并添加字幕”按钮
(2) 在线体验地址
https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary