首页 > 短视频制作技巧 > 一种短视频自动剪辑方法与流程
2020
03-09

一种短视频自动剪辑方法与流程

  随着网络的发展普及,短视频作为一种新生的媒体形式也逐渐被公众接受,众多自媒体和个人都选择短视频作为表达自身观点和展现自己生活的方式,但短视频的剪辑对视频处理软件的使用有一定的门槛,并非所有人都有良好的视频处理软件操作基础,这就对这些人的短视频剪辑带来了难以克服的障碍,现有技术中虽然也有一些对视频进行自动剪辑的方法,但大多都是通过选取视频长度进行简单的拼接,无法考虑到视频片段之间的连贯性和整体性。

  抽取视频单元中的第一帧作为第一参考帧,并以所述第一参考帧为基点,以设定帧数为间隔,抽取若干第二参考帧,将各参考帧进行前景目标识别;

  按照时序信息和目标运动信息,对相邻且前景目标相同的参考帧进行再次识别,得出相邻参考帧之间的视频片段中的主体目标;

  优选地,对视频单元进行质量诊断,舍弃各所述视频单元中存在异常状况的帧数时,本方法进一步包括:

  计算视频单元中存在异常状况的帧数,所述异常状况包括清晰度异常、亮度异常、偏色和灰度异常,将异常状况的帧数从所述各视频单元中删除,保留视频单元中剩余连续帧数大于阈值的视频片段。

  预先建议转场特效库,将转场特效库中的转场特效根据适用色差分类,根据相邻剪辑素材之间的边缘色差,从适用的转场特效分类中随机选取添加转场特效。

  优选地,对剪辑素材进行剪切时,分析剪辑素材的音频频谱,若剪切起止点不处于音频频谱中的波谷,则将剪切起止点向前或向后顺延至最近的音频频谱波谷处。

  从上面所述可以看出,本发明提供的短视频自动剪辑方法,通过将视频素材分隔为若干视频单元,并分别进行质量诊断,舍弃各视频单元中存在异常状况的帧数,可以避免剪辑出的短视频中存在视频质量不佳的情况,通过抽取第一参考帧和若干第二参考帧,对参考帧进行前景目标识别,可以初步了解视频图像中的前景目标,通过根据时序信息和目标运动信息,对相邻且前景目标相同的参考帧进行再次识别,可以更加准确地识别出视频拍摄的主体目标,从而作为视频剪辑的基础,通过将主体目标相同的各视频片段进行分别归类,根据主体目标匹配关键词,从各视频片段中选取共同关键词最多的视频片段进行剪辑,可以有效剪辑出视频素材中最能反映视频主题的短视频。

  为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。

  需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。

  视频单元的数量根据目标短视频时长及视频素材总时长确定,具体的,可将目标短视频时长的30%作为视频单元的标准时长。

  s103抽取视频单元中的第一帧作为第一参考帧,并以第一参考帧为基点,以设定帧数为间隔,抽取若干第二参考帧,将各参考帧进行前景目标识别;

  前景目标识别中可利用深度学习卷积神经网络,对各参考帧的视频图像进行单帧识别,设定帧数按视频单元中颜色平均变化率进行调整,若视频单元中颜色平均变化率较高,则缩短设定帧数,若视频单元中颜色平均变化率较低,则延长设定帧数。

  s104按照时序信息和目标运动信息,对相邻且前景目标相同的参考帧进行再次识别,得出相邻参考帧之间的视频片段中的主体目标;

  能够解决单一帧图像不能完全将目标识别检测出来的问题,将不同时刻的视频信息综合起来,对于同一前景目标的前后两参考帧来说,前景目标往往会产生一定的动态变化,结合时序变化和运动变化,可以有效排除在单一帧识别中误识别为前景目标的情况。

  s105将主体目标相同的各视频片段进行分别归类,并根据主体目标匹配关键词;

  视频拍摄中可能会拍摄到与想要拍摄的视频主题无关的内容,或者因误拍和等待拍摄时机而拍摄到的无用内容,通过将主体目标相同的各视频片段进行分别归类,可以将与视频主题相关性较高的内容和相关性较低的内容进行区分,从而为后续剪切拼接提供依据,避免目标短视频中出现与视频主题无关的内容,上述关键词可通过人工智能识别得出,如湖泊、桥、汽车、森林、摩天大楼等。

  通过该步骤可以进一步使最终剪辑出的短视频主题相一致,即使源视频素材内容杂乱,也可以从视频素材中剪辑出与视频主题相关性最高的短视频。

  本发明通过将视频素材分隔为若干视频单元,并分别进行质量诊断,舍弃各视频单元中存在异常状况的帧数,可以避免剪辑出的短视频中存在视频质量不佳的情况,通过抽取第一参考帧和若干第二参考帧,对参考帧进行前景目标识别,可以初步了解视频图像中的前景目标,通过根据时序信息和目标运动信息,对相邻且前景目标相同的参考帧进行再次识别,得出相邻参考帧之间的视频片段中的主体目标,可以更加准确地识别出视频拍摄的主体目标,从而作为视频剪辑的基础,通过将主体目标相同的各视频片段进行分别归类,根据主体目标匹配关键词,从各视频片段中选取共同关键词最多的视频片段进行剪辑,可以有效剪辑出视频素材中最能反映视频主题的短视频。

  作为一种实施方式,对视频单元进行诊断,舍弃各视频单元中存在异常状况的帧数时,本方法进一步包括:

  计算视频单元中存在异常状况的帧数,异常状况包括清晰度异常、亮度异常、偏色和灰度异常,将异常状况的帧数从各视频单元中删除,保留视频单元中剩余连续帧数大于阈值的视频片段。

  由于在视频拍摄中常常会遇到部分片断拍摄质量不佳的问题,而如果只是简单地删除掉存在异常状况的视频帧,可能会导致剩余的视频片段缺乏连贯性,所以本实施方式中,只保留剩余连续帧数大于阈值的视频片段。

  作为一种实施方式,对剪辑素材进行剪切时,本方法进一步包括,剪切后的剪辑素材的最小时长不低于目标短视频时长的比例限值,上述比例限值,即为目标短视频时长的最低百分比限制,如目标短视频时长为3分钟,比例限值为10%,即剪切后的剪辑素材的最小时长不低于18秒。

  作为一种实施方式,在各剪切后的剪辑素材之间添加转场特效时,本方法进一步包括:

  预先建议转场特效库,将转场特效库中的转场特效根据适用色差分类,根据相邻剪辑素材之间的边缘色差,从适用的转场特效分类中随机选取添加转场特效。

  在视频剪辑过程中,由于相邻剪辑素材之间的边缘色差不同,需要针对不同的边缘色差采用不同的转场特效,使视频片段间的连接转场更为流畅。

  作为一种实施方式,对剪辑素材进行剪切时,分析剪辑素材的音频频谱,若剪切起止点不处于音频频谱中的波谷,则将剪切起止点向前或向后顺延至最近的音频频谱波谷处,传统的视频剪辑往往只考虑画面部分,但由于画面部分色彩复杂,在进行剪切拼接时很容易造成视频片段间的连接生硬不连贯,而分析其音频频谱,由于场景转换或事件改变时,在音频上往往存在一定的间隙,也就是波谷,将剪切起止点顺延到波谷,可以有效防止剪辑视频生硬的情况出现,使每一个视频片段更加完整。

  所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。

  另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(ic)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。

  尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态ram(dram))可以使用所讨论的实施例。

  本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。


本文》有 0 条评论

留下一个回复