首页

华盛论文咨询网

当前位置:首页>>文史论文

影视音乐视频获取途径及取证

来源:华盛论文咨询网时间:2020-04-02所属栏目:文史论文

  

  1引言

  随着互联网技术发展越来越快,数字视频技术获得广泛发展及传播,通过计算机可对世界各动态进行了解[1]。在日常生活中,对于视频信息的使用也日益频繁,例如电影、电视广播节目、网络视频等。当前影视技术的发展速度非常快,因此也形成了完善的数字化音频制作、编辑、设备体系,不论是音频制作还是影视音乐,都随着数字音频软件技术的应用而提升,大大增强其工作质量和整体效率[2]。在各类网站中,影视音乐成为人们获得信息的重要来源。但随着视频编辑软件的进一步普及,在互联网影视音乐中,有一些虚假视频信息在传播,造成一些恶劣影响[3]。因而,研究篡改检测,确保视频信息完整性、真实性已成为视频取证技术的研究热点,国内当前已有研究主要是围绕音频分类领域展开的分析[4]。但这些研究未涉及影视音频检测领域和录制环境的辨别,因此,本文利用小波包分析和梅尔倒谱系数分析对影视音频的频域统计特性进行提取,研究了影视音乐后期制作中的录制环境检测与视频取证技术。

影视音乐视频获取途径及取证

  2影视音乐视频的获取途径及取证简述

  近几年,随着廉价硬件设备的进一步普及,获取影视视频的途径日益增多,例如智能手机、数码摄像机、平板电脑等,图1为影视音乐视频获取途径。影视音乐视频资源可通过数字硬盘、DVD光盘、网络等传输,海量影视音乐视频因编辑软件操作简便,大量音乐视频资源经历修饰,不管通过何种途径获取,人们对其视频真实性存在疑问,因此需要知道该影视音乐视频片段来自的硬件设备,对视频来源进行取证。

  视频来源取证指根据影视音乐视频处理过程、采集过程遗留痕迹的视频捕获设备及其型号进行确定,这样方便对其视频来源进行追溯。这对于互联网上对视频的篡改非法传播的来源的追溯意义重大。对于数字音乐视频合法版权所有者来说,可借助来源取证技术对该影视音乐视频进行拷贝检测。检查多媒体文件头信息是最简单的一种对视频来源进行确定的方法,许多硬件设备制造商都会将摄像机型号、媒体获取时间、压缩编码模式等信息在扩展头中进行加入。但这些信息易被伪造、修改,或经再次压缩后将不存在,因此,需要从影视音乐视频对其物理层出发进行获取,从而可找到更可靠的取证方法。

  3特征提取及分类方法

  3.1MFCC特征提取

  在分析处理影视音乐时频信号的过程中,需要使用MCFF手段,从根本上来说就是对语音特性进行适应的滤波器组,而其基础为同态处理的去卷积倒谱改进算法[5]。传统MFCC处理方法当中需要变换信号,并采取后续处理从而得到不同谱带的功率变化速度的信号,其具体算法流程见图2所示。

  在本研究中,MFCC算法同时引入信号的一阶差分梅尔倒谱系数(FMFCC),这样可对影视音乐音频动态特性进行更加充分的计算。该系数可对音频每帧之间的相关性进行更好的消除,从而能使影视音乐音频特征的辨识率得到提高,可通过公式(1)对FMFCC进行计算:

  公式中,第n+i帧的倒谱系数用sfmel(n+j)表示,通常情况下,j=2,主要对一阶差分倒谱系数进行求解。二阶FMFCC可通过同样原理进行继续迭代求得。在MFCC传统算法中,傅里叶变换可等间隔对信号进行频带划分。首先需要对窗口大小进行确定分析,在FFT分析过程中,时频分辨率并不能根据信号的变化进行调整。而在多分辨率分析过程中,会表现出局限性的尺度变化情况,因此会造成其分辨率在低频段时间分辨率较差,在高频段频率较差。对其存在的缺陷,通过小波包变换思想能对其进行较好地弥补。在小波包变换的基础上,对分辨率分析方法进行延续处理,同时划分非均匀对时频空间,如果是较低的影视音乐视频,此时需要使用较长的时间窗。从而确保能够将多元化分辨率的小波系数与成分复杂的音频信号对应起来。在本研究中,将MFCC、小波包变换、FMFCC进行结合,同时增加影视音乐音频时域的短时能量、能量熵、频谱重心、频谱滚降、零值点、频谱通量六个主要特征,通过该特征提取影视音乐音频特征,实现分类数据的最终目的。提取特征的算法步骤详见图3所示。

  3.2机器训练聚类方法

  作为k均值算法的扩展,期望最大化算法(EM)可以估计得出未知参数迭代优化过程。在隶属概率权重的基础上,相似类别在EM算法的基础上可以进行数据归类。在参数向量的基础上,EM可以实现,确定其所产生的混合密度,从而对整体数据集进行初始估计。对于EM过程来说,不同数据均与其概率值相对应,从而反映出数据的类别集合情况。EM算法流程期望步骤如下:结合估计值展开迭代过程,从而确保EM能够寻找到数据的下一个最佳下届,表示为期望;并通过概率对数据xi进行归类,通过公式(2)将其归到类别Ck中:

  公式中,高斯分布规则符合p(xi∈Ck)=N(mk,Ek(xi))服从期望为Ek、均值为xi。在该步骤的基础上可以计算出每类别中对象xi的隶属概率。在最大化步骤当中,期望步骤与EM相结合,可以重新估计概率分布情况,从而得出未知变量期望,这样数据集具有更大化相似性,具体见公式(3):公式中,最终期望估计值用mk表示,通过验证发现可以实现EM算法,且其收敛性在某些特征优化函数当中可以较快实现。

  4性能测试方案

  4.1实验设备

  在进行实验时,硬件设备包括罗兰UA-55录音外置声卡、索尼ECM-TL1麦克风、联想笔记本电脑。软件设备包括Matlab2014、Audacity2.2.1、WEKA3.9.0,这样可实现影视音乐音频录制、特征提取分析,并根据特征分类进行提取。在进行影视音乐音频录制时,工程采样率88kHz,128bits,单声道参数。

  4.2数据采集

  在录制地点A、录制地点B、录制地点C、录制地点D、录制地点E、录制地点F六个不同的环境下,进行影视音乐音频数据的采集,对分类算法、特征提取的有效性进行验证。在相同环境下,影视音乐音频的采集工作分十个时间点进行均匀录制,这样可对某个环境整体噪声特性进行反映,时间范围从早上八点到晚上六点,在每个时间点,进行五段影视音乐音频的连续录制,其中每段音频需要30s的时间。

  4.3特征提取

  对于录制影视音乐音频的三十个特征数据,通过Matlab2014进行提取,包括短时能量、能量熵、频谱重心、频谱滚降、零值点、频谱通量六种时域特征,MFCC特征十二个(sfmel1,sfmel2,···,sfmel12),FMFCC特征十二个(sfmel1,sfmel2,···,sfmel12)。不同通过预处理特征数据的手段进行操作,而是结合WEKA3.9.0分类工具来分析聚类情况。聚类模式选用训练模型,分类工具采用EM算法。

  5测试结果分析

  由表1知,不同行的离散数据差异性较大,但向同行的百分数相加为100%。R0、R1、R2数据全部分布为三列,这说明录制地点A、录制地点B、录制地点C的音频特征显著度较低。但是该环境影视音乐音频特征的变化情况比较显著,音频可能会被认为是其他环境下的。录制地点D的音频并不会被误认为其他环境,这主要是因为其集中在一列当中。从表1对角线方向数据可看出,在本研究中,算法分类录制地点A的正确率最差,为59%;录制地点D正确率最高,为100%,该系统实验正确检测期望为85%。在六个类别中,录制地点B的Clusterl、录制地点F的Cluster5分类情况最复杂。在Clustcrl中,录制地点2分类率为91%,但该类当中融入了部分其他环境影视音乐录音,其中录制地点A录音、录制地点C录音、录制地点F录音所占比例分别为18%、31%、11%,此外相似结果还体现在Cluster5当中。对于Clustcrl、Clustcr5这两组来说,自身分类虽正确率高于91%,但有相当数量的其他类别录音混入,这表明在录制地点B和录制地点F两个环境下,其影视音乐音频特征的相似性较强,而其他环境下的也会出现于其相似的音频特征。其他环境音频并未融入到Cluster0、Cluster2、Cluster4这三组当中。与此同时,其他环境音频却混入了Cluster3分类,但其分类正确率达到了100%。录制地点E的Cluster4分类正确率为97%,具有显著的音频特征,同时其综合辨识率更具有优势。表2为MFCC特征提取算法及EM分类器分类结果,由表2知,对角线方向的便是准确率更低,主要原因是由于未使用小波包变换,但该算法在录制地点A、录制地点C的分类效果要比小波包提取算法好,表3为小波和傅里叶提取算法的分类结果。图4、图5为基于质心的k均值分类方法的结果分类,可看出,小波和傅里叶的特征提取,最终所得到的k均值分类准确率低于期望最大化算法。将期望最大化分类算法与k均值相结合,与傅里叶算法的小波包特征后分类结果相比,前者的显然更优。

  6结语

  本文分析测试了影视音乐音频盲取技术的环境监测,在提取过程中所使用的数学工具包括小波包分析、梅尔倒谱系数等,综合探究其特征性,同时结合期望最大化算法展开机器训练聚类。结果表明,影视音乐音频录制环境的分类准确率获得大幅提高;小波和傅里叶的特征提取,最终所得到的k均值分类准确率低于期望最大化算法。将期望最大化分类算法与k均值相结合,与傅里叶算法的小波包特征后分类结果相比,前者的显然更优。

  影视音乐视频获取途径及取证相关推荐三维动画设计中如何应用影视特效

论文发表问题咨询

回到顶部