一、MPEG-4自然视频编码工具和算法(论文文献综述)
刘艺[1](2020)在《H.266/VVC复杂度分析及帧间算法优化研究》文中指出H.264/AVC及H.265/HEVC视频编解码标准自发布后取得了巨大成功,为了提高对于更高分辨率、更高位深的视频编解码效果,新一代编解码标准VVC正在制定中。新标准以上一代标准H.265/HEVC为基础,加入了一些新的技术,以期在编码相同质量的图像情况下,节省一半的码率。本文针对新一代视频编解码标准VVC进行研究,着重研究了新标准的编码性能及复杂度,并就其中占编码复杂度较高的四叉树加多元树划分进行了算法分析及优化。每一代标准在制定过程中,总需要进行反复的性能测试工作,测试结果能够比较全面的显示加入新技术后新标准相对于原标准的性能提升情况,为优化及算法研究学者提供标准制定思路。VVC标准仍处于研发阶段,目前无比较权威的针对VVC标准的性能测试文献,官方的性能测试工具仅仅提供了比特率性能测试算法,测试结果较好,但仍可进一步改进。本文据此设计了一种压缩比特率及图像失真度相结合的算法进行性能测试工作,该算法将视频编码压缩率及编码图像的完整度进行了综合计算,进而得到更加科学、有效的性能测试结果。实验结果表明,VVC相对于上一代标准HEVC在编码性能上提高了20%,图像质量方面增加了0.7d B,但编码复杂度增加了近5倍。性能测试结果发现,VVC标准相比于H.265/HEVC标准编码复杂度增加很大,因此有必要对VVC编码器进行复杂度分析工作。据此本文设计了一种复杂度分析算法,该算法通过统计编码过程中各主要函数消耗时间,并对各主要函数进行分类,从而找到编码复杂度占比最高的模块。实验结果表明,帧间预测编码在整个编码过程中占比70%,因此有必要对其进行复杂度优化。四叉树加多元树划分是VVC中加入的新技术,其在HEVC的四叉树划分基础上加入了多元树划分,使块划分具有更高的灵活性,在较好的提升编码性能的同时,也大大增加了编码复杂度。本文通过分析VVC标准帧间预测过程中单元划分层次,提出一种划分层次限制的优化算法,通过提前结束划分降低编码复杂度。实验结果表明,优化算法相比于原算法在损失1.35%的性能同时,减少了44%的编码复杂度,大大提高了新标准的实用价值。
杜盼盼[2](2020)在《3D-HEVC标准中基于SKIP模式快速帧间编码》文中研究指明数字视频应用的多样性和高清化,人们愈加迫切需要更高的视频压缩效率。新一代视频编码标准H.265/HEVC应运而生。由于引入了一些新的编码技术,3D-HEVC能够在原来的基础上使压缩效率提高1倍。这些新技术对编码效率的提高具有重要意义,例如四叉树递归划分的CU技术来说,也造成了编码计算的复杂度的极大增加。因此,本文主要研究3D-HEVC中基于SKIP模式的帧间编码的快速算法,并致力于优化深度图像编码的计算复杂度。深度图像联合编码帧中,针对当前第一个附属CU为帧间跳过模式(Skipmode)最优编码的情形,提出了一种3D-HEVC中基于SKIP模式的深度视图的帧间编码快速决策算法。鉴于SKIP作为最优预测模式所具有的特性,本文以第一个附属CU的率失真函数值的4倍作为编码结构决策式一侧的下界,并基于此提出决策帧间编码结构划分的判定式。此外,本文还选取3D-HEVC中深度图像对应纹理图像编码块的,提出了在3D-HEVC中基于SKIP模式纹理视图的快速帧间编码方法。本文采用联合视频工作组官方推荐的测试环境参数进行参数设置,及视频测试序列进行算法测试。实验证明上述算法能够在确保合成视点视频质量前提下,降低深度图像帧间编码复杂度,减少编码时间。
郭红伟[3](2019)在《视频编码的码率控制及优化技术研究》文中进行了进一步梳理高效视频编码HEVC是继H.264/AVC之后的新一代视频编码国际标准,标准规定了编码后比特流的句法结构和对应解码器,而对于编码器的结构和实现模式没有具体的要求。这种开放性使设计者可以根据实际应用的需求灵活地制定编码策略,在特定码率下实现最优的编码性能。率失真优化是视频编码中一项非常重要的技术,其用于选择编码参数并实现编码失真与编码所需比特数的平衡。码率控制是视频编码系统中不可缺少的重要模块,其控制编码器输出特定的码率以满足信道传输带宽及存储设备存储空间的要求。本文就是以HEVC编码器为平台,通过深入分析视频编码中的率失真依赖关系,探讨视频编码优化和码率控制这两个重要的问题。具体的研究内容和创新点包括以下几个方面:(1)HEVC编码器通过计算最小率失真代价独立地为每个基本编码单元选择包括编码模式、运动矢量、参考帧和量化变换系数等编码参数。像素预测和运动矢量预测等技术的应用使不同编码单元之间存在着率失真依赖性,因此对当前编码单元的编码决策将影响到后续编码单元可达到的最大率失真性能。为了能更好地把这种率失真依赖性应用到视频编码优化和码率控制的设计中,本文首先研究了HEVC中不同层级编码单元的率失真特性和率失真依赖性。通过理论分析和实验统计得出,幂函数形式的R-D模型能非常好地表示不同层级编码单元的可操作率失真曲线;率失真依赖关系中,时域依赖较显着,而空域依赖不明显;参考像素的失真对后续编码失真影响较大,而对码率影响较小。(2)通过分析编码帧与参考重建像素的率失真依赖关系,以及编码帧中不同编码块对后续编码过程的率失真影响强度,提出一种基于率失真依赖性的二次编码优化方法。该算法对每一帧进行连续的两次编码,第一次按照原始HEVC的量化参数设置进行简化的帧间预测编码,但不输出码流,以此获得用于度量率失真依赖强度的帧级和块级影响因子;然后利用这些信息确定新的量化参数及拉格朗日乘子进行第二次编码,并正常输出码流及存储重建图像。实验结果显示,本文的二次编码优化方法在低延迟B帧和P帧编码配置下分别平均达到了5.1%和5.3%的码率节省,其编码复杂度平均只增加了23%。(3)针对传统码率控制方法往往会降低编码器率失真性能的问题,本文提出一种基于全局最优准则的帧级比特分配及帧级码率控制算法。首先,通过分析HEVC低延迟编码结构,提出了一种精确的帧级R-D模型估计方法。其次,根据视频序列中不同GOP在编码中的率失真重要性,提出改进的GOP层比特分配方法。然后,从全局率失真优化的视角建立了码率控制下的最优帧级比特分配方程,结合帧级R-D模型和GOP级的比特预算最终实现了最优帧级比特分配及码率控制。该方法在实现精确码率控制的同时,显着地改善了编码器的率失真性能。与不开启码率控制的HEVC基准编码器相比,在低延迟B帧和P帧编码配置下,本文方法获得了平均3.2%和3.7%的率失真性能改善。(4)为了进一步提高比特率控制精确度和编码性能,本文提出了一种基于块间时域依赖性的CTU级码率控制方法。首先,基于率失真优化理论建立了CTU级的全局优化公式,表述为一种加权拉格朗日乘子法,其加权系数与当前CTU的时域失真传播因子相关。然后,提出了一种精确的CTU级R-D模型估计方法。最后,结合CTU的R-D特性和时域失真传播因子建立了一个CTU级最优比特分配方程,其优化目标是在当前帧比特预算约束下最小化编码视频的失真,而不是最小化当前帧的失真。此外,在编码一帧的过程中提出了两种不同的码率控制策略用于减小当前帧的编码比特数与预算比特数的差异,分别称为松弛约束算法和严格约束算法。其中,严格约束算法达到了极高的码率控制精确度,相比于不开启码率控制的HEVC基准编码器获得了3.7%和4.2%的率失真性能提升;而松驰约束算法的码率控制精确度略低于严格约束算法,但实现了5.1%和5.4%的率失真性能提升。
王洋[4](2019)在《基于深度学习的视频编码技术研究》文中指出随着通信技术、互联网技术的发展和移动终端、智能设备的普及,数字广播电视、互联网视频、视频会议、远程医疗、远程教育等传统多媒体应用以及3D视频、虚拟现实视频、短视频等新兴多媒体应用丰富着人们的日常生活,但同时也使得视频数据呈爆炸式增长,给数据存储和网络传输带来巨大挑战,如何稳定高效的存储和传输海量的视频数据成为目前亟待解决的问题。数字视频压缩技术在视频数据压缩处理中扮演关键角色,数字视频压缩技术在通信、计算机、广播电视等领域的广泛应用促进了数字视频编码标准的产生和发展。目前,已经发布的最新的数字视频编码标准HEVC和AVS2虽然能够满足高清和超高清数字视频的压缩性能需求,但是,随着人工智能的发展和5G时代的到来,更加庞大的视频数据量对视频编码标准提出了更高的要求,因此,在现有数字视频编码标准的基础上进一步提升压缩性能十分必要。近年来,随着深度学习的发展,以卷积神经网络为代表的深度神经网络在计算机视觉、语音识别、自然语言处理等计算机领域都取得了令人瞩目的成果,利用深度学习提升视频编码的压缩性能不仅能够为未来的数字视频编码标准提供技术储备,而且是目前视频编码领域的前沿问题和研究热点。本文从利用深度学习提升视频编码技术的压缩性能角度展开深入研究,涵盖了数字视频编码标准框架中的帧内预测、帧间预测以及环路滤波三个主要模块。具体的研究内容分为以下三个部分:第一,本文提出了基于多尺度卷积神经网络的帧内预测算法,用来提高视频编码中帧内预测的准确性。基于方向插值的帧内预测方法广泛应用在现有的数字视频编码标准中,这种方法能够很好的预测具有主方向纹理的图像块,但是对于复杂纹理的图像块或者方向性较弱的图像块不能获得较好的预测效果。为了提高现有视频编码标准中的帧内预测的准确性和为下一代视频编码标准的制定做技术储备,本文提出了基于多尺度卷积神经网络的帧内预测方法。具体来讲,本文提出的算法由两个子网络组成:多尺度特征提取网络和复原网络。将基于方向插值的帧内预测生成的预测块与其相邻的L型重构像素组合为更大的图像块输入到多尺度特征提取网络,然后将输入图像块进行下采样并提取不同尺度的特征图,最后对特征图进行上采样恢复到原始尺度。复原网络用来聚合不同尺度的特征图,并利用卷积操作生成最终更准确的预测块。实验结果表明,与HEVC参考软件HM 16.9相比,本文提出的帧内预测算法能够获得3.4%的BD-rate节省。第二,本文提出了基于深度神经网络的帧间预测算法,用于提高数字视频编码中帧间预测的准确性。现有的数字视频编码标准中的帧间预测是通过运动估计和运动补偿技术从参考帧获取当前预测块,基于平移运动的运动估计技术不能处理自然视频中的更复杂的变化,如非线性亮度变化、模糊、缩放等。为了提高视频编码中帧间预测的准确性,本文提出了基于深度神经网络的视频编码帧间预测算法,旨在利用当前块邻近的L型重构像素、参考块邻近的L型重构像素提高帧间预测的准确性。具体来讲,本文提出的方法包括三个子网络:关系估计网络、组合网络、深度提纯网络。关系估计网络用于学习当前块与其参考块之间的关系。组合网络用于提取学习到的关系和参考块的特征图,然后将这些特征图连接在一起。深度提纯网络用于生成最终更准确的预测块。实验结果表明,与HEVC参考软件HM 16.9相比,本文提出的帧间预测算法能够获得4.4%的BD-rate节省。第三,本文提出了基于卷积神经网络的环路滤波算法以及基于GPU的环路滤波并行优化算法,前者旨在利用卷积神经网络提升环路滤波的编码性能;后者旨在降低环路滤波的编码复杂度。环路滤波在现有的数字视频编码标准中扮演十分重要的角色,不仅能够去除编码过程中产生的块效应、振铃效应,提高重构视频的主观质量,而且能够提高视频编码的压缩性能。本文从两个方面对环路滤波展开深入的研究。一方面,从提高环路滤波的编码性能入手,本文提出了基于卷积神经网络的环路滤波算法。具体来讲,本文提出了一个全新的卷积神经网络结构,利用编码过程中产生的边信息(如块划分、残差以及运动矢量)结合重构视频本身来提高环路滤波的性能。实验结果表明,与HEVC参考软件HM 16.9相比,本文提出的帧间预测算法能够获得4.6%的BD-rate节省。另一方面,环路滤波的较高复杂度是HEVC在实时编码应用场景中的瓶颈,为了降低环路滤波的编码复杂度以及考虑基于深度学习的视频编码架构使用CPU+GPU的多设备协同编码,本文提出了基于GPU的环路滤波并行优化算法。具体来讲,本文提出了使用CPU+GPU的多设备协同的并行编码方案,通过将HEVC编码端Deblocking和SAO联合在GPU端并行处理来降低环路滤波的编码复杂度。实验结果表明,与HEVC的开源编码器x265相比,本文提出的环路滤波并行算法能够获得47%的编码加速。
王英彬[5](2019)在《基于卷积神经网络的视频压缩环路滤波技术研究》文中认为随着信息技术的高速发展,移动设备的逐渐普及,多媒体应用广泛流行,各式各样的多媒体内容极大丰富了人们的日常生活。其中,数字视频是多媒体应用中最常用的信息载体之一。原始视频由于数据量巨大难以投入实际应用之中,为了高效的存储,传输及应用视频数据,往往需要对视频数据进行压缩。国际化标准组织于20世纪80年代起开始建立视频编码的国际标准,目前正在开展新一代的视频编码标准VVC的研究。环路滤波技术是视频编码的关键技术之一。为了取得较高的压缩比,一般采用有损压缩的方式对视频进行压缩。压缩后的视频往往伴有块效应,振铃效应和模糊等失真。当前编码标准使用环路滤波技术对压缩后的重构像素进行处理,有效改善了视频质量。另外,环路滤波有利于提高后续压缩过程中帧间预测的准确性,能够进一步的提升压缩性能。近年来,卷积神经网络在众多计算机视觉任务上取得令人瞩目的成绩,为进一步提升视频压缩性能提供了新的思路。本文结合视频压缩和卷积神经网络的原理,重点研究卷积神经网络在视频压缩环路滤波技术中的应用。本文在新一代的视频编码国际标准VVC的基础上,从性能和速度两方面对基于卷积神经网络的环路滤波技术开展了深入的研究,主要创新及贡献如下:(1)本文提出了一种基于卷积神经网路的环路滤波算法。为了能够学习压缩前后视频图像之间的映射,本文设计了一种全新的卷积神经网络结构,称为密集残差网络。该网络不仅能够充分利用多层级的特征,而且能有效的进行特征复用,特征融合。通过将该算法与最新的视频编码国际标准VVC结合,进一步提升了编码性能。(2)本文对所提出的基于卷积神经网路的环路滤波算法的优化加速进行了研究。尽管基于卷积神经网络的环路滤波算法能够带来大幅度的编码性能提升,但其引入的复杂度难以满足视频压缩实际应用的要求。本文从计算效率上对所提出的模型进行分析,提出一个轻量高效的卷积神经网络模型。
董泽芳[6](2019)在《基于TMS320DM8168的H.264快速视频编码算法研究》文中认为随着通信技术的快速发展,视频逐渐成为了人类传递信息的主要方式之一。于此同时,大量的视频信息给网络传输和视频存储带来了巨大的压力。由于H.264编码标准具有高效的编码效率,在视频编解码领域得到了广泛的应用。但在一些领域,比如视频会议、远程医疗、视频制导,对视频的延时要求特别高,这就使得研究H.264快速视频编码算法越发的重要。开发视频编码系统是一件十分庞大而且复杂的工程,为了缩短编码系统的开发时间,降低设计复杂度和设计的工作量,同时保证较好的实时性要求,本文采用TI推出的专门针对视频编解码的高性能处理器芯片TMS320DM8168,设计了一个视频编码硬件系统;并利用其推出的DVR-RDK软件开发包,实现了视频采集、视频编码和基于RTP协议的网络组播,最后利用视频播放软件VLC进行解码并显示。基于上文提到的视频编解码系统,本文从采集到解码等多个环节逐一分析,明确造成延时的来源,有针对性地来减小整个视频编解码系统的延时。本文主要提出以下几个方法来减小视频编码系统的延时。1.结合TMS320DM8168的多核架构,提出了帧层并行处理方法,使视频采集、视频编码和网络传输3个任务能够在多个核同时并行运行,显着提高了系统运行效率,对减小系统延时起到了关键性的作用。2.采用CBR的码率控制,来平滑码流,以此来减小编码缓冲带来的延时。3.采用了全I帧结构进行编码,一方面减小了B帧双向预测或帧重排序带来的延时,另一方面有效平滑了编码后产生的码流波动,减小了编码缓冲带来的延时。4.针对IPPP…帧结构,提出一种单一方向强制帧内刷新算法。该算法的基本思想是把一帧图像分为M个等体积的竖直条带,从左往右有序地刷新每一个竖直条带(对每一个竖直条带强制进行帧内预测编码)。按此方式,经过M帧编码后,就完成了一个完整的帧内刷新过程。在传输视频帧的时候,舍弃I帧,仅传输I帧后面的P帧,解码时可以通过强制刷新的竖直条带恢复图像。这种方式既延续了IP帧结构高效的编码效率,又能够显着地平滑编码后的码流波动,大大减小了编码缓冲的体积,所以有效地减小了缓冲延时。最后,本文搭建了一个完整的视频编解码测试系统,对本文提出的算法进行系统测试。测试结果表明,在保证良好的视频主观质量和稳定性的前提下,系统总延时在300ms以内,达到了设计要求。
王钊[7](2019)在《自适应划分预测编码研究》文中指出在信息时代,数字多媒体在人们日常生活中发挥着越来越重要的作用。数字视频,作为多媒体内容的最重要载体,也是人类获取信息、感知世界的最主要途径。由于人们对视觉质量和媒体交互的不断追求,数字视频的分辨率和帧率不断提高,新的视频形式,如虚拟现实、点云、全息等,也在逐渐兴起。视频数据量的爆发增长与新媒体形式的出现对视频编码技术也提出了更高的要求和新的挑战。然而,目前的视频编码技术并不能灵活适应数字视频在数据量、内容特性、媒体形式上的变化,相对固定的编码规则限制了编码效率的进一步提高。因此,本文以自适应决策为出发点,对视频编码中的划分和预测展开深入地研究。本文的创新点主要包括以下几个方面:·基于局部约束的自适应划分树结构。最新视频编码标准采用了多类型划分树组合结构,包括四叉树划分、三叉树划分和二叉树划分等。但组合划分树固定的层次与结构使得在一些图像内容上划分形状不足、在另一些图像内容上划分模式又过多。针对这一问题,本文提出了基于局部约束的自适应划分树结构算法。一方面,利用时空域已编码块信息,解码端自行导出划分参数,可以根据图像内容特性自适应调整划分树使用范围与划分层次,尤其对简单内容能显着约束不必要的划分形状。另一方面,根据不同划分树之间存在的冗余,分析划分对子块编码次序的影响,并依此约束部分划分树类型,消除划分冗余。·基于置信区间的划分决策算法。多类型划分树结构在每层划分时均需要迭代多种划分模式,复杂度极高。为了加速划分决策过程,首先从运动差异场入手,建立率失真模型,能够快速估计率失真代价。然后,将最优划分模式与率失真估计代价之间的关系映射到概率区间,并提出了基于置信区间的划分决策算法。将在置信区间内的划分模式归为可靠模式,在置信区间外的划分模式归为不可靠模式,在保留有效划分的同时显着降低了编码复杂度。·面向内容的自适应预测单元划分。多类型划分树结构的划分灵活性有了一定提高,但在运动物体的边界附近依然不能获得良好的预测效果。本文提出了面向内容的自适应预测单元划分算法,首先通过一个运动矢量指向提供边界信息的参考块的位置。然后,对参考块进行自适应分割,并对每个分割区域使用不同的运动补偿机制。前景区域使用隐式多假设预测,背景区域从局部运动场中导出运动矢量,边界区域进行加权预测。该方法既实现了面向视频内容的自适应划分预测,又不增加过多额外码率开销,对客观压缩效率与主观质量均有提升。·基于率失真优化的自适应运动矢量精度预测。划分是为了更好地预测,而预测性能还依赖于对运动信息的描述准确度。运动矢量精度越高,运动描述越精确,同时自身编码码率也增大。为了在预测质量与运动矢量码率之间达到更好的平衡,本文在预测失真-运动矢量精度、运动矢量码率-运动矢量精度之间建立率失真模式。模型揭示运动矢量精度预测与视频内容的纹理特性和运动特性相关,同时还受到编码环境的影响。基于此,将影响运动矢量精度选择的因素提取为特征,并训练成决策树对每帧图像的最优运动矢量精度进行预测。该方法在预测质量与运动矢量码率之间达到了更好的平衡,提高了压缩效率。综上,本文针对视频编码中的划分和预测,从率失真优化的角度分析了视频内容特性产生的影响,提出了自适应划分树结构、基于置信区间的划分决策算法、自适应预测单元划分以及自适应运动矢量精度预测算法,探索了自适应机制在划分预测编码中的潜力,显着提高了编码效率、降低编码复杂度,对学术研究和实际应用提供了新的思路。
何沛松[8](2018)在《基于重编码痕迹的数字视频被动取证算法研究》文中认为随着数字多媒体技术的高速发展,数字视频已经成为重要的信息传播载体之一,在金融,教育和安全等领域得到广泛使用。另一方面,现有视频编辑技术已经能够轻易的对视频内容进行篡改,严重威胁数字视频的完整性和真实性。面对上述问题,数字视频取证技术应运而生。其中,数字视频被动取证算法由于仅依靠数字视频固有指纹进行检测,无需预先嵌入取证信息而受到广泛关注和研究。本论文研究数字视频被动取证领域中的重压缩视频检测技术。在大多数视频篡改过程中,篡改者需要经历“视频解压缩-视频内容篡改-视频重压缩”三个步骤。检测重压缩视频具有的重编码痕迹不仅为篡改分析提供重要依据,还能有效还原可疑视频的压缩历史。重压缩视频检测的主要难点在于:视频编码参数的多样性(例如:时域编码结构)使得重编码痕迹具有复杂的特性。本论文根据视频重压缩过程前后时域编码结构(即图像组,Group of Pictures,简称GOP)是否一致,将重压缩视频检测分为GOP结构错位的重压缩视频检测以及GOP结构对齐的重压缩视频检测两类问题。针对重压缩视频的特殊情况-双压缩视频,本文结合多种新技术对上述问题展开了深入研究,提出了四种创新的检测算法。针对GOP结构错位的重压缩视频在压缩域留下的异常编码痕迹,本文分析了视频背景和前景区域中运动向量等编码数据的统计特性,提出一种基于局部运动向量场分析的静止背景视频双压缩检测算法。该算法利用局部运动向量场分析方法对背景区域进行宏块级分割。通过对背景和前景区域赋予不同权重,抑制快速运动前景内容的干扰并提取更为鲁棒的加权预测残差序列。然后采用时间域周期性分析算法对双压缩视频进行检测并估计原始视频的GOP结构。由于充分考虑了背景和前景区域重编码痕迹的不同特性,该算法比传统算法对编码参数的多样性更为鲁棒。针对GOP结构错位的重压缩视频在像素域留下的异常编码痕迹,本文分析了MPEG-4视频像素域的块效应痕迹,提出一种基于块效应异常强度的双压缩视频检测算法。该算法首先利用去块效应滤波器提取解压帧的块效应强度。块效应强度序列结合宏块类型统计模式计算特征序列。对特征序列采用时间域周期分析方法检测双压缩视频并估计原始视频的GOP结构。由于采用了可靠的像素域异常块效应度量方法,该算法比传统算法对视频内容多样性更为鲁棒,特别是具有复杂纹理并缓慢运动的视频内容。为了自动从大量样本中学习重编码痕迹的特征表达,本文将近年来获得广泛研究的深度学习技术引入到GOP结构错位的重压缩视频检测问题中。提出了一种基于卷积神经网络的帧级H.264视频双压缩痕迹检测算法。该算法采用卷积神经网络技术区分重定位I帧和其他类型的P帧。与传统的计算机视觉任务不同,所设计的卷积神经网络需要检测人眼难以感知的重编码痕迹。因此在网络结构设计过程中,考虑加入提取高频分量的预处理层抑制视频内容对分类性能的干扰。此外,该网络还采用1×1卷积核以及平均池化层等结构减少过拟合现象。实验结果表明该算法能够准确的检测帧级重定位I帧,为后续视频级取证分析提供重要依据。在实际应用中,具备专业知识的篡改者往往可以从视频文件中读取相关的视频编码信息,利用与输入视频相同的编码参数(例如:时域编码结构)进行重压缩,达到使重编码痕迹难以被检测的目的。针对这一类GOP结构对齐的重压缩视频,本文分析发现视频质量经过多次同参数重压缩后最终将收敛到稳定不变的状态。而单次压缩和双次压缩视频具有不同的视频质量收敛速度。根据上述发现,本文提出了一种基于质量下降机制分析的同参数双压缩视频检测算法。该算法构建了多种宏块模式用于有效表达重压缩过程中视频质量的下降程度。考虑不同编码标准的具体技术特点,面向MPEG视频和H.264视频分别提出了两套检测特征,结合支持向量机分类器完成检测。实验结果表明该算法能够有效检测多种编码设置下的同参数双压缩视频。
隋鑫[9](2011)在《基于DSP的视频压缩编码与实现》文中指出由于野外油井分散,环境恶劣,人工维护难,本文针对这种情况,提出了一种基于DSP的视频压缩监控系统。该系统依据模块化的设计理念,由三个主要的功能模块组成,即:现场监控视频终端下位机、通讯模块和监控中心计算机系统。除此之外,本文中的监控算法还可以应用在需要长时间进行监控,且监控背景中偶尔有运动目标的环境,减少视频存储的空间。系统可以结合无线通信模式,进行实时传输。对于铺线难,分布广的监控目标具有很实用的应用价值。本文研究的核心是系统视频采集压缩部分。针对系统可能会有无线传输部分需要视频压缩率高,本课题在深入分析MPEG-4标准的基础上,首先,对MPEG-4标准的核心部分-视频压缩编码进行重点研究,实现了MPEG-4标准视频框架的简单级别的视频编码;然后,对MPEG-4编码中的关键技中的码率控制算法和视频对象平面概念进行重点研究,提出了一种改进的结合帧间差分算法的MPEG-4算法以实现快速的编码和高压缩比,并完成了帧间差分算法的仿真和运动目标提取的仿真。其中,结合恒定码率控制和可变码率控制算法提出了一种双值码率控制,将视频传输分成两种情况,使用两种码率传输。然后用帧间差分算法提取出的目标范围进行多分辨率的视频压缩。最后依据以上的理论,完成了MPEG-4视频编码器的软件实现及DSP硬件实现。实验结果表明,该算法基本能够满足视频监控系统的要求。
李双阳[10](2009)在《MPEG-4视频传输关键技术研究》文中提出随着Internet技术的迅猛发展及带宽资源的日益增长,人们对于丰富的网络多媒体信息,尤其是高质量的视频通信应用的需求日益强烈。与此同时,随着新的多媒体标准MPEG-4的出现,基于Internet的MPEG-4视频网络流媒体技术必然成为一个重要的应用研究领域。但是,由于MPEG-4视频编码算法的高复杂性,设计出一个既能最大限度的保证视频质量同时又能高效的利用网络信道资源,尤其是多通道应用的高效MPEG-4视频传输系统成为一个很大的挑战。本论文针对这一应用需求,研究及设计实现了一个基于Internet的高效MPEG-4视频传输体系结构。首先,对MPEG-4视频编解码算法简化及优化,以实现多平台应用;接着,对优化后的MPEG-4视频编解码器进行DirectShow Filter开发,以应用于Windows平台;最后,利用优化后的MPEG-4视频编解码器设计基于Windows平台的视频传输系统,实现视频的多路实时传输。验证结果显示,该系统实现了高质量的传输多路视频信息,可应用于包括视频监控系统在内的多种视频应用系统。
二、MPEG-4自然视频编码工具和算法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、MPEG-4自然视频编码工具和算法(论文提纲范文)
(1)H.266/VVC复杂度分析及帧间算法优化研究(论文提纲范文)
摘要 |
ABSTRACT |
缩略语注释 |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状及发展态势 |
1.2.1 国外视频编解码发展现状 |
1.2.2 国内视频编解码发展现状 |
1.2.3 新一代视频编解码标准研究进展 |
1.3 本文研究主要内容 |
1.4 本文结构安排 |
第二章 新一代视频编解码标准VVC |
2.1 引言 |
2.2 VVC技术 |
2.2.1 发展历程 |
2.2.2 编码框架 |
2.2.3 单元划分 |
2.2.4 帧内预测 |
2.2.5 帧间预测 |
2.2.6 变换/量化 |
2.2.7 环路滤波 |
2.2.8 熵编码 |
2.3 测试序列及条件 |
2.3.1 测试环境配置 |
2.3.2 测试序列 |
2.3.3 硬件测试配置 |
2.4 本章小结 |
第三章 VVC性能测试和复杂度分析 |
3.1 引言 |
3.2 VVC编解码器性能测试 |
3.2.1 性能测试指标 |
3.2.2 性能测试算法 |
3.2.3 性能测试配置 |
3.2.4 实验结果 |
3.3 VVC编解码器复杂度分析 |
3.3.1 复杂度测试 |
3.3.2 复杂度分析 |
3.3.3 实验结果 |
3.4 本章小结 |
第四章 VVC中单元划分分析与优化 |
4.1 引言 |
4.2 单元划分历程 |
4.2.1 AVC中的单元划分 |
4.2.2 HEVC中的单元划分 |
4.3 VVC中单元划分 |
4.4 VVC单元划分优化 |
4.4.1 VVC单元划分复杂度分析 |
4.4.2 VVC单元划分分析 |
4.4.3 VVC单元划分算法优化 |
4.4.4 实验结果 |
4.5 本章小结 |
第五章 结论 |
5.1 总结 |
5.2 展望 |
附录 |
参考文献 |
攻读学位期间取得的科研成果 |
致谢 |
(2)3D-HEVC标准中基于SKIP模式快速帧间编码(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究的目的和意义 |
1.2 视频编码标准 |
1.3 国内外研究现状 |
1.3.1 HEVC算法研究 |
1.3.2 3D-HEVC算法研究 |
1.4 论文内容及结构 |
2 3D-HEVC视频编码 |
2.1 HEVC编码标准 |
2.1.1 HEVC编码框架 |
2.1.2 编码树的划分 |
2.2 HEVC编码结构 |
2.2.1 编码单元 |
2.2.2 预测单元 |
2.2.3 变换单元 |
2.3 HEVC关键技术 |
2.3.1 帧内预测 |
2.3.2 帧间预测 |
2.3.3 变换量化 |
2.3.4 环路滤波 |
2.3.5 熵编码 |
2.4 HEVC的3D延续—3D-HEVC |
2.4.1 多视点视频加深度图 |
2.4.2 3D-HEVC编码框架 |
2.4.3 深度图编码技术 |
2.4.4 非独立视点编码技术 |
2.4.5 虚拟视点合成技术 |
2.5 本章小结 |
3 3D-HEVC中基于SKIP模式的快速帧间编码—深度视频 |
3.1 编码模式选择算法研究 |
3.1.1 深度图像编码模式选择 |
3.1.2 深度图像最优编码模式分布 |
3.2 基于SKIP模式的深度图帧间编码快速算法 |
3.2.1 深度图帧间编码快速决策条件 |
3.2.2 深度图帧间编码快速方法的具体流程 |
3.3 实验结果与分析 |
3.3.1 实验设计和评价标准 |
3.3.2 实验结果与分析 |
3.4 本章小结 |
4 3D-HEVC中基于SKIP模式的快速帧间编码—纹理视频 |
4.1 纹理图像的模式选择算法研究 |
4.1.1 纹理图像的模式选择算法研究 |
4.1.2 纹理图像最优编码模式研究 |
4.1.3 纹理图像和深度图像的区别 |
4.2 基于SKIP模式的纹理图快速帧间编码 |
4.2.1 附属CU中都选择SKIP最优编码(Case A) |
4.2.2 附属CU中至少有一个未选择SKIP最优编码(Case B) |
4.3 实验结果与分析 |
4.3.1 实验环境设计与评估准则 |
4.3.2 实验结果与分析 |
4.4 本章小结 |
5 总结和展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
附录 |
(3)视频编码的码率控制及优化技术研究(论文提纲范文)
摘要 |
abstract |
缩略词表 |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 率失真优化及国内外研究现状 |
1.2.1 率失真优化技术 |
1.2.2 率失真优化技术研究进展 |
1.3 码率控制及国内外研究现状 |
1.3.1 码率控制技术 |
1.3.2 码率控制技术研究进展 |
1.4 本文主要工作及论文组织 |
第二章 视频编码框架与HEVC关键技术 |
2.1 视频中的数据冗余 |
2.2 视频编码框架及编码工具 |
2.2.1 混合视频编码框架 |
2.2.2 帧内预测 |
2.2.3 帧间预测 |
2.2.4 变换编码 |
2.2.5 量化和量化失真 |
2.2.6 熵编码 |
2.2.7 环路滤波 |
2.3 HEVC标准关键技术 |
2.3.1 编码树单元和编码单元划分 |
2.3.2 预测单元 |
2.3.3 变换单元 |
2.4 基于率失真优化的编码模式选择 |
2.4.1 拉格朗日乘子选择 |
2.4.2 CTU编码参数选择 |
2.5 本章小结 |
第三章 率失真依赖性分析及二次编码优化 |
3.1 率失真特性分析 |
3.1.1 率失真函数 |
3.1.2 HEVC率失真特性分析 |
3.2 率失真依赖性分析 |
3.2.1 时域依赖性 |
3.2.2 空域依赖性 |
3.3 二次编码优化 |
3.3.1 率失真依赖性度量 |
3.3.2 基于率失真依赖性的二次编码优化 |
3.4 实验结果及分析 |
3.4.1 实验设置 |
3.4.2 率失真性能比较 |
3.4.3 编码复杂度评估 |
3.5 本章小结 |
第四章 基于全局最优准则的帧级比特分配 |
4.1 相关工作 |
4.1.1 R-λ模型码率控制 |
4.1.2 迭代泰勒展开方法 |
4.2 帧层R-D模型估计 |
4.3 GOP层比特分配 |
4.4 最优帧层比特分配 |
4.5 实验结果及分析 |
4.5.1 实验设置 |
4.5.2 评估帧层R-D模型估计 |
4.5.3 评估GOP层比特分配 |
4.5.4 评估最优帧级比特分配方法的性能 |
4.6 本章小结 |
第五章 基于块间时域依赖性的CTU级码率控制 |
5.1 R-λ码率控制方法中的CTU级比特分配 |
5.2 CTU级的全局率失真优化分析 |
5.3 估计编码块的时域失真传播因子 |
5.3.1 建立时域传播链 |
5.3.2 信源失真时域传播模型 |
5.3.3 HEVC低延时编码中的时域失真传播 |
5.4 基于时域传播因子的CTU级码率控制 |
5.4.1 CTU层的R-D模型估计 |
5.4.2 计算CTU的时域失真传播因子 |
5.4.3 CTU级码率控制 |
5.4.4 算法实现细节 |
5.5 实验结果及分析 |
5.5.1 实验设置 |
5.5.2 率失真性能比较 |
5.5.3 码率精确度比较 |
5.5.4 复杂度评估 |
5.5.5 讨论 |
5.6 本章小结 |
第六章 全文总结与展望 |
6.1 全文总结 |
6.2 后续工作展望 |
致谢 |
参考文献 |
攻读博士学位期间取得的成果 |
(4)基于深度学习的视频编码技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景 |
1.2 数字视频压缩基础 |
1.2.1 视频压缩的基本原理 |
1.2.2 视频编码标准的基本框架 |
1.2.3 数字视频编码标准的发展历程 |
1.3 HEVC标准的关键技术 |
1.3.1 块划分方式 |
1.3.2 帧内预测 |
1.3.3 帧间预测 |
1.3.4 环路滤波 |
1.4 基于深度学习的视频编码 |
1.5 本文课题的提出及其主要贡献 |
第2章 基于深度学习的视频编码技术的研究现状 |
2.1 帧内预测技术的研究现状 |
2.2 帧间预测技术的研究现状 |
2.3 环路滤波技术的研究现状 |
2.3.1 基于深度学习的环路滤波技术的研究现状 |
2.3.2 环路滤波并行优化的研究现状 |
2.4 本章小结 |
第3章 基于多尺度卷积神经网络的帧内预测 |
3.1 问题的提出 |
3.2 模式依赖的帧内平滑滤波 |
3.2.1 MDISF原理及分析 |
3.2.2 MDISF的滤波器设计 |
3.2.3 MDISF集成到HEVC |
3.2.4 MDISF的实验结果 |
3.3 基于多尺度卷积神经网络的帧内预测 |
3.3.1 MSCNN的网络结构 |
3.3.2 MSCNN的训练策略 |
3.3.3 MSCNN集成到HEVC |
3.4 实验结果与分析 |
3.4.1 实验配置 |
3.4.2 与HEVC的性能比较 |
3.4.3 与其他方法的性能比较 |
3.4.4 网络深度分析 |
3.4.5 编解码时间分析 |
3.5 本章小结 |
第4章 基于深度神经网络的帧间预测 |
4.1 问题的提出 |
4.2 NNIP的网络结构 |
4.2.1 关系估计网络 |
4.2.2 组合网络 |
4.2.3 深度提纯网络 |
4.3 NNIP的训练策略 |
4.4 NNIP集成到HEVC |
4.5 实验结果与分析 |
4.5.1 实验配置 |
4.5.2 与HEVC的性能比较 |
4.5.3 与其他方法的性能比较 |
4.5.4 编解码时间分析 |
4.6 本章小结 |
第5章 基于卷积神经网络的环路滤波及其并行优化 |
5.1 基于卷积神经网络的环路滤波 |
5.1.1 CNNF的网络结构 |
5.1.2 CNNF的训练策略 |
5.1.3 CNNF集成到HEVC |
5.1.4 实验结果与分析 |
5.2 基于GPU的环路滤波并行优化 |
5.2.1 问题的提出以及算法的整体框架 |
5.2.2 GPU端 Deblocking的并行结构 |
5.2.3 GPU端 SAO的并行结构 |
5.2.4 内存优化管理 |
5.2.5 实验结果与分析 |
5.3 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的学术论文及研究成果 |
致谢 |
个人简历 |
(5)基于卷积神经网络的视频压缩环路滤波技术研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.3 研究内容 |
1.4 论文章节安排 |
2 视频压缩基础 |
2.1 视频压缩基本概念 |
2.1.1 视频 |
2.1.2 视频编码 |
2.1.3 编码性能评价 |
2.2 视频编码标准的发展 |
2.3 新一代视频编码标准VVC |
2.4 本章小结 |
3 卷积神经网络及其在视频压缩中的应用 |
3.1 卷积神经网络基础 |
3.1.1 人工神经网络 |
3.1.2 卷积神经网络 |
3.2 卷积神经网络在视频压缩中的应用 |
3.2.1 基于卷积神经网络的预测技术 |
3.2.2 基于卷积神经网络的压缩视频后处理 |
3.2.3 基于卷积神经网络的熵编码和量化 |
3.3 本章小结 |
4 基于卷积神经网络的环路滤波算法设计 |
4.1 概述 |
4.2 方案设计 |
4.2.1 卷积神经网络模型设计 |
4.2.2 模型的训练 |
4.3 实验结果与分析 |
4.3.1 实验配置 |
4.3.2 编码性能 |
4.3.3 与其他方法的对比 |
4.4 本章小结 |
5 基于卷积神经网络的环路滤波算法优化 |
5.1 概述 |
5.2 方案设计 |
5.2.1 模型的优化 |
5.2.2 训练方法的优化 |
5.3 实验结果与分析 |
5.4 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
(6)基于TMS320DM8168的H.264快速视频编码算法研究(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外相关研究现状 |
1.2.1 视频编码标准发展历程 |
1.2.2 快速视频编码技术 |
1.2.3 编码器实现平台 |
1.3 本文所做工作及内容安排 |
第二章 相关技术介绍 |
2.1 TMS320DM8168硬件平台介绍 |
2.2 DVR-RDK软件开发包介绍 |
2.2.1 Mc FW多通道软件开发框架 |
2.2.2 Link机制 |
2.2.3 多核间通信机制 |
2.3 H.264 编码标准介绍 |
2.3.1 H.264 编码标准基本概念 |
2.3.2 档次和级 |
2.3.3 H.264 的分层结构 |
2.3.4 H.264 编解码原理 |
2.3.5 帧内预测 |
2.3.6 帧间预测 |
2.3.7 变换与量化 |
2.3.8 去块效应滤波 |
2.3.9 码率控制 |
2.4 本章小结 |
第三章 基于DM8168视频编码系统的总体设计 |
3.1 需求分析 |
3.1.1 功能需求 |
3.1.2 性能需求 |
3.1.3 稳定性需求 |
3.2 基于TMS320DM8168的硬件系统设计 |
3.3 基于DVR-RDK的软件系统设计 |
3.3.1 基于link设计的数据链路 |
3.3.2 采集模块设计 |
3.3.3 编码模块设计 |
3.3.4 网络传输模块设计 |
3.4 本章小结 |
第四章 快速视频编码算法 |
4.1 视频编解码系统的延时环节分析 |
4.2 基于帧层的并行处理方法 |
4.3 H.264 码率控制算法研究及改进 |
4.3.1 JVT-H017提案的码率控制算法研究 |
4.3.2 基于快速视频编码的码率控制算法改进 |
4.4 H.264 编码模式研究 |
4.4.1 帧内编码模式 |
4.4.2 IP编码模式 |
4.4.3 帧内刷新编码模式 |
4.4.4 仿真结果与分析 |
4.5 帧内刷新算法研究及改进 |
4.5.1 运动自适应帧内刷新算法研究 |
4.5.2 基于快速视频编码的帧内刷新方向选择 |
4.5.3 仿真结果与分析 |
4.6 本章小结 |
第五章 系统测试与结果分析 |
5.1 测试系统的搭建 |
5.1.1 基于DM8168平台的硬件系统搭建 |
5.1.2 基于DVR-RDK开发包的软件系统搭建 |
5.2 功能测试 |
5.3 性能测试 |
5.3.1 码流波动测试 |
5.3.2 延时测试 |
5.4 稳定性测试 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
作者简介 |
(7)自适应划分预测编码研究(论文提纲范文)
摘要 |
abstract |
第一章 序言 |
1.1 研究背景 |
1.1.1 视频编码原理 |
1.1.2 视频编码标准 |
1.1.3 视频编码框架 |
1.2 划分预测编码 |
1.3 课题的提出与本文的主要贡献 |
1.4 论文的组织 |
第二章 相关研究综述 |
2.1 率失真优化 |
2.2 最新编码标准进展 |
2.3 编码单元划分 |
2.4 划分模式决策 |
2.5 运动信息表达 |
第三章 自适应编码单元划分决策 |
3.1 编码单元划分结构 |
3.2 自适应划分参数算法 |
3.3 受约束的二叉树划分算法 |
3.4 基于置信区间的划分决策算法 |
3.4.1 率失真模型 |
3.4.2 基于置信区间的划分决策 |
3.5 实验结果与分析 |
3.5.1 基于局部约束的四叉树二叉树划分算法性能 |
3.5.2 置信区间参数设置 |
3.5.3 基于置信区间的划分决策算法性能与对比分析 |
3.5.4 划分决策算法整体性能表现 |
3.6 本章小结 |
第四章 自适应预测单元划分 |
4.1 自适应预测单元划分框架 |
4.2 自适应划分与运动补偿 |
4.2.1 应用于参考块的图像分割 |
4.2.2 基于局部内容特性的背景区域运动补偿 |
4.2.3 基于多假设预测的前景区域运动补偿 |
4.2.4 基于加权预测的边界区域运动补偿 |
4.2.5 优化决策与语法设计 |
4.3 实验结果与分析 |
4.3.1 模型参数取值 |
4.3.2 算法性能与对比分析 |
4.4 本章小结 |
第五章 自适应运动矢量精度预测 |
5.1 运动矢量精度分析 |
5.2 率失真模型 |
5.2.1 预测失真-运动矢量精度模型 |
5.2.2 运动矢量码率-运动矢量精度模型 |
5.3 自适应运动矢量精度预测 |
5.3.1 分阶运动矢量精度 |
5.3.2 运动矢量精度预测 |
5.4 实验结果与分析 |
5.4.1 率失真模型验证 |
5.4.2 算法性能与对比分析 |
5.5 本章小结 |
第六章 全文总结 |
6.1 本文工作总结 |
6.2 未来研究计划 |
参考文献 |
附录 A 攻读博士学位期间的科研成果 |
致谢 |
(8)基于重编码痕迹的数字视频被动取证算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 多媒体取证研究背景及意义 |
1.2 数字多媒体取证技术 |
1.2.1 多媒体主动取证技术简介 |
1.2.2 多媒体被动取证技术简介及国内外研究现状 |
1.2.3 现有工作的局限性分析 |
1.3 本文主要研究内容及创新点 |
1.4 章节安排 |
第二章 视频重编码痕迹模型构建及理论分析 |
2.1 数字视频重压缩问题建模及应用场景 |
2.1.1 问题原型 |
2.1.2 重压缩视频检测算法应用场景 |
2.1.3 重压缩视频的特例:双压缩视频 |
2.2 视频编码标准简介 |
2.2.1 MPEG系列视频编码标准简介 |
2.2.2 H.264 视频编码标准简介 |
2.3 典型的视频重压缩操作 |
2.3.1 GOP结构对齐的重压缩操作 |
2.3.2 GOP结构错位的重压缩操作 |
2.4 重编码痕迹模型 |
2.4.1 时间域与空间域重编码痕迹模型 |
2.4.2 像素域与压缩域重编码痕迹模型 |
2.4.3 重编码痕迹模型关系图 |
2.5 本章小结 |
第三章 基于局部运动向量场分析的静止背景双压缩视频检测算法 |
3.1 引言 |
3.2 静止背景视频重编码痕迹模型 |
3.3 静止背景视频重编码痕迹特性实例分析 |
3.3.1 P帧宏块类型统计特性分析 |
3.3.2 P帧运动向量的统计特性分析 |
3.3.3 预测残差特性分析 |
3.4 基于局部运动向量场分析的静止背景双压缩视频检测算法 |
3.4.1 背景区域宏块级分割 |
3.4.2 提取加权预测残差序列 |
3.4.3 后处理操作 |
3.4.4 周期性分析 |
3.5 实验与结果分析 |
3.5.1 数据库 |
3.5.2 双压缩检测性能实验 |
3.5.3 原始GOP长度估计实验 |
3.5.4 对于不同码率控制算法的可靠性实验 |
3.5.5 对于转码过程的鲁棒性实验 |
3.5.6 时间效率分析实验 |
3.6 本章小结 |
第四章 基于块效应度量的MPEG-4 双压缩视频检测算法 |
4.1 引言 |
4.2 MPEG-4 视频中的块效应 |
4.2.1 块效应理论模型分析 |
4.2.2 MPEG-4 双压缩视频块效应实例分析 |
4.3 基于块效应度量的MPEG-4 双压缩视频检测算法 |
4.3.1 块效应度量 |
4.3.2 结合块效应强度与VPF痕迹 |
4.3.3 周期性分析 |
4.4 实验与结果分析 |
4.4.1 块效应强度及VPF痕迹的实例分析 |
4.4.2双压缩检测性能实验 |
4.4.3 原始GOP大小估计准确性实验 |
4.4.4不同调节参数对于检测性能的影响实验 |
4.4.5 不同备选GOP选择算法对于检测性能的影响实验 |
4.5 本章小结 |
第五章 基于卷积神经网络的H.264 视频帧级双压缩痕迹检测算法 |
5.1 引言 |
5.2 深度卷积神经网络技术简介 |
5.2.1 典型的网络层结构 |
5.2.2 典型的深度卷积网络结构 |
5.3 基于卷积神经网络的帧级双压缩检测算法 |
5.3.1 帧级重编码痕迹分析 |
5.3.2 算法整体框架 |
5.3.3 预处理层 |
5.3.4 在深层卷积层中使用1×1 卷积核 |
5.3.5 全局平均池化层 |
5.4 实验与结果分析 |
5.4.1 数据库 |
5.4.2 帧级双压缩痕迹检测性能评价标准 |
5.4.3 实验参数设置 |
5.4.4 卷积神经网络结构分析实验 |
5.4.5 检测性能对比实验 |
5.4.6 对于不同GOP大小的鲁棒性实验 |
5.4.7 网络参数规模分析 |
5.5 本章小结 |
第六章 基于质量下降机制分析的同参数双压缩视频检测算法 |
6.1 引言 |
6.2 重压缩视频质量下降机制分析 |
6.2.1 连续重压缩后视频客观质量的变化规律 |
6.2.2 MPEG视频编解码过程中的质量下降机制 |
6.2.3 H.264 视频编解码过程中的质量下降机制 |
6.3 基于质量下降机制分析的同参数双压缩视频检测算法 |
6.3.1 MPEG-DM算法 |
6.3.2 H264-DM算法 |
6.4 实验与结果分析 |
6.4.1 数据库 |
6.4.2 MPEG-2 视频的双压缩检测性能实验 |
6.4.3 MPEG-4 视频的双压缩检测性能实验 |
6.4.4 关于H.264 视频的检测性能实验 |
6.4.5 算法在多样视频内容及编码参数设置下的性能分析实验 |
6.5 本章小结 |
第七章 总结与展望 |
7.1 研究工作总结 |
7.2 不足与展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文目录 |
攻读学位期间参与的项目目录 |
(9)基于DSP的视频压缩编码与实现(论文提纲范文)
摘要 |
ABSTRACT |
创新点摘要 |
前言 |
一、视频监控系统的需求背景 |
二、视频监控系统的发展 |
三、本文研究的目的和意义 |
四、本文章节安排 |
第一章 MPEG-4 标准及其关键技术 |
1.1 MPEG 制定的标准 |
1.2 MPEG-4 标准的特点和功能 |
1.3 MPEG-4 的关键技术 |
1.3.1 多媒体传送集成框架DMIF |
1.3.2 语法描述 |
1.3.3 音频对象的编码 |
1.3.4 视频对象的编码 |
1.4 MPEG-4 视频编码器的结构 |
1.4.1 MPEG-4 视频编码器中的数据结构类型 |
1.4.2 MPEG-4 视频基于 VOP 概念的编码基本原理 |
1.5 MPEG-4 算法的PC 实现 |
1.5.1 初始化模块 |
1.5.2 仿真 |
1.6 本章小结 |
第二章 视频图像中运动目标检测算法 |
2.1 运动目标检测算法概述 |
2.1.1 背景差分算法 |
2.1.2 帧间差分法 |
2.1.3 光流法 |
2.1.4 嫡检测算法 |
2.1.5 四种算法性能比较 |
2.2 帧间差分算法的PC 实现 |
2.2.1 算法概述 |
2.2.2 算法在 pc 上仿真实现 |
2.3 基于应用结合MPEG-4 做的改进 |
2.3.1 MPEG-4 结合帧间差分算法的目的 |
2.3.2 MPEG-4 结合帧间差分算法的改进 |
2.4 实验结果分析 |
2.5 小结 |
第三章 码率控制算法及算法优化 |
3.1 码率控制算法概述 |
3.2 常用的码率控制算法 |
3.2.1 RM8 码率控制 |
3.2.2 TM5 码率控制 |
3.2.3 TMN8 码率控制 |
3.2.4 VM8 码率控制 |
3.3 改变码率的方法 |
3.3.1 时间和空间分辨率 |
3.3.2 图组长度 |
3.3.3 量化步长 |
3.4 量化参数在编码器及码率控制中的作用 |
3.5 基于MPEG-4 码率算法的改进 |
3.5.1 算法改进的基本思想 |
3.5.2 算法实现及结果分析 |
3.6 小结 |
第四章 MPEG-4 视频编码技术 |
4.1 形状编码 |
4.1.1 二值形状编码 |
4.1.2 灰度形状的编码 |
4.2 运动估计和运动补偿 |
4.2.1 填充技术 |
4.2.2 基本运动估计技术中的多边形的匹配 |
4.2.3 无限的运动估计 |
4.3 纹理编码 |
4.4 可扩展性编码 |
4.4.1 空间域扩展编码 |
4.4.2 时间域扩展编码 |
4.5 容错和纠错 |
4.5.1 重新同步 |
4.5.2 数据恢复 |
4.5.3 错误隐藏 |
4.6 扩展编码仿真及结果分析 |
4.6.1 视频监控中扩展编码的目的 |
4.6.2 仿真结果及分析 |
4.7 小结 |
第五章 MPEG-4 算法 DSP 实现 |
5.1 TMS320DM642 DSP 的集成软件设计的环境 |
5.1.1 集成开发环境CCS |
5.1.2 实时操作系统DSP/BIOS |
5.2 系统编码流程 |
5.3 算法移植 |
5.3.1 视频编码流程 |
5.3.2 视频编码算法在DSP 平台的实现 |
5.4 小结 |
结论 |
参考文献 |
发表文章目录 |
致谢 |
详细摘要 |
(10)MPEG-4视频传输关键技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 引言 |
1.1 背景介绍 |
1.2 视频传输关键技术介绍 |
1.3 本文研究的内容和主要研究成果 |
1.4 论文的结构安排 |
第二章 视频编码及传输技术 |
2.1 MPEG-4 视频编码介绍 |
2.1.1 多媒体应用技术的系列标准 |
2.1.2 MPEG-4 视频编码系列标准介绍 |
2.1.3 MPEG-4 视频编码标准的新特征 |
2.1.4 MPEG-4 视频编码流的主要概念 |
2.1.5 MPEG-4 视频的编解码过程 |
2.2 视频网络传输技术 |
2.2.1 流媒体概述 |
2.2.2 RTP/RTCP协议 |
2.2.3 RTSP协议 |
2.2.4 基于服务器-客户端模式的流媒体框架结构 |
第三章 MPEG-4 视频基于Windows平台的简化及优化 |
3.1 Win32 平台MPEG-4 视频编码算法概述 |
3.1.1 概述 |
3.1.2 软件mp4video概述 |
3.2 MPEG-4 视频优化目标 |
3.3 MPEG-4 视频简化 |
3.3.1 MPEG-4 视频编解码功能测试 |
3.3.2 MPEG-4 视频编解码器的简化 |
3.4 MPEG-4 视频优化 |
3.4.1 概述 |
3.4.2 MPEG-4 视频编码算法复杂度测试 |
3.4.3 视频编码算法优化 |
3.5 MPEG-4 视频优化性能评估 |
3.5.1 测试准备工作 |
3.5.2 测试环境 |
3.5.3 测试方法 |
3.5.4 测试结果 |
第四章 Windows平台MPEG-4 视频编解码器模块设计 |
4.1 Microsoft DirectShow技术介绍 |
4.1.1 概述 |
4.1.2 DirectShow解决方案 |
4.2 DirectShow Filter技术 |
4.2.1 概述 |
4.2.2 Filter的使用 |
4.3 视频编解码器Filter设计与实现 |
4.3.1 Filter开发环境配置 |
4.3.2 Filter一般实现方法 |
4.3.3 MPEG-4 视频Filter开发与实现 |
4.4 视频编解码器Filter测试 |
第五章 MPEG-4 视频远程传输系统设计 |
5.1 概述 |
5.2 点对点视频传输 |
5.3 视频会议系统 |
5.3.1 概述 |
5.3.2 H.323 介绍 |
5.3.3 小结 |
5.4 服务器/客户端框架下的视频传输 |
5.4.1 MPEG-4 视频传输的框架结构 |
5.4.2 服务器/客户端框架下的视频传输实现 |
第六章 结论 |
致谢 |
参考文献 |
研究成果 |
四、MPEG-4自然视频编码工具和算法(论文参考文献)
- [1]H.266/VVC复杂度分析及帧间算法优化研究[D]. 刘艺. 太原理工大学, 2020(07)
- [2]3D-HEVC标准中基于SKIP模式快速帧间编码[D]. 杜盼盼. 南京理工大学, 2020(01)
- [3]视频编码的码率控制及优化技术研究[D]. 郭红伟. 电子科技大学, 2019(04)
- [4]基于深度学习的视频编码技术研究[D]. 王洋. 哈尔滨工业大学, 2019(01)
- [5]基于卷积神经网络的视频压缩环路滤波技术研究[D]. 王英彬. 武汉大学, 2019(06)
- [6]基于TMS320DM8168的H.264快速视频编码算法研究[D]. 董泽芳. 西安电子科技大学, 2019(02)
- [7]自适应划分预测编码研究[D]. 王钊. 北京大学, 2019(09)
- [8]基于重编码痕迹的数字视频被动取证算法研究[D]. 何沛松. 上海交通大学, 2018(01)
- [9]基于DSP的视频压缩编码与实现[D]. 隋鑫. 东北石油大学, 2011(04)
- [10]MPEG-4视频传输关键技术研究[D]. 李双阳. 西安电子科技大学, 2009(S2)