多媒体通信复习指南2014版
1. 多媒体通信概述
(1) 举例论述对“Multimedia =Variety + Integration + Interaction”的理解。 要点:Variety:多种媒体(声、像、图、文„) Integration: 将多种不同类型媒体集成为一体 Interactivity: 用户与系统之间交互、通信
比如:数字电视这种多媒体系统,将电视节目、电影、文字信息等多种信息(Variety),通过MPEG-2流的方式整合(Integration),利用DVB网络与用户交互(Interaction)。 (2) 分析多媒体通信中的“Synchronization”和“Network offerings”特征。 Network offerings:网络承载 Synchronization:同步
承载层起到承上启下的作用,对它的基本要求是:按照业务层的要求把每个业务信息流从源端引导到目的端;按照每种业务的属性要求调度网络资源确保业务的功能和性能;实现多媒体业务对通信形态的特殊要求;它将适应各种类型数据流的非固定速率特性,并提供统计复用功能;通过在承载层组建不同的承载VPN,可以为不同类型和性质的通信提供其所需要的QoS保证和网络安全保证。
多媒体信息本身具有一定的时效性,因此在通信过程中, 终端显示的多媒体信息必须问步、且能与其它媒体同步, 这也是多媒体通信的一个重要特点。
2. 多媒体数据压缩国际标准
(3) 爱迪生的留声机、磁带录音机、CD-DA、MP3对声音进行记录和存储的方式有何区别,试分析音频存储技术变化的趋势。
1、爱迪生的留声机用机械刻纹的方式记录,以音槽形式存储模拟声音信号。磁带录音机,利用磁记录原理直接记录和存储模拟声音信号。CD-DA(Compact Disc-Digital Audio)采用数字方式记录声音信息,通过对模拟声音信号进行采样、量化、编码,将声音信息以0、1数字信号的形式通过激光刻录存储在光盘上。MP3(Moving Picture Experts Group Audio Layer III)除了对模拟音频信号做AD转换外,根据声音信号的时间冗余和人耳的听觉特点还对转换后的数字音频信号进行压缩、编码,从而既降低了存储成本,又保证了声音质量。
2、以数字技术主导的现代信息技术中,对声音的记录和存储方式由模拟到数字方式转变推动了音频信息技术的发展。随着多媒体技术和互联网技术的普及,人们对声音的记录、存储、传输变得频繁。高质量、小体积是音频存储技术的发展目标。实现的技术从单纯的对音频数据去除本身的冗余,到重视人们的听觉特点和体验,音频数据的压缩方式变得更加综合。 (4) JPEG压缩标准中为何选择DCT变换?MP3压缩中为何选择MDCT变换?
因为JPEG压缩对象为静止图像,而图像是空间信号,采用2D-DCT变换能够很好地去除空间信号的相关性,从而去除图像的空间冗余;其次DCT变换具有快速算法来实现,借此可以得到较高的算法效率;MP3压缩对象为音频信号,即一维时间信号。在MP3压缩算法中,由于心理声学模型的引入,当一段语音信号的连续两帧波动差别较大时,波动较小的帧将被当做噪声,而对之选用较大的量化步长,进而造成严重失真。MDCT变换通过对相邻两帧的语音信号进行加窗,然后做DCT变换,起到了平滑作用,可以很好地解决这个问题。
(5) JPEG系列的各图像压缩标准(JPEG、JPEG-LS、JPEG2000、JPEG XR)实现压缩的技术手段中各自体现了哪些思想?
JPEG:1、色彩空间由RGB转换到YUV,通过选取不同的缩减采样方式可以对图像做不同压缩程度的压缩,该方法利用了人眼对亮度差异的敏感度高于色彩变化的视觉特点。2、通过对图像作DCT变换,该方法去除了图像的空间冗余。3、通过对DCT变换系数做有区别的量化,
降低了数据量又保证了图像的视觉效果,该方法利用了人眼对高频亮度变动的分辨较弱的特点。4、Z字形扫描DCT系数,采用熵编码方式对图像编码,该方法结合了DCT系数在空间上的分布特点。
JPEG-LS:利用图像在空间上的相关性,采用了适应预测、上下文建模和Colomb编码的方法来压缩冗余。
JPEG2000:基于小波变换、标量量化、上下文建模、算术编码以及后压缩率配置;不会产生基于DCT变换的JPEG标准产生的块状模糊问题。
JPEG XR:使用可逆的色彩空间变换、可逆的重叠双正交变换,非算数熵编码机制,从而可以高效地保存高频率的图像数据,在高压缩率的情况下保持很好的图像质量。 (6) 采用滤波的方法能否滤出量化噪声?为什么?
不能。因为量化噪声实际上是量化误差,并不是真正的噪声;量化处理将输入归总到与其相近的输出级别,该过程必然带来信息的丢失,从而产生量化误差(量化噪声),而且该过程不可逆,采用滤波方法是无法滤出量化噪声的。
(7) 采用分块方式的变换编码存在哪些缺点?说明在MP3中如何克服该问题。
分块方式的变换编码会存在块效应现象,在MP3中使用MDCT代替DCT,MDCT连续帧之间使用“时域交叠取样”技术,可以很好地消除不同帧由于量化差异造成的块效应现象。 (8) K-L变换为何被称为最佳变换?为何它在数据压缩领域没有得到广泛应用?
K-L变换是建立在统计特性基础上的一种变换,实质上是作坐标系的转换,尽量让向量落在最少的坐标轴上或其范围,从而只用较少的变换系数就可以恢复出质量不错的图像,压缩效率比较高,均方误差小。K-L变换是均方误差意义下的最优变换。但是一旦图像变化后,就要重新找到一个变换的坐标系才能使其投影最稀疏,即变换核矩阵要重新计算,计算过程比较复杂,所以在数据压缩领域没有得到广泛应用。
(9) 采用Wavelet、Ridgelet、Curvelet、Contourlets等不同变换有何差异? Wavelet即小波变换,对于一维信号中的点奇异特征具有优良的表示能力; Ridgelet即脊波变换,能够更有效地表征信号内具有方向性的奇异特征; Curvelet是对脊波变换的改进,能够较好地表现曲线的奇异特征;
Contourlet即轮廓波变换,也可以较好地表现曲线的奇异特征,其方法与Curvelet不同。 (10) 什么是压缩感知?其要素有哪些?
压缩感知通过开发信号的稀疏特性,在远小于Nyquist 采样率的条件下,用随机采样获
取信号的离散样本,然后通过非线性重建算法完美的重建信号。
信号的稀疏性是压缩感知理论的一个重要前提,并且直接影响着信号感知的效率。压缩感知的关键是观测矩阵的构造。
非线性优化是CS重建信号的手段,也是从低分辨观测中恢复出高分辨信号所必须付出
的软件代价。
(11) 定性讨论采用DCT变换的时候,对变换前的样本做量化和对变换后的系数做量化所产生的结果有何差异。
DCT将原始样本转换成代表不同频率分量的系数集,对系数量化后的数据直流分量相
对于交流分量来说要大,而且交流分量中含有大量的0。这样便于对量化后的数据进行简化,从而提高压缩比。而DCT变换前对样本的量化并不能减少频率成分,不能达到较高的压缩比。量化会带来原始数据的部分丢失,精度下降。在DCT变换之前对样本做量化,会将两个量化级内的数据变换成相同的,之后将该样本数据变换到频域后就会影响数据频域特性,造成误差累积到频域中,进一步降低数据精度。
(12) 相比于MPEG2,H.2引入了哪些措施提高压缩比?
①运动补偿(减少时间冗余):1⁄4像素精度的运动估计、7种大小不同的块匹配、前向与后向多个参考帧。
②帧内预测(减少空间冗余):9种4×4亮度块、4种16×16亮度块和4种色度块的预测
模式。去除相邻块之间的相关性。
③熵编码的改进 CAVLC/CABAC ④空间域到频率域的变换:DCT→4×4整数变换;52级步长的量化器,量化步长以12.5%
递增。
(13) 定性讨论视频质量可伸缩性可以通过哪些措施实现。
采用层结构:基本层和增强层,一个基本层,一个或多个增强层。增强层可以通过三种方式实现可伸缩性:spatial scalability、temporal scalability、quality scalability。有时候,也可以采用感兴趣区域的伸缩和基于实物的伸缩。不同的伸缩方法可以再同一码流中结合使用。 (14) ITU-R BT.656 并行/串行传输模式的信号格式,与模拟电视扫描信号结构有何联系? ITU-R BT.656通过定义的定时基准信号(SAV、EAV)实现一行图像的开始和结束,模拟电视扫描信号结构是逐行扫描或隔行扫描的。这里一次定时基准信号的出现标志着一行图像传送结束,是类似于模拟电视信号的一行扫描完成的,不论是前者还是后者都是先将一行信号串行发送在并行重组实现接收显示。
(15) HDMI中视频数据周期、数据岛周期、控制周期的定义与模拟电视扫描信号结构有何联系?
模拟电视扫描信号结构进行逐行扫描时从左向右开始扫描,扫描一行完成后进行回扫及行消隐操作,同时在此过程中传送语音信号。在HDMI规程中,视频数据周期主要完成视频像素的传送操作,是类似于逐行扫描操作的,数据岛周期完成语音信号和辅助信号的操作,类似于模拟电视信号的语音传送部分,而控制周期控制个视频块的扫描周期,类似于模拟电视信号中一行数据扫描结束和下一行数据扫描开始的控制功能。
(16) 根据数码相机的组成结构分析影响最终照片质量的因素。
数码相机是通过光学系统将影像聚焦在成像元件CCD/ CMOS 上,通过A/D转换器将每个像素上光电信号转变成数码信号,再经DSP处理成数码图像,存储到存储介质当中。影响最终照片成像质量的因素包括成像器件的像素水平(分辨率水平),其他条件一致情况下,像素水平越高,图像质量越高;色彩位数,数码相机的色彩位数指标反映了数码相机能正确记录的色调有多少,色彩位数越高,相应的图像细节越真实;A/D转换精度,该精度直接影响数码图像的颜色表现;镜头性能,主要性能包括镜头的分辨率和明锐度,一般镜头口径和相对孔径大,成像效果好;感光度,数码相机上感光度通过调整CCD电荷输出时的增益实现的,感光度对于图像的质量有很大影响;图像压缩格式(图像处理算法)等等。
3. 多媒体同步机制
(17) DAB和DVB系统中除了音频或视频之外需要存储/传输的额外信息包括哪些?各采用什么方式予以解决。
DAB:1、额外存储/传输的信息:同步信息,发射机标识信息,时间频率TFPR,CRC校验信息等;2、解决方式:利用帧开头的部分传递同步信息、发射机标识信息、时间频率,crc校验信息,利用帧后面的PAD与X-PAD等附加区域,传递附加信息,实质上是修改帧的对应区域。
DVB:1、额外存储/传输的信息:节目特殊信息PSI,服务信息SI,同步、PID信息;2、
解决方式:将PSI、PMT与SI等附加信息放进188字节的TS包进行传递。 (18) 简述时间戳思想在HDTV系统中的应用。
在HDTV系统的视频流和音频流的同步中,音频和视频编码器各自工作。为了解决
两个数据流的同步问题,通过一个90HZ的系统时钟向两个编码器输入当前的时间值。扩充过的TS(Transport Stream)包括时间戳,这些时间戳被包含在编码输出中传送给接收方,借此可以同步音频流和视频流。
(19) MP3文件中帧(frame)的帧头中的Frame sync(11bits)信息与MPEG2的TS包中PCR(Program Clock Reference)信息所起的作用各是什么?
Frame sync:Frame sync是MP3帧头帧开始处的“同步”块。MP3播放器可以通过搜寻
第一个同步块,锁定到第一个有效数据帧上,以便开始播放。在快进、快退等播放操作中,同步块都起到同步、定位的作用。
PCR:PRC可以使得码流中带有准确的内部时钟,所有编码和解码过程都接受这个内部时钟控制。解码器必须读出PCR值,与自身系统时钟比较,如果收到的PCR与解码器系统时钟一致,则收发端时钟同步;否则,根据差别大小产生一个控制变量发送至锁相环,从而纠正接收端的振荡器。
(20) 试述HDTV中媒体同步是如何实现的?
HDTV的同步问题主要在于音频流和视频流之间的同步。音频和视频编码器各自工作,为了解决两个数据流的同步问题,通过一个90HZ的系统时钟向两个编码器输入当前的时间值。扩充过的TS(Transport Stream)包括时间戳,这些时间戳被包含在编码输出中传送给接收方,借此可以同步音频流和视频流。 (21) MP3如何实现流内同步?
MP3通过Samples Per Frame 和 Sampling Rate 来控制播放时间,从而实现流内同步。 (22) 什么是同步容限?哪些标准化组织对音视频的同步容限做了怎么的规定?
同步容限是用户与同步机制之间就偏差的许可范围所达成的协议。同步容限包含了用户对偏差许可范围的定义,同步机制则需依据同步容限,保证在恢复后的时域场景中,事件间的偏差在其许可范围之内。 标准化组织
ITU BT.1359 ATSC IS/191 EBU R37
滞后容限 -30ms -45ms -60ms
超前容限 +22.5ms +15ms +40ms
(23) 试述多媒体时间域信息的描述方法。
一个描述时域信息的时间模型由基本时间单位、关联信息和时间表示技术三部分组成。 基本时间单位:分为时刻和间隔两种类型,其中时刻是持续时间为零的瞬间。
关联信息:反应时域事件的组织方式。分为定量关联信息(场景中的各时域事件相互
,可以单独地描述每一个时域事件在场景中的位置,从而间接地反映时间关系)和定性关联信息(场景中的各时域事件彼此相关,关联信息中包含对时域事件约束关系的描述)两类。
时间表示技术:依照关联信息定义场景中各事件与时间轴之间对应关系的方法。 此外,典型的时间模型还有:时间轴模型,需时间轴模型,OCPN模型等。
(24) HDMI中音视频的同步的方式。 HDMI的流内同步:
视频同步:S在控制周期传HSync和VSync.
音频同步:通过DDC传输音频采样频率等基本信息. HDMI音视频流间同步:
HDMI 1.3(2006年)添加了automatic audio syncing支持 HDMI 2.0 (2013年)添加了Dynamic auto lip-sync支持
(25) RTP时间戳(32bits)和NTP时间戳(bits)有何不同?
RTP时间戳计算的单位一般是对应流的采样周期;NTP时间戳为绝对时间,而不是采样周期,且往往有MSW和LSW两部分组成。
4. 多媒体网络通信QoS
(26) 多媒体数据流和传统电话网数据流的区别。
传统电话源单一(语音信号),数据量小,信源压缩率有限,传输控制简单,信
息传输前信道已建好确定,类似于TCP传输;
多媒体数据流信源丰富,数据量大,数据编码压缩方式多样,传输控制复杂,要考虑信道带宽分配,动态路径选择,网络延时阻塞,传输同步等问题。
(27) 从通信建立时间、传输延时、延时抖动、带宽利用率、对实时业务的支持、包传输次序及丢失和 QoS 保障等方面对下列网络进行比较:(1)电路交换网络与分组交换网络;(2)面向连接网络与无连接网络。 电路交换网络 分组交换网络 面向连接网络 无连接网络 通信建立时间 在建立由双方独占的物理电路之后建立通信 短 只限于物理抖动 低 支持 发送顺序和接收顺序一致 稳定QoS保障 不需建立专用通道,随时建立通信 长 存在抖动 高 不支持 发送顺序和接收顺序可能不一致 定性的QoS保障 首先建立网络连接才能进行通信 短 抖动较小 低 支持 发送顺序和接收顺序一致 稳定QoS保障 随时进行通信,不需要网络许可连接 长 存在抖动 高 不支持 发送顺序和接收顺序可能不一致 定性的QoS保障 传输延时 延时抖动 带宽利用率 实时业务的支持 包传输次序 QoS 保障 (28) 论述QoS和QoE的区别。
QoS是技术平面的问题,QoE是用户平面的问题。
a) Qos是一个技术概念,是通过网络或者网络元素来测量表示;QoE定义为一个应用或
业务的总体可接受性,是终端用户的主管感知。
b) QoS可以通过具体的参数来描述,可以精确的刻画表示;QoE只能通过优秀一般等等
简单的等级来大概表达用户的感受。
c)Qos在具体的通信网络中体现,QoE和具体的业务紧密联系;QoE=网络QoS+内容+
人的体验
d)现有的QoS体系与用户真实体验存在距离,单纯的分段式的网络性能分析已经不能满
足网络化需求,QoS不足以反映用户的感受,而QoE以人的感受为价值核心。
(29) 传统电信网(固网)和基于IP的网络中话音质量评估存在哪些差别?哪些标准对话音质量评估做了规定?
传统电信网语音质量的测量方式是主观的。个人评价采用打分法,用MOS表示得分,范围从1~5,数值越大越好。
基于IP的网络中话音质量常用客观评价方法,通过测量终端和网络的特征参数,以方
便、快捷的给出语音质量的评价方法。其中应用最广泛的是ITU G.107中的E-Model模型,其优势在于模型专为语音的网络传输而设计,模型采用了百分比的方式来表示发话端和接听端之间的通话质量。
ITU G.862和ITU G.107标准对话音质量评估做了规定。
(30) 传统电视质量评估和IPTV质量评估存在哪些差别?
一般从两个角度对IPTV视频质量进行评价分析:用户体验质量(QoE)和系统服务质量(QoS)。QoE是从用户感知角度出发,对网络提供业务以及应用层面性能的整体感受进行评价。QoS是从系统网络的角度出发,对网络参数性能进行评价。
传统电视质量监控体系,更关注设备自身的转发性能和网络系统性能服务质量QoS。但
从服务角度讲,视频图像质量好坏最终应由用户的体验决定,只有人的视觉感官作出的评价才是最贴切的、最有效的,所以,在IPTV中更关注QoE,其指标为延迟系数DF、媒体丢失率MLR、IPTV频道切换时间。
(31) QoE管理的难点在哪里?
影响QoE的因素主要有三个方面:端到端的网络QoS、中间媒体的透明性以及影响用户期望、特殊体验等相关的主观因素。所以如何多方配合相互保证用户的QoE是QoE的管理难点。
另外对每一类用户所使用的业务和应用,实施何种QoS机制才能达到用户QoE的需求也是QoE管理的难点。
(32) 请分析图像质量客观评估方法和基于内容的图像检索方法之间的联系。
图像质量客观评价方法:利用数学和工程方法对图像质量进行度量,弥补了由观察者对图像质量进行评分、主观评价方法的不足。
基于内容的图像检索:传统的图像库检索采用基于关键词或描述性文本的检索方式。 联系:
1)视觉特征检索,对原图像所用到特征提取的特征提取技术与图像客观质量评价方法
技术手段相同。这样图像质量客观评估质量越高则代表我们对图像提取的特征信息越全面,图像检索更准确。
2)图像质量客观评价中对所提取出的特征信息的做评价算法可以利用到图像检索相似
度度量上来。
3)都面对着如何最大限度的与人们的主观评价相一致的问题。
(33) 请对IP网的Intserv和Diffserv的QoS保障机制的复杂度和性能做出评价。它们能够提供定性的还是定量的、确定的还是统计意义上的QoS保障?
Diffserv的QoS保障机制复杂度要比Intserv低,这是因为后者的服务质量要求要比前者高,这也决定了前者的服务质量不如后者,区分服务提供的只是一种CoS相对的服务质量,而综合服务则提供低延时、低抖动、低丢包率、保证带宽的端到端服务。
(34) 为了保障QoS,在以太网和IP网络中分别采用了哪些技术?
IEEE802.3x为全双工以太网规定了流量控制的方法以实现点到点的链路上流量的控制;IEEE802.1p为以太网规定了包分类的方法,以便交换机根据包的优先级分别进行处理,使以太网具有MAC层CoS能力。
IP网络中采用综合服务模型(Intserv)、区别服务模型(Diffserv)、多协议标记交换(MPLS)三种QoS保障机制。
5. 多媒体网络数据传送
(35) 调研在视频播放系统中用到的缓冲区设计技术。
缓冲区的设计对保证实时视频压缩数据的正确解压缩及高品质播放起着关键作用。
1、传统的视频播放系统中用到的缓冲区设计技术是设计为FIFO 队列, 利用满则溢的
原理, 当接收数据包插入缓冲队列的尾部结点,又接收到其后数据包需要加入缓冲队列时, 位于队列头部结点的帧数据将向下传递。
2、另一种视频播放系统中用到的缓冲区设计技术是基于时间驱动的实时视频流缓冲区
的设计方案, 缓冲区除了完成排序组帧、制定丢包策略等功能外, 由时间精确控制视频的解码和播放, 实现视频的平滑播放。这种缓冲区采用二级缓冲策略, 一级缓冲为数据暂存缓冲, 二级缓冲为数据信息缓冲,并启动数据接收线程和时间驱动线程两个线程。首先由数据接收线程接收数据包, 并保存在一级数据暂存缓冲中, 读取其帧序号及帧内包序号来确定此数据包在二级缓冲环中的位置, 完成二级缓冲队列的排序。二级缓冲环以组合完整的帧为单位, 不是以数据包为单位, 在出队列时检测此帧是否完整, 然后把整帧数据交给解码器处理。设计一个出队列指针, 由时间线程来驱动出队列指针, 精确控制音视频数据向下传递, 使视频可以平滑地显示, 有效避免了视频延时抖动情况的发生。
(36) 总结主流音频、图像、视频媒体的资源需求特征。
可用带宽:网络的两个节点之间特定业务流的平均速度;时延:数据包在网络的两个节点之间的传送的平均往返时间;丢包率:在网络传输过程中丢失报文的百分比;时延抖动:时延的变化;误包率:网络传输中报文出现错误的百分比。 (37) 支持IP网实时多媒体信息传送的协议有哪些?描述基本思想。
协议:RTP/RTCP
基本思想:控制信息与媒体数据分离。RTP被定义为传输音频、视频、模拟数据等实时
数据的传输协议,与传统的注重的高可靠的数据传输的运输层协议相比,它更加侧重的数据传输的实时性。RTP通常与辅助控制协议RTCP一起工作,RTP只负责实时数据的传输,RTCP负责对RTP的通信和会话进行带外管理(如流量控制、拥塞控制、会话源管理等)。在RTP会话期间,各参与者周期的发送RTCP消息。RTCP消息含有已发送数据的丢包统计和网络拥塞等信息,服务器可以利用这些信息动态的改变传输速率,甚至改变净荷的类型。 (38) 何为ATM?为何说ATM结合了分组交换和线路交换的优点?
异步传输模式(Asynchronous Transfer Mode, ATM),又叫信元中继。ATM采用面向连接的交换方式,它以信元(cell)为单位。每个信元长53字节。其中报头占了5字节。
ATM是一项数据传输技术。它适用于局域网和广域网,它具有高速数据传输率和支持
许多种类型如声音、数据、传真、实时视频、CD质量音频和图象的通信。
ATM异步传输模式结合了电路交换和分组交换的优点,能够实现网络与业务的无关性,
是在光纤通信基础上建立起来的一种新的交换技术,它是一种虚电路传输技术,面向连接,十分适合传输语音数据和视频数据等多媒体信息。他继承了电路交换中的速率性和高速分组交换方式对任意速率的适应性,取长补短,以实现高速传送综合业务信息的能力。 (39) 模拟音频和数字音频的失真包括哪些类型?
模拟音频的失真主要包括:谐波失真、互调失真、噪声干扰失真; 数字音频的失真主要包括:量化失真、编码失真等 (40) 常见的视频失真包括哪些类型?
常见的视频失真包括:空间失真、时间失真等。其中空间失真包括块效应、模糊效应、振铃效应、阶梯效应(staircase)、色彩流失(color bleeding)、伪轮廓(false contouring)等;时间失真包括蚊式噪声(mosquito noise)、闪烁(flickering)、包丢失、抖动(jitter)、贴片式误码等。
(41) 衡量图像失真如何利用视觉认知特性?
在衡量图像中利用视觉特性(HVS)通常将图像通过信道分解为各子带,在各子带中利
用各种已有的人眼视觉模型(如频率选择性,对比灵敏度函数CSF)加权平均原始参考图像与失真参考图像的信号差值得到失真图像的质量测度;另外利用人眼视觉的主要功能是提取场景中的结构信息这一特性,产生了图像质量评价算法MSSIM,取得了比较好的图像质量评价效果,且算法比较简单。该算法将两幅图像的相似度分为三个部分:亮度相似度、对比度相似度及结构相似度.根据失真图像与原始参考图像(完美图像)的相似程度来评定图像质量,与参考图像相似度越高,则认为失真图像质量越好.
6. 多媒体通信终端、系统与标准协议
(42) 多媒体会议系统的基本组成与一般结构是什么?网关和会务器的定义和功能如何? 多媒体会议系统主要是由会议终端、传输链路、多点控制单元(MCU)及控制和管理软件组成。会议终端分为大型专用会议终端和桌面型终端,主要是将视频、音频、数据和信令等各种数字信号分别进行处理后组成一路复合的数字码流,再将它转变为适合在传输网络中传输的帧格式送到信道中进行传输。主要包括(1)音频、视频I/O设备(2)视频、音频编解码器(3)信息处理设备与应用软件(4)多路复用/分接设备四部分。
传输链路包括线路交换网和分组交换网。
多点控制单元(MCU)的功能是控制处理、媒体处理、媒体分发。
网关是不同类型网络会议系统间的接口,为不同类型终端提供必要的协议转换。 网关的功能:(1)转换协议(translating protocols):网关作为一个解释器,使不同的网络
能够建立联系,例如,允许PSTN和H.323网络相互对话以建立和清除呼叫。(2) 转换信息格式(converting information formats):不同的网络使用不同的编码方法,网关将对信息进行转换,使异种网络之间能够自由地交换信息,例如声音和电视。(3) 传输信息(transferring information):负责在不同网络之间传输信息。
会务器,又称关守,用于连接IP网络上的H.323电视会议客户,是电视会议的关键部件
之一,提供授权和验证、保存和维护呼叫记录、执行地址转换而不需要你去记忆IP地址、监视网络、管理带宽以同时呼叫的数目从而保证电视会议的质量、以及提供与现存系统的接口。
会务器功能:(1)地址转换(Address Translation):使用一种可由注册消息(Registration
messages)更新的转换表,把别名地址转换成传输地址(Transport Address)。这个功能在线路交换网络上的电话企图呼叫IP网络上的PC时显得尤其重要,在确定网关地址时也很重要。(2)准入控制(Admissions Control):使用准入请求/准入确认/准入拒绝ARQ/ARC/ARJ(Admission Request, Confirm and Reject)消息,对访问局域网进行授权。H323标准规定必须要有用来对网络服务进行授权的RAS消息(RAS messages),RAS是一个注册/准入/状态(Registration/Admission/Status)协议,但它不定义授权存取网络资源的规则或者,因此服务提供者需要会务器来干预现存的授权方法。此外,企业管理人员和服务提供者也许想使用他们自己的标准来授权,例如,根据订金、信用卡等。(3)带宽控制(Bandwidth Control):支持RAS带宽消息(RAS bandwidth messages),即带宽请求/带宽确认/带宽拒绝BRQ/BCF/BRJ(Request, Confirm and Reject)消息,以强制执行带宽控制。至于如何管理则要根据服务提供者或者企业管理人员的来确定。在许多情况下,如果在网络或者特定的网关不拥挤的的情况下,对任何带宽的请求都应该给予满足。(4)区域管理(Zone Management):用于管理所有已经注册的H.323端点(endpoint),为它们提供上面介绍的功能。至于确定哪个终端可以注册以及地理或者逻辑区域的组成(单个会务器管理的终端、网关和多点控制单元MCU)则由网络设计人员决定。 (43) 简述VoIP需要解决的基本问题。
可靠性,包括服务质量和供电问题。VoIP是基于面向无连接的IP网络,可能遇到呼叫质
量太差;回音过多;电话不振铃;语音流量太慢或丢失;不能发起或接受呼叫等问题。另外,完全依靠网络的VoIP还无法解决停电通话的问题。
安全问题,分为两个方面,一是对于IP 网和承载它的以太网在信息安全方面有先天的
缺陷,而作为一种通信服务必须能保证用户的个人隐私和商业安全。另一方面,对于运营商需要保证自己业务的安全性,不受欺诈。
网络融合问题,与现有PSTN网络互通上还有很多问题需要解决。 软件化问题。
(44) 简述内容分发网络和P2P网络的工作原理和核心技术问题。 内容分发网络工作原理:
1)、用户向浏览器提供要访问的域名;
2)、浏览器调用域名解析库对域名进行解析,由于CDN对域名解析过程进行了调整,所
以解析函数库一般得到的是该域名对应的CNAME记录,为了得到实际IP地址,浏览器需要再次对获得的CNAME域名进行解析以得到实际的IP地址;在此过程中,使用的全局负载均衡DNS解析,如根据地理位置信息解析对应的IP地址,使得用户能就近访问。
3)、此次解析得到CDN缓存服务器的IP地址,浏览器在得到实际的IP地址以后,向缓存
服务器发出访问请求;
4)、缓存服务器根据浏览器提供的要访问的域名,通过Cache内部专用DNS解析得到此
域名的实际IP地址,再由缓存服务器向此实际IP地址提交访问请求;
5)、缓存服务器从实际IP地址得得到内容以后,一方面在本地进行保存,以备以后使用,
另一方面把获取的数据返回给客户端,完成数据服务过程;
6)、客户端得到由缓存服务器返回的数据以后显示出来并完成整个浏览的数据请求过
程。
内容分发网络核心技术问题:内容路由技术、内容分发技术、内容存储技术、内容管
理技术等。
P2P网络的工作原理: (1)发现
新节点了解系统提供的业务、该项业务的元数据和可供下载数据的节点列表。 (2)走位
新节点了解跟踪服务器和可供下载数据的节点的位置;同时新节点页必须报告自己的
位置和已存储的数据。
(3)数据传输
节点下载自己所需要的数据和上载其他节点需要的数据。
P2P网络核心技术问题:a)结构化P2P中覆盖网络拓扑结构一致性问题; b)网络的路由与
定位效率问题; c) P2P网络分割问题。
(45) RTP与SCTP应用场景有何不同?
RTP主要应用于需要实时流媒体传输的场景如多媒体会议等;SCTP设计之初是在IP网上支持电信级的信令消息传输,因此其主要应用于多媒体系统的信令消息传输。 (46) 基于RTP/RTCP的流媒体传输和基于HTTP的流媒体有何不同?
在流式传输的实现方案中,一般采用HTTP/TCP来传输控制信息,而用RTP/UDP来传输实时声音数据。
(47) 典型的视听终端应该包含哪几个功能模块?列举其中可能采用的协议。
(48) 在H.323域中,网关、MCU和网守的功能什么?为什么一个域中必须有一个网守,而可以没有MCU?说明H.323终端的通信建立过程,以及实时媒体数据、应用数据、通信控制信号、信令信号各采用什么协议,为什么?
网关:实现协议转换。通过网关,两个不同协议体系结构的网络就可以得以通信;
MCU:提供会议管理以及视频、音频信号的混合与切换:
完成音频、视频信号的混合与切换功能的部分称为多点处理器MP(Multipoint Processor);
完成其余其余功能的部分称为多点控制器MC(Multipoint Controller); 网守:对域内的终端进行接纳控制以防止拥塞; 某个终端使用的带宽; 进行地址翻译; 进行域控制。
(49) 画出H.323终端与3G-324M终端相互通信的连接示意图,并具体列出网关应该具备的功能。
从上图中选出H.323终端与3G-324M终端绘图即可。
网关(Gateway)在不同系统的互联中扮演着极其重要的角色。首先它通过对不同信令
信号的转换在不同类型终端之间建立(或撤销)通信链路;
(50) 从控制功能和传输可靠性两个方面,对H.242和H.245进行比较。 H.242 H.245 控制功能 能力交换; 能力交换与通信模式确定; 通信模式确定; 对特定的音频和视频模式的请求及模式转换; 模式转换; 逻辑通道管理; 远程应用功能控制; 对各个逻辑通道比特率的控制; 多点会议控制。 远端应用控制; 确定主、从终端盒; 修改复接表。 传输可靠性 可靠 可靠 7. 多媒体通信技术最新进展
(51) 语义网(Semantic Web)的目标是什么?试述其关键技术。
语义网的目标是让Web上的信息能够被机器理解,从而实现Web信息的自动处理。
关键技术:Resource Description Framework(RDF),Ontologies(本体论,实用分类系
统),Web Ontology Language(OWL),规则和自动推理。
(52) 音视频等多媒体信息的检索和传统的文本检索之间最本质的差异是什么?
传统的文本检索往往是简单的字符匹配的过程,更本质的说是比特流匹配的过程;而
音频等多媒体信息的检索更看重其内容、语义。不同类型的多媒体信息形式多样,信息量大,而且各具特色。相比之下,多媒体信息的检索依赖于更高层次的对信息的描述。 (53) 面向信息的网络(Information-Centric Networking)面临的主要困难是什么? 如何对信息进行定义、表示、归纳、关联。
(54) 请阐述云计算(Cloud Computing)对多媒体通信可能产生的影响。
云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。云计算的核心思想是将大量用网络连接的计算资源统一管理和调度,构成一个计算资源池向用户按需服务。
利用云计算的多媒体通信将成为一种新的服务模式,尤其是PaaS平台服务。用户不在
需要购置高性能的专用设备就可以享受高质量的计算服务,多媒体资源的处理、传递、共享将变得更加便捷高效。
(55) 软件定义网络的基本思想是什么?
是一种新型的网络架构,其核心理念是使网络软件化并充分开放,从而使得网络能够像软件一样便捷、灵活,以此提高网络的创新能力。
(56) 举例论述网络结构“扁平化”的发展趋势。
要点:扁平网络结构概念:扁平网络一般被认作是一种网络架构(fabric),其优势在于能够允许更多的路径通过网络,以满足数据中心的新要求,包括对虚拟化网络和虚拟机迁移的支持。扁平网络旨在尽量缩短延迟,提高可用带宽,同时提供虚拟化环境下所需的众多网络路径。由于其将传统的接入、汇聚、核心三层网络架构进行了简化,因此人们形象地将其冠以“扁平”的称号。
网络结构扁平化可以减少延迟,以节省更多的带宽,并加大数据中心在网络基础
架构方面的投资回报。
传统网络环境较为复杂,维护起来成本也较高;同时这种高度复杂的安全环境本
身又滋生出一种新的“极端风险”——可能导致一个或多个设备出现配置错误,或来不及应用最新的规则或软件补丁,进而使企业陷入危险境地。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- vipyiyao.com 版权所有 湘ICP备2023022495号-8
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务