IP网络电话技术与IP可视对讲技术的比较
近几年,随着IP可视对讲技术的逐渐成熟,IP可视对讲产品也逐步得到了普及应用。然而,一些厂家为了节省庞大的研发费用,将IP网络电话技术直接移植到IP可视对讲产品中,消费者无法辨识真假。为此,本文将通过对IP网络电话技术与IP可视对讲技术的分别阐述,并进行比较,以帮助广大消费者辨别真伪IP可视对讲产品。
IP网络电话泛指在以IP(InternetProtocol)为网络层协议的计算机网络中进行话音通讯的系统,它采用的技术统称为VoIP(VoiceoverIP),即IP上传送话音。由于计算机网络采用的都是分组交换技术,其传送的数据单元都是由控制部分和数据部分封装而成的独立数据包,通常称之为“分组”,因此,从更一般的意义上来说,VoIP属于分组话音通信的范畴。
而从技术上说,IP网络电话则是以IP为标志的网络分组化和以多媒体为目标的网络业务综合化两大主流技术融合的结果。随着分组通信技术、综合业务通信技术,以及IP通信技术的不断发展,尤其是90年代以来以TCP/IP为核心协议的因特网(Internet)在全球范围内超乎寻常的大发展,使得以IP业务为主的数据业务成倍增长,数据业务成倍增长又导致IP网络的大力扩建,增加其带宽,有效提高了Internet传送质量;反过来,它又促进了Internet业务的发展和用户数的增长。
Internet已从单纯的数据业务进入包括声音和图像在内的多媒体通信领域,传统的计算机网络和电信网络壁垒分明的界线已经被打破。Internet进入电信服务的第一步,自然就是用户面最为广泛的基于IP的分组话音通信,即IP网络电话。
IP网络电话关键技术
IP网络电话由于具有价格低廉、可以灵活提供各种增值业务、有利于企业建立高效综合服务内部网、有利于运营商开拓新的市场及有助于和新技术的融合等的应用优势,使得IP网络电话能够赢得市场的青睐。其关键技术主要表现在以下几个方面,即话音处理技术、IP话音通信协议、网络管理和安全技术、终端技术及视频编码技术。
话音处理技术是IP网络电话技术的重要组成部分,IP网络电话中的话音处理主要解决两个问题。一是在保证一定话音质量的前提下尽可能降低编码比特率,二是在IP网络环境下保证一定的通话质量。前者主要是话音编码技术,包括静音检测;后者包括分组丢失补偿和回波抵消技术。在话音通信中,时延指标是主要的,时延过大会使听话者有不连续的感觉,而时延抖动是次要的。另外,话音编码算法需要考虑三个方面的问题:编码比特率、话音质量和算法复杂度。一般来说,这些指标是有矛盾的,比特率越低,线路的利用率越高,但话音质量会受到影响;在同样比特率情况下,算法设计越复杂,话音质量就会有所提高,但处理时延将增加。目前在PSTN中广泛应用的是PCM话音编码,其比特率为64Kbit/s,话音采样率是8KHz。它属于波形编码类型。通常,这类编码的最低比特率为32Kbit/s,即ADPCM。若要进一步降低其比特率,特别是低于16Kbit/s的低比特率编码方案,必须采用新的编码原理,这就是参数编码,又称作声码器(Vocoder)技术。它是通过模拟人的发声器官,提取模型参数来降低话音信息编码率的。
目前,IP网络电话最常用的是G.729和G.723话音编码。G.729是8Kbit/s的LPAS声码器,线性预测采用前馈型前向自适应技术,并使用预示提高合成模型的精度。G.723是双速率LPA声码器,低速率的编码比特率为5.3Kbit/s,高速率的编码比特率为6.3Kbit/s,线性预测也采用前馈型前向自适应,并使用预视。G.723主要应用于低比特率可视电话。
静音检测又称话音活动性检测,它是一种静音压缩技术,实用的静音压缩技术由话音活动性检测器和舒适噪声生成器两个部分组成。分组丢失补偿主要以处理在传输过程中分组的丢失为主要目的。因为在IP网络中分组的丢失是不可避免的,丢失的原因可能是线路误码或者网络路由器故障,更常见的原因则是传输时延过长或网络拥塞导致分组被丢弃。
回波抵消主要针对通话回声的抑制,对于纯IP电话系统来说,由于话音信号的接收和发送经由不同的物理线路,也就是所谓的四线制,因此不存在回音的问题。如果IP网和PSTN互连,通信双方至少有一方是二线制电话,涉及有混合线圈的2/4线转换电力,就会产生回音。(其原理如图1所示)理论上说,混合线圈对端间的衰耗应为无穷大,这样IP电话发出的话音信号只能送到PSTN电话,不会串到对端。可是,实际上混合线圈很难做到完全平衡,这样一部分信号将漏到对端返回IP电话,如果传输时延较长,发话者就会感到明显的回声,严重干扰通话。
回波抵消就是通过自适应方法估计回波信号的大小,然后在接收信号中减去此估计值。这种方法虽然比较复杂,但是已有专用芯片推出,因此得到广泛的应用。在IP网络和PSTN互通的情况下,回波抵消功能一般由网关完成。
除此之外,IP话音通信协议包含有话音通信控制协议、话音信息传送协议、会议电话控制协议及实时控制协议。网络管理和安全技术主要体现在IP网络电话系统的安全性如鉴权、权限验证、加密等和IP网络电话系统必须具有的计费功能和运营商间互操作管理功能等方面。而终端技术则主要体现在基于以太网[NextPage]的专用IP电话机。此类话机具有许多PC机的特性,比如典型的如RJ-45接口、具有自己的IP地址、内置多种话音压缩编码等等。
IP网络可视电话的视频编码技术
IP网络可视电话,即在IP网络电话的基础上增加了视频传输功能。
在IP网络可视电话中,视频编码技术是视频处理的重要组成部分,目前最常用的视频编码为MPEGx及H.26x系列,笔者以H.26x系列为例进行分析。
H.261是最早出现的视频编码建议,目的是规范ISDN网上的会议电视和可视电话应用中的视频编码技术。它采用的算法结合了可减少时间冗余的帧间预测和可减少空间冗余的DCT变换的混合编码方法。和ISDN信道相匹配,其输出码率是p×64kbit/s。p取值较小时,只能传清晰度不太高的图像,适合于面对面的电视电话;p取值较大时(如p>6),可以传输清晰度较好的会议电视图像。H.263建议的是低码率图像压缩标准,在技术上是对H.261的改进和扩充,支持码率小于64kbit/s的应用。但实质上,H.263以及后来的H.263+和H.263++已发展成支持全码率应用的建议,从它支持众多的图像格式这一点就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。
IP可视对讲技术的特点及技术参数
IP可视对讲又称为全数字对讲,它是在原有的总线式可视对讲系统的基础上演变过来的数字化产品。IP可视对讲系统采用当前最新的数字音视频压缩、DSP、嵌入式及流媒体网络传输等技术,结合家庭智能网关系统的特点,利用小区的以太网络,进行音频、视频的网络流传送,集成报警、门禁、智能家电等控制功能,提供短信、公告等增值服务。核心模块是基于TCP/IP协议的可视对讲系统(包含户内机/门口机/围墙机/管理机),提供核心控制与调度、音视频处理与压缩、网络控制与传输、以及周边设备(如RS232/RS485)控制等功能。
IP可视对讲系统主要特点是门口主机、室内分机、管理中心控制主机的音视频信号均采用数字压缩处理后再通过网络传送及接收,设备之间均采用网络线连接方式,安装及联网方便快捷(可直接并入小区内现成的到户网络,无须另行布线)。室内分机还提供视频信号输入接口,可外接视频信号(如摄像机等视频设备);8路的报警输入输出接口(输入输出可定义),可接红外/微波探测器、幕帘式探测器、门磁等报警探测设备及警号、警灯等报警输出控制设备;系统还支持互联网接入功能,支持远程异地联网监控功能,直接通过IE方式即可进行图像及声音的浏览、报警的布撤防功能。
特点
·视频压缩格式常采用M-JPEG、MPEG1/2、MPEG-4/H.264压缩算法;
·数字音视频数据通过网络传输;
·布线方便、简捷;
·支持联动报警;
·门口机呼叫住户、管理中心;
·采用密码开门、RF卡开门及呼叫遥控开门;
·住户与住户机、门口机、警卫中心、管理中心均可实现可视对讲;
·住户可扩展室内分机;
·室内分机嵌装液晶显示屏;
·室内分机提供视频信号输入接口;
·室内分机预留家用电器控制接口;
·离家模式、睡眠模式,可供选择;
[NextPage] ·支持访客记录查询功能,内容包括时间及视频抓拍等信息;
·提供网络化的语音、图像传输,方便住户远程监控;
·管理中心可根据授权监视录像相应视频,授权回放。
技术参数
·分辨率:480×234(VGA);
·网络协议:TCP、DHCP、PPPOE;
·网络环境:LAN、VLAN等;
·视频压缩:M-JPEG、MPEG1/2、MPEG-4/H.264;
·音频压缩:PCM、ADPCM、G.723.1、G.726、G.729。
IP可视对讲和IP网络电话的比较
近几年来,IP可视对讲凭借其强大的优势在实际应用中越来越得到普及,其市场份额也越来越大。因此越来越多的商家投入到IP可视对讲产品的制造行列,有些商家为了节省庞大的研发费用干脆拿现成的IP网络电话技术直接移植到IP可视对讲产品中,其中最为突出的就是以飞利浦芯片为主的解决方案。那么这样做的后果是什么呢?存在哪些优缺点呢?让我们从以下几个方面来进行比较。
1、从通讯模式来看,IP可视对讲系统和IP网络(可视)电话存在本质上的区别。IP网络电话主要存在PC-PC通信、电话—电话通信、PC—电话通信和IP用户控制的电话—电话通信,IP可视对讲主要存在大门口主机—室内分机、门口主机—室内分机、门口主机—管理中心机和室内分机—室内分机。例如:北京的用户甲通过办公室的电脑(IP语音终端)与广州的用户乙的办公室电脑(IP语音终端)之间进行通话,当然也可以是视频电话类的数据业务。这就是典型的PC-PC通信。在某个小区内,访客A通过装于小区入口的大门口主机(IP大门口主机)与该小区内某个单元某层某室住户B的室内可视分机(IP室内数字终端)进行通话、对讲,这就是典型的大门口主机-室内分机之间通讯模式。
2、从信号传输的路径来看,IP网络电话侧重于因特网(Internet)之间的通信,如用户甲和用户乙之间是通过两地之间的互联网进行通讯;而IP可视对讲侧重于LAN(或VLAN)之间的通信,如访客A和住户B之间是通过小区内的局域网来实现两者之间的通讯。因特网(Internet)之间的通信只应用在少数的远程控制。如住户B在办公室的电脑上通过互联网控制自己家中的室内数字终端,完成防区的布/撤防、家电的控制及图像的查看等操作。
3、在音视频编码方面,IP网络电话更多的是考虑带宽的影响,而在音视频质量和传输网络的实际情况之间进行取舍和平衡,选取高压缩率的音视频编码[NextPage]算法(G.729,H.264)对其具有十分的必要性。然而,高压缩率的编码势必会导致图像和声音质量的下降,加上编码器产生的各种时延(算法时延、计算时延、复用时延和传输时延),必然会导致图像及声音的质量下降,这与我们在电脑上用QQ视频聊天的情况是类似的。即便是在网络环境比较好的情况下图像也不是十分的流畅,图像的清晰度也不是很好,声音听起来存在断续现象,失真比较严重。在IP可视对讲中,这种情况将更加严重。因为在IP网络电话中使用的终端多为电话机及PC型的话音终端,话机产生的回声可以通过回波消除的方法进行消除,而在IP可视对讲系统中使用的终端多为单线制(声音为一条线)的免提室内分机和门口主机,这样的主机和分机所产生的回音要比电话机大得多,此时的回声不仅有电路造成的电回声,同时还具有机器结构产生的声回声。如何消除这类回声,这可以说是世界性的难题。
4、从系统及用户的使用要求来看,IP可视对讲要比IP网络(可视)电话要高得多。IP网络(可视)电话要求能听得到对方声音(和看得到对方的图像)就足够了,至于声音及图像的质量那就要看网络的情况来定了。这一点用户心里也很清楚,为了省点钱差就差点啦,只要能说得过去就行了。要是无法接受的话还可以有很多的选择余地,如用有线电话、小灵通、GSM移动电话等等。而IP可视对讲主要针对小区的住户,是房地产商提供给小区所有住户使用的门禁可视对讲系统。它的使用者是小区住户,实际购买者也是下区住户,它的质量好坏、系统的稳定性直接影响小区住户的自身安全及切身利益。类似QQ视频聊天这样的效果产品给住户作为门禁可视对讲产品,住户肯定是接受不了的。另外作为IP可视对讲系统的重要组成部分——IP室内数字终端,它往往是集成多种功能于一体的,它既是门禁可视对讲系统的室内可视分机,同时又可以是家居安防系统的报警主机,同时又可以是智能家居系统的家电控制器,同时又是网络中的网关等。这种情况下住户对它的要求就更高了,因为它是跟住户的安全是息息相关的。比如IP网络电话的语音终端出问题,大不了就是通不了话而已,然而要是IP可视对讲的室内数字终端出故障就会导致用户的生命财产安全。两者的安全系数要求完全不是处于同一平台的。
结论:IP可视对讲≠IP网络电话
通过以上分析,IP可视对讲和IP网络电话不论从通讯模式、信号传输的途径、音视频编码方式还是从系统及用户的使用要求来看,两者之间都存在本质的不同。一味地将IP网络电话技术原封不动地移植到IP可视对讲中来,其结果可想而知。所幸的是,国内一些厂家已经认识到了其中厉害关系,纷纷投以巨资进行自主开发。针对IP可视对讲有别于IP网络电话的特点,创建了具有自主知识产权的音视频编码算法,很好地解决了这一难题(包括回声消除及音视频信号传输质量的保障),既充分满足了IP可视对讲对声音和图像的要求,又解决了网络传输的带宽问题。相信随着网络技术的迅猛发展以及人们生活水平的提高,IP可视对讲将更稳定可靠,更容易走进千家万户。
相关阅读
征稿:
为了更好的发挥CPS中安网资讯平台价值,促进诸位自身发展以及业务拓展,更好地为企业及个人提供服务,中安网诚征各类稿件,欢迎有实力安防企业、机构、研究员、行业分析师。投稿邮箱: cps-tougao@cps.com.cn(查看征稿详细)