在客户拨打电话时,他们都希望电话能一次拨通,而且也都希望通话能持续进行而不受干扰。这一用户体验需要非常高的可用性才能实现,而这样高的可用性传统上是用网络可用性来衡量的。当然,网络可用性是有线网络运营商关心的一个主要问题。但是,当有线网络运营商部署基于ip的语音电话服务时,他们都希望能实现与公众交换电话网络(pstn)相当的可用性水平。要想实现相当于pstn的用户体验,我们就必须同时衡量网络可用性和语音服务的可用性。
所有高级有线服务都对网络提出了严格要求,包括可用性、延迟时间、抖动和可对用户体验产生影响的其他参数(图1)。本文主要探讨这些要求的可用性方面。
在所有高级有线服务中,相当于pstn的语音服务对网络的可用性、丢包率、延迟时间和抖动等提出了一些最苛刻的要求。


服务可用性的概念对于商业高速数据、广播视频以及视频点播等服务也是很重要的(图2)。凭借其针对基于ip的数据网络、基于ip的语音(voip)以及视频等而开发的一整套领先产品和技术,思科系统公司为有线网络运营商提供了在今天可为高级有线服务实现高可用性的解决方案。然而,鉴于相当于pstn的语音通信有着最严格的要求,因此本文主要探讨有线网络上基于ip的语音电话服务的服务
可用性。
不同的高级有线服务对服务可用性有不同的要求

多少个九?测量真正的网络和服务可用性
“五个九”是对pstn可用性的经典衡量标准,意思是在99.999%的时间里网络都是正常运行的。然而,在文件《针对packetcable 体系结构的voip 可用性与可靠性模型》(文件:pkt-tr-voipar-v01-001128)中,packetcable指出,人们通常所接受的端到端pstn可靠性的五个九(99.999%)神话是不正确的。为了能计算出pstn可用性的真正等效数值,该文件剖析了pstn的组件并将其直接与基于ip的等效网络进行了比较。根据这一分析,packetcable确定出voip网络的端到端可用性应高于99.94%。
除正常运行时间外,其他服务-可用性指标也是很重要的,因为它们都能直接影响用户体验。对于语音而言,这些指标包括现有通话掉线数目以及新拨通话无效尝试次数等。正如packetcable文件中所定义的,端到端网络服务-可用性指标应为每一百万次通话掉线次数不超过125以及每一百万次拨叫无效尝试次数不超过500。这些数值与bellcore gr系列技术规范中所规定的pstn对网络和服务可
用性的要求完全相同。
在评价网络和服务可用性时,有线网络运营商需要考虑端到端网络以及其中的思科®设备,而不仅仅是要考虑每个网元。图3显示了端到端有线网络的参考体系结构;该网络中的思科设备部分显示在突显方框中。
该网络中思科设备部分不包括一端的有线调制解调器和混合型光纤-同轴(hfc)环境以及在有线网络与pstn的相连点处的本地交换局和访问网络。为符合packetcable指导方针,思科公司建议网络中的思科设备部分正常运行时间应大于99.9665%,每一百万次通话掉线次数不超过65次且每一百万次通话尝试失败次数不超过275。根据这些数值,当现在部署基于ip的语音电话服务时,有线网络运营商肯定能实现相当于pstn的可用性。
思科设备部分的可用性指标是影响端到端网络可用性的关键因素

保证高可用性的领先方法
不同于那些仅仅为有线网络运营商网络中的某些服务或方面提供产品的厂家,思科系统公司提供了覆盖从hfc环境到pstn网关的整个网络的语音解决方案。有了这样一个面向整个系统的方法,思科公司就能实现针对服务可用性的集成化方法---确认出最优特性然后在最合适的平台上实施这些特性。
思科公司一直在不断开发高可用性特性,当网络发生故障时,这些特性有助于减少语音通话的停机时间。这些特性包括了很多基本功能,如可支持软件和硬件冗余配置;针对快速融合的路由-优化技术;以及具有动态分组传输(dpt)等可实现快速故障恢复的特性的光纤传输技术。
思科公司还针对高可用性提供了其他一些创新特性,如cisco nonstop forwarding (nsf)、cisco stateful switchover (sso)以及服务中软件升级等。计划将在2003年-2004年期间分阶段实施的这些特性将根据情况在思科路由器、交换机、pstn网关以及有线调制解调器终端系统(cmtss)中实现。
如图4所示,所有这些思科特性都将进一步减小有线网络运营商在通话掉线次数和无效尝试次数等方面的每一百万次通话缺陷数(dpm)数值。
思科公司计划到2004年底前将推出其他高可用性特性,并逐步减小这两个关键语音服务指标的数值。

第三层路由的快速融合
在ip网络中,第三层路由体系结构---及其从故障中快速恢复(融合)的能力---是高可用性的一个重要方面。如果因组件或链路故障而导致第三层拓扑结构的更改,那么该路由体系结构就应该能实现快速融合以避免通话掉线,也就是说融合时间不能超过三秒钟(通话掉线阈值)。快速融合还有助于缩短平均修复时间(mttr)---即对于路由器能以多快速度从故障中恢复的衡量,而这一时间可对服务可用性指标产生直接影响。
思科公司针对ip路由而提供的领先技术可使第三层融合时间短于三秒钟(而且在某些情况下速度甚至还会更快)。之所以能实现如此之短的路由器融合时间就是因为思科公司增强了最短路径优先(spf)计算算法、指数计时器以及分秒级呼叫功能。
运行规程对高可用性的影响
日常运行活动和规程可对网络和服务可用性产生重大而持久的影响。思科公司帮助世界各地一些规模最大的服务提供商改进了它们的运行规程以及对服务可用性的相关影响。例如,在思科公司为美国某大型服务提供商实施的一个咨询项目中,一个联合小组着重分析和解决了网络运行的若干方面,包括:
• 对网元更改进行了回归测试,以最大限度缩短意外停机时间
• 针对计划停机以部署硬件和软件升级的过程和程序
• 可以有预见性地解决可用性问题的网络管理规程
• 考虑网络和服务可用性的体系结构和规划
• 有助于快速响应并解决停机故障的覆盖整个系统的故障排除方法和逐级汇报过程
作为这一项目的成果,思科公司帮助该服务提供商将数据服务的dpm从2000以上降低到了100以下,改进了95%。
思科公司在有线网络高可用性方面的领先地位
思科系统公司非常注重服务和网络可用性,因此在业内能率先推出可支持语音电话的严格要求的有线网络解决方案。这一重点贯穿在思科联网产品和思科ios®软件的高可用性技术和高级第三层路由技术之中,并可指导有线网络运营商的网络设计和运行规程等工作。
端到端思科网络可帮助有线网络运营商满足今天packetcable对网络和服务可用性的技术要求---并可实现积极的用户体验,从而保证语音电话服务在市场上取得成功。