过去几年以来,光网络工业持续变革,但是,对光器件高可靠性的要求却一直没有改变。由诸如放大器之类的网络器件的故障所造成的花费非常巨大(图1),网络供应商们估计目前单信道放大器故障率要高于500FIT,全受控宽带放大器故障率要高于1500FIT。
产品的可靠性由故障率表示,通常以FIT为单位(每十亿个累积工作小时的故障次数)。

现场修复故障光放大器的花费远高于放大器本身的成本
不幸的是,很多制造商错误地认为顺利通过认证测试的产品就是可靠的产品。虽然那些由TelcordiaTechnologies公司和国际电工委员会等组织提出的标准提供了非常详细的产品认证方法,但是,达到这些标准并不能说明实际应用时就一定可靠。
通过认证测试是产品进入市场的最低标准,它只是更全面的可靠性程序的一小部分。可靠性程序用于找出并消除设计和生产过程中存在的一些问题,如果不进行这个程序,认证测试只是浪费时间和金钱,并不能保证产品的可靠性。
市场变化的影响
最早的光放大器设计非常简单,单信道放大器的组件不超过10个,这些器件一般由单个低功率激光泵浦源(小于150mW)和简单印刷电路板以及一些无源器件组成。
而如今用于WDM的放大器则要复杂得多,它包括控制系统瞬态响应的全电控制器和多个高功率(大于450mW)泵浦激光器以及30到60个光组件,所有组件都集成在一个比早期产品小得多的机械平台上。随着复杂性的增加和功能的增多,放大器潜在的故障种类也在剧增。
市场环境的不断变化同样也给可靠性带来了新的挑战。设计部门处在一种巨大的压力之下,他们必须在很短的时间内交付成本非常低的产品。同时,错误的企业经济学观点造就了一批财力贫乏的企业,它们没有足够资金长期投入到产品测试和测试数据分析中去,因此,大多数产商将可靠性工程简化为通过认证测试并且只由质检部门负责。
价格的压力迫使放大器生产商们开始想方设法降低生产成本。多数情况下,模块的组装被转移到劳动力低廉的国家进行,这些国家通常与公司本部所在的国家存在工作节奏和文化上的差异。而且,员工个人的报酬通常与工作定额和产量密切相关,而这些因素往往又与产品的可靠性和质量目标相冲突。
因此,除非在设计时就彻底排除组装时可能发生的故障,否则上述情况将给保持可靠性带来很大的挑战。由于市场的这些变化,产品的可靠性问题可能一时不会暴露出来,直到累积出现大问题,到那时才发现问题显然已经太晚了,而且修复起来必将耗费巨大。
可靠性程序的要素
一个全面的可靠性程序需要多方面的努力。任何程序的成功都取决于能否在性能、结构复杂性、制造难度、可靠性和成本之间取得最佳平衡,如果为了满足一个方面或几个方面而牺牲其它方面,那么,整个程序将很难得到成功。
只有当这些要素之间的平衡得到精确量化时,一个好的程序管理方法才能保证恰当的平衡。因此,可靠性部门必须与其它职能部门紧密联系,其中包括:销售/市场、设计、组件工程、制造以及现场支持等部门。
一个可靠性程序至少在五个方面需要正确的处理方法:明确使用要求、组件筛选和应用、设计、制造以及可靠性的不断提高。
可靠性要求是通过评估器件的用途和使用方法来确定的。通常,这些要求在产品说明书和行业标准中都有,虽然这些要求对光电性能都有非常详细的说明,但还是缺少对可靠性的详细说明。
结果,在设计阶段往往漏掉大量使用要求。而可靠性问题往往就是因为产品的功能和这些未列出的使用要求之间发生冲突而产生的。
以下举一个例子来说明明确使用要求对于可靠性问题的重要性。在系统启动过程中,尽管还没有输入信号,控制电路也让放大器处于待机状态,同时激活泵浦源,这就导致大量没被吸收的泵浦功率从掺铒光纤射出并进入临近的光组件。这些光组件工作在1500-1600nm的波长范围内,而不能工作于泵浦波长范围内,因此,很多组件的故障就是由于光功率的损害造成的。
因此,可以修改控制电路,在没有输入信号时关闭放大器。如果大家都知道不能在放大器空闲的情况下开启泵浦源,那么,很多实际应用中的故障就可以避免了。
器件是主要故障来源
从现场反馈回来的信息显示近80%的故障出在组件上(图2),因此,严格的组件管理程序显得非常必要。这类程序包括制定详细的组件说明书、使用通过审核的厂商的标准部件以及制定稳健的制造工序。

从现场反馈回来的信息显示光放大器大部分的故障出在组件上,因此要用严格的组件管理程序降低组件的故障率。
这可以通过成立一个组件工程职能部门来实现,这一部门的组件工程师可与设计部门和可靠性部门密切合作,针对组件的各种具体工作环境制定出相应的功能要求,然后,同供应商一起确保这些组件符合要求。
为确保可靠性,经常需要进行特殊测试和寿命建模。而供应商的选择则是根据对其进行的设计评价、制造工艺和可靠性评价以及定期审核作出的。
一个很好的可靠性程序还需要稳健的设计,这些工作将与一些成熟的保证可靠性的方法相结合,这些方法在诸如汽车、航空和医疗等工业领域都已被证明是非常有效的,它们包括:
●设计时要考虑到产品寿命期内所有参数的变化;
●减少单点故障源(即会造成整个器件崩溃的单点故障);
●确保重大故障能被检测到。
评估器件设计的方法包括:故障类型、影响及严重性分析(FMECA);最坏情况分析;故障关系分析;风险评估;设计审核;环境影响分析(温度、机械、电、光);设计类比;可靠性预测;极限测试以及破坏性物理分析。通过这些分析,工程师们才能确定产品是否能达到可靠性目标。
任何可靠性程序都要考虑制造难度,特别是工作量很大的光放大器装配和海外生产尤其要重视这一点。同时,为了简化装配和消除大量依赖技巧的工序,必须建立通用标准,这是生产设计(DFM)规则的重要组成部分。评价制造难度的方法包括FMECA和有效的实时监控。
可靠性设计(DFR)规则和生产设计(DFM)规则必须用于稳健的设计和生产过程。这些设计规则和使用要求之间存在着密切的联系。
一旦一个稳健的设计投入到生产中,产品质量和稳定性只有通过严格地控制生产中的各种因素才能得以保持。在生产过程中一些看起来很小的变化(如设备的调整、周期的改变、设备的固定等),如果没有得到很好的估算和校验,都有可能导致产品在实际应用中出现很大的问题。供应商的审核、变化控制程序、FMECA、监视测试等等都是估算这些变化很有效的方法。
最后,对产品质量和可靠性进行有效的监控,是一个公司有能力提高下一代产品可靠性的必备要素。这种“提升可靠性”的过程需要持续进行故障监测、辨认故障根源和确定修正方法,并将这些信息运用到将来的优化设计中去。在这些实践中所得到的教训将反馈到设计方案中,这些设计方案就能最终达到提升可靠性的目的。
可靠性程序贯彻始终
建立一个自始至终的可靠性程序,而不是仅仅依靠质量检测,这样才可以确保光放大器的可靠性。这一程序从产品设计时就开始执行,并贯穿产品的实际使用过程。它是整个生产和设计过程的一个组成部分。
虽然可靠性工程组只是隶属于设计部门的一个小组,但是,实际的可靠性保障需要每一个职能部门的配合。尽管这个小组为整个项目提供分析和技术支持,但他们主要还是专注于分析新的、尚未被证明的设计思路和工序。
高效的可靠性工程要求懂得如何去分配资源。结合DFR和DFM,并在设计过程中提前区分和预防各种故障,这样,制造商们才可以获得较低的故障率:单信道放大器故障率低于150FIT,受控宽带放大器故障率低于650FIT。
为什么要花费时间和精力去执行这些程序呢?为什么要为了一个成功的可靠性程序而花费额外的资源呢?答案是不仅仅为了让顾客满意,同时也为了在竞争中获胜。同时这些程序可以剔除设计过程中很多重复的步骤。减少“多余步骤”、预防所有曾经出现过的可靠性问题,这样才能提高产品性能、缩短生产周期,最终获得最优秀的产品。
Doug Harshbarger、Wendy Bahn、William Denson、Reinaldo Gonzalez分别是Avanex公司放大器市场总监、光线路模块可靠性工程经理、可靠性工程师、资深可靠性工程师。
方宏:北京交通大学光波技术研究所
译自:《Lightwave》04年8月29页《Amplifier reliability is key to economical systems》
|
· EPON:最后一公里的新贵 · 集成SDH与ATM优化3G传输网 · 新一代MSTP优化本地传输网 · MSR为城域网建设提供更多选择 · 超长距离光传输势在必行 · 突破40G光传输技术瓶颈 |
· 浅析40G光传输系统的商用价值 · ULH超长系统与ASON网络并不矛盾 · ULH系统将从试验转向商用 · ASON如何应对下一代光网络需求 · 详述光波分复用(WDM)技术 · 光纤与光缆介绍 |