可用性和可靠性


1、平均故障间隔时间(MTBF - Mean Time Between Failure)

MTBF 是指相邻两次故障之间的平均工作时间,是衡量一个产品的可靠性指标。


2、平均修复时间(MTTR - Mean Time To Repair)

MTTR 是描述产品由故障状态转为工作状态时修理时间的平均值。
在工程学,MTTR是衡量产品维修性的值,
在维护合约里很常见,并以之作为服务收费的准则。


3、可用性(Availability)

GB/T3187-97 对 Availability 可用性的定义:
在要求的外部资源得到保证的前提下,
产品在规定的条件下和规定的时刻或时间区间内处于可执行规定功能状态的能力。
它是产品可靠性、维修性和维修保障性的综合反映。

Availability = MTBF / (MTBF + MTTR)

通常大家习惯用N个9来表征系统可用性,
比如99.9%(3-nines availability),99.999%(5-nines availability)。


4、宕机时间(Downtime)

Downtime 指机器出现故障的停机时间。
使用每年的宕机时间来衡量系统可用性,更符合直觉,更容易理解。
在这里插入图片描述


5、 可用性 VS 可靠性

可用性(Availability)
是关于系统可供使用时间的描述,以丢失的时间为驱动(Be Driven By Lost Time)。

可靠性(Reliability)
是关于系统无失效时间间隔的描述,以发生的失效个数为驱动(Be Driven By Number of Failure)。

两者都用百分数的形式来表示。
在一般情况下,可用性不等于可靠性,
只有在没有宕机和失效发生的理想状态下,两者才是一样的。


如下图所示:

可用性关注可用时长,可靠性关注故障频率。

在这里插入图片描述


版权声明:本文为weixin_44648216原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。