La infraestructura y el estándar TIA-942
En abril de 2005, la Telecomunication Industry Association publica su estándar TIA-942 con la intención de unificar criterios en el diseño de áreas de tecnología y comunicaciones. Este estándar que en sus orígenes se basa en una serie de especificaciones para comunicaciones y cableado estructurado, avanza sobre los subsistemas de infraestructura generando los lineamientos que se deben seguir para clasificar estos subsistemas en función de los distintos grados de disponibilidad que se pretende alcanzar. En su anexo G (informativo) y basado en recomendaciones del Uptime Institute, establece cuatro niveles (tiers) en función de la redundancia necesaria para alcanzar niveles de disponibilidad de hasta el 99.995%.
A su vez divide la infraestructura soporte de un datacenter en cuatro subsistemas a saber:
- Telecomunicaciones
- Arquitectura
- Sistema eléctrico
- Sistema Mecánico
Entendiendo los tiers
Uno de los mayores puntos de confusión en el campo del uptime (tiempo disponible de los sistemas) es la definición de datacenter confiable; ya que lo que es aceptable para una persona o compañía no lo es para otra. Empresas competitivas con infraestructuras de datacenter completamente diferentes proclaman poseer alta disponibilidad; esto puede ser cierto y dependerá de la interpretación subjetiva de disponibilidad que se realice para el tipo de negocio en que se encuentre una compañía.
Lo cierto es que para aumentar la redundancia y los niveles de confiabilidad, los puntos únicos de falla deben ser eliminados tanto en el datacenter como en la infraestructura que le da soporte.
Los cuatro niveles de tiers que plantea el estándar se corresponden con cuatro niveles de disponibilidad, teniendo que a mayor número de tier mayor disponibilidad, lo que implica también mayores costos constructivos.
Esta clasificación es aplicable en forma independiente a cada subsistema de la infraestructura (telecomunicaciones, arquitectura, eléctrica y mecánica). Hay que tener en cuenta que la clasificación global del datacenter será igual a la de aquel subsistema que tenga el menor número de tier. Esto significa que si un datacenter tiene todos los subsistemas tier IV excepto el eléctrico que es tier III, la clasificación global será tier III.
La norma describe, resumidamente, los distintos tiers de la manera que sigue:
Tier I: datacenter básico
Un datacenter tier I puede se susceptible a interrupciones tanto planeadas como no planeadas. Cuenta con sistemas de aire acondicionado y distribución de energía; pero puede o no tener piso técnico, UPS o generador eléctrico; si los posee pueden no tener redundancia y existir varios puntos únicos de falla. La carga máxima de los sistemas en situaciones críticas es del 100%. La infraestructura del datacenter deberá estar fuera de servicio al menos una vez al año por razones de mantenimiento y/o reparaciones. Situaciones de urgencia pueden motivar paradas más frecuentes y errores de operación o fallas en los componentes de su infraestructura causarán la detención del datacenter. La tasa de disponibilidad máxima del datacenter es 99.671% del tiempo.
Tier II: componentes redundantes
Los datacenters con componentes redundantes son ligeramente menos susceptibles a interrupciones, tanto planeadas como las no planeadas. Estos datacenters cuentan con piso falso, UPS y generadores eléctricos, pero están conectados a una sola línea de distribución eléctrica. Su diseño es “lo necesario mas uno” (N+1), lo que significa que existe al menos un duplicado de cada componente de la infraestructura. La carga máxima de los sistemas en situaciones críticas es del 100%. El mantenimiento en la línea de distribución eléctrica o en otros componentes de la infraestructura pueden causar una interrupción del procesamiento. La tasa de disponibilidad máxima del datacenter es 99.749% del tiempo.
Tier III: mantenimiento concurrente
Las capacidades de un datacenter de este tipo le permiten realizar cualquier actividad planeada sobre cualquier componente de la infraestructura sin interrupciones en la operación. Actividades planeadas incluyen mantenimiento preventivo y programado, reparaciones o reemplazo de componentes, agregar o eliminar elementos y realizar pruebas de componentes o sistemas, entre otros. Para infraestructuras que utilizan sistemas de enfriamiento por agua significa doble conjunto de tuberías.
Debe existir suficiente capacidad y doble línea de distribución de los componentes, de forma tal que sea posible realizar mantenimiento o pruebas en una línea, mientras que la otra atiende la totalidad de la carga. En este tier, actividades no planeadas como errores de operación o fallas espontáneas en la infraestructura pueden todavía causar una interrupción del datacenter. La carga máxima en los sistemas en situaciones críticas es de 90%.
Muchos datacenters tier III son diseñados para poder actualizarse a tier IV, cuando los requerimientos del negocio justifiquen el costo. La tasa de disponibilidad máxima del datacenter es 99.982% del tiempo.
Tier IV: tolerante a fallas
Este datacenter provee capacidad para realizar cualquier actividad planeada sin interrupciones en las cargas críticas, pero además la funcionalidad tolerante a fallas le permite a la infraestructura continuar operando aun ante un evento crítico no planeado. Esto requiere dos líneas de distribución simultáneamente activas, típicamente en una configuración system + system; eléctricamente esto significa dos sistemas de UPS independientes, cada sistema con un nivel de redundancia N+1. La carga máxima de los sistemas en situaciones críticas es de 90% y persiste un nivel de exposición a fallas, por el inicio una alarma de incendio o porque una persona inicie un procedimiento de apagado de emergencia o Emergency Power Off (EPO), los cuales deben existir para cumplir con los códigos de seguridad contra incendios o eléctricos. La tasa de disponibilidad máxima del datacenter es 99.995% del tiempo.
Para poner en perspectiva la tasa de disponibilidad que se pretende para los distintos tiers, el cuadro 2 expresa su significado expresado en el tiempo de parada anual del datacenter. Estos porcentajes deben considerarse como el promedio de cinco años.
Hay que tener en cuenta que para un tier IV se contempla que la única parada que se produce es por la activación de un EPO y esto sólo sucede una vez cada cinco años.
No obstante para la exigencia que demanda un tier IV algunas empresas u organizaciones manifiestan necesitar una disponibilidad de “cinco nueves”, esto significa un 99,999% de disponibilidad. Esto es poco más de cinco minutos anuales sin sistemas.