Una transacción exitosa, por simple que parezca, depende de un sistema tecnológico eficiente detrás. Un servicio en línea, por lo tanto, es aún más dependiente de la tecnología. Estas son las demandas y requerimientos que han puesto en la mira a la continuidad operativa de los data centers, indispensables para garantizar el uptime de las operaciones de las compañías e imprescindibles para asegurar la permanencia de las empresas en un mercado de extrema competencia.
Aunque en Chile no existen cifras oficiales respecto a la tasa de falla de los data centers, a nivel mundial se han determinado algunas tendencias. Nelson Wilson, Socio Responsable de Qualitas, división de DMR Consulting, indica que de acuerdo a un estudio de Gartner Group respecto a causas de fallas en data centers, el 40% corresponde a aplicación, otro 40% a errores de operación y el 20% restante a problemas en el hardware, software y telecomunicaciones. Otra fuente, BIS Applied Systems, señala que respecto a estudios de falla una de las más importantes es la producida por la acción de eventos como la exposición al fuego, que alcanza el 36%, seguida por problemas de software en un 24% y de suministro de energía en un 21%.
Una de las características esenciales de los data centers es, como señala Cristián Alvarez, Gerente de Ventas de Elevair, su uptime o tiempo de funcionamiento, que se mide en términos de disponibilidad como porcentaje. “Generalmente se habla entre un 99% -mínimo aceptable- de disponibilidad hasta un 99,999%. En el primer caso se asume que el data center podría estar abajo 87,6 horas al año, y en el segundo que tendría un down-time de sólo 5,25 minutos por año”, asegura.
Claramente, el ‘tiempo arriba’ o continuidad operativa de los data centers no depende de un sistema en particular, sino de una solución global, íntimamente entrelazada, que les permite mantenerse en funcionamiento aún ante accidentes o desastres naturales.
Los sistemas arriba
Dependiendo de los bienes y servicios que protege un data center, es su importancia. Así lo afirma Domingo Gutiérrez, Gerente de Proyectos de DGR Ingenieros, “y por lo tanto -comenta el ejecutivo- si hablamos de los data centers de instituciones que ofrecen servicios las 24 horas y 365 días del año, claramente se está hablando de alta importancia de la continuidad ope-rativa”.
Lo anterior es un tema clave para cualquier empresa hoy en día, según José Eduardo Muñoz, Gerente Comercial de Rittal, porque cualquier actividad que realiza una compañía depende de la información de los servidores que están en el data center. “Desde la documentación adjunta a un envío de material hasta la emisión de una factura para un cliente, necesita de información alojada en servidores. Esto hace que cualquier parada en el sistema informático de una empresa se convierta directamente en dinero que no se factura”, afirma.
Y es que actualmente, en opinión de Wilson, la alta dependencia de los servicios de TIC -como apoyo a los procesos de negocios- demanda que se minimicen los riesgos y salvaguarden el funcionamiento de los procesos y tecnologías que están concentrados en un data center. “En estas organizaciones, los problemas de continui-dad pueden producir trastornos operativos en las áreas de negocios y a nivel de gestión, pérdidas económicas e incluso pérdidas de información”.
Es así, como según Al-varez, hoy en día la gran mayoría de las empresas depende de sus procesos informá-ticos y la continuidad se vuelve más crítica en la medida en que crecen las pérdidas generadas por la ‘caída’ del sistema. En algunos casos, indica el Gerente de Ventas de Elevair, las pérdidas se pueden evaluar en millones de pesos por cada minuto que los servidores estén abajo. Algo todavía más crítico en bancos, compañías de seguros y empresas de servicios.
Respuestas a tiempo
Incendios, inundaciones, cortes de energía, fallas en el control de acceso e incapacidad de adaptarse a nuevas tecnologías son, a juicio de Gutiérrez, errores que un data center no puede permitirse. Para eso es necesario que se arme de una artillería compuesta, como indica Wilson, por elementos tecnológicos como sitios alternativos, dispositivos redun-dantes, sistemas de respaldo y recuperación; procesos de gestión de continuidad TI, entre ellos, procedimientos de recuperación, análisis de impacto en el negocio, buenas prácticas de administración de cambios y administración de inventario y configuración, roles y responsabilidades bien definidas en el ámbito de la continuidad operativa; y conocimiento de los niveles de servicio que se deben operar en condiciones normales y ante desastres.
Nelson Wilson,
QUALITAS – DMR CONSULTINGCristián Alvarez,
ELEVAIRDomingo Gutiérrez,
DGR INGENIEROSJosé Eduardo Muñoz,
RITTAL
Según el Gerente Comercial de Rittal, para que la continuidad de un data center sea máxima se recomienda trabajar con equipos redundantes y no tener puntos únicos de falla. Al hacerlo, es posible asegurar que en caso de falla de uno de los sistemas principales, se conmute al redundante y se pueda seguir trabajando normalmente. Otro factor que ayuda a la continuidad del data center es, como explica el ejecutivo, trabajar con equipos modulares, ya que en caso de cualquier inconveniente, el tiempo de reparación se reduce al mínimo; algo tan simple como sacar el módulo dañado y sustituirlo por uno en buen estado.
La infraestructura de un data center debe estar diseñada para la flexibilidad y la escabilidad. Ante todo, a juicio del Socio Responsable de Qualitas, se debe definir estratégicamente -y desde el punto de vista de seguridad física- la localización, diseño del piso, control de acceso, sistema eléctrico, diseño mecánico, la protección ante fuego, las comunicaciones y el concepto de modularidad. Asimismo, es importante que se contemplen los sistemas de monitoreo del hardware y software, un sistema de respaldo eficiente de acuerdo a las necesidades del negocio para un real aprovechamiento eficiente de la inversión realizada en el data center, además de una organización adecuada para dar respuestas oportunas.
Lo ideal, en opinión del Gerente de Proyectos de DGR Ingenieros, es contar con sistemas redundantes, un servicio de atención y so-lución las 24 horas, además de tener toda una normalización ISO 11.801 actualizada y monitoreo online de todos los sistemas.
Julio de 2006