Cómo un enfoque crítico para la confiabilidad (CTR) mejora el tiempo de actividad del proveedor de servicios de colocación e hiperescala

3 min de lectura

 Mark Bidinger| 16 de abril de 2020  |

Cómo un enfoque crítico para la confiabilidad (CTR) mejora mejora el tiempo de actividad del proveedor de servicios de colocación e hiperescala

El aumento de la demanda de capacidad de TI y de centros de datos es sin precedentes. Los centros de datos de servicios de colocación e hiperescala están operando a sus niveles óptimos, pero la confiabilidad y el tiempo productivo siguen siendo un problema. Por ejemplo,  la Encuesta Global de Centros de Datos de 2019 del Uptime Institute indica que un tercio de los 1,600 encuestados experimentaron un incidente de paro o una degradación grave del servicio. Varios de esos incidentes produjeron graves pérdidas financieras relacionadas con las actividades comerciales. Casi el 80% de los encuestados indicó que su interrupción más reciente bien pudo haberse evitado. El tiempo de recuperación completa para la mayoría de las interrupciones fue de una a cuatro horas, y más de un tercio informó un tiempo de recuperación de cinco horas o más.

Para los centros de servicios de colocación y las empresas de hiperescala cuyos clientes requieren confiabilidad predecible, tal situación es insostenible. Los enfoques innovadores tienen que ir más allá de la simple garantía de que los productos de infraestructura física de las instalaciones de centros de datos individuales son confiables. Si bien un producto tal como un sistema de energía ininterrumpida (UPS) podría funcionar por un período prolongado y continuo, se necesita un enfoque más integral para garantizar un mayor grado de confiabilidad operativa.

Aquí es donde agrega valor el enfoque Crítico para la Confiabilidad (CTR). El enfoque CTR incorpora muchos componentes físicos de los sistemas de infraestructura del centro de datos que garantizan l tiempo de actividad, tales como un UPS, tablero de distribución, sistemas SCADA, disyuntores, software de monitoreo de energía y controladores lógicos programables (PLC), y los administra como un todo. Si se implementa correctamente, el enfoque CTR ayuda a aumentar la confiabilidad general de las operaciones de los servicios de colocación e hiperescala.

Cómo es que el enfoque CTR proporciona una predicción de tiempo de actividad más detallada

Para implementar un enfoque CTR, las partes interesadas del centro  de datos de servicios de colocación deben reconocer primero la diferencia entre la calidad del producto y la confiabilidad del producto. Por ejemplo, un UPS de calidad podría funcionar bien después de su fabricación, prueba y puesta en marcha. Sin embargo, una vez que el UPS está funcionando en un entorno de producción en vivo, existe un elemento de tiempo que se deberá considerar para saber cuánto tiempo durará el funcionamiento del UPS en el sitio. Ese elemento de tiempo, que es fundamental para la noción de confiabilidad del producto, también es un factor en el momento en que un cliente u otros se ven afectados por una falla (es decir, la velocidad con la que se corrige dicha falla).

El enfoque CTR adopta una estrategia que se basa en una fórmula y que permite a los proveedores de hiperescala y colocación cumplir con los estándares de confiabilidad que prometen a sus clientes. «Si instalan 10 unidades UPS y 10 tableros de distribución, por ejemplo, saben que todos estos sistemas tienen que funcionar juntos sin problemas durante cinco años para cumplir con la promesa de confiabilidad que prometen», dijo Andy Durand, Promotor de las Cuentas de Clientes Estratégicos para Gigantes del Internet del equipo de Satisfacción del Cliente y Calidad de Schneider Electric.

«Hoy en día, muchos datos se recopilan a partir de los activos de infraestructura física del centro de datos y su rendimiento en el campo», comentó Andy. «Esos datos permiten a las partes interesadas que analicen una flota de activos, por ejemplo, saber cuánto tiempo están funcionando los sistemas y grupos de sistemas sin fallas». Establecer una línea de base con las métricas de tiempo hasta la falla profundiza la comprensión de la verdadera confiabilidad del sistema.

El análisis de fallas se agrega a la ecuación predictiva

El análisis de fallas también es un factor importante. Un proceso de «sub CTR», denominado ‘problema a prevención’, incorpora órdenes de trabajo de reparación automatizadas y mecanismos para enviar y coordinar los servicios en los sistemas. Estos servicios también se basan en indicadores KPI para medir la eficacia y velocidad de cada caso enviado y los datos recopilados y analizados para, una vez más, mejorar la precisión de los pronósticos de confiabilidad. Una vez que se corrige un problema, la fase final investiga las causas por las que falló el sistema. Esta evaluación técnica considera las piezas defectuosas y las compara con otros incidentes para determinar si existe un problema sistémico, tal como un aumento en las fallas del condensador.

La intención del proceso CTR es evitar las fallas mediante predicciones más precisas, documentar los problemas a medida que se presentan y clasificarlos en cuanto a su criticidad. A medida que se resuelven estos problemas con el proceso, se pueden controlar mejor o se eliminan los defectos de diseño del producto para dar soporte a la estabilidad energética del centro de datos.

Lea más sobre las maneras en que los proveedores de servicios de colocación se enfocan en la confiabilidad para clientes de empresas e hiperescala en la entrada de este blog, Por qué los proveedores de servicio de hiperescala cuentan con proveedores de servicios de colocación para ajustarse a la alta demanda de capacidad y servicios de los centros de datos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.