1

Ciber Monday y el Colapso de Sistemas: Lo que no se mide…no se mejora

Hoy el acceso a la información mediante plataformas tecnológicas es algo común. Sus múltiples funcionalidades permiten desde hacer gestiones financieras hasta informarse, lo que ha cambiado la forma en que nos desenvolvemos, generando una especie de dependencia de dichos sistemas.

El tema se vuelve especialmente sensible cuando los sistemas colapsan debido a la gran afluencia de usuarios o peaks de visitas. ¿Por qué plataformas que son ampliamente conocidas y que soportan una gran cantidad de usuarios sufren estas “caídas”? ¿Por qué los sistemas para comprar entradas, la telefonía celular, los sitios de algunos bancos e incluso páginas de empresas participantes en Ciber Monday colapsan cuando hay un gran número de usuarios tratando de entrar al mismo tiempo?

La principal razón de estos colapsos es que la infraestructura que soporta estos servicios y las aplicaciones que se transforman en su acceso, no están en condiciones de soportar consultas masivas al mismo tiempo. Esto sucede porque la arquitectura de las soluciones, no es sometida a pruebas de estrés. Es decir, antes de poner a disposición de los usuarios finales un sistema de información, no se realizan las pruebas que simulen lo más cercano a un escenario de alta concurrencia. Este procedimiento permite garantizar que tanto el sistema como sus aplicaciones, tendrán disponibilidad de acceso y responderán en un determinado tiempo.

Una vez realizado el ensayo, viene un trabajo permanente de monitoreo, que requiere un censo constante en el website para medir su comportamiento, con usuarios que ingresan en tiempo real.

En el país, hay organizaciones y empresas que si aplican este tipo de medidas y responden frente a la gran afluencia de visitantes, garantizando los tiempos de respuesta y una disponibilidad del 99,9%. Sin embargo, hay otras que no los utilizan, ya sea por costo o falta de compromiso y garantía de un acceso sólido a las plataformas, sin niveles de servicios comprometidos, funcionando sólo con el mejor esfuerzo. Esto deriva en colapsos, siendo inevitables las pantallas de “Fuera de servicio” o “Página en mantenimiento”.

Aunque siempre hay una fase para recuperar el sistema, que permite la reacción del área de soporte, como un número de contacto para contrarrestar la demanda, es una medida reactiva, que con la implementación de un área de calidad, que involucre test y sondeo de desempeño, no ocurrirían.

Los bancos y las entidades privadas son las que más invierten en áreas de calidad, ya que el mal funcionamiento de sus plataformas les juega en su contra, pierden clientes y dañan su imagen, lo que puede durar mucho tiempo.

Para evitar estos colapsos es necesario realizar permanentemente pruebas de funcionamiento, además del sondeo continuo, lo que ayuda a garantizar el correcto servicio de los sistemas de soportes. Contar con áreas que respalden la calidad, que realicen un proceso de monitoreo constante para medir la salud y efectividad del sistema, es la única forma de asegurar que estas caídas no ocurran, ya que lo que no se mide, no se mejora.

Por Gabriel Ledesma Gerente de Operaciones de ANIDA