Consideraciones de seguridad y riesgo en la gestión de incidentes
Los gestores de incidentes suelen tener permisos de administradores en los sistemas informáticos. Esto es necesario para permitir el diagnóstico y la resolución de problemas, pero también puede presentar algunos riesgos para la organización. Por lo tanto, es importante que los incident managers comprendan que, además de tener acceso a información y a potentes herramientas de apoyo, tienen la responsabilidad de garantizar la seguridad y de comprender las repercusiones que pueden tener sus acciones.
Reinicio de servicios y sistemas
Muchas veces, para resolver un incidente, los gestores reinician los servicios sin ser plenamente conscientes de que otros usuarios y áreas de la empresa pueden necesitarlos. No es raro que los reinicios durante las horas pico de trabajo tengan un impacto aún mayor que el problema original que el gestor pretendía resolver.
Correcciones destructivas
Los sistemas de TI son complejos y tienen muchas dependencias que no se comprenden ni documentan correctamente. El cambio de una configuración o la aplicación de una corrección para resolver un problema crea la posibilidad de que se produzca otro. Antes de realizar cambios en los sistemas, los gestores de incidentes deben ser conscientes de la posibilidad de que se produzcan “correcciones destructivas” y asegurarse de que se hayan realizado las pruebas y los planes de reversión correspondientes.
Acceso a datos sensibles
Los gestores de incidentes de TI suelen tener acceso a datos de producción (que pueden ser secretos), información personal de los empleados o datos sensibles de los clientes. La divulgación involuntaria de datos privados es uno de los errores de seguridad más comunes que cometen los gestores de incidentes, concretamente la inclusión de información sensible en las comunicaciones de los usuarios o en las notas de los tickets que no cuentan con los mismos controles de acceso que los sistemas de origen.
Destrucción de pistas y síntomas
Una gestión eficaz de los problemas requiere comprender lo que estaba ocurriendo en el entorno de TI en el momento en que se produjo el incidente. Lamentablemente, mientras se solucionan los incidentes, los gestores a menudo deben tomar medidas que destruyen pistas y eliminan síntomas que podrían ayudar en el análisis de la causa raíz. Es importante que los gestores de incidentes y de problemas colaboren estrechamente para recopilar estos valiosos datos.
Revertir los cambios sin entender las dependencias
Los cambios y lanzamientos planificados son la causa de muchos incidentes en los sistemas de TI y una resolución habitual es revertirlos y volver a la versión anterior. Por desgracia, las versiones suelen probarse en paquetes, lo que oculta las dependencias internas que pueden verse afectadas si se revierte un solo componente. Antes de revertir los cambios implementados en el marco de una nueva versión, el gestor de incidentes debe consultar con el gestor de versiones y el equipo responsable del proyecto, ya que puede ser necesario realizar pruebas adicionales.
Eludir los mecanismos de control de cambios
La mayoría de las organizaciones cuentan con sólidos mecanismos de control de cambios que incluyen la revisión y aprobación de los mismos. Su finalidad es salvaguardar la infraestructura de TI de impactos adversos y garantizar la debida diligencia y la mitigación de riesgos. Los incident managers suelen tener acceso y autorización para actuar de forma independiente y aplicar cambios en los sistemas de producción que deberían ser revisados como parte del proceso normal de control de cambios. Por esa razón, deben comprender cuándo están facultados para actuar y cuándo deben solicitar aprobación antes de aplicar cambios.
El valor de los incident managers para su organización de TI
Los gestores de incidentes son esenciales para cualquier organización por ser la primera línea de interacción entre los usuarios de la empresa y el personal de TI. Evalúan el impacto de los incidentes, su urgencia e importancia, con el fin de garantizar que las actividades más trascendentales reciban la mayor atención. Los gestores de incidentes realizan gran parte de los diagnósticos, la recopilación de datos y la resolución de problemas necesarios para entender lo que está ocurriendo cuando un sistema de TI no funciona correctamente, y toman medidas para remediar el problema, de modo de minimizar la interrupción de la actividad.
Los gestores de incidentes tienen la tarea de resolver rápidamente los impactos operativos para minimizar la interrupción de la productividad de los usuarios y de la empresa en general. Cada incidente es una interrupción que cuesta a la empresa tiempo, recursos y capacidad, e incluso puede dañar su reputación en el mercado. Los gestores de incidentes se encargan de responder a los eventos y problemas imprevistos para evitar que otros empleados de TI se distraigan del trabajo en sus proyectos y tareas diarias.
Además de resolver los impactos a corto plazo, los gestores de incidentes son responsables de capturar datos para apoyar los procesos de gestión de problemas, de modo que se pueda identificar la causa raíz de los incidentes y desarrollar soluciones a largo plazo para prevenir futuros inconvenientes. Los incident managers también recopilan valiosos conocimientos sobre la organización y los transforman en artículos que permiten resolver problemas conocidos y que ayudan a mejorar el soporte durante futuros problemas. Eso permite que los equipos de desarrollo de soluciones construyan sistemas y servicios de mejor calidad para satisfacer las necesidades de la empresa.