RSS |

Blog de Omar

Just another WordPress weblog

Advertisement

Posts Tagged ‘ 1 ’

Ha pasado casi un mes desde que escribí mi ultimo post sobre ITIL y si alguno pensó que estaba vagando o simplemente me había aburrido de escribir, déjenme decirles que uno de mis principales defectos (o quizás virtud….) es estar siempre estudiando algo, lo que me resta tiempo para cosas como escribir en mi blog y demás actividades de ocio.

Bueno hoy pienso dar un paso mas para ir concluyendo mis posts sobre ITIL v3; hasta el momento ya he escrito 4 posts y no quiero caer pesado pero les recomiendo leer los posts anteriores para entender todo el contexto de ITIL.

Si quieres darle un review a los post anteriores, aquí lo puedes hacer:

- Introducción a ITIL v3
- Estrategia del Servicio
- Diseño del Servicio
- Transición del Servicio

Habíamos dejado la “acción” en la implementación del servicio (Transición del Servicio – ST), acuérdense que en la ST habíamos visto la gestión del cambio, gestión del activo servicio y configuración, y la gestión del despliegue, ¿lo recuerdan, verdad?. Pues la lógica me indica que después de implementar el servicio en un cliente viene algo que cae por su propio peso…. MANTENER EL SERVICIO SIEMPRE FUNCIONANDO.

monitoreo

¿Acaso existe un sistema de TI que funcione completamente solo y sin necesidad de algún mantenimiento? Analicemos un poco, los desarrolladores siempre tienen nuevos requerimientos por parte de los usuarios, los DBA siempre tienen que monitorear que sus BDs estén funcionando, los sysadmin revisar que todo el sistema corporativo este funcionando y así podría pasarme todo el día diciendo que este trabajo nunca tiene fin, por eso en ITIL v3 existe algo que se llama MEJORA CONTINUA que será el tema del siguiente y ultimo post.

Con esas cuantas líneas arriba he tratado de resumir lo que hace la Operación del Servicio y que entramos a analizar en este mismo instante:

Definición, metas y objetivos
SO (Service Operation), conduce, gestiona y controla las operaciones del día a día de los procesos, con la finalidad de tener los servicios estables, registrar incidentes, registrar problemas y sugerir el uso de nuevos procesos. Seamos sinceros …. muchas personas desmerecen este tipo de trabajo, no? pero por el contrario este trabajo tiene una importancia estrategia importante! porque estas son las personas que dan la cara frente al usuario, son los que dicen: “Buenos días, el área de TI le habla; ¿en que puedo ayudarlo?” y nunca debemos olvidar que el área de TI brinda servicios a los clientes y son estos quienes perciben el valor del servicio.

impacto

Cuando hablamos de gente que esta constantemente monitoreando los servicios, atendiendo llamadas y dando soluciones temporales, hablamos de nuevos conceptos como: impacto, urgencia y prioridad. Imaginemos….. llama un usuario de logística indicando que no puede abrir un archivo PDF y llama el director general indicando que no le funciona el outlook, ¿a quien se atiende primero? ¿al que llamo primero?, pues…. eso depende de muchos factores como la cantidad de gente con la que se cuente, la cantidad de recursos y de tiempo.

Terminología: En este tema existen muchos términos nuevos y definiciones muy técnicas así que me gustaría explicarlo mejor con un ejemplo para que quede bien claro:

Se tiene una aplicación llamada “ABC” programada en Java que utiliza una BD Oracle, esta aplicación es accedida mediante un browser por los clientes quienes agregan información de manera diaria.
Cierto día, los chicos de SO reciben un correo de sistema CACTI (sistema que monitorea el ancho de banda de la red) indicando que el consumo del ancho de banda de la red se ha incrementando en un 40% desde las 12pm hasta las 4pm. A los 2 días de recibido este correo, llega otro correo del sistema CACTI indicando que el disco duro del servidor de BD ha pasado el 80% de su capacidad y que se recomienda liberar espacio. Al tercer día (y justo fin de mes) llama un cliente indicando que el sistema “ABC” no funciona y que no puede adjuntar información y que necesita hacerlo lo antes posible porque tiene que terminar su trabajo de fin de mes, a los 10 minutos de esta llamada se reciben 5 nuevas llamadas de otros usuarios con el mismo inconveniente.

cacti_overview

De este pequeña historia que es totalmente real, tenemos:

Evento: Aumento del consumo del ancho de banda en un 40% (lo mas seguro es que algún usuario estaba agregando bastante información)
Alerta: Uso del disco duro en un 80%
Incidente: Primera llamada del usuario que no puede adjuntar archivos
Problema: 5 clientes que no pueden usar el sistema el fin de mes
Workaround (Solución temporal): Montar nuevo disco duro para aumentar el espacio en disco
KnowError (Error conocido-KE): Este error se ha presentado con anterioridad y el procedimiento de solución y causa del problema esta documentada.
Reactivo: Personas que actúan solo frente a un aviso o problema.
Proactivo: Personas que están en búsqueda de la mejora continua

[More]

Popularity: 43% [?]