Cuando algo deja de correr, el ingeniero de control abre tres ventanas: el log de eventos del MES, la vista del historian y la nota de relevo de la noche pasada. Corre la misma consulta que corrió las últimas seis veces, en el mismo orden, buscando la misma forma. La primera hora de cada incidente es trabajo de reconstrucción que debería haber sido automatizado hace cinco años.
Las hipótesis se prueban en serie porque el ingeniero solo puede leer una ventana a la vez. Para cuando la tercera vuelve no concluyente, la línea ha estado abajo cuarenta minutos y alguien decidió «simplemente reiniciarla» para ver qué pasa. El post-mortem registra «causa desconocida, recurrente» — que es lo mismo que registró la última vez.
El registro de auditoría es lo que alguien recordó tipear en el ticket del incidente al salir. Seis meses después, cuando el OEM pregunta por qué apareció un defecto similar en una prensa similar, nadie puede reconstruir qué se miró y qué se descartó — solo qué se arregló finalmente.