La técnica del Arbol Lógico de Fallas (LTA) para el Análisis Causa Raíz
Técnico7 de marzo de 2026
Un árbol lógico de fallas (ALF o RCA Logic Tree) representa una herramienta metodológica deductiva esencial dentro del Análisis Causa Raíz (RCA, dotada con carácter científico y enfocada en descubrir las causas subyacentes (con orígenes físicos, humanos y latentes) que provocan eventos no deseados dentro de un entorno operativo que puede ser de un sector industrial, medico, o de cualquier otro sector que demande evaluar incidentes mediante investigaciones formales y estandarizadas.
De forma visual, este arbol se trata básicamente de un diagrama estructurado que desglosa gráficamente un problema principal, el cual va identificando secuencialmente sus modos de manifestación sintomática hasta llegar a los factores sistémicos que lo originaron en primera instancia. Conformando entonces, un mecanismo de investigación que visualiza las relaciones causales mediante la validación rigurosa de hipótesis basadas exclusivamente en evidencias tangibles, permitiendo que el equipo investigador reconstruya la trayectoria técnica del fallo sin desviarse por opiniones subjetivas ni conjeturas que carezcan de sustentos físicos comprobables.
Construir este modelo deductivo implica iniciar obligatoriamente desde la identificación de los síntomas asociados al evento superior que genera la pérdida, conocido formalmente como evento tope. Posteriormente, el esquema desciende hacia los niveles de hechos observables formulando propuestas de suposiciones técnicas, también conocidas como las hipótesis sobre su origen. Cada suposición planteada debe comprobarse utilizando datos duros de campo, del historial operativo y de estudios especiales para descartar aquellas opciones inválidas, garantizando que el camino hacia la raíz sistémica sea una ruta de certezas plenamente documentadas. Al confirmar experimentalmente una trayectoria causal, el grupo identifica con alta precisión los mecanismos que llevaron a los componentes físicos a averiarse, malas practicas organizacionales y las acciones humanas incorrectas que propiciaron el daño material. El desarrollo de la técnica finaliza en su nivel más profundo al encontrar los vacíos organizacionales o raíces latentes que indujeron la desviación humana original.
Para las corporaciones enfocadas en la cultura de la confiabilidad operacional, es importante implementar estas clases de análisis estructurados sobre sus activos más críticos. Tanto el personal técnico como gerencial requieren comprender exactamente por qué ocurren las averías recurrentes o catastróficas para evitar la fuga de capital en gastos innecesarios por intervenciones repetitivas que solo atacan el síntoma superficial y digamos que no a la enfermedad causal del fallo. Aplicar el método deductivo facilita la canalización de los esfuerzos de mantenimiento hacia la resolución definitiva de conflictos crónicos que merman las cuotas de producción. Esto transforma definitivamente la cultura de la empresa, sacándola de la reacción constante para llevarla hacia una gestión predictiva y proactiva del riesgo industrial.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FLos%2520beneficios%2520del%2520%25C3%2581rbol%2520L%25C3%25B3gico%2520de%2520Fallas-1773856400500.png%3Falt%3Dmedia%26token%3D223afc97-2702-44ff-b29b-98859289b3ee&w=1920&q=75)
Esta investigación de incidentes para resolver fallas es considerada, al ejecutarla, una acción de mantenimiento por resolver que busca la sostenibilidad corporativa desde su origen más profundo al evitar paros futuros de la producción por la recurrencia de averías, permitiendo un incremento sustancial en la disponibilidad operativa de los activos físicos de la planta; asimismo, modificar los procedimientos que presenten deficiencias o establecer planes de capacitación adecuados previene eficazmente la reaparición del incidente en equipos similares y maximiza el aprendizaje institucional extraído de cada falla. Optimizar los procesos de esta forma garantiza un elevado retorno de inversión y asegura la rentabilidad financiera a largo plazo, posicionando la investigación de incidentes como el factor estratégico para resguardar la sostenibilidad y seguridad operativa de los complejos modernos.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FMiniaturas%2520Predyc%2520(8)-1773760310534.png%3Falt%3Dmedia%26token%3De1a5084f-04c9-42e1-964f-6e7e919fd45c&w=1920&q=75)
Diferencias metodológicas del árbol lógico de fallas frente a otras técnicas
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252Fsynthid-removed-Gemini_Generated_Image_s3x0bgs3x0bgs3x0-1773760659520.png%3Falt%3Dmedia%26token%3D6c25d306-2bb8-4e89-bd1d-79a97d2d6023&w=1920&q=75)
Al analizar los incidentes industriales es común encontrar métodos que pueden parecer idénticos a simple vista, pero que poseen aplicaciones operativas muy distintas. Comprender estas diferencias garantiza la selección de la herramienta correcta para cada situación particular, evitando que el analista aplique un enfoque predictivo sobre un evento que ya ocurrió o viceversa. El rigor en la distinción técnica es lo que permite que el reporte de investigación sea aceptado con autoridad por las juntas de ingeniería.
Para responder a esto a fondo, basándonos en las normativas internacionales (como la BS EN 62740) y la literatura técnica de ingeniería de confiabilidad, es vital distinguir el Árbol Lógico de Fallas de otras técnicas basadas en diagramas de "árboles" que difieren en su propósito, con el uso de probabilidades y la aplicación del álgebra de Boole.
El Árbol Lógico (RCA) frente al Análisis de Árbol de Fallas (FTA) Tradicional
El análisis de árbol de fallas tradicional se utiliza fundamentalmente de forma probabilística durante las etapas de diseño o evaluación de riesgos para predecir cómo podría ocurrir un evento superior indeseado. Este enfoque emplea Álgebra de Boole y compuertas lógicas estrictas ("Y" and, "O" or) para calcular la probabilidad de un fracaso general combinando las tasas de avería de los componentes individuales. Busca modelar escenarios hipotéticos antes de que se materialicen los problemas, siendo una herramienta de carácter a priori y preventivo.
Por el contrario, el Árbol lógico de fallas aplicado al Análisis Causa Raíz se ejecuta de manera posterior al tiempo sobre eventos que ya han sucedido en la planta. No utiliza reglas booleanas estrictas para calcular probabilidades futuras, sino que traza una línea deductiva basada estrictamente en hechos comprobables del pasado reciente. Mientras que el FTA modela eventos binarios (falló o no falló), el modelo lógico de RCA aborda la complejidad de las decisiones humanas y deficiencias organizacionales que no siempre son estrictamente binarias, convirtiéndose en un instrumento avanzado para la ingeniería que se encarga investigación de fallas e incidentes, cual curiosamente en algunos entornos también es llamada ingeniería forense.
Contraste con el Árbol de Éxito y el Árbol de Eventos
Es importante no confundir estas herramientas con el Árbol de Éxito (Success Tree), que es la imagen especular del FTA. Aunque aplica la misma lógica booleana y cálculos probabilísticos, su "evento tope" determina el éxito del sistema en lugar de su fracaso. Se usa en diseño para asegurar la supervivencia de funciones críticas, a diferencia del enfoque investigativo del RCA.
Por otro lado, el Árbol de Eventos (Event Tree) es una técnica inductiva (hacia adelante). A diferencia de la naturaleza deductiva del árbol lógico de fallas, el árbol de eventos comienza con un evento iniciador y traza todos los posibles caminos o escenarios futuros. Es fundamentalmente probabilístico; a cada barrera de seguridad se le asigna una probabilidad de éxito o falla, permitiendo calcular cuantitativamente el riesgo de distintos escenarios finales, como una recuperación segura o una falla catastrófica.
Distinción del Árbol de Causas (CTM) y el Diagrama de Ishikawa
Según la norma internacional IEC/UNE/BS EN 62740, el Método del Árbol de Causas (CTM) es también una técnica a posteriori, pero se diferencia del Árbol Lógico de RCA en su profundidad y rigor lógico. El CTM utiliza relaciones lógicas más simples (secuencia, conjunción y disyunción) y no desarrolla las relaciones lógicas booleanas en detalle. Es una herramienta excelente para incidentes simples, pero puede quedarse corta ante fallas sistémicas complejas donde el Árbol Lógico de RCA profundiza hasta las raíces latentes.
Finalmente, el Diagrama de Ishikawa (espina de pescado o 6M) es una técnica categórica ideal para lluvias de ideas iniciales agrupando causas bajo clasificaciones genéricas (materiales, métodos, etc.). Sin embargo, carece de la rigurosidad deductiva requerida para correlacionar directamente una causa con una evidencia física o una decisión humana mediante eslabones lógicos. El modelo de árbol lógico aborda esta debilidad exigiendo pruebas contundentes para cada hipótesis, eliminando el riesgo de que la investigación termine siendo una "lluvia de culpas" sin fundamento técnico.
Proceso sistemático de investigación estructurada
La norma internacional BS EN 62740 establece un flujo de trabajo de forma rigurosa para conducir investigaciones de incidentes con resultados objetivos y soluciones que erradiquen o en su defecto mitiguen las recurrencias de falla. Construir un árbol lógico de fallas exige adherirse a las cinco etapas secuenciales del RCA donde cada paso alimenta al siguiente, donde los analistas deben actuar con la disciplina de los métodos científicos.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%25202-1773760809212.png%3Falt%3Dmedia%26token%3D93a8fcd6-9288-4600-99a5-0cfd9bc663be&w=2048&q=75)
Preparación del análisis y conformación del equipo
Antes de iniciar cualquier investigación, el primer paso consiste en que debe definirse con claridad:
Principalmente el problema y estimar su impacto económico sobre el negocio, las métricas como el lucro cesante (parecido al costo de oportunidad, pero en este caso como lo que se dejó de ganar en producción por el paro), los costos de reparación y la frecuencia de ocurrencia permiten dimensionar la inversión justificable en el estudio.
Delimitación del alcance evita que los esfuerzos se dispersen hacia áreas de la planta que no guardan relación directa con el incidente.
Un Equipo Natural de Trabajo (ENT) debe conformarse reuniendo personas con conocimiento profundo del sistema afectado. Este grupo multidisciplinario incluye, como mínimo, un facilitador neutral que guíe la metodología, un operador que conozca el comportamiento del equipo en servicio, un mantenedor familiarizado con el historial de intervenciones y especialistas según la complejidad del caso. La diversidad de perspectivas dentro del ENT reduce el riesgo de sesgos individuales durante la formulación de hipótesis.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FENT-1773783727429.jpeg%3Falt%3Dmedia%26token%3D248d9623-5427-43cf-8343-71bc8b9272aa&w=1920&q=75)
Recolección estratégica de información mediante las cuatro P
La segunda etapa consiste en recabar toda la información relevante del evento.
Los integrantes del equipo deben consultar los registros del sistema computarizado de gestión del mantenimiento (CMMS), manuales de operación, reportes de monitoreo de condición, avisos de averías y testimonios del personal de planta que estuvo presente durante el incidente.
Establecer una línea de tiempo precisa resulta indispensable para visualizar la secuencia exacta de eventos previos al problema. Esta cronología ayuda a identificar desviaciones que pudieron pasar desapercibidas bajo la presión operativa del momento. Para estructurar el levantamiento de datos, se recomienda documentar las denominadas cuatro P del evento, que responden a qué posición tenían los equipos, qué personas estaban involucradas, qué partes del activo resultaron dañadas y qué tipo de papeles (documentación) o procedimientos se encontraban vigentes o en default durante la falla.
Construcción de la lógica deductiva y reglas de parada
El proceso de armar la lógica deductiva es prácticamente el núcleo donde cobra vida el árbol lógico de fallas. Con la información recopilada, se estructura el diagrama descendiendo paso a paso mediante la pregunta central del método:
¿cómo pudo ocurrir el evento inmediatamente superior?
Ahora, cada factor causal que es propuesto como hipótesis debe validarse antes de continuar al siguiente nivel de profundidad, las rutas confirmadas por evidencias se marcan en el diagrama y las hipótesis descartadas quedan documentadas con su respectiva justificación técnica, garantizando que no se vuelvan a proponer sin fundamento en el futuro. Además, las reglas de parada determinan el punto exacto donde la investigación ha encontrado deficiencias gestionables por la administración, es decir, las causas raíces latentes u organizacionales.
Establecimiento del plan de acción y seguimiento
Al concluir el análisis, el equipo debe formular un plan de acción concreto para eliminar o en el defecto mitigar las causas fundamentales identificadas, las soluciones propuestas requieren un seguimiento mediante indicadores clave de desempeño (KPI) para confirmar su efectividad real en la operación de campo, si los resultados no alcanzan los objetivos esperados, se reevalúa el proceso y se ejecutan los ajustes necesarios, manteniendo activo el ciclo de la mejora continua.
Estructura y niveles jerárquicos de un árbol lógico de fallas
El diseño gráfico de esta herramienta posee una arquitectura jerárquica que guía al investigador desde el síntoma hasta la causa. Cada nivel cumple un propósito específico dentro de la cadena deductiva.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FArbol%2520L%25C3%25B3gico%2520de%2520Fallas-1773786696366.png%3Falt%3Dmedia%26token%3D11903df0-5e80-486c-878f-a09659211513&w=2048&q=75)
El evento tope y los hechos observables
En la parte superior del diagrama se coloca el enunciado del problema principal que justifica la inversión de recursos en la investigación.
Este evento tope debe redactarse únicamente indicando la pérdida de la función deseada sin incluir suposiciones sobre sus posibles orígenes. Representa la consecuencia final que experimenta el negocio, como una parada de producción o la pérdida de contención de fluidos.
Inmediatamente debajo del evento superior se ubican los hechos, que corresponden a los modos de falla observados directamente por el personal técnico.
Es importante que aclaremos que un mismo problema puede manifestarse a través de múltiples síntomas simultáneos o secuenciales. Estos elementos conforman verdades respaldadas por evidencias sensoriales, ensayos, pruebas y mediciones instrumentales o registros de los sistemas de control.
Cuando existen varios hechos, el ENT les asigna un peso % (porcentual) según su contribución al problema global, lo que permite priorizar qué rama del árbol desarrollar primero.
Formulación y validación técnica de hipótesis
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%25206-1773793883891.png%3Falt%3Dmedia%26token%3D10bb6a38-0f8a-44a7-87b2-bd28e767c0b6&w=2048&q=75)
Al desconocer las razones directas que provocaron los hechos observables, el equipo formulará escenarios explicativos mediante técnicas como una lluvia de ideas guiada. En donde, las hipótesis representan todas las causas potenciales que técnicamente podrían generar el modo de falla que es analizado según las leyes de la física y la mecánica aplicables.
Incluir opciones poco probables, pero físicamente posibles es necesario para evitar que sesgos cognitivos oculten la verdadera raíz del problema (teniendo en cuenta, que se proponen y se marcan utilizando la coherencia con la delicadeza de no menospreciar las ideas del grupo, por lo que a su vez podrían descartarse en el momento con el tacto y tecnicismo adecuado para la consideración de la hipótesis planteada).
Ninguna hipótesis se considera verdadera sin atravesar un proceso de verificación con métodos específicos. Así, que el equipo debe definir para cada suposición las herramientas de comprobación aplicables, ya sean END como inspecciones visuales, análisis de espectros de vibración o pruebas de laboratorio, mediciones de variables de proceso y entrevistas al personal.
Las opciones descartadas se van marcando en el árbol para documentar que fueron investigadas.
Raíces físicas, humanas y latentes organizacionales
Descendiendo por las ramas que van siendo validadas, se encuentran;
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FCausas%2520F%25C3%25ADsicas-1773849841877.png%3Falt%3Dmedia%26token%3Db66d77d1-0d1f-4c57-bd30-ce0f4a11e565&w=1200&q=75)
Las raíces físicas, es decir, los componentes tangibles que sufrieron daño directo y cuya sustitución restaura temporalmente la operatividad del equipo. La investigación no puede detenerse aquí, pues el mecanismo que originó el deterioro probablemente seguirá presente en el sistema generando un ciclo repetitivo de fallas. Toda pieza dañada es consecuencia de alguna intervención o decisión inapropiada por parte de las personas involucradas en el ciclo de vida del activo (esto incluye las piezas que tienen cierto rango de envejecimiento o antigüedad por así decirlo, respecto a componentes que cumplen con su ciclo de vida natural y que es recomendable o no cambiar antes de un evento).
Las raíces humanas identifican errores de comisión u omisión durante el diseño, la operación o el mantenimiento. Señalar al trabajador como único responsable resulta contraproducente, ya que las personas generalmente actúan con base en la información, las herramientas y el entrenamiento que la organización les proporciona.
Las raíces latentes u organizacionales conforman el nivel más profundo y valioso del análisis. Revelan deficiencias en los sistemas gerenciales que indujeron al trabajador a cometer el error identificado en el nivel anterior. La ausencia de procedimientos estandarizados, la falta de programas de capacitación o las políticas de compras centradas exclusivamente en el precio mínimo representan ejemplos frecuentes de estas causas que la administración tiene la facultad de corregir para proteger la confiabilidad de toda la instalación.
Las raíces latentes u organizacionales conforman el nivel más profundo y valioso del análisis. Revelan deficiencias en los sistemas gerenciales que indujeron al trabajador a cometer el error identificado en el nivel anterior. La ausencia de procedimientos estandarizados, la falta de programas de capacitación o las políticas de compras centradas exclusivamente en el precio mínimo representan ejemplos frecuentes de estas causas que la administración tiene la facultad de corregir para proteger la confiabilidad de toda la instalación.
Desarrollo de un árbol lógico de fallas con un caso práctico industrial
Para demostrar el alcance analítico de esta metodología, se presenta a continuación un caso simplificado donde se aplican los pasos descritos anteriormente sobre un equipo rotativo de una refinería. El desarrollo sigue fielmente los niveles jerárquicos del árbol lógico, desde la definición del evento tope hasta la identificación de las causas latentes organizacionales.
Paso 1. Definición del problema
Alcance: Analizar las fallas prematuras recurrentes en el sello mecánico de la bomba centrífuga P-203 del sistema de transferencia de gasoil de la unidad de destilación, con el fin de identificar las causas reales que las provocan y establecer recomendaciones que permitan eliminarlas o reducirlas a niveles tolerables.
Propósito: Eliminar las fallas prematuras del sello mecánico o llevarlas a una frecuencia aceptable, mejorando la disponibilidad operativa de la bomba y minimizando los riesgos ambientales asociados a las fugas de gasoil al entorno de la planta.
Paso 2. Entendimiento del problema
Datos técnicos del equipo:
Parámetro | Especificación |
|---|---|
Equipo | Bomba centrífuga horizontal |
Designación/Etiqueta/Código de Equipo | P-203 |
Tipo | API 610, OH2 (una etapa, voladizo) |
Año de instalación | 2015 |
Caudal de diseño (BEP) | 500 GPM |
Cabezal de diseño | 350 ft |
Velocidad nominal | 3560 RPM |
Fluido manejado | Gasoil a 45 °C |
Accionamiento | Motor eléctrico de 75 HP |
Tipo de sello | Mecánico simple, plan API 11 |
NPSH requerido (al BEP) | 9 ft |
Flujo mínimo estable | 280 GPM |
Contexto operacional: La bomba P-203 forma parte del sistema de transferencia de gasoil desde los tanques de almacenamiento intermedio hacia la unidad de mezcla (blending) de la refinería. Opera en servicio continuo durante las campañas de producción, con paradas planificadas cada seis meses. El sistema cuenta con un filtro tipo canasta en la línea de succión, válvulas de seccionamiento manuales y una válvula de control en la descarga. La demanda de caudal varía según el programa de mezcla de productos, lo que exige ajustes frecuentes en las condiciones operativas.
Antecedentes:
N° | Fecha | Actividad | Resultado |
|---|---|---|---|
1 | Mar 2024 | Instalación de sello mecánico nuevo | Vibración inicial aceptable: 2.1 mm/s |
2 | Jun 2024 | Reporte de operador: ruido inusual en la bomba durante picos de demanda | No se tomó acción. Ruido clasificado como "normal" por el turno |
3 | Ago 2024 | Análisis de vibración programado | Nivel: 7.8 mm/s. Diagnóstico: componentes de baja frecuencia y banda ancha. Alta temperatura en cámara de sellos: 78 °C (lado libre) |
4 | Sep 2024 | Fuga visible por el sello mecánico. Parada no programada | Inspección: caras del sello con erosión tipo picadura (pitting) y desgaste acelerado en anillo primario |
5 | Oct 2024 | Reemplazo del sello. Bomba operativa | Mismo patrón de ruido reaparece a las 3 semanas. Se convoca ENT para RCA |
Establecimiento de hechos (Hoja de registro de información):
Pregunta | Respuesta |
|---|---|
¿Qué equipo y componentes participaron? | Bomba centrífuga P-203; componente: sello mecánico. Variables: vibración, temperatura, ruido |
¿Cuándo ocurrió la falla más reciente? | 15 de septiembre de 2024, turno diurno, 14:30 h |
¿Dónde ocurrió? | Área de transferencia de gasoil, rack de bombas P-201 a P-205 |
¿Quién aporta información? | (Hipotéticos para el caso): Luis Martínez (Operador), Carlos Herrera (Supervisor Mecánico), Ana Rivas (Analista de Monitoreo de Condición) |
¿Opiniones del personal? | Operador: "la bomba hace ruido cuando se baja el flujo". Supervisor: "los sellos vienen defectuosos". Analista: "el espectro muestra cavitación, no fallas mecánicas" |
Cursos recomendados
Paso 3. Identificación de la causa raíz mediante el árbol lógico de fallas
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FRCA%2520Ejemplo%252001-1773850780021.png%3Falt%3Dmedia%26token%3Ddbe4616a-9085-4915-ad22-a0174d7976e7&w=1920&q=75)
Evento tope (Nivel A): Fallas prematuras recurrentes en el sello mecánico de la bomba centrífuga P-203 del sistema de transferencia de gasoil.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%25208-1773850934338.png%3Falt%3Dmedia%26token%3D8d1f991a-c0c5-4ab9-9aaa-b045f63228cd&w=2048&q=75)
Hechos observados (Nivel B):
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%25209-1773851030110.png%3Falt%3Dmedia%26token%3D8113e0ac-7518-4658-b174-970565e4fe50&w=1920&q=75)
Se identificaron dos hechos concurrentes que contribuyen al deterioro del sello:
Alta vibración con componentes de baja frecuencia; Contribución estimada: 55%. Los registros del analizador portátil muestran niveles generales provenientes de la transformada rápida de Fourier (FTT) con 7.8 mm/s con componentes sub-síncronas y banda ancha de alta frecuencia.
Alta temperatura en la cámara de sellos; Contribución estimada: 45%. Mediciones termográficas reportan 78 °C en el lado libre, frente a 52 °C de referencia en condiciones normales.
Dado su mayor peso porcentual, el ENT decidió desarrollar primero la rama de alta vibración.
Hipótesis del Nivel C (origen de la alta vibración):
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252010-1773851166150.png%3Falt%3Dmedia%26token%3D14cca1ca-572f-4312-bc81-2f0bf092089c&w=2048&q=75)
El equipo planteó dos hipótesis para explicar la vibración anómala:
Hipótesis C1: Origen mecánico. Se verificó mediante revisión de los análisis espectrales de vibración y la inspección visual de componentes internos durante el último desmontaje. En los espectros no se observaron frecuencias dominantes a 1X ni 2X con las características típicas de desalineación angular o paralela, ni armónicos asociados a desbalanceo o holgura mecánica. La inspección de los rodamientos no mostró patrones de desgaste por precarga asimétrica. Resultado: hipótesis descartada.
Hipótesis C2: Origen hidráulico. Se verificó mediante análisis espectral de la forma de onda y entrevistas al personal operativo. Los espectros mostraron una banda ancha de alta frecuencia y componentes sub-síncronas que son señales características de cavitación e inestabilidad hidráulica. El operador del turno diurno confirmó que el ruido tipo cascajo o trituración de grava se intensificaba durante los períodos de bajo caudal, cuando la demanda de la unidad de mezcla disminuía. Resultado: hipótesis confirmada. El ENT procedió a profundizar esta rama.
Matriz de verificación C3:
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252011-1773851946389.png%3Falt%3Dmedia%26token%3D0529a7a2-97bf-4a52-a61b-ecedacd77c6d&w=2048&q=75)
Sub-hipótesis del Nivel D (dentro del origen hidráulico):
Para identificar el mecanismo hidráulico específico, se formularon tres sub-hipótesis:
Hipótesis D1: Cavitación por NPSH disponible insuficiente. Se realizó el cálculo de NPSH disponible considerando las condiciones reales de operación y se comparó con el NPSH requerido según la curva del fabricante al caudal operativo registrado. El resultado arrojó un NPSHd de 8.2 ft frente a un NPSHr de 12 ft al caudal medido, lo que confirma operación en zona de cavitación. Al desmontar el impulsor se observaron marcas de erosión tipo picadura (pitting) en los álabes del lado de succión, patrón consistente con daño por cavitación sostenida. Resultado: hipótesis confirmada (contribución estimada: 60%).
Hipótesis D2: Recirculación en succión por operación a bajo flujo. Sin medidor de flujo permanente instalado, se realizó una medición temporal con caudalímetro ultrasónico portátil durante una jornada operativa típica. El caudal registrado fue de 180 GPM, muy por debajo del flujo mínimo estable de 280 GPM indicado por el fabricante. La bomba estaba operando de forma crónica al 36% de su punto de máxima eficiencia (BEP = 500 GPM). Bajo esta condición se generan vórtices de recirculación en el ojo del impulsor que producen las fluctuaciones de presión detectadas en los espectros. Resultado: hipótesis confirmada (contribución estimada: 40%).
Hipótesis D3: Vaporización del fluido por exceso de temperatura. Se realizó termografía infrarroja en la tubería de succión y se comparó la temperatura del gasoil (47 °C) con la temperatura máxima de diseño (60 °C). La presión de vapor del fluido a 47 °C no excede la presión disponible en la línea de succión. Resultado: hipótesis descartada.
Matriz de verificación Nivel D:
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252012-1773852053549.png%3Falt%3Dmedia%26token%3D516b5be8-bd87-4aae-9260-910f8ffd8694&w=2048&q=75)
Camino | Hipótesis | Método de verificación | Responsable | Resultado |
|---|---|---|---|---|
Origen hidráulico | D1: Cavitación (NPSHd < NPSHr) | Cálculo de NPSH; inspección de impulsor | Ing. de proceso + C. Herrera | Confirmada. NPSHd=8.2 ft vs NPSHr=12 ft. Pitting en álabes |
Origen hidráulico | D2: Recirculación por bajo flujo | Medición ultrasónica portátil; revisión curva fabricante | A. Rivas + Operador | Confirmada. 180 GPM vs. 280 GPM mín. Opera al 36% BEP |
Origen hidráulico | D3: Vaporización por alta temp. | Termografía infrarroja; comparación P. vapor vs. P. succión | A. Rivas | Descartada. Temp. y presión dentro de rango de diseño |
Causas verificadas del Nivel E:
Al profundizar en los mecanismos confirmados, el ENT identificó las condiciones específicas que generaban la cavitación y la recirculación:
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252013-1773852374845.png%3Falt%3Dmedia%26token%3D34e94e46-888d-4ed0-a02c-c5a2768737a0&w=1920&q=75)
E1: Válvula de succión parcialmente cerrada. Durante la inspección en sitio, se encontró la válvula HV-203A al 60% de apertura. Al entrevistar al operador Luis Martínez, este confirmó haber reducido la apertura "para bajar la presión de descarga cuando la unidad de mezcla no pide tanto producto".
Por lo tanto, la pérdida de carga adicional generada por la restricción fue calculada en 6.3 ft, suficiente para hacer que el NPSHd cayera por debajo del requerido.
E2: Filtro de succión obstruido. La medición de presión diferencial en el filtro tipo canasta arrojó un ΔP de 4.8 psi, frente al ΔP de diseño de 1.2 psi con elemento limpio. Al desmontar el filtro se encontró una acumulación considerable de sedimentos y productos de corrosión del tanque de almacenamiento. El último mantenimiento registrado del filtro era de 14 meses atrás....
E3: Operación sostenida por debajo del flujo mínimo estable. La medición ultrasónica confirmó un caudal operativo crónico de 180 GPM. Sin un medidor permanente instalado ni las curvas de la bomba disponibles en campo, de modo que el personal operativo no contaba con referencia alguna para determinar si el equipo trabajaba dentro de su ventana operativa segura.
Errores humanos identificados (Nivel F) y Causas latentes u organizacionales identificadas (Nivel G):
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252014-1773852936999.png%3Falt%3Dmedia%26token%3Dee43beb4-6ec7-4fc6-993a-8563be336338&w=2048&q=75)
F1: El operador redujo la apertura de la válvula de succión para controlar la presión de descarga, sin conocer que esta maniobra reduce drásticamente el NPSH disponible y provoca cavitación.
F2: No se realizó la limpieza del filtro de succión en 14 meses, a pesar de que las condiciones del tanque de almacenamiento (presencia de sedimentos) exigían una frecuencia mayor.
F3: Nadie en el equipo de operaciones monitoreaba el caudal de la bomba ni lo verificaba contra los límites del fabricante, permitiendo la operación crónica fuera de rango.
Al investigar por qué el personal incurrió en estos errores, el ENT descubrió las siguientes deficiencias organizacionales:
No existe un procedimiento operativo que establezca las posiciones requeridas de las válvulas de succión y descarga para cada escenario de demanda, ni que prohíba el estrangulamiento de la succión como método de regulación de presión.
El personal operativo no ha recibido capacitación sobre las limitaciones hidráulicas de las bombas centrífugas, incluyendo conceptos como el Punto de Máxima Eficiencia (BEP), el flujo mínimo estable, el NPSH y las consecuencias de operar fuera de estos rangos.
No existe plan de mantenimiento preventivo para el filtro de succión. La tarea de limpieza no figura en el CMMS, por lo que depende exclusivamente de la memoria del personal y no cuenta con una frecuencia definida ni con criterios de intervención basados en condición (ΔP).
No se ha instalado instrumentación de presión diferencial en el filtro de succión que permita detectar la obstrucción progresiva antes de que alcance niveles críticos.
No se ha instalado medidor de flujo en la descarga de la bomba. La norma API 610 recomienda instrumentación de caudal para el monitoreo operativo de bombas en servicio continuo, y su ausencia impide que operadores y mantenedores detecten condiciones de bajo flujo.
Las curvas de desempeño de la bomba proporcionadas por el fabricante no fueron difundidas al personal de operaciones ni se encuentran disponibles en sala de control o en campo. Sin esta referencia, es imposible determinar si el equipo trabaja dentro de su ventana segura.
No existe procedimiento de inspección del sistema auxiliar del sello (Plan API 11). Las tuberías, orificios de recirculación y conexiones del circuito de enfriamiento del sello no figuran como tarea en el CMMS ni en ningún plan de mantenimiento preventivo.
No se ha instalado sensor de temperatura en la cámara del sello ni en la línea de retorno del Plan API 11. Sin esta medición, las desviaciones térmicas que degradan el lubricante y aceleran el desgaste de las caras pasan desapercibidas hasta que se produce la fuga.
Desarrollo de la rama B2 correspondiente a la alta temperatura en la cámara de sellos
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252015-1773855906692.png%3Falt%3Dmedia%26token%3Dcb3cea91-ce0b-4d29-9b8d-a4ed5d7466b4&w=2048&q=75)
Completado el análisis de la rama de vibración, el ENT abordó el segundo hecho observado.
La termografía infrarroja registró 78 °C en el lado libre de la cámara del sello, frente a los 52 °C de referencia normal. Además que, durante un desmontaje previo se habían encontrado residuos de coque en el alojamiento, lo cual es indicativo de degradación del aceite lubricante por exposición prolongada a temperatura excesiva.
Hipótesis C3: Sistema de enfriamiento del sello deficiente. El sello opera bajo un Plan API 11 (recirculación del fluido de proceso desde la descarga hacia la cámara del sello a través de un orificio calibrado). Al inspeccionar el circuito completo, se encontró el orificio de retorno parcialmente obstruido por depósitos de coque y partículas. El flujo de recirculación medido estaba reducido al 30% del nominal, y la temperatura del fluido dentro de la cámara alcanzaba 85 °C frente a los 55 °C de diseño. Resultado: hipótesis confirmada.
Hipótesis C4: Fricción excesiva por desalineación del sello. Se realizó inspección dimensional del eje y la cámara del sello. El run-out axial medido fue de 0.02 mm, dentro de la tolerancia establecida por la norma API 682 para sellos mecánicos. La concentricidad del alojamiento también se encontró dentro de especificación, y las caras del sello presentaban un patrón de desgaste uniforme sin marcas de contacto asimétrico. Resultado: hipótesis descartada.
Al profundizar en la hipótesis confirmada, se identificó que la obstrucción del orificio del Plan API se originó porque el sistema auxiliar del sello nunca fue incluido en las rutinas de inspección ni de mantenimiento preventivo desde la instalación del equipo. Las raíces latentes identificadas fueron dos. Primero, no existe un procedimiento de inspección del sistema auxiliar del sello (tuberías, orificios y conexiones del Plan API) ni figura como tarea en el CMMS. Segundo, no se ha instalado un sensor de temperatura en la cámara del sello ni en la línea de retorno del Plan API 11 que permita detectar desviaciones térmicas antes de que se produzca daño en las caras.
La imagen completa del árbol lógico de fallas termina a continuación;
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252016-1773875084699.png%3Falt%3Dmedia%26token%3Ddc75eb33-2bd4-4b2d-b8dd-74977306adcf&w=3840&q=75)
Paso 4. Plan de acción
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252016-1773875357729.png%3Falt%3Dmedia%26token%3Db690d9ae-8ded-4ca5-95fc-9dc9d086f0b8&w=1920&q=75)
Con las ocho causas latentes identificadas entre ambas ramas del árbol, el ENT formuló el siguiente plan de solución:
Elaborar un procedimiento operativo (como un manual) para la bomba P-203 que incluya las posiciones de válvulas para cada escenario de demanda, los rangos de flujo permitidos y la prohibición explícita de estrangular la succión como método de regulación.
Implementar un programa de capacitación para operadores y supervisores que cubra los fundamentos hidráulicos de bombas centrífugas, con énfasis en BEP, flujo mínimo, NPSH y consecuencias de la cavitación y la recirculación.
Incorporar la limpieza del filtro de succión al plan de mantenimiento preventivo en el CMMS, con una frecuencia inicial de 3 meses, ajustable según la evolución del ΔP.
Instalar un transmisor de presión diferencial en el filtro de succión, integrado al sistema SCADA con alarma de alta.
Instalar un medidor de flujo en la descarga de la P-203, con indicación local y remota en sala de control, y configurar alarma por bajo caudal al valor del flujo mínimo estable (280 GPM).
Reproducir las curvas de la bomba en formato de cartelera técnica y ubicarlas en sala de control y en el área de la bomba para consulta permanente del personal.
Elaborar procedimientos de inspección del sistema auxiliar del sello (Plan API 11) que incluya la verificación periódica del orificio de recirculación, tuberías y conexiones, e incorporarlo al plan de mantenimiento preventivo del CMMS.
Instalar un sensor de temperatura (RTD o termopar) en la cámara del sello con indicación en sala de control y alarma por alta temperatura, para detectar desviaciones térmicas antes de que las caras del sello sufran daño.
Paso 5. Monitoreo del sistema y ajuste continuo
Tras la implementación de las acciones, el equipo definió los siguientes indicadores de seguimiento:
Tiempo medio entre fallas (MTBF) del sello mecánico: objetivo mínimo de 18 meses (anterior: 5 meses).
Nivel de vibración en zona de sellos: mantener por debajo de 3.5 mm/s.
ΔP del filtro de succión: mantener por debajo de 2.5 psi.
Caudal operativo: verificar que se mantenga dentro de la ventana 280–600 GPM.
Temperatura en cámara de sellos: mantener por debajo de 60 °C con el sistema auxiliar en operación normal.
Si los indicadores no alcanzan las metas tras 6 meses de seguimiento, el análisis deberá reevaluarse y las acciones ajustarse según los nuevos hallazgos, manteniendo el ciclo de mejora continua.
Impacto del árbol lógico de fallas en la gestión de activos
La integración de técnicas como la del árbol lógico de fallas dentro de estrategias de mantenimiento transforma a la cultura de organizaciones en el aspecto de la resolución de problemas de forma proactiva. Puesto que, la madurez técnica de las empresas las obliga a entrar en un entorno competitivo en el cuál deben de abandonar los enfoques de reactividad para adoptar una postura analítica frente a las desviaciones operacionales de alto impacto.
Cuando los equipos multidisciplinarios aplican esta herramienta de forma sistemática, logran eliminar los defectos que históricamente consumían el presupuesto de mantenimiento. Asimismo, corregir una deficiencia organizacional produce un efecto multiplicador, porque un mismo vacío en capacitación o en instrumentación suele afectar a múltiples equipos de forma simultánea.
Demostrar el retorno de inversión resulta necesario para asegurar el apoyo de la alta gerencia. El análisis deductivo facilita evaluaciones de costo-beneficio al relacionar cada causa raíz con las pérdidas económicas totales que genera el evento.
En el caso de la bomba P-203
Se ilustró cómo un problema aparentemente relacionado con la calidad del sello mecánico tenía sus raíces en deficiencias operacionales y organizacionales que, de no haberse identificado, habrían perpetuado el ciclo de fallas recurrentes.
Resolver el problema de la bomba generó mejoras que beneficiaron a las cinco bombas del mismo rack, ya que todas carecían de la misma instrumentación y sus operadores enfrentaban idénticas limitaciones de información.
Cuando el costo anual de reemplazo de sellos, las pérdidas de producción por paradas no programadas y los riesgos ambientales por fugas se comparan con la inversión en instrumentación, capacitación y procedimientos, la aprobación de los recursos se agiliza ante la administración.
Conclusión
El árbol lógico de fallas se ha posicionado en diferentes sectores como un instrumento analítico de carácter sistémico para la investigación de incidentes industriales, particularmente en equipos de alta criticidad operativa. Su estructura jerárquica permite que los equipos de trabajo conecten los síntomas visibles con las deficiencias organizacionales subyacentes, empleando un rigor deductivo basado exclusivamente en evidencias comprobables y documentadas. De este modo, la metodología evita que los recursos técnicos de una planta se desperdicien combatiendo de manera cíclica las consecuencias superficiales de problemas crónicos que afectan la competitividad de los activos.
Implementar este nivel de análisis en los departamentos de mantenimiento y operaciones eleva el desempeño global de los activos físicos y la seguridad funcional de las instalaciones. Al documentar y resolver los errores sistémicos relacionados con la falta de procedimientos, la carencia de instrumentación adecuada o las brechas de capacitación del personal, las empresas logran extender el tiempo medio entre fallas (MTBF) de sus equipos críticos. Las soluciones derivadas de esta investigación estructurada mejoran las prácticas laborales tanto en el corto como en el largo plazo, creando un entorno operativo más seguro, eficiente y predecible para todos los involucrados en la cadena productiva.
Adoptar la investigación estructurada de incidentes demanda un compromiso directivo firme que facilite el tiempo, las herramientas y la formación técnica necesaria a los especialistas de planta. Fomentar el cuestionamiento profundo y el uso de diagramas lógicos como práctica habitual continuará impulsando la optimización de los procesos productivos hacia niveles superiores de rentabilidad operativa. Bajo esta perspectiva, cada fallo funcional deja de ser solamente un gasto para convertirse en una oportunidad de mejora que fortalece el futuro de la organización.
Dinos qué te ha parecido el artículo
La técnica del Arbol Lógico de Fallas (LTA) para el Análisis Causa Raíz
Técnico 7 de marzo de 2026Un árbol lógico de fallas (ALF o RCA Logic Tree) representa una herramienta metodológica deductiva esencial dentro del Análisis Causa Raíz (RCA, dotada con carácter científico y enfocada en descubrir las causas subyacentes (con orígenes físicos, humanos y latentes) que provocan eventos no deseados dentro de un entorno operativo que puede ser de un sector industrial, medico, o de cualquier otro sector que demande evaluar incidentes mediante investigaciones formales y estandarizadas.
De forma visual, este arbol se trata básicamente de un diagrama estructurado que desglosa gráficamente un problema principal, el cual va identificando secuencialmente sus modos de manifestación sintomática hasta llegar a los factores sistémicos que lo originaron en primera instancia. Conformando entonces, un mecanismo de investigación que visualiza las relaciones causales mediante la validación rigurosa de hipótesis basadas exclusivamente en evidencias tangibles, permitiendo que el equipo investigador reconstruya la trayectoria técnica del fallo sin desviarse por opiniones subjetivas ni conjeturas que carezcan de sustentos físicos comprobables.
Construir este modelo deductivo implica iniciar obligatoriamente desde la identificación de los síntomas asociados al evento superior que genera la pérdida, conocido formalmente como evento tope. Posteriormente, el esquema desciende hacia los niveles de hechos observables formulando propuestas de suposiciones técnicas, también conocidas como las hipótesis sobre su origen. Cada suposición planteada debe comprobarse utilizando datos duros de campo, del historial operativo y de estudios especiales para descartar aquellas opciones inválidas, garantizando que el camino hacia la raíz sistémica sea una ruta de certezas plenamente documentadas. Al confirmar experimentalmente una trayectoria causal, el grupo identifica con alta precisión los mecanismos que llevaron a los componentes físicos a averiarse, malas practicas organizacionales y las acciones humanas incorrectas que propiciaron el daño material. El desarrollo de la técnica finaliza en su nivel más profundo al encontrar los vacíos organizacionales o raíces latentes que indujeron la desviación humana original.
Para las corporaciones enfocadas en la cultura de la confiabilidad operacional, es importante implementar estas clases de análisis estructurados sobre sus activos más críticos. Tanto el personal técnico como gerencial requieren comprender exactamente por qué ocurren las averías recurrentes o catastróficas para evitar la fuga de capital en gastos innecesarios por intervenciones repetitivas que solo atacan el síntoma superficial y digamos que no a la enfermedad causal del fallo. Aplicar el método deductivo facilita la canalización de los esfuerzos de mantenimiento hacia la resolución definitiva de conflictos crónicos que merman las cuotas de producción. Esto transforma definitivamente la cultura de la empresa, sacándola de la reacción constante para llevarla hacia una gestión predictiva y proactiva del riesgo industrial.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FLos%2520beneficios%2520del%2520%25C3%2581rbol%2520L%25C3%25B3gico%2520de%2520Fallas-1773856400500.png%3Falt%3Dmedia%26token%3D223afc97-2702-44ff-b29b-98859289b3ee&w=1920&q=75)
Esta investigación de incidentes para resolver fallas es considerada, al ejecutarla, una acción de mantenimiento por resolver que busca la sostenibilidad corporativa desde su origen más profundo al evitar paros futuros de la producción por la recurrencia de averías, permitiendo un incremento sustancial en la disponibilidad operativa de los activos físicos de la planta; asimismo, modificar los procedimientos que presenten deficiencias o establecer planes de capacitación adecuados previene eficazmente la reaparición del incidente en equipos similares y maximiza el aprendizaje institucional extraído de cada falla. Optimizar los procesos de esta forma garantiza un elevado retorno de inversión y asegura la rentabilidad financiera a largo plazo, posicionando la investigación de incidentes como el factor estratégico para resguardar la sostenibilidad y seguridad operativa de los complejos modernos.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FMiniaturas%2520Predyc%2520(8)-1773760310534.png%3Falt%3Dmedia%26token%3De1a5084f-04c9-42e1-964f-6e7e919fd45c&w=1920&q=75)
Diferencias metodológicas del árbol lógico de fallas frente a otras técnicas
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252Fsynthid-removed-Gemini_Generated_Image_s3x0bgs3x0bgs3x0-1773760659520.png%3Falt%3Dmedia%26token%3D6c25d306-2bb8-4e89-bd1d-79a97d2d6023&w=1920&q=75)
Al analizar los incidentes industriales es común encontrar métodos que pueden parecer idénticos a simple vista, pero que poseen aplicaciones operativas muy distintas. Comprender estas diferencias garantiza la selección de la herramienta correcta para cada situación particular, evitando que el analista aplique un enfoque predictivo sobre un evento que ya ocurrió o viceversa. El rigor en la distinción técnica es lo que permite que el reporte de investigación sea aceptado con autoridad por las juntas de ingeniería.
Para responder a esto a fondo, basándonos en las normativas internacionales (como la BS EN 62740) y la literatura técnica de ingeniería de confiabilidad, es vital distinguir el Árbol Lógico de Fallas de otras técnicas basadas en diagramas de "árboles" que difieren en su propósito, con el uso de probabilidades y la aplicación del álgebra de Boole.
El Árbol Lógico (RCA) frente al Análisis de Árbol de Fallas (FTA) Tradicional
El análisis de árbol de fallas tradicional se utiliza fundamentalmente de forma probabilística durante las etapas de diseño o evaluación de riesgos para predecir cómo podría ocurrir un evento superior indeseado. Este enfoque emplea Álgebra de Boole y compuertas lógicas estrictas ("Y" and, "O" or) para calcular la probabilidad de un fracaso general combinando las tasas de avería de los componentes individuales. Busca modelar escenarios hipotéticos antes de que se materialicen los problemas, siendo una herramienta de carácter a priori y preventivo.
Por el contrario, el Árbol lógico de fallas aplicado al Análisis Causa Raíz se ejecuta de manera posterior al tiempo sobre eventos que ya han sucedido en la planta. No utiliza reglas booleanas estrictas para calcular probabilidades futuras, sino que traza una línea deductiva basada estrictamente en hechos comprobables del pasado reciente. Mientras que el FTA modela eventos binarios (falló o no falló), el modelo lógico de RCA aborda la complejidad de las decisiones humanas y deficiencias organizacionales que no siempre son estrictamente binarias, convirtiéndose en un instrumento avanzado para la ingeniería que se encarga investigación de fallas e incidentes, cual curiosamente en algunos entornos también es llamada ingeniería forense.
Contraste con el Árbol de Éxito y el Árbol de Eventos
Es importante no confundir estas herramientas con el Árbol de Éxito (Success Tree), que es la imagen especular del FTA. Aunque aplica la misma lógica booleana y cálculos probabilísticos, su "evento tope" determina el éxito del sistema en lugar de su fracaso. Se usa en diseño para asegurar la supervivencia de funciones críticas, a diferencia del enfoque investigativo del RCA.
Por otro lado, el Árbol de Eventos (Event Tree) es una técnica inductiva (hacia adelante). A diferencia de la naturaleza deductiva del árbol lógico de fallas, el árbol de eventos comienza con un evento iniciador y traza todos los posibles caminos o escenarios futuros. Es fundamentalmente probabilístico; a cada barrera de seguridad se le asigna una probabilidad de éxito o falla, permitiendo calcular cuantitativamente el riesgo de distintos escenarios finales, como una recuperación segura o una falla catastrófica.
Distinción del Árbol de Causas (CTM) y el Diagrama de Ishikawa
Según la norma internacional IEC/UNE/BS EN 62740, el Método del Árbol de Causas (CTM) es también una técnica a posteriori, pero se diferencia del Árbol Lógico de RCA en su profundidad y rigor lógico. El CTM utiliza relaciones lógicas más simples (secuencia, conjunción y disyunción) y no desarrolla las relaciones lógicas booleanas en detalle. Es una herramienta excelente para incidentes simples, pero puede quedarse corta ante fallas sistémicas complejas donde el Árbol Lógico de RCA profundiza hasta las raíces latentes.
Finalmente, el Diagrama de Ishikawa (espina de pescado o 6M) es una técnica categórica ideal para lluvias de ideas iniciales agrupando causas bajo clasificaciones genéricas (materiales, métodos, etc.). Sin embargo, carece de la rigurosidad deductiva requerida para correlacionar directamente una causa con una evidencia física o una decisión humana mediante eslabones lógicos. El modelo de árbol lógico aborda esta debilidad exigiendo pruebas contundentes para cada hipótesis, eliminando el riesgo de que la investigación termine siendo una "lluvia de culpas" sin fundamento técnico.
Proceso sistemático de investigación estructurada
La norma internacional BS EN 62740 establece un flujo de trabajo de forma rigurosa para conducir investigaciones de incidentes con resultados objetivos y soluciones que erradiquen o en su defecto mitiguen las recurrencias de falla. Construir un árbol lógico de fallas exige adherirse a las cinco etapas secuenciales del RCA donde cada paso alimenta al siguiente, donde los analistas deben actuar con la disciplina de los métodos científicos.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%25202-1773760809212.png%3Falt%3Dmedia%26token%3D93a8fcd6-9288-4600-99a5-0cfd9bc663be&w=2048&q=75)
Preparación del análisis y conformación del equipo
Antes de iniciar cualquier investigación, el primer paso consiste en que debe definirse con claridad:
Principalmente el problema y estimar su impacto económico sobre el negocio, las métricas como el lucro cesante (parecido al costo de oportunidad, pero en este caso como lo que se dejó de ganar en producción por el paro), los costos de reparación y la frecuencia de ocurrencia permiten dimensionar la inversión justificable en el estudio.
Delimitación del alcance evita que los esfuerzos se dispersen hacia áreas de la planta que no guardan relación directa con el incidente.
Un Equipo Natural de Trabajo (ENT) debe conformarse reuniendo personas con conocimiento profundo del sistema afectado. Este grupo multidisciplinario incluye, como mínimo, un facilitador neutral que guíe la metodología, un operador que conozca el comportamiento del equipo en servicio, un mantenedor familiarizado con el historial de intervenciones y especialistas según la complejidad del caso. La diversidad de perspectivas dentro del ENT reduce el riesgo de sesgos individuales durante la formulación de hipótesis.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FENT-1773783727429.jpeg%3Falt%3Dmedia%26token%3D248d9623-5427-43cf-8343-71bc8b9272aa&w=1920&q=75)
Recolección estratégica de información mediante las cuatro P
La segunda etapa consiste en recabar toda la información relevante del evento.
Los integrantes del equipo deben consultar los registros del sistema computarizado de gestión del mantenimiento (CMMS), manuales de operación, reportes de monitoreo de condición, avisos de averías y testimonios del personal de planta que estuvo presente durante el incidente.
Establecer una línea de tiempo precisa resulta indispensable para visualizar la secuencia exacta de eventos previos al problema. Esta cronología ayuda a identificar desviaciones que pudieron pasar desapercibidas bajo la presión operativa del momento. Para estructurar el levantamiento de datos, se recomienda documentar las denominadas cuatro P del evento, que responden a qué posición tenían los equipos, qué personas estaban involucradas, qué partes del activo resultaron dañadas y qué tipo de papeles (documentación) o procedimientos se encontraban vigentes o en default durante la falla.
Construcción de la lógica deductiva y reglas de parada
El proceso de armar la lógica deductiva es prácticamente el núcleo donde cobra vida el árbol lógico de fallas. Con la información recopilada, se estructura el diagrama descendiendo paso a paso mediante la pregunta central del método:
¿cómo pudo ocurrir el evento inmediatamente superior?
Ahora, cada factor causal que es propuesto como hipótesis debe validarse antes de continuar al siguiente nivel de profundidad, las rutas confirmadas por evidencias se marcan en el diagrama y las hipótesis descartadas quedan documentadas con su respectiva justificación técnica, garantizando que no se vuelvan a proponer sin fundamento en el futuro. Además, las reglas de parada determinan el punto exacto donde la investigación ha encontrado deficiencias gestionables por la administración, es decir, las causas raíces latentes u organizacionales.
Establecimiento del plan de acción y seguimiento
Al concluir el análisis, el equipo debe formular un plan de acción concreto para eliminar o en el defecto mitigar las causas fundamentales identificadas, las soluciones propuestas requieren un seguimiento mediante indicadores clave de desempeño (KPI) para confirmar su efectividad real en la operación de campo, si los resultados no alcanzan los objetivos esperados, se reevalúa el proceso y se ejecutan los ajustes necesarios, manteniendo activo el ciclo de la mejora continua.
Estructura y niveles jerárquicos de un árbol lógico de fallas
El diseño gráfico de esta herramienta posee una arquitectura jerárquica que guía al investigador desde el síntoma hasta la causa. Cada nivel cumple un propósito específico dentro de la cadena deductiva.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FArbol%2520L%25C3%25B3gico%2520de%2520Fallas-1773786696366.png%3Falt%3Dmedia%26token%3D11903df0-5e80-486c-878f-a09659211513&w=2048&q=75)
El evento tope y los hechos observables
En la parte superior del diagrama se coloca el enunciado del problema principal que justifica la inversión de recursos en la investigación.
Este evento tope debe redactarse únicamente indicando la pérdida de la función deseada sin incluir suposiciones sobre sus posibles orígenes. Representa la consecuencia final que experimenta el negocio, como una parada de producción o la pérdida de contención de fluidos.
Inmediatamente debajo del evento superior se ubican los hechos, que corresponden a los modos de falla observados directamente por el personal técnico.
Es importante que aclaremos que un mismo problema puede manifestarse a través de múltiples síntomas simultáneos o secuenciales. Estos elementos conforman verdades respaldadas por evidencias sensoriales, ensayos, pruebas y mediciones instrumentales o registros de los sistemas de control.
Cuando existen varios hechos, el ENT les asigna un peso % (porcentual) según su contribución al problema global, lo que permite priorizar qué rama del árbol desarrollar primero.
Formulación y validación técnica de hipótesis
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%25206-1773793883891.png%3Falt%3Dmedia%26token%3D10bb6a38-0f8a-44a7-87b2-bd28e767c0b6&w=2048&q=75)
Al desconocer las razones directas que provocaron los hechos observables, el equipo formulará escenarios explicativos mediante técnicas como una lluvia de ideas guiada. En donde, las hipótesis representan todas las causas potenciales que técnicamente podrían generar el modo de falla que es analizado según las leyes de la física y la mecánica aplicables.
Incluir opciones poco probables, pero físicamente posibles es necesario para evitar que sesgos cognitivos oculten la verdadera raíz del problema (teniendo en cuenta, que se proponen y se marcan utilizando la coherencia con la delicadeza de no menospreciar las ideas del grupo, por lo que a su vez podrían descartarse en el momento con el tacto y tecnicismo adecuado para la consideración de la hipótesis planteada).
Ninguna hipótesis se considera verdadera sin atravesar un proceso de verificación con métodos específicos. Así, que el equipo debe definir para cada suposición las herramientas de comprobación aplicables, ya sean END como inspecciones visuales, análisis de espectros de vibración o pruebas de laboratorio, mediciones de variables de proceso y entrevistas al personal.
Las opciones descartadas se van marcando en el árbol para documentar que fueron investigadas.
Raíces físicas, humanas y latentes organizacionales
Descendiendo por las ramas que van siendo validadas, se encuentran;
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FCausas%2520F%25C3%25ADsicas-1773849841877.png%3Falt%3Dmedia%26token%3Db66d77d1-0d1f-4c57-bd30-ce0f4a11e565&w=1200&q=75)
Las raíces físicas, es decir, los componentes tangibles que sufrieron daño directo y cuya sustitución restaura temporalmente la operatividad del equipo. La investigación no puede detenerse aquí, pues el mecanismo que originó el deterioro probablemente seguirá presente en el sistema generando un ciclo repetitivo de fallas. Toda pieza dañada es consecuencia de alguna intervención o decisión inapropiada por parte de las personas involucradas en el ciclo de vida del activo (esto incluye las piezas que tienen cierto rango de envejecimiento o antigüedad por así decirlo, respecto a componentes que cumplen con su ciclo de vida natural y que es recomendable o no cambiar antes de un evento).
Las raíces humanas identifican errores de comisión u omisión durante el diseño, la operación o el mantenimiento. Señalar al trabajador como único responsable resulta contraproducente, ya que las personas generalmente actúan con base en la información, las herramientas y el entrenamiento que la organización les proporciona.
Las raíces latentes u organizacionales conforman el nivel más profundo y valioso del análisis. Revelan deficiencias en los sistemas gerenciales que indujeron al trabajador a cometer el error identificado en el nivel anterior. La ausencia de procedimientos estandarizados, la falta de programas de capacitación o las políticas de compras centradas exclusivamente en el precio mínimo representan ejemplos frecuentes de estas causas que la administración tiene la facultad de corregir para proteger la confiabilidad de toda la instalación.
Las raíces latentes u organizacionales conforman el nivel más profundo y valioso del análisis. Revelan deficiencias en los sistemas gerenciales que indujeron al trabajador a cometer el error identificado en el nivel anterior. La ausencia de procedimientos estandarizados, la falta de programas de capacitación o las políticas de compras centradas exclusivamente en el precio mínimo representan ejemplos frecuentes de estas causas que la administración tiene la facultad de corregir para proteger la confiabilidad de toda la instalación.
Desarrollo de un árbol lógico de fallas con un caso práctico industrial
Para demostrar el alcance analítico de esta metodología, se presenta a continuación un caso simplificado donde se aplican los pasos descritos anteriormente sobre un equipo rotativo de una refinería. El desarrollo sigue fielmente los niveles jerárquicos del árbol lógico, desde la definición del evento tope hasta la identificación de las causas latentes organizacionales.
Paso 1. Definición del problema
Alcance: Analizar las fallas prematuras recurrentes en el sello mecánico de la bomba centrífuga P-203 del sistema de transferencia de gasoil de la unidad de destilación, con el fin de identificar las causas reales que las provocan y establecer recomendaciones que permitan eliminarlas o reducirlas a niveles tolerables.
Propósito: Eliminar las fallas prematuras del sello mecánico o llevarlas a una frecuencia aceptable, mejorando la disponibilidad operativa de la bomba y minimizando los riesgos ambientales asociados a las fugas de gasoil al entorno de la planta.
Paso 2. Entendimiento del problema
Datos técnicos del equipo:
Parámetro | Especificación |
|---|---|
Equipo | Bomba centrífuga horizontal |
Designación/Etiqueta/Código de Equipo | P-203 |
Tipo | API 610, OH2 (una etapa, voladizo) |
Año de instalación | 2015 |
Caudal de diseño (BEP) | 500 GPM |
Cabezal de diseño | 350 ft |
Velocidad nominal | 3560 RPM |
Fluido manejado | Gasoil a 45 °C |
Accionamiento | Motor eléctrico de 75 HP |
Tipo de sello | Mecánico simple, plan API 11 |
NPSH requerido (al BEP) | 9 ft |
Flujo mínimo estable | 280 GPM |
Contexto operacional: La bomba P-203 forma parte del sistema de transferencia de gasoil desde los tanques de almacenamiento intermedio hacia la unidad de mezcla (blending) de la refinería. Opera en servicio continuo durante las campañas de producción, con paradas planificadas cada seis meses. El sistema cuenta con un filtro tipo canasta en la línea de succión, válvulas de seccionamiento manuales y una válvula de control en la descarga. La demanda de caudal varía según el programa de mezcla de productos, lo que exige ajustes frecuentes en las condiciones operativas.
Antecedentes:
N° | Fecha | Actividad | Resultado |
|---|---|---|---|
1 | Mar 2024 | Instalación de sello mecánico nuevo | Vibración inicial aceptable: 2.1 mm/s |
2 | Jun 2024 | Reporte de operador: ruido inusual en la bomba durante picos de demanda | No se tomó acción. Ruido clasificado como "normal" por el turno |
3 | Ago 2024 | Análisis de vibración programado | Nivel: 7.8 mm/s. Diagnóstico: componentes de baja frecuencia y banda ancha. Alta temperatura en cámara de sellos: 78 °C (lado libre) |
4 | Sep 2024 | Fuga visible por el sello mecánico. Parada no programada | Inspección: caras del sello con erosión tipo picadura (pitting) y desgaste acelerado en anillo primario |
5 | Oct 2024 | Reemplazo del sello. Bomba operativa | Mismo patrón de ruido reaparece a las 3 semanas. Se convoca ENT para RCA |
Establecimiento de hechos (Hoja de registro de información):
Pregunta | Respuesta |
|---|---|
¿Qué equipo y componentes participaron? | Bomba centrífuga P-203; componente: sello mecánico. Variables: vibración, temperatura, ruido |
¿Cuándo ocurrió la falla más reciente? | 15 de septiembre de 2024, turno diurno, 14:30 h |
¿Dónde ocurrió? | Área de transferencia de gasoil, rack de bombas P-201 a P-205 |
¿Quién aporta información? | (Hipotéticos para el caso): Luis Martínez (Operador), Carlos Herrera (Supervisor Mecánico), Ana Rivas (Analista de Monitoreo de Condición) |
¿Opiniones del personal? | Operador: "la bomba hace ruido cuando se baja el flujo". Supervisor: "los sellos vienen defectuosos". Analista: "el espectro muestra cavitación, no fallas mecánicas" |
Cursos recomendados
Paso 3. Identificación de la causa raíz mediante el árbol lógico de fallas
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FRCA%2520Ejemplo%252001-1773850780021.png%3Falt%3Dmedia%26token%3Ddbe4616a-9085-4915-ad22-a0174d7976e7&w=1920&q=75)
Evento tope (Nivel A): Fallas prematuras recurrentes en el sello mecánico de la bomba centrífuga P-203 del sistema de transferencia de gasoil.
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%25208-1773850934338.png%3Falt%3Dmedia%26token%3D8d1f991a-c0c5-4ab9-9aaa-b045f63228cd&w=2048&q=75)
Hechos observados (Nivel B):
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%25209-1773851030110.png%3Falt%3Dmedia%26token%3D8113e0ac-7518-4658-b174-970565e4fe50&w=1920&q=75)
Se identificaron dos hechos concurrentes que contribuyen al deterioro del sello:
Alta vibración con componentes de baja frecuencia; Contribución estimada: 55%. Los registros del analizador portátil muestran niveles generales provenientes de la transformada rápida de Fourier (FTT) con 7.8 mm/s con componentes sub-síncronas y banda ancha de alta frecuencia.
Alta temperatura en la cámara de sellos; Contribución estimada: 45%. Mediciones termográficas reportan 78 °C en el lado libre, frente a 52 °C de referencia en condiciones normales.
Dado su mayor peso porcentual, el ENT decidió desarrollar primero la rama de alta vibración.
Hipótesis del Nivel C (origen de la alta vibración):
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252010-1773851166150.png%3Falt%3Dmedia%26token%3D14cca1ca-572f-4312-bc81-2f0bf092089c&w=2048&q=75)
El equipo planteó dos hipótesis para explicar la vibración anómala:
Hipótesis C1: Origen mecánico. Se verificó mediante revisión de los análisis espectrales de vibración y la inspección visual de componentes internos durante el último desmontaje. En los espectros no se observaron frecuencias dominantes a 1X ni 2X con las características típicas de desalineación angular o paralela, ni armónicos asociados a desbalanceo o holgura mecánica. La inspección de los rodamientos no mostró patrones de desgaste por precarga asimétrica. Resultado: hipótesis descartada.
Hipótesis C2: Origen hidráulico. Se verificó mediante análisis espectral de la forma de onda y entrevistas al personal operativo. Los espectros mostraron una banda ancha de alta frecuencia y componentes sub-síncronas que son señales características de cavitación e inestabilidad hidráulica. El operador del turno diurno confirmó que el ruido tipo cascajo o trituración de grava se intensificaba durante los períodos de bajo caudal, cuando la demanda de la unidad de mezcla disminuía. Resultado: hipótesis confirmada. El ENT procedió a profundizar esta rama.
Matriz de verificación C3:
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252011-1773851946389.png%3Falt%3Dmedia%26token%3D0529a7a2-97bf-4a52-a61b-ecedacd77c6d&w=2048&q=75)
Sub-hipótesis del Nivel D (dentro del origen hidráulico):
Para identificar el mecanismo hidráulico específico, se formularon tres sub-hipótesis:
Hipótesis D1: Cavitación por NPSH disponible insuficiente. Se realizó el cálculo de NPSH disponible considerando las condiciones reales de operación y se comparó con el NPSH requerido según la curva del fabricante al caudal operativo registrado. El resultado arrojó un NPSHd de 8.2 ft frente a un NPSHr de 12 ft al caudal medido, lo que confirma operación en zona de cavitación. Al desmontar el impulsor se observaron marcas de erosión tipo picadura (pitting) en los álabes del lado de succión, patrón consistente con daño por cavitación sostenida. Resultado: hipótesis confirmada (contribución estimada: 60%).
Hipótesis D2: Recirculación en succión por operación a bajo flujo. Sin medidor de flujo permanente instalado, se realizó una medición temporal con caudalímetro ultrasónico portátil durante una jornada operativa típica. El caudal registrado fue de 180 GPM, muy por debajo del flujo mínimo estable de 280 GPM indicado por el fabricante. La bomba estaba operando de forma crónica al 36% de su punto de máxima eficiencia (BEP = 500 GPM). Bajo esta condición se generan vórtices de recirculación en el ojo del impulsor que producen las fluctuaciones de presión detectadas en los espectros. Resultado: hipótesis confirmada (contribución estimada: 40%).
Hipótesis D3: Vaporización del fluido por exceso de temperatura. Se realizó termografía infrarroja en la tubería de succión y se comparó la temperatura del gasoil (47 °C) con la temperatura máxima de diseño (60 °C). La presión de vapor del fluido a 47 °C no excede la presión disponible en la línea de succión. Resultado: hipótesis descartada.
Matriz de verificación Nivel D:
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252012-1773852053549.png%3Falt%3Dmedia%26token%3D516b5be8-bd87-4aae-9260-910f8ffd8694&w=2048&q=75)
Camino | Hipótesis | Método de verificación | Responsable | Resultado |
|---|---|---|---|---|
Origen hidráulico | D1: Cavitación (NPSHd < NPSHr) | Cálculo de NPSH; inspección de impulsor | Ing. de proceso + C. Herrera | Confirmada. NPSHd=8.2 ft vs NPSHr=12 ft. Pitting en álabes |
Origen hidráulico | D2: Recirculación por bajo flujo | Medición ultrasónica portátil; revisión curva fabricante | A. Rivas + Operador | Confirmada. 180 GPM vs. 280 GPM mín. Opera al 36% BEP |
Origen hidráulico | D3: Vaporización por alta temp. | Termografía infrarroja; comparación P. vapor vs. P. succión | A. Rivas | Descartada. Temp. y presión dentro de rango de diseño |
Causas verificadas del Nivel E:
Al profundizar en los mecanismos confirmados, el ENT identificó las condiciones específicas que generaban la cavitación y la recirculación:
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252013-1773852374845.png%3Falt%3Dmedia%26token%3D34e94e46-888d-4ed0-a02c-c5a2768737a0&w=1920&q=75)
E1: Válvula de succión parcialmente cerrada. Durante la inspección en sitio, se encontró la válvula HV-203A al 60% de apertura. Al entrevistar al operador Luis Martínez, este confirmó haber reducido la apertura "para bajar la presión de descarga cuando la unidad de mezcla no pide tanto producto".
Por lo tanto, la pérdida de carga adicional generada por la restricción fue calculada en 6.3 ft, suficiente para hacer que el NPSHd cayera por debajo del requerido.
E2: Filtro de succión obstruido. La medición de presión diferencial en el filtro tipo canasta arrojó un ΔP de 4.8 psi, frente al ΔP de diseño de 1.2 psi con elemento limpio. Al desmontar el filtro se encontró una acumulación considerable de sedimentos y productos de corrosión del tanque de almacenamiento. El último mantenimiento registrado del filtro era de 14 meses atrás....
E3: Operación sostenida por debajo del flujo mínimo estable. La medición ultrasónica confirmó un caudal operativo crónico de 180 GPM. Sin un medidor permanente instalado ni las curvas de la bomba disponibles en campo, de modo que el personal operativo no contaba con referencia alguna para determinar si el equipo trabajaba dentro de su ventana operativa segura.
Errores humanos identificados (Nivel F) y Causas latentes u organizacionales identificadas (Nivel G):
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252014-1773852936999.png%3Falt%3Dmedia%26token%3Dee43beb4-6ec7-4fc6-993a-8563be336338&w=2048&q=75)
F1: El operador redujo la apertura de la válvula de succión para controlar la presión de descarga, sin conocer que esta maniobra reduce drásticamente el NPSH disponible y provoca cavitación.
F2: No se realizó la limpieza del filtro de succión en 14 meses, a pesar de que las condiciones del tanque de almacenamiento (presencia de sedimentos) exigían una frecuencia mayor.
F3: Nadie en el equipo de operaciones monitoreaba el caudal de la bomba ni lo verificaba contra los límites del fabricante, permitiendo la operación crónica fuera de rango.
Al investigar por qué el personal incurrió en estos errores, el ENT descubrió las siguientes deficiencias organizacionales:
No existe un procedimiento operativo que establezca las posiciones requeridas de las válvulas de succión y descarga para cada escenario de demanda, ni que prohíba el estrangulamiento de la succión como método de regulación de presión.
El personal operativo no ha recibido capacitación sobre las limitaciones hidráulicas de las bombas centrífugas, incluyendo conceptos como el Punto de Máxima Eficiencia (BEP), el flujo mínimo estable, el NPSH y las consecuencias de operar fuera de estos rangos.
No existe plan de mantenimiento preventivo para el filtro de succión. La tarea de limpieza no figura en el CMMS, por lo que depende exclusivamente de la memoria del personal y no cuenta con una frecuencia definida ni con criterios de intervención basados en condición (ΔP).
No se ha instalado instrumentación de presión diferencial en el filtro de succión que permita detectar la obstrucción progresiva antes de que alcance niveles críticos.
No se ha instalado medidor de flujo en la descarga de la bomba. La norma API 610 recomienda instrumentación de caudal para el monitoreo operativo de bombas en servicio continuo, y su ausencia impide que operadores y mantenedores detecten condiciones de bajo flujo.
Las curvas de desempeño de la bomba proporcionadas por el fabricante no fueron difundidas al personal de operaciones ni se encuentran disponibles en sala de control o en campo. Sin esta referencia, es imposible determinar si el equipo trabaja dentro de su ventana segura.
No existe procedimiento de inspección del sistema auxiliar del sello (Plan API 11). Las tuberías, orificios de recirculación y conexiones del circuito de enfriamiento del sello no figuran como tarea en el CMMS ni en ningún plan de mantenimiento preventivo.
No se ha instalado sensor de temperatura en la cámara del sello ni en la línea de retorno del Plan API 11. Sin esta medición, las desviaciones térmicas que degradan el lubricante y aceleran el desgaste de las caras pasan desapercibidas hasta que se produce la fuga.
Desarrollo de la rama B2 correspondiente a la alta temperatura en la cámara de sellos
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252015-1773855906692.png%3Falt%3Dmedia%26token%3Dcb3cea91-ce0b-4d29-9b8d-a4ed5d7466b4&w=2048&q=75)
Completado el análisis de la rama de vibración, el ENT abordó el segundo hecho observado.
La termografía infrarroja registró 78 °C en el lado libre de la cámara del sello, frente a los 52 °C de referencia normal. Además que, durante un desmontaje previo se habían encontrado residuos de coque en el alojamiento, lo cual es indicativo de degradación del aceite lubricante por exposición prolongada a temperatura excesiva.
Hipótesis C3: Sistema de enfriamiento del sello deficiente. El sello opera bajo un Plan API 11 (recirculación del fluido de proceso desde la descarga hacia la cámara del sello a través de un orificio calibrado). Al inspeccionar el circuito completo, se encontró el orificio de retorno parcialmente obstruido por depósitos de coque y partículas. El flujo de recirculación medido estaba reducido al 30% del nominal, y la temperatura del fluido dentro de la cámara alcanzaba 85 °C frente a los 55 °C de diseño. Resultado: hipótesis confirmada.
Hipótesis C4: Fricción excesiva por desalineación del sello. Se realizó inspección dimensional del eje y la cámara del sello. El run-out axial medido fue de 0.02 mm, dentro de la tolerancia establecida por la norma API 682 para sellos mecánicos. La concentricidad del alojamiento también se encontró dentro de especificación, y las caras del sello presentaban un patrón de desgaste uniforme sin marcas de contacto asimétrico. Resultado: hipótesis descartada.
Al profundizar en la hipótesis confirmada, se identificó que la obstrucción del orificio del Plan API se originó porque el sistema auxiliar del sello nunca fue incluido en las rutinas de inspección ni de mantenimiento preventivo desde la instalación del equipo. Las raíces latentes identificadas fueron dos. Primero, no existe un procedimiento de inspección del sistema auxiliar del sello (tuberías, orificios y conexiones del Plan API) ni figura como tarea en el CMMS. Segundo, no se ha instalado un sensor de temperatura en la cámara del sello ni en la línea de retorno del Plan API 11 que permita detectar desviaciones térmicas antes de que se produzca daño en las caras.
La imagen completa del árbol lógico de fallas termina a continuación;
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252016-1773875084699.png%3Falt%3Dmedia%26token%3Ddc75eb33-2bd4-4b2d-b8dd-74977306adcf&w=3840&q=75)
Paso 4. Plan de acción
%2520para%2520el%2520An%25C3%25A1lisis%2520Causa%2520Ra%25C3%25ADz%252FImagen%252016-1773875357729.png%3Falt%3Dmedia%26token%3Db690d9ae-8ded-4ca5-95fc-9dc9d086f0b8&w=1920&q=75)
Con las ocho causas latentes identificadas entre ambas ramas del árbol, el ENT formuló el siguiente plan de solución:
Elaborar un procedimiento operativo (como un manual) para la bomba P-203 que incluya las posiciones de válvulas para cada escenario de demanda, los rangos de flujo permitidos y la prohibición explícita de estrangular la succión como método de regulación.
Implementar un programa de capacitación para operadores y supervisores que cubra los fundamentos hidráulicos de bombas centrífugas, con énfasis en BEP, flujo mínimo, NPSH y consecuencias de la cavitación y la recirculación.
Incorporar la limpieza del filtro de succión al plan de mantenimiento preventivo en el CMMS, con una frecuencia inicial de 3 meses, ajustable según la evolución del ΔP.
Instalar un transmisor de presión diferencial en el filtro de succión, integrado al sistema SCADA con alarma de alta.
Instalar un medidor de flujo en la descarga de la P-203, con indicación local y remota en sala de control, y configurar alarma por bajo caudal al valor del flujo mínimo estable (280 GPM).
Reproducir las curvas de la bomba en formato de cartelera técnica y ubicarlas en sala de control y en el área de la bomba para consulta permanente del personal.
Elaborar procedimientos de inspección del sistema auxiliar del sello (Plan API 11) que incluya la verificación periódica del orificio de recirculación, tuberías y conexiones, e incorporarlo al plan de mantenimiento preventivo del CMMS.
Instalar un sensor de temperatura (RTD o termopar) en la cámara del sello con indicación en sala de control y alarma por alta temperatura, para detectar desviaciones térmicas antes de que las caras del sello sufran daño.
Paso 5. Monitoreo del sistema y ajuste continuo
Tras la implementación de las acciones, el equipo definió los siguientes indicadores de seguimiento:
Tiempo medio entre fallas (MTBF) del sello mecánico: objetivo mínimo de 18 meses (anterior: 5 meses).
Nivel de vibración en zona de sellos: mantener por debajo de 3.5 mm/s.
ΔP del filtro de succión: mantener por debajo de 2.5 psi.
Caudal operativo: verificar que se mantenga dentro de la ventana 280–600 GPM.
Temperatura en cámara de sellos: mantener por debajo de 60 °C con el sistema auxiliar en operación normal.
Si los indicadores no alcanzan las metas tras 6 meses de seguimiento, el análisis deberá reevaluarse y las acciones ajustarse según los nuevos hallazgos, manteniendo el ciclo de mejora continua.
Impacto del árbol lógico de fallas en la gestión de activos
La integración de técnicas como la del árbol lógico de fallas dentro de estrategias de mantenimiento transforma a la cultura de organizaciones en el aspecto de la resolución de problemas de forma proactiva. Puesto que, la madurez técnica de las empresas las obliga a entrar en un entorno competitivo en el cuál deben de abandonar los enfoques de reactividad para adoptar una postura analítica frente a las desviaciones operacionales de alto impacto.
Cuando los equipos multidisciplinarios aplican esta herramienta de forma sistemática, logran eliminar los defectos que históricamente consumían el presupuesto de mantenimiento. Asimismo, corregir una deficiencia organizacional produce un efecto multiplicador, porque un mismo vacío en capacitación o en instrumentación suele afectar a múltiples equipos de forma simultánea.
Demostrar el retorno de inversión resulta necesario para asegurar el apoyo de la alta gerencia. El análisis deductivo facilita evaluaciones de costo-beneficio al relacionar cada causa raíz con las pérdidas económicas totales que genera el evento.
En el caso de la bomba P-203
Se ilustró cómo un problema aparentemente relacionado con la calidad del sello mecánico tenía sus raíces en deficiencias operacionales y organizacionales que, de no haberse identificado, habrían perpetuado el ciclo de fallas recurrentes.
Resolver el problema de la bomba generó mejoras que beneficiaron a las cinco bombas del mismo rack, ya que todas carecían de la misma instrumentación y sus operadores enfrentaban idénticas limitaciones de información.
Cuando el costo anual de reemplazo de sellos, las pérdidas de producción por paradas no programadas y los riesgos ambientales por fugas se comparan con la inversión en instrumentación, capacitación y procedimientos, la aprobación de los recursos se agiliza ante la administración.
Conclusión
El árbol lógico de fallas se ha posicionado en diferentes sectores como un instrumento analítico de carácter sistémico para la investigación de incidentes industriales, particularmente en equipos de alta criticidad operativa. Su estructura jerárquica permite que los equipos de trabajo conecten los síntomas visibles con las deficiencias organizacionales subyacentes, empleando un rigor deductivo basado exclusivamente en evidencias comprobables y documentadas. De este modo, la metodología evita que los recursos técnicos de una planta se desperdicien combatiendo de manera cíclica las consecuencias superficiales de problemas crónicos que afectan la competitividad de los activos.
Implementar este nivel de análisis en los departamentos de mantenimiento y operaciones eleva el desempeño global de los activos físicos y la seguridad funcional de las instalaciones. Al documentar y resolver los errores sistémicos relacionados con la falta de procedimientos, la carencia de instrumentación adecuada o las brechas de capacitación del personal, las empresas logran extender el tiempo medio entre fallas (MTBF) de sus equipos críticos. Las soluciones derivadas de esta investigación estructurada mejoran las prácticas laborales tanto en el corto como en el largo plazo, creando un entorno operativo más seguro, eficiente y predecible para todos los involucrados en la cadena productiva.
Adoptar la investigación estructurada de incidentes demanda un compromiso directivo firme que facilite el tiempo, las herramientas y la formación técnica necesaria a los especialistas de planta. Fomentar el cuestionamiento profundo y el uso de diagramas lógicos como práctica habitual continuará impulsando la optimización de los procesos productivos hacia niveles superiores de rentabilidad operativa. Bajo esta perspectiva, cada fallo funcional deja de ser solamente un gasto para convertirse en una oportunidad de mejora que fortalece el futuro de la organización.
Dinos qué te ha parecido el artículo





%252FRAMPREDYC.webp%3Falt%3Dmedia%26token%3D0ef608dc-cd45-4601-a211-997dda9326df&w=3840&q=75)



