Logo Predyc
Predyc

Modos de falla, Mecanismos de Daño y Nivel de Causalidad en el RCM

 Articulo 28 de abril de 2026
Román Ventura
Autor: Román VenturaIngeniero de Mantenimiento Industrial, Especialista Jr. en Ingeniería de Confiabilidad y Gestión de Activos.
EmailLinkedIn

Los Modos de Fallas son un evento único que causa que un activo físico deje de cumplir una función al estándar de desempeño que su usuario requiere. Dentro de la metodología de Mantenimiento Centrado en la Confiabilidad (RCM), este concepto responde a la tercera pregunta de su proceso y no puede responderse correctamente sin haber identificado antes qué se espera del activo y de qué manera puede fallar en cumplirlo.

La normativa UNE EN 60300-3-11. (2009). Define al modo de fallo de manera concisa como la "manera en la que ocurre un fallo". Básicamente, estos modos de fallas son las formas en que las causas físicas desencadenan a la falla funcional, y entenderlo con precisión es lo que permite seleccionar las tareas de mantenimiento que realmente prevengan o detecten el deterioro antes de que se pierda la función. Adicionalmente, señala que existen algunos mecanismos específicos de degradación que ocurren mediante los procesos, y son los responsables de dar lugar a los fallos funcionales

Gestión de la confiabilidad Parte 3-11: Guía de aplicación: Mantenimiento centrado en la fiabilidad
Gestión de la confiabilidad Parte 3-11: Guía de aplicación: Mantenimiento centrado en la fiabilidad

La razón por la que estas diferencias técnicas importan en la práctica tiene mucho que ver con el dinero y la seguridad.

Cuando los modos de falla se describen de manera vaga, las tareas de mantenimiento que se desprenden son igualmente vagas, y un plan vago consume recursos sin reducir riesgo.

Que un motor vibre no es un modo de falla en sí (al menos, no hasta cierta medida todos los equipos rotativos, reciprocantes y hasta los estáticos lo hacen); que el rodamiento presenta fatiga bajo la superficie de su pista exterior sí lo es.

Saber identificar ese tipo de diferencias con precisión para determinar qué herramienta diagnóstica se usa, con qué frecuencia y quién la ejecuta.

Los Modos de Fallas desde Diferentes Fuentes
Los Modos de Fallas desde Diferentes Fuentes

Para los ingenieros de confiabilidad, los facilitadores de RCM y el personal técnico que opera y mantiene los equipos, comprender bien este concepto define la frontera entre un plan de mantenimiento defendible y uno que se construyó sobre suposiciones.

El proceso de identificación se realiza en las sesiones del Equipo Natural de Trabajo mediante la combinación del historial de fallas del CMMS, los manuales del fabricante y el conocimiento técnico del personal. Allí se listan los modos de falla probables que incluyen tanto los eventos ocurridos como los prevenidos por el mantenimiento actual y aquellos que, sin haber sucedido, son creíbles en el contexto operativo. Finalmente, cada declaración integra el componente afectado con su proceso físico correspondiente.

El propósito final de definir bien los modos de falla es construir un plan de mantenimiento auditable donde cada tarea exista porque mitiga un riesgo identificado.

Eso se convierte en disponibilidad operativa, reducción de paradas imprevistas y, en los modos de falla con consecuencias sobre personas o ambiente, en seguridad industrial real.

La falla funcional como punto de partida del análisis

Antes de hablar de modos de falla hay que entender muy bien qué los precede.

Una falla funcional es la incapacidad de un activo para cumplir una función específica al nivel de desempeño que el usuario considera aceptable.

En términos del RCM, es la negación de la función:

si la función dice "transferir agua del tanque A al tanque B a no menos de 800 litros por minuto", la falla funcional ocurre cuando eso deja de suceder, sea de forma total o parcial.

Pérdida total y pérdida parcial de la función

  • La pérdida total ocurre cuando el activo deja de realizar cualquier acción asociada a su función operativa. Un ejemplo claro es una bomba que no gira o que simplemente no entrega flujo alguno.

    • Esta pérdida total suele ser evidente porque el operador la detecta casi de inmediato al detenerse el proceso o activarse una alarma.

  • Por otra parte, la pérdida parcial resulta más sutil y se presenta con mayor frecuencia en entornos industriales reales. Esto sucede cuando el equipo continúa operando pero no cumple con los niveles de desempeño esperados, como ocurre si una bomba entrega 600 litros por minuto en lugar de los 800 requeridos.

    • A diferencial de la total, la pérdida parcial puede pasar inadvertida durante semanas si falta instrumentación adecuada o si los parámetros de calidad del producto no reciben un seguimiento minucioso.

      • Desde la perspectiva del proceso productivo, esa unidad se encuentra en estado de falla, aunque físicamente mantenga su movimiento, y, el plan de mantenimiento debe contemplar la gestión de ambos escenarios.

En este punto radica gran parte del riesgo operacional. Debido a que un activo que presenta fallas parciales puede no generar la urgencia de intervención inmediata, pero sí permite la acumulación de daños secundarios y deteriora la calidad del servicio ofrecido.

El modo de falla en el RCM y su diferencia con la ISO 14224

Aquí aparece una gran distinción técnica que conviene aclarar porque genera confusión y discusiones frecuentes entre los equipos de trabajo.

El término modo de falla no significa lo mismo en todas las normativas.

Modos de Falla; ISO 14224 vs SAE
Modos de Falla; ISO 14224 vs SAE

Los modos de falla según la ISO 14224

La norma ISO 14224, que establece criterios para la recolección y el intercambio de datos de confiabilidad en la industria petrolera y petroquímica, describe el modo de falla como la forma en que se manifiesta la falla. Veamos algunas de estas formas:

La vibración alta, falla de arranque, fuga externa o el sobrecalentamiento son descriptores del síntoma observable.

Estos elementos están diseñados para estandarizar los registros en el sistema de gestión de mantenimiento asistido por computadora (CMMS) y permitir comparaciones entre plantas, fabricantes y diversas bases de datos de confiabilidad.

Esta función resulta válida y útil para el análisis estadístico.

Un código de vibración alta, registrado dentro de un sistema en un rango de 15 a 20 órdenes de alerta y trabajo durante el último año permite realizar un análisis de Pareto, identificar un activo problemático y priorizar recursos con mayor eficiencia.

Sin embargo, ese nivel de descripción no es suficiente para seleccionar una tarea de mantenimiento proactiva que evite la repetición del evento. Para lograr un mantenimiento efectivo, se requiere ir más allá del síntoma y determinar la causa raíz del fallo.

Lo que exige el RCM en la definición del modo de falla

El estándar SAE JA1011, que rige los criterios de evaluación para procesos de RCM, requiere algo más específico. Desde esta perspectiva, el modo de falla es la causa de la falla funcional, no su manifestación. Y esa causa debe describirse con suficiente detalle para que sea posible definir una política de gestión de fallas aplicable.

La forma práctica de lograr eso es combinar dos elementos en cada declaración: el ítem mantenible afectado y el mecanismo de deterioro que lo compromete.

  • Desde la ISO 14224; Rodamiento desalineado. (Identifica la pieza, pero no el proceso que la llevó a ese estado).

  • Con la SAEJ1012; Rodamiento con fatiga de contacto por desalineación del eje. (Describe la pieza y el fenómeno físico, lo que permite determinar la técnica adecuada como; el análisis de vibraciones con el espectro de frecuencias en bandas de defecto, logrando así detectar la degradación antes de que afecte su funcionamiento.

Esta diferencia de nivel entre la ISO 14224 y el RCM no implica que una sea mejor que la otra. Son instrumentos distintos.

La ISO nos ayuda a organizar más que todo a los datos históricos para el análisis estadístico; y, el RCM usa esos datos, entre otras fuentes, para definir qué se va a hacer con cada modo de falla identificado.

En la práctica, los sistemas de gestión bien configurados combinan ambos enfoques: el código ISO al cerrar la orden de trabajo, y la descripción de causa al análisis del ENT.

El mecanismo de daño como origen físico de los modos de falla

Si el modo de falla es la causa de la pérdida de función, el mecanismo de daño o deterioro es el proceso físico, químico, lógico o de otra naturaleza u combinación que pueda actuar sobre el material y que, sostenido en el tiempo, conduce inevitablemente a la falla.

Existen 2 guías principales para ayudarnos a definir a los mecanismos de daño en ciertas medidas puntuales, por eso aquí es donde se concentra gran parte de la capacidad analítica para el diagnóstico y las propuestas de mantenimiento acertadas en los profesionales.

Entre estas guías, resulta muy útil saber darles un uso adecuado, puesto que, ambas tienen una diferencia en su propósito fundamental y tiene que ver directamente con el alcance del diseño;

Comenzando por la API 571 (Damage Mechanisms Affecting Fixed Equipment in the Refining Industry), esta constituye una Práctica Recomendada (RP, por sus siglas en inglés), la cual proporciona directrices, orientación y los mejores métodos aceptados por la industria para abordar situaciones específicas. Aunque estas no representan mandatos legales obligatorios, el cumplimiento de dichas prácticas es a menudo requerido por normativas gubernamentales, políticas corporativas o contratos de seguros.

Esta práctica, se encarga de catalogar a los mecanismos de daño para la industria de proceso, en una interpretación sencilla, los define como los procesos que degradan la integridad de los materiales de un componente tanto a nivel microscópico como macroscópico, y que pueden ser caracterizados por su morfología, sus agentes promotores y sus métodos de detección; para este caso, la práctica está diseñada como un manual especializado sobre la degradación de materiales en equipos fijos o estáticos de refinerías, dirigido a ingenieros de integridad mecánica que necesitan comprender cómo la química y los esfuerzos del proceso afectan y degradan los metales.

Gran parte de ellos generalmente tiene una característica evolutiva respecto a su capacidad de hacer que parte de sus procesos sean incrementales, lo que hace que, en muchos casos, los daños generados sean irrecuperables.

Mecanismos de Daño/Falla/Deterioro en API 571
Mecanismos de Daño/Falla/Deterioro en API 571

Por eso, la estructura de cada mecanismo en el API 571 responde a un ciclo de gestión de integridad, lo cual nos deja ese manual de instrucciones generales para tratar el daño:

  1. Descripción del daño: Define la morfología del mecanismo (cómo se ve al microscopio o a simple vista).

  2. Equipos afectados: Identifica en qué tipo de recipientes, tuberías o intercambiadores es más probable que ocurra.

  3. Factores críticos: Explica qué condiciones del proceso (temperatura, presión, composición química del fluido, velocidad de flujo) aceleran o detienen el mecanismo.

  4. Morfología/Apariencia: Describe qué debes buscar físicamente (grietas intergranulares, pérdida de espesor uniforme, picaduras).

  5. Métodos de detección / Inspección: Aquí es donde reside el "tratamiento". Te indica qué técnica de Ensayos No Destructivos (END) es la más efectiva para ese mecanismo específico. Por ejemplo, te dirá si debes usar Ultrasonido (UT), Radiografía (RT), Partículas Magnéticas (MT) o Líquidos Penetrantes (PT).

  6. Prevención / Mitigación: Te sugiere acciones de diseño o mantenimiento, como:

    • Cambio de materiales: Usar aceros inoxidables o aleaciones de cromo-molibdeno.

    • Control del proceso: Ajustar la temperatura por debajo de un límite crítico o eliminar contaminantes químicos del fluido.

    • Tratamientos térmicos: Realizar alivios de tensiones (PWHT) tras soldaduras.

Sin embargo, como parte del conocimiento general, los equipos estáticos o fijos no son los únicos que se degradan. Los equipos dinámicos pueden llegar a sufrir, en igual medida o incluso más, los mismos mecanismos de daño. Pero determinar estos últimos mecanismos, es sin duda mucho más complejo, la API 571, es incompleta para ambas caras por 3 razones fundamentales:

  • Exclusión de componentes móviles críticos: Los equipos dinámicos fallan principalmente por el movimiento relativo entre partes (desgaste adhesivo/abrasivo, erosión de sellos, fatiga de rodamientos, problemas de lubricación). Y, respecto a API 571, se enfoca en la "integridad de la presión" de las paredes de metal, no en la "capacidad funcional" de las piezas en movimiento.

  • Omisión de fallas eléctricas y de control: API 571 no contempla a las fallas por sobrecarga eléctrica, arcos, degradación dieléctrica o errores de lógica de control, que en equipos dinámicos (accionados por motores eléctricos) representan una parte sustancial de los modos de falla.

  • Diferencia en el modo de deterioro: En un recipiente estático, el daño más progresivo suele relacionado al entorno ambiental (corrosión química). En un equipo dinámico, el daño suele ser inducido por la carga y la dinámica del sistema (vibración, desalineación, inestabilidad hidrodinámica...).

En tal sentido, la norma ISO 14224, surge como el marco taxonómico e internacional diseñado para superar estas fronteras operativas (pero de una forma mucho más general y no tan especifica respecto con los mecanismos de deterioro como la API 571, el nivel de causalidad es un detalle que veremos más adelante y va de la mano con estos modos, para lo cual usualmente en casos específicos se deja en manos del conocimiento del usuario profesional capaz de identificarlos).

Entonces, mientras que la perspectiva de la práctica petroquímica restringe su enfoque analítico a la degradación de la estructura del material, este estándar proporciona una arquitectura de datos universal que abarca la totalidad de las clases de equipos en una planta. De este modo, permite registrar bajo un orden común tanto los fenómenos físicos de los recipientes a presión como las pérdidas funcionales de los activos rotativos, eléctricos y de control; sirviendo como un puente de información necesario para los análisis integrales de confiabilidad.

La capacidad de distinción con el modo de falla es de nivel.

El modo de falla describe el evento desde el punto de vista de la función perdida:

"sello mecánico con fuga excesiva".

El mecanismo de daño describe por qué ese sello llegó a ese estado:

"erosión por partículas abrasivas en suspensión en el fluido bombeado".

Conocer el mecanismo permite seleccionar el método de monitoreo correcto, porque cada proceso de deterioro produce síntomas físicos distintos que se detectan con técnicas distintas.

Categorías de mecanismos de deterioro

  • Desde el estándar API 571. (2020) organiza sus 70 mecanismos de daño en 4 grandes grupos, basándose en la naturaleza del fenómeno;

    • Corrosión a baja y alta temperatura: Incluye procesos químicos y electroquímicos. Ejemplos destacados son la sulfidación, la corrosión por ácido sulfúrico y la corrosión por CO2...

    • Daños metalúrgicos y mecánicos: Procesos que alteran la estructura del metal o su integridad por esfuerzos físicos. Incluye la fluencia (creep), la grafitización, el ablandamiento (spheroidization) y la fatiga mecánica...

    • Agrietamiento asistido por el entorno (Environment-Assisted Cracking): Fallas resultantes de la combinación de esfuerzos de tracción y un medio corrosivo. Ejemplos son el agrietamiento por corrosión bajo tensión por cloruros y el daño por H2S húmedo ...

    • Otros mecanismos: Procesos que no encajan estrictamente en las categorías anteriores, como la degradación de refractarios...

Ahora, para el enfoque de la ISO 14224 con el RCM, se busca facilitar la codificación en sistemas de gestión y asociarlos con técnicas de inspección o monitoreo, para lo cual, los mecanismos de la API 571 se pueden agrupar en las familias solicitadas según la 14224 que también los denomina mediante un sinónimo como mecanismos de falla;

Propuesta de la Categorización ISO 14224 para los Mecanismos de Daño
Propuesta de la Categorización ISO 14224 para los Mecanismos de Daño
  • Mecánicos incluyen desgaste (abrasivo/adhesivo), fatiga mecánica, deformación plástica, sobrecarga y vibración...

  • De Material comprenden corrosión general, corrosión localizada por picaduras, erosión, cavitación, agrietamiento por tensión y fluencia a alta temperatura...

  • De Influencias Externas, como la contaminación de lubricantes, impactos accidentales, atmósferas corrosivas...

  • Eléctricos e Instrumentales, aparecen cortocircuitos, errores de software, y fallas de control en general; pérdida de aislamiento dieléctrico, sulfatación de terminales y descalibración por envejecimiento...

La correcta identificación de estos depende de la calidad del diagnóstico profesional de los individuos que deban identificarlos.

Cada categoría de mecanismos tiene implicaciones directas para las estrategias de mantenimiento.

  • Un mecanismo de corrosión uniforme progresa con el tiempo y puede modelarse estadísticamente; es candidato para tareas de reemplazo cíclico o medición periódica de espesores por ultrasonido.

  • De fatiga por ciclos de carga muestra síntomas en el espectro vibracional que el análisis predictivo puede capturar antes de la fractura.

  • Uno inducido por error humano, como una desalineación durante el montaje, no tiene síntoma previo observable y requiere procedimientos de trabajo y verificación post-intervención.

El mecanismo, o el conjunto de ellos, tiene mucha importancia en el mantenimiento, pues esto contribuye a definir el intervalo P-F; este intervalo es el tiempo que transcurre entre el momento en que la degradación es físicamente detectable y el momento en que ocurre la falla funcional, por ejemplo; el proceso de fatiga en un rodamiento puede dar semanas de aviso en el espectro de vibraciones; una fractura frágil por corrosión bajo tensión puede no dar ninguno. Esa vital diferencia se determina mediante el monitoreo del comportamiento de los activos y las inspecciones, junto con el diagnóstico de los síntomas, para determinar si una tarea predictiva es técnicamente viable o si conviene optar por una sustitución preventiva o un rediseño.

El nivel de causalidad y la profundidad del análisis

El nivel de causalidad describe hasta qué punto se desciende en la cadena de causas al definir un modo de falla. Es importante aclarar que no existe un nivel único que sea correcto para todos los casos:

La profundidad adecuada depende de lo que el equipo de trabajo necesita saber para prescribir una acción de mantenimiento efectiva.

La jerarquía, en términos prácticos, puede presentar tantos niveles como le permitan los recursos y la capacidad de diagnóstico del equipo de trabajo, en un ejemplo de su libro, John Moubray autor del RCM II, presenta siete niveles posibles a partir de la siguiente tabla:

RCM II John Moubray - Modos de Falla con diferentes niveles de detalle
RCM II John Moubray - Modos de Falla con diferentes niveles de detalle

En el nivel más alto se observa que el sistema falla; en el más bajo se llega a la causa raíz administrativa o humana: un error de montaje, un procedimiento de compras deficiente, una capacitación incompleta. Para fines del RCM, el análisis suele detenerse entre los niveles tres y cinco (aunque no es una regla), es decir, en el componente afectado y el mecanismo de deterioro, por ejemplo; "Fatiga del rodamiento por falta de lubricación" es suficiente para prescribir análisis de vibraciones y revisión de los procedimientos de lubricación. No hace falta descender a la composición de la grasa ni a la formulación química del aditivo.

Sin embargo, cuando una falla es crónica o ha tenido consecuencias catastróficas, el análisis debe profundizar hasta la causa raíz. Si el rodamiento del que hablamos, falla repetidamente por falta de lubricación y el procedimiento de lubricación existe y se ejecuta, la causa no está en el procedimiento de campo sino en otro nivel, quizás en la especificación del lubricante, en el diseño del punto de aplicación o en la frecuencia del turno.

Lo cierto es que llegar a ese nivel es lo que produce una solución definitiva en lugar de una tarea de monitoreo que solo gestiona el síntoma.

El equilibrio es el punto crítico. Un análisis demasiado superficial genera planes con tareas que no atacan el problema real. Desde el otro lado, un análisis demasiado profundo de cada modo de falla en una planta compleja puede extenderse meses sin producir resultados aplicables. La decisión sobre el nivel adecuado la toma el facilitador con el ENT, guiada por la criticidad del activo, la frecuencia del evento y la disponibilidad de métodos de detección para el mecanismo identificado.

Un análisis de confiabilidad excesivamente granular en un equipo de baja criticidad es, en sí mismo, un desperdicio de recursos.

Criterios para incluir modos de falla en el análisis RCM

El estándar SAE JA1011/2 establece que deben identificarse todos los modos de falla razonablemente probables en el contexto operativo actual.

Eso no significa todos los físicamente posibles; significa los que tienen base técnica para ocurrir en ese equipo, en ese entorno y bajo esas condiciones de carga.

Los criterios de inclusión se organizan en tres grupos.

  • Primero, los eventos históricos: fallas que ya ocurrieron en ese activo o en equipos similares de la industria. Este insumo proviene del historial del CMMS, de los informes de análisis causa raíz y de la experiencia del personal.

  • Segundo, los modos que están en prevención actualmente: para identificarlos, el ENT pregunta qué sucedería si se dejara de ejecutar una tarea específica del plan vigente. Si la respuesta es una falla funcional con consecuencias significativas, ese modo de falla debe registrarse, aunque nunca haya ocurrido.

  • Tercero, los modos potenciales creíbles: eventos que aún no han sucedido en esa instalación pero que son técnicamente posibles dado el contexto operativo y cuyas consecuencias justifican su inclusión.

Omitir modos de falla por comodidad analítica es uno de los errores más comunes y más costosos del proceso.

Los modos que no se identifican no reciben ninguna política de gestión, lo que equivale a aceptar su ocurrencia por omisión. Cuando esos modos tienen consecuencias sobre la seguridad o el ambiente, la omisión no es solo ineficiente, es inaceptable.

Conclusión

La correcta definición de los modos de falla en el RCM es uno de los puntos donde la ingeniería de confiabilidad se convierte en una herramienta de gestión real. Identificar el componente afectado, el mecanismo que lo deteriora y el nivel causal necesario para prescribir una acción concreta es lo que nos ayuda a transformar los datos de plantas en políticas y planes de mantenimiento que reducen el riesgo. Todo gira alrededor de la esa precisión del diagnostico, pues las tareas programadas pueden ser numerosas y costosas sin ser eficaces.

La diferencia entre el modo de falla según la ISO 14224 y el que exige el RCM no es únicamente una discusión terminológica, esta tiene consecuencias directas en qué tecnología de detección se selecciona y con qué frecuencia.

Entender a los mecanismos de daño subyacentes es importante para cerrar esos ciclos al conectar la causa física con la señal que es posible medir antes de que ocurra la pérdida de función. Esa conexión es la que hace viable el mantenimiento predictivo y la que justifica la inversión en monitoreo de condición.

El nivel de causalidad adecuado protege a la organización de dos extremos igualmente improductivos; el análisis superficial que no llega a la raíz del problema y el análisis excesivo que paraliza el proyecto sin generar mejoras aplicables.

El equilibrio entre ambos es una decisión de ingeniería que debe tomarse con criterio, con datos y con el conocimiento real de las personas que trabajan con el activo todos los días.

Dinos qué te ha parecido el artículo

starstarstarstarstar