Tabla de Contenido

Priorización de Equipos y Sistemas Productivos para el RCM

Técnico - Articulo27 de abril de 2026

Autor: Román VenturaIngeniero de Mantenimiento Industrial, Especialista Jr. en Ingeniería de Confiabilidad y Gestión de Activos.

romanventura99@gmail.com - Ver perfil de LinkedIn

La priorización de equipos, en el contexto del Mantenimiento Centrado en la Confiabilidad, es el proceso de preselección y selección mediante el cual una organización determina qué activos físicos justifican la inversión de tiempo y recursos que implican realizar los análisis y determinar hasta qué nivel de profundidad deben llevarse, y que puede desarrollarse siguiendo su enfoque tradicional con diagramas lógicos de decisión según el RCM II y los estándares SAE J1011/1012, o desde su enfoque Riguroso presentado en 1978 por los pioneros F. Stanley Nowlan y Howard F. Heap

El propósito final de una correcta priorización es garantizar que los activos cuyas fallas podrían poner en riesgo a las vidas humanas, provocar contaminación ambiental o detener la producción durante semanas, reciban el tratamiento que se merecen con los análisis técnicos más exhaustivos disponibles en la capacidad de la organización. De modo que, al blindar estos sistemas críticos, la gestión adquiere la madurez necesaria para que el resto de los componentes menores se administren bajo una óptica de eficiencia de costos, asegurando que ningún recurso sea desperdiciado.

Mapa Mental sobre la Prioización de Equipos

¿Por qué el RCM no se aplica igual a toda la cadena de activos?

Lo principal es que debemos tener muy en claro que, así como un motor (como equipo) tiene cientos de componentes también una planta industrial típica contiene cientos o miles de activos físicos de diferentes clases y funciones. Desde grandes compresores centrífugos hasta pequeñas válvulas de corte manual, todos estos activos están registrados en el inventario del CMMS, pero su impacto sobre el negocio varía en varios órdenes de magnitud.

Pretender un nivel de análisis uniforme para todos ignora esa gran realidad y distribuye el esfuerzo de ingeniería de manera desproporcionada respecto al riesgo que se intenta gestionar.

Mantener esta coherencia entre el esfuerzo analítico y el impacto potencial es lo que hace sostenible un programa de confiabilidad a largo plazo.

Desde la historia, el RCM surgió en la aviación comercial debido a la crisis sobre las fallas que se enfrentaban, entonces con parte de estos principios como bases iniciales. Los ingenieros del Maintenance Steering Group en 1968 necesitaban concentrar el rigor analítico en los sistemas cuya falla podía comprometer la seguridad del vuelo, no en cada componente del avión por igual. Ese criterio se trasladó a la industria general sin modificaciones esenciales el esfuerzo debe ser proporcional a las consecuencias.

⚠️ Los sistemas más críticos, es decir, los que resultan con mayor criticidad, son gestionados con el máximo rigor metodológico que se pueda aplicar para mitigar su riesgo de falla, asegurando que cada fase del proceso cumpla con los más altos estándares.
📋 En contraste, aquellos de criticidad intermedia pueden adoptarse a otras estrategias menos exigentes o hacer sobre optimizaciones en sus planes de mantenimiento preventivos, lo que evita un consumo excesivo de los recursos operativos. Ahora, si se demuestra que corresponden a un menor impacto se administran mediante enfoques menos intensivos, y cuidadosamente seleccionados para responder de manera precisa y adecuada a sus necesidades específicas, operando entonces sin un mantenimiento proactivo e inclusive hasta la falla que pueda cumplirse sin comprometer la seguridad ni los objetivos de producción.

El razonamiento de fondo detrás de estos análisis es muy claro, si buscamos realizar un análisis de modos de falla que sea muy riguroso para un sistema complejo puede consumir una cantidad de horas considerable, digamos que alrededor de veinte y cuarenta horas o más de trabajo de un equipo multidisciplinario.

El punto clave de esta lógica es que aplicar ese nivel minucioso de detalle a cada motor de bombeo, válvula de cierre y ventilador auxiliar en una planta industrial consumiría demasiados recursos del departamento de mantenimiento & confiabilidad sin generar un beneficio proporcional al esfuerzo realizado.

La Priorización de Equipos tiene diferentes Niveles, Enfoques, y Aplicaciones ¿Entonces, que se usa en cada uno?

La priorización de activos es un proceso estratificado según el nivel taxonómico y la etapa analítica, esencial para la toma de decisiones en mantenimiento.
Dentro de esta gestión, tres metodologías destacan por sus funciones, enfoques y niveles de aplicación específicos según la necesidad operativa.
Estas herramientas fundamentales son: el Análisis de Criticidad, el Número Prioritario de Riesgo (NPR) y el Análisis de Pareto (Ley 80-20).

El Análisis de Criticidad como Método de Preselección.

El método que organiza a la preselección es el Análisis de Criticidad, y, algo sumamente interesante de esta es que puede formularse de manera cualitativa, semicuantitativa o cuantitativa según la disponibilidad de datos y la madurez del programa. En cualquiera de sus formas, evalúa cada activo frente a criterios definidos por la organización y lo clasifica en un nivel que corresponde a una estrategia de mantenimiento específica.

Este análisis es considerado una de las metodologías fundamentales de la confiabilidad, puesto que, mediante el uso de una matriz basada en la criticidad o el riesgo operativo, nos guía en la selección de estrategias como el RCM y otros modelos de gestión de fallas, así como en la asignación eficiente de los presupuestos de mantenimiento.

En la práctica básicamente nos permite evaluar el impacto potencial de cada equipo u sistemas sobre los objetivos del negocio en diferentes categorías como la seguridad, el ambiente, la capacidad productiva y los costos de ciclo de vida, y produce como resultado una jerarquía que orienta la asignación del esfuerzo analítico.

Clasificación Análisis de Criticidad y sus modelos

Clasificación de los Modelos del Análisis de Criticidad

Tipo Cualitativo (Análisis Descriptivo)
- Se fundamenta primordialmente en el juicio de ingeniería por opinión de expertos y la experiencia del Equipo Natural de Trabajo (ENT).
  - Sus entradas de datos: Utilizan información descriptiva y rangos de datos en lugar de valores discretos. Se apoya en técnicas como la tormenta de ideas (brainstorming), entrevistas estructuradas y el método Delphi.
  - Resultados: Los riesgos se categorizan en escalas descriptivas como Alto, Medio y Bajo. Aunque se asocien números a estas categorías, no representan cálculos matemáticos reales, sino jerarquías de percepción.
  - Fortalezas: Es la técnica más rápida y económica. Es ideal para el tamizaje inicial (screening) de grandes parques de activos para decidir dónde aplicar métodos más profundos. Es la única opción viable cuando no existe un historial de fallas registrado.
  - Debilidades: Presenta un alto nivel de subjetividad, ya que los resultados dependen totalmente del conocimiento del analista y el equipo. Es difícil de reproducir con exactitud por diferentes evaluadores y tiende a generar recomendaciones conservadoras.
    - Modelos de Nivel Cualitativo
      - Metodología de NORSOK Standard Z-008: Este enfoque estructural define los límites de riesgo y la jerarquía de los activos evaluando funciones de seguridad esenciales mediante lógicas cualitativas de toma de decisiones.
Tipo Semi-cuantitativo (Análisis de Rangos Relativos)
- Se trata de un enfoque híbrido enfoque híbrido que busca obtener la agilidad y rapidez del análisis cualitativo con la precisión y el rigor del cuantitativo. Esta modalidad se ha consolidado como la más empleada en el ámbito petrolero e industrial, ya que los datos que requiere resultan accesibles y manejables, permitiendo así un equilibrio óptimo entre eficiencia y solidez metodológica.
  - Entradas de datos: Establece escalas ordinales (típicamente del 1 al 5 o del 1 al 10) para la frecuencia y las consecuencias. Combina datos objetivos (como conteo de fallas) con razonamiento cualitativo valorado numéricamente.
  - Resultados: Provee un valor de criticidad o Número de Prioridad de Riesgo (NPR/RPN) que es proporcional al riesgo real. Permite generar una Matriz de Criticidad (ej. 4x4 o 5x5) para visualizar la distribución de activos.
  - Fortalezas: Mejora la precisión estandarizada y la repetibilidad de los resultados. Facilita la identificación de los malos actores y permite realizar seguimientos de tendencias de riesgo a lo largo del tiempo.
  - Debilidades: Al no utilizar unidades absolutas (como $ / año), no es adecuado para establecer la tolerabilidad del riesgo en términos financieros ni legales estrictos.
    - Modelos de Nivel Semi-cuantitativo
      - API-RP-691: Risk-based Machinery Management: Integra enfoques basados en riesgo que permiten transitar desde evaluaciones cualitativas hacia métodos más rigurosos, utilizando criterios de tolerancia al riesgo para la selección preliminar de maquinaria crítica.
      - MIL-STD-882E (2012): Aplica una matriz de evaluación de riesgos estandarizada que cruza rangos de probabilidad con niveles de severidad descriptivos ponderados.
      - Método de los puntos Mar del Norte: Utiliza un sistema híbrido que asigna puntuaciones fijas a variables como costos de reparación, frecuencia de fallas y afectación ambiental para calcular un impacto total.
      - NORSOK Z-013 – "Risk and Emergency Preparedness Analysis": Emplea matrices de riesgo relativas basadas en consecuencias e intervalos de frecuencia para la preparación ante emergencias industriales.
      - PEMEX - México: Utiliza una matriz de criticidad específica ponderada por colores (alto, medio, bajo) y asociada a puntajes definidos para la priorización de rutina en activos petroleros.
      - PDVSA MM-02-15-03: Emplea una matriz bidimensional estándar que cruza niveles proporcionales de frecuencia de fallas contra consecuencias operacionales.
      - Análisis de Criticidad Metodología de Ciliberti: Se fundamenta en un algoritmo jerárquico que pondera numéricamente la flexibilidad operacional, los costos de mantenimiento y la seguridad.
Tipo Cuantitativo (Análisis Numérico Probabilístico)
- Es la modalidad más compleja y objetiva, orientada a determinar valores de riesgo que pueden tratarse como egresos probables.
  - Entradas de datos: Requiere datos de alta calidad y precisión, utilizando distribuciones de probabilidad (como Weibull o Normal) en lugar de valores fijos. También, podría utilizar modelos lógicos (árboles de fallas y de eventos) y simulaciones de Monte Carlo para propagar la incertidumbre.
  - Resultados: Expresa el riesgo en unidades específicas (ej. fatalidades por año, barriles perdidos o costo económico total). Los resultados se comparan contra criterios de tolerancia de riesgo preestablecidos por la organización.
  - Fortalezas: Proporciona un dimensionamiento objetivo que permite realizar análisis de sensibilidad para identificar qué variables (ej. temperatura, corrosión) impactan más en el riesgo. Es indispensable para evaluaciones financieras de Costo de Ciclo de Vida (LCC) y para justificar inversiones en activos de alta criticality.
  - Debilidades: Exige una inversión significativa de tiempo y recursos. La calidad de la salida depende críticamente de la veracidad y cantidad de la data histórica evaluada.
    - Modelos de Nivel Cuantitativo
      - ISO 31010 Técnicas de Gestión de Riesgo: Proporciona las bases normativas para modelados probabilísticos de consecuencias y niveles de verosimilitud numéricos frente a incertidumbres.
      - API-RP-581: Risk-based Inspection: Representa la modalidad más compleja al calcular de forma numérica y probabilística el riesgo real mediante la multiplicación exacta de la probabilidad de falla por la consecuencia financiera de la misma.

Cuadro Comparativo de los Niveles de Análisis

Atributo	Cualitativo	Semi-cuantitativo	Cuantitativo
Complejidad	Baja	Media	Alta
Tiempo/Esfuerzo	Mínimo	Moderado	Elevado
Precisión	Menor	Estandarizada	Alta resolución
Foco	Opinión de expertos	Factores ponderados	Modelos probabilísticos
Uso Principal	Selección preliminar	Priorización de rutina	Decisiones financieras/seguridad

Los enfoques y el cálculo del Análisis de Criticidad.

Hablemos sobre el análisis de criticidad semi-cuantitativo del método de los puntos (que es el más utilizado) desde la gestión de la integridad física del activo, este mismo se puede implementar bajo dos enfoques diferenciados que dependen de la naturaleza de los activos y de los datos disponibles para la gestión.

El método del cálculo de la criticidad va a depender del enfoque que es utilizado; respecto a si es basado en el hoy (con las frecuencias) o en la predicción (el riesgo futuro). En ambos casos, cada uno de estos criterios se multiplica por sus consecuencias, y opcionalmente se puede incluir a la detectabilidad.

Las fórmulas son muy variadas, pues pueden cambiar según los modelos que adopte o que pueda crear la organización, pues el análisis de criticidad es un traje a la medida; por ello, los criterios y factores de cálculo contienen ponderaciones que la empresa debe adoptar según sus propias necesidades y contexto operacional.

De forma muy general, después de seleccionar los criterios y factores que conformarán las columnas de estudio = [frecuencia o riesgo x consecuencias (x detectabilidad; opcional)], se asignan esas ponderaciones a estos factores mediante el consenso de un Equipo Natural de Trabajo (ENT). Cada una de estas columnas de estudio requiere un cálculo individual totalmente ajustado y personalizado al contexto de los objetos de estudio.

No es lo mismo realizar un análisis de criticidad para toda una planta que enfocarlo únicamente a una familia de equipos; el nivel de personalización y profundidad cambia según el nivel jerárquico y los límites de batería definidos.

⚠️Como las corporaciones manejan desde cientos hasta decenas de miles de equipos, la premisa fundamental de este análisis es la administración de recursos agotables.
- Así que, los recursos que tengamos disponibles para la optimización de los esfuerzos dictarán el nivel de profundidad del análisis; por tanto, la segmentación depende de si se evalúa la planta completa o una familia en particular.
  - El objetivo es alcanzar un equilibrio contextualizado entre la complejidad del estudio y la capacidad de tiempo del equipo de confiabilidad, evitando análisis tan complejos que no puedan terminarse o tan simples que carezcan de valor. Continuando con este flujo, tras las evaluaciones individuales, se llega a un cálculo total de la criticidad que permite generar la lista jerarquizada para la toma de decisiones.

Respecto a la constructibilidad geométrica de una matriz de criticidad o riesgo, esta debe aclararse que no es un proceso estandarizado, sino que esta ligada a lo mencionado anteriormente con una arquitectura técnica que se adapta a la realidad específica de cada organización para facilitar la toma de decisiones informadas. Esta estructura básica de la matriz es un arreglo rectangular de celdas que representa la intersección de dos ejes.

Eje de Probabilidad o Frecuencia: Suele dividirse en rangos que van desde eventos "muy probables" o "frecuentes" hasta eventos "remotos" o "extremadamente improbables".
Eje de Consecuencia (Impacto): Clasifica la severidad de los fallos, generalmente en términos de seguridad, ambiente, producción y costos, con escalas que van desde "insignificante" o "marginal" hasta "catastrófico" o "muy severo".
Dimensiones de la Configuración: No existe un tamaño obligatorio, las configuraciones comunes son de 4x4, 5x5, 6x6, e incluso matrices asimétricas como 4x5 o 7x5... La elección depende de la necesidad de discriminación de los activos.

Estrategias de Mantenimiento, el Mapa de Calor, y las Regiones del Riesgo

El análisis de criticidad no produce únicamente una clasificación; el mayor atractivo de este es la asignación de cada activo a una familia de estrategias de mantenimiento, que nos señalan o indican a donde se debería atacar primero, y la respuesta de cómo es que se van a atacar, pues dependerá del modelo de la confiabilidad de cada organización, además del nivel de riesgo tolerable de la misma para cada activo dentro de este grupo de estrategias.

Por eso mismo, esta correspondencia entre el nivel de criticidad y la profundidad del análisis en sí, es lo que hace útil y operativo el proceso de priorización.

El mapa de calor es la representación visual de la intensidad del riesgo mediante un código de colores. Generalmente, las matrices se dividen en tres o cuatro regiones fundamentales, es muy importante mencionar que el trato que se les dará a los activos será según el resultante de que entren en cada una estas áreas/celdas (además, así como los equipos tienden a degradarse con el tiempo y cambiar su comportamiento, también lo hará la criticidad y el riesgo moviendo a través de estos puntos):

Riesgo Alto (🔴- Roja): Representa riesgos inaceptables o intolerables que requieren las estrategias más exhaustivas con metodologías como el RCM y el IBR, con acciones de mitigación inmediatas, cambios permanentes o rediseños.
Riesgo Moderado (🟠 - Naranja/ 🟡- Amarilla): Indica los límites hasta dónde puede llegar el riesgo máximo tolerable con controles específicos, y donde empieza a generarse de forma alarmante. De modo que, requieren una evaluación detallada y posibles actividades de monitoreo constante para no migrar a la zona roja. Por ello, el foco de acciones de estos equipos en estos rangos, donde en la generación de planes de mantenimiento por familia y tipo de equipo.
Región de Riesgo Bajo (🟢- Verde/⚪ - Blanca): Se considera un nivel de riesgo ampliamente aceptable. Destinado a estrategias preventivas o RTF, pero guiadas por evaluaciones costo-riesgo-beneficio (OCR).
- Opcionalmente, es común encontrar un cuarto estrato como: 🟡- Región de Riesgo Semi-crítica (antes del riesgo medio/moderado): Algunas organizaciones añaden esta categoría (usualmente asociada al color amarillo) para identificar activos que, aunque no son críticos, están llegando a un punto meritorio de atención.

Simetría vs. Asimetría y el Modelo ALARP

La distribución de las áreas de color no siempre es simétrica respecto a la diagonal de la matriz.

Matrices Balanceadas (Simétricas): El riesgo se distribuye de forma equitativa entre probabilidad y consecuencia.
Matrices No Balanceadas (Asimétricas): Las empresas suelen dar mayor peso a las consecuencias (especialmente en seguridad y ambiente) que a la probabilidad. Bajo esta lógica, un evento con baja probabilidad pero consecuencia catastrófica puede ubicarse directamente en la zona de riesgo alto, mientras que un evento de alta probabilidad pero impacto insignificante se mantendrá en la zona baja.
Modelo ALARP (As Low As Reasonably Practicable): Este principio se aplica visualmente en la banda media de la matriz. Representa una zona de "tolerabilidad" donde se asume el riesgo solo si reducirlo es impracticable o si los costos de la mejora son desproporcionados frente al beneficio obtenido.

Definición de Tolerancias

La configuración de estas áreas y sus límites de tolerancia no es una decisión unilateral de un analista, sino el resultado de un proceso colaborativo y de consenso.

Equipos Naturales de Trabajo (ENT): Para marcar las áreas y definir los puntajes, se reúnen representantes multidisciplinarios de operaciones, mantenimiento, procesos, finanzas, seguridad y ambiente.
Establecimiento de la Tolerancia: Cada empresa tiene distintos niveles de riesgo que son diferentes.
- El Proceso de Marcaje: Durante las reuniones, el equipo valida los resultados del análisis estadístico y de escenarios hipotéticos para ajustar la matriz a la filosofía de gestión de la organización.

El proceso de determinar la criticidad

Según sus enfoques:

Enfoques de Criticidad; Frecuencia vs Riesgo

⏳Basado en la Frecuencia: Define lo que está ocurriendo actualmente, apoyándose en registros históricos de fallas reales. Es el método idóneo para jerarquizar equipos dinámicos o rotativos con eventos recurrentes o fallas crónicas, bajo la fórmula:
- Frecuencia de Ocurrencia × Consecuencia (Impactos)
  - Para calcular la frecuencia de falla se tienen en cuenta ciertos factores determinantes:
    - Historial de fallas: Fundamentado en el conteo de eventos registrados en el Sistema de Gestión de Mantenimiento (CMMS).
    - Frecuencia de eventos: Totalización de la ocurrencia de fallas, expresada generalmente como fallas por año.
    - Tasa de falla λ y TPEF: Uso del Tiempo Promedio Entre Fallas (TPEF o MTBF por sus siglas en inglés) calculado a partir del tiempo real transcurrido entre paradas.
    - Datos comparativos: Ante la ausencia de datos propios, se emplean bases de datos estandarizadas (como OREDA) para establecer una tasa de falla de referencia.
  - Propósito: Identificar activos con comportamientos recurrentes o los malos actores que impactan negativamente la disponibilidad operativa actual.

🎲Basado en el Riesgo: según ISO 31000. (2018). se define al riesgo como el "efecto de la incertidumbre sobre los objetivos", trasladando esto a este enfoque profesional; proyecta lo que puede ocurrir, como la probabilidad de que ocurra un evento potencial que generalmente no es deseado por sus consecuencias), utilizando entonces un carácter predictivo para evaluar escenarios potenciales y sus efectos. Resulta ideal para jerarquizar equipos estáticos o críticos donde la falla es inaceptable, la probabilidad se define comúnmente como el Índice de Probabilidad de Falla (IPF) o solo probabilidad de falla dependiendo de la literatura, integrando en su cálculo:
- Índice de Probabilidad de Falla (IPF) × Consecuencia (Impactos)
  - Para determinar el Índice de Probabilidad de Falla (IPF) se consideran los siguientes factores de susceptibilidad:
    - Integridad mecánica: Diagnóstico del estado físico, espesores remanentes y cumplimiento de las normativas de diseño original.
    - Factores de integridad: El IPF se determina mediante una suma ponderada de variables técnicas que condicionan el estado del activo.
    - Mecanismos de degradación: Evaluación de tasas de corrosión (interna o externa) y tendencias de deterioro activo.
    - Variables operacionales: Análisis de presión, temperatura, presencia de fluidos corrosivos (H2S, CO2) y el cumplimiento de los límites operativos de diseño.
    - Sistemas de protección: Verificación del estado de lazos de control, alarmas y dispositivos de seguridad instalados.
    - Efectividad de la inspección: Evaluación de la calidad y frecuencia de las intervenciones de inspección previas.
    - Factores de edad: Análisis de la relación entre el tiempo en servicio y la vida útil remanente estimada.
  - Propósito: Evaluar el riesgo potencial y la susceptibilidad a la falla basada en la física del deterioro del activo.
(🚨+💥+💸) El cálculo de las consecuencias:
- Independientemente del método, las consecuencias se definen como las afectaciones derivadas del efecto de materialización de un modo de falla.
  - Los criterios evaluados, derivados de estándares de confiabilidad como el RCM, incluyen:
    - Seguridad, Higiene y Ambiente (SHA): Impacto en la integridad humana, daño a instalaciones o violación de regulaciones ecológicas.
    - Impacto Operacional: Pérdida de producción, paradas de sistema, afectación a inventarios o calidad.
    - Costos: Gastos directos en mano de obra, materiales y repuestos.
    - Flexibilidad Operacional: Existencia de repuestos o redundancias que mitigan el efecto.
Su cálculo tiene diferentes fórmulas, dependiendo el modelo a seleccionar, pues cada uno de ellos puede o no considerar los factores mencionados, si hablamos desde una perspectiva global podemos presentar diversos modelos las siguientes desde diferentes categorías: Sistémicos (es decir, integrales), Operacionales (basados en la integridad de los equipos) y la Financieros (costos globales):
- Modelo Generalista de Jerarquización de Consecuencias:
  - Fórmula: C = (IO x FO) + CM + SHA
    - Abreviaturas:
      - IO: Impacto Operacional (pérdida de capacidad productiva).
      - FO: Flexibilidad Operacional (factor de atenuación, como redundancias o stock).
      - CM: Costos de Mantenimiento (directos de reparación).
      - SHA: Impacto en Seguridad, Higiene y Ambiente.
    - Prioridad: Alta (Priorización de Activos en Plantas de Alta Densidad de Equipos).
- Modelo Operacional de Jerarquización de Consecuencias:
  - Fórmula: C = (NP x %I x TPFS) + CR + IS + IA
    - Abreviaturas:
      - NP: Nivel de Producción (valor del flujo o capacidad).
      - %I: Porcentaje de Impacto (afectación directa sobre la capacidad).
      - TPFS: Tiempo Promedio Fuera de Servicio.
      - CR: Costo de Reparación.
      - IS: Impacto en Seguridad.
      - IA: Impacto Ambiental.
    - Prioridad: Media-Alta (Gestión de Sistemas Críticos de Equipos Dinámicos y Estáticos).
- Modelo Financiero para Costos Globales de Falla
  - Fórmula: Cf = ingresos (perdidos) + gastos (extra) + materia prima(desperdiciada)
    - Abreviaturas:
      - Cf: Costo total de falla (expresado exclusivamente en unidades monetarias).
      - Ingresos (perdidos): Lucro cesante por parada.
      - Gastos (extra): Costos administrativos, penalizaciones, horas extras, logística de emergencia.
      - Materia prima (desperdiciada): Valor de los insumos perdidos durante la falla.
    - Prioridad: Estratégica (Toma de decisiones de inversión).
(🔍+ 📡+🎯+ 🧠) La detectabilidad: es un factor opcional que también entra en la evaluación, para disminuir la incertidumbre que se puede añadir o no, y de igual manera estará desglosado más adelante con otro sentido en el RPN (Risk Priority Number) correspondiente al método del RCM como complemento de los pasos del FMEA (Failure Modes Effects Analysis).
- La justificación del uso de detectabilidad también es básicamente porque un activo cuyo deterioro se manifiesta con síntomas anticipados puede gestionarse predictivamente con mayor efectividad que uno cuyas fallas son abruptas o silenciosas.
  - Su cálculo en el análisis de criticidad modificaría la formula inicial:
    - Criticidad = Frecuencia/Riesgo * Consecuencias (Impactos) * Detectabilidad
      - Independientemente de la metodología utilizada, su evaluación se fundamenta en la cuantificación de cinco factores de diagnóstico universales:
        Existencia de Señales y Síntomas (Señales Débiles): Presencia de evidencias físicas (vibraciones, ruidos, cambios de temperatura) que preceden a la falla.
        Sistemas de Monitoreo y Sensores: Disponibilidad y confiabilidad de instrumentación en línea (DCS, alarmas) para captar condiciones precursoras.
        Accesibilidad e Inspeccionabilidad: Facilidad física para acceder al componente y realizar pruebas; la inaccesibilidad genera incertidumbre absoluta.
        Intervalo P-F (Margen de Respuesta): Tiempo transcurrido entre la detección de la falla potencial (P) y la falla funcional (F). Un intervalo corto reduce la detectabilidad efectiva.
        Efectividad de Técnicas de Inspección: Capacidad de los métodos de ensayos no destructivos (NDT) o rondas operativas para identificar el deterioro con precisión.

El RPN (Risk Priority Number)

El Número de Prioritario de Riesgo, conocido como NPR o por sus siglas en inglés RPN, es una parte complementaria del FMEA, y, se incluye como medida semicuantitativa de la criticidad que permite jerarquizar los riesgos para priorizar a nivel Micro a los modos de falla, con cada línea de sus causas y efectos.

Recordemos que las primeras 4 preguntas del RCM; están basadas en el FMEA

El Cálculo Matemático y sus Factores

El RPN se obtiene mediante el producto de tres escalas de valoración, generalmente puntuadas del 1 al 10

Según SAEJ1739. (1995). Su fórmula fundamental es RPN = S x O x D

Severidad (S): Califica la gravedad del efecto potencial de la falla desde la perspectiva del usuario o del negocio

Ranking	Descripción	Criterio
1	Ninguna	No hay efecto
2	Muy menor	Efecto muy menor
3	Menor	Efecto menor
4	Moderadamente menor	Efecto moderadamente menor
5	Moderado	Efecto moderado
6	Moderadamente mayor	Efecto moderadamente mayor
7	Mayor	Efecto mayor
8	Muy mayor	Efecto muy mayor
9	Extremadamente mayor	Efecto extremadamente mayor
10	Catastrófico	Efecto catastrófico

Ocurrencia (O): Estima la probabilidad o frecuencia con la que el modo de falla se manifestará en un periodo determinado

Ranking	Descripción	Criterio
1	Remoto	Menos de 1 vez en 10 años
2	Muy bajo	Menos de 1 vez en 5 años
3	Bajo	Menos de 1 vez en 2 años
4	Moderadamente bajo	Menos de 1 vez por año
5	Moderado	1 vez por año
6	Moderadamente alto	2 veces por año
7	Alto	1 vez cada 3 meses
8	Muy alto	1 vez por mes
9	Extremadamente alto	1 vez por semana
10	Muy frecuente	1 vez por día

Detectabilidad (D): Mide la capacidad de los controles actuales (de diseño o mantenimiento) para identificar la falla antes de que el impacto sea percibido por el sistema o usuario

Ranking	Descripción	Criterio
1	Muy alta	El efecto es casi seguro que será detectado
2	Alta	El efecto es muy probable que sea detectado
3	Moderadamente alta	El efecto es probable que sea detectado
4	Media	El efecto es posible que sea detectado
5	Moderadamente baja	El efecto es moderadamente improbable que sea detectado
6	Baja	El efecto es improbable que sea detectado
7	Muy baja	El efecto es muy improbable que sea detectado
8	Extremadamente baja	El efecto es extremadamente improbable que sea detectado
9	Casi nula	El efecto es casi seguro que no será detectado
10	Nula	El efecto es seguro que no será detectado

Cursos recomendados

Tibaldo Díaz

Análisis de criticidad de activos

Planes de inspección basados en riesgo (IBR)

Elimar Anauro Rojas

Planes de inspección basados en riesgo (IBR)

Mantenimiento Centrado en Confiabilidad (RCM)

Andrés González

Mantenimiento Centrado en Confiabilidad (RCM)

Elimar Anauro Rojas

Fundamentos de Gestión de Riesgo

Análisis de criticidad de activos

Planes de inspección basados en riesgo (IBR)

Mantenimiento Centrado en Confiabilidad (RCM)

Limitaciones Técnicas del RPN

El RPN presenta desafíos que deben ser gestionados por expertos:

Escala No Continua: En una escala de 1 a 1,000, solo se pueden generar alrededor de 120 combinaciones numéricas únicas utilizando números enteros, lo que puede causar que riesgos distintos obtengan el mismo puntaje. Esto significa que el 88% de la escala de 1 a 1,000 está vacía, creando saltos artificiales que pueden dificultar un poco la comparación real entre riesgos.

Peso Equitativo: El cálculo otorga la misma importancia a la severidad que a la detección, lo cual es técnicamente discutible; un fallo fatal y difícil de detectar podría llegar a tener el mismo RPN que un fallo menor muy frecuente

Ratios sin significado: En el RPN tradicional, un valor de 200 no es necesariamente el doble de grave que uno de 100, ya que los pesos de S, O y D son iguales pero sus impactos físicos no son lineales.

Sensibilidad Matemática: Pequeños cambios en un solo parámetro pueden causar saltos drásticos en el resultado, citando a IEC 60812. (2018) observemos el siguiente ejemplo:

Escenario A: 9×9×3= 243.
Escenario B (cambio de un solo punto en un factor): 9×9×4= 324.
- Resultado: Un cambio de 1 punto en la detectabilidad generó un salto de 81 puntos en el RPN. Esto hace que el método sea muy inestable ante errores de apreciación.

⚠️ Para mitigar estas limitaciones sin abandonar la estructura del método, la ingeniería de confiabilidad ha desarrollado variantes que sí modifican el peso relativo de cada factor sobre el resultado final. Donde el modelo más directo es el aditivo ponderado (NPRw), cuya expresión es:

NPRw = (Ws × S) + (Wo × O) + (Wd × D)

A diferencia del producto tradicional, la suma sí permite que los coeficientes Ws, Wo y Wd alteren la jerarquía entre modos de falla, porque cada factor opera de forma independiente sobre el total. El resultado ya no está acotado en 1 a 1000, sino que depende directamente de los pesos asignados, razón por la cual la organización debe redefinir sus umbrales de acción antes de aplicar el modelo.

Criterios para la Asignación de Pesos

La utilidad de este enfoque depende de que los coeficientes se definan en función del perfil de riesgo real de la organización y no de forma arbitraria:

(Ws > Wo ≈ Wd): prioriza la gravedad del efecto, lo que resulta adecuado en entornos donde la seguridad del personal o la integridad del activo son el objetivo primario.
(Wo > Ws ≈ Wd): privilegia la frecuencia de ocurrencia, orientado a organizaciones que buscan maximizar la disponibilidad operativa reduciendo fallas recurrentes.
(Wd > Ws ≈ Wo): centraliza la detectabilidad, útil cuando se desea auditar la eficacia de los sistemas de monitoreo y los programas de Ensayos No Destructivos (END).

La determinación de estos valores debe ser producto de una sesión de trabajo técnico multidisciplinario, y la organización debe estandarizar los coeficientes antes de iniciar el análisis para garantizar coherencia entre activos.

El RPN; siempre suele ser de carácter debatible entre organizaciones y profesionales, por ello, quienes deseen profundizar en los fundamentos académicos de las variantes ponderadas del RPN pueden consultar las siguientes referencias.
Chin, Wang, Poon y Yang (2009) formalizaron matemáticamente la distinción entre el modelo aditivo y el multiplicativo, enunciando de forma explícita la expresión Rᵢ = Σ wⱼ · rᵢⱼ como definición del riesgo aditivo ponderado, que es la base directa del NPRw desarrollado en este artículo.
Chin, K.-S., Wang, Y.-M., Poon, G. K. K., & Yang, J.-B. (2009). Failure mode and effects analysis by data envelopment analysis. Decision Support Systems, 48(1), 246–256.
Braglia (2000) sentó las bases al proponer el MAFMA, un modelo multicriterio que trata la severidad, la ocurrencia y la detectabilidad como atributos ponderables mediante el Proceso Analítico Jerárquico (AHP), alejándose por primera vez del producto tradicional.
Braglia, M. (2000). MAFMA: Multi-attribute failure mode analysis. International Journal of Quality & Reliability Management, 17(9), 1017–1033.
Bevilacqua, Braglia y Gabbrielli (2000) llevaron este principio a la práctica en una planta industrial real, definiendo el RPN como una suma ponderada de seis parámetros operativos en una refinería italiana, lo que demuestra que la adaptación de los pesos al contexto de cada instalación es técnicamente viable.
Bevilacqua, M., Braglia, M., & Gabbrielli, R. (2000). Monte Carlo simulation approach for a modified FMECA in a power plant. Quality and Reliability Engineering International, 16(4), 313–324.

El Análisis del Diagrama/Ley/Principio de Pareto (80/20)

Esta distribución, conocida como principio de Pareto o regla 80/20, en mantenimiento este principio es llamado como los "pocos vitales", pues nos ayuda también a orientar dónde concentrar las acciones de mantenimiento y los análisis de confiabilidad para obtener el mayor retorno en disponibilidad y reducción de costos.

Identificar esos porcentajes requiere de datos reales del historial de fallas, órdenes de trabajo correctivas y registros de producción diferida.

Cuando esos datos existen y están correctamente codificados en el sistema de gestión, el análisis de Pareto produce una lista clara de sistemas problemáticos que justifican la inversión en un análisis de modos de falla detallado.
Cuando los datos son deficientes, el equipo de trabajo debe apoyarse en mayor medida en el conocimiento empírico del personal de campo, lo que introduce más incertidumbre en la clasificación, pero no invalida el proceso.

Pasos para la Construcción del Análisis de Pareto

Identificar el objetivo: ¿Qué quieres analizar? (Ej. causas de paradas de planta, tipos de fallos, costo de repuestos, quejas de clientes).
Recolección: Obtén los datos sobre la frecuencia (cuántas veces ocurre) o el impacto (cuánto cuesta, cuántas horas pierde) de cada categoría durante un periodo específico.

Veamos cómo se ven algunos ejemplos;

El Diagrama de Pareto para los resultados del Análisis de Criticidad a nivel de Equipos

#	Elemento / Activo	Criticidad (0-100)	% Peso Individual	% Acumulado
1	Compresor de Gas Principal	100	19.65%	19.65%
2	Turbina de Generación Eléctrica	95	18.66%	38.31%
3	Caldera de Vapor de Alta Presión	85	16.70%	55.01%
4	Bomba de Alimentación de Crudo	65	12.77%	67.78%
5	Intercambiador de Calor Principal	45	8.84%	76.62%
6	Transformador de Potencia Planta	30	5.89%	82.51%
7	Ventilador de Tiro Forzado	25	4.91%	87.42%
8	Bomba de Agua de Enfriamiento	15	2.95%	90.37%
9	Compresor de Aire de Instrumentos	10	1.96%	92.33%
10	Sistema de Filtrado de Combustible	8	1.57%	93.90%
11	Bomba de Sumidero de Planta A	6	1.18%	95.08%
12	Bomba de Sumidero de Planta B	5	0.98%	96.06%
13	Válvula de Control de Recirculación	4	0.79%	96.85%
14	Motor de Agitador de Tanque	4	0.79%	97.64%
15	Extractor de Aire de Techo	3	0.59%	98.23%
16	Transportador de Banda Secundario	3	0.59%	98.82%
17	Bomba de Dosificación Química	2	0.39%	99.21%
18	Sistema de Alumbrado de Planta	2	0.39%	99.60%
19	Trampa de Vapor de Línea 3	1	0.20%	99.80%
20	Sensor de Temperatura de Respaldo	1	0.20%	100.00%

El Diagrama de Pareto desde el Nivel Micro con Modos de Fallo (Análisis de causas en Motor Eléctrico)

Distribución estadística de modos de fallo y tiempos asociados en motores eléctricos
	Modo de Fallo (ISO 14224)	Frecuencia Absoluta (n°)	Frecuencia Relativa (%)	Frecuencia Acumulada (%)	TPPF (Horas)	TPPR (Horas)
1	Desgaste y degradación de rodamientos	15	20%	20%	19.960	20
2	Lubricación deficiente o contaminada	12	15%	35%	14.960	15
3	Falla por bajo aislamiento	8	10%	45%	29.996	24
4	Sobrecargas eléctricas	6	8%	53%	24.957	25
5	Desalineación motor-bomba	5	7%	60%	17.992	10
6	Cortocircuitos en bobinados	5	7%	67%	34.992	56
7	Desbalanceo del rotor	4	5%	72%	21.944	15
8	Alineación incorrecta rodamiento	3	5%	77%	19.971	15
9	Fallas en el rotor (barras rotas)	4	5%	82%	39.970	75
10	Ventilador sucio o bloqueado	2	3%	85%	14.976	5
11	Soltura de pernos de anclaje	2	3%	88%	24.953	7
12	Fallas en caja de bornes	2	3%	91%	27.968	20
13	Ventilador defectuoso	2	2%	93%	19.982	10
141	Falla de resistencia de calefacción	2	2%	95%	29.919	12
15	Contaminación y humedad ambiental	2	2%	97%	34.997	20
16	Temperaturas ambiente extremas	1	1%	98%	39.939	10
17	Unidad de control defectuosa	1	1%	99%	49.966	30
18	Cableado y caja de conexiones dañados	1	1%	100%	44.911	15
	TOTALES	77	100%	100%	24.468	23

El Caracter Reactivo y el Proactivo

El Pareto es una herramienta estrictamente reactiva; requiere de un historial de datos sólido y validado para poder realizar la jerarquización. A nivel macro (especialmente en fases de diseño o proyectos de capital), se necesita un enfoque proactivo y predictivo para evaluar riesgos potenciales de eventos que aún no han ocurrido. El Análisis de Criticidad permite manejar esta incertidumbre mediante el juicio de expertos y matrices de riesgo, algo que el Pareto no puede hacer por sí solo.

Análisis de Pareto (Enfoque Reactivo): Es una herramienta estrictamente reactiva que jerarquiza los "pocos vitales" basándose en un historial sólido de fallas y costos reales. Su función es identificar visualmente a los "malos actores" actuales para concentrar los esfuerzos en eventos que ya están impactando negativamente la disponibilidad operativa.
Análisis de Criticidad (Enfoque Proactivo/Macro): Adopta un carácter proactivo y predictivo al evaluar riesgos potenciales en niveles macro (plantas o sistemas) mediante el juicio de expertos y matrices de riesgo. Permite manejar la incertidumbre en fases de diseño o proyectos de capital al proyectar escenarios de falla antes de que estos se materialicen.
RPN en el FMEA/RCM (Enfoque Proactivo/Micro): El Número de Prioridad de Riesgo (RPN) es el motor cuantitativo del FMECA que opera a nivel micro. Es intrínsecamente proactivo porque se fundamenta en el FMEA, el cual analiza modos de falla potenciales para establecer contramedidas antes de que el impacto ocurra. No opera de forma aislada; requiere como insumo la identificación detallada de funciones y fallas para priorizar técnicamente las tareas de mantenimiento.

Resumen de las herramientas de Priorización

Resumen de los Niveles, Enfoques y Aplicaciones de las herramientas de Priorización
Metodología	Nivel de Aplicación	Enfoque Principal	Objetivo
Análisis de Criticidad	Macro (Planta, Sistemas y Equipos)	Criticidad (Frecuencia x Consecuencia) Riesgo (Probabilidad x Consecuencia)	Jerarquizar activos para definir la política de mantenimiento.
Análisis de Pareto	Intermedio (Resultados de Criticidad en Planta, Sistemas y Equipos) Micro (Grupos de fallas, Historial)	Frecuencia (Estadístico)	Identificar a los malos actores basándose en el historial de eventos.
NPR (RPN)	Micro (Modos de falla específicos)	Riesgo relativo (Severidad x Ocurrencia x Detección)	Priorizar modos de falla dentro del FMECA.

Conclusión

La priorización de equipos es la decisión que hace que cualquier metodología de confiabilidad como el RCM sea manejable desde la práctica industrial.

La priorización de equipos es el factor clave de decisión que permite que cualquier metodología de confiabilidad, como el RCM, sea aplicable (en el sentido del control) de manera efectiva en la práctica industrial. Sin esta guía, dichos métodos se ven obligados a elegir entre aplicarse exhaustivamente a todos los equipos o de forma superficial a ninguno, y ninguna de estas opciones genera los beneficios esperados.

Con una clasificación de criticidad bien elaborada permite concentrar el esfuerzo analítico en aquellos casos donde el impacto es significativo, asegurando que cada tarea de mantenimiento esté respaldada por el riesgo que mitiga y no por la costumbre o por recomendaciones genéricas del fabricante.

Lo que distingue a las organizaciones que obtienen resultados de sus programas de confiabilidad es que decidieron con criterio cuáles activos merecen el análisis más profundo. Esa decisión, respaldada en datos operativos y en el conocimiento del equipo de campo, es la que convierte un inventario de activos en una estrategia de mantenimiento coherente con los objetivos reales del negocio.

Referencias Bibliográficas

American Petroleum Institute. (2017). Risk-based machinery management (API Recommended Practice 691, 1.ª ed.). American Petroleum Institute.
American Petroleum Institute. (2020). Risk-based inspection technology (API Recommended Practice 581, 3.ª ed.). American Petroleum Institute.
International Electrotechnical Commission. (2018). Analysis techniques for system reliability: Procedure for failure mode and effects analysis (FMEA) (IEC 60812:2018). IEC.
Ciliberti, H. (2005). Análisis de criticidad: Una metodología para mejorar la confiabilidad operacional. Reliabilityweb.
International Organization for Standardization. (2019). Risk management: Risk assessment techniques (ISO/IEC 31010:2019). ISO.
Mobley, R. K. (2008). Maintenance fundamentals (2.ª ed.). Butterworth-Heinemann.
Moubray, J. (1997). Reliability-centered maintenance (2.ª ed.). Industrial Press.
Nowlan, F. S., & Heap, H. F. (1978). Reliability-centered maintenance. U.S. Department of Defense.
Petróleos de Venezuela, S.A. (2004). Manual del proceso de mantenimiento de rutina: Clasificación de la criticidad del activo (Norma PDVSA MM-02-15-03). PDVSA.
SAE International. (2002). A guide to the reliability-centered maintenance (RCM) standard (SAE Standard JA1012).
SAE International. (2009). Evaluation criteria for reliability-centered maintenance (RCM) processes (SAE Standard JA1011).
Standards Norway. (2010). Risk and emergency preparedness assessment (NORSOK Standard Z-013, Rev. 3). Standards Norway.
Standards Norway. (2011). Criticality analysis for maintenance purposes (NORSOK Standard Z-008, Rev. 3). Standards Norway.
U.S. Department of Defense. (2012). Standard practice: System safety (MIL-STD-882E). U.S. Department of Defense.
Wireman, T. (2004). Benchmarking best practices in maintenance management. Industrial Press.
Chin, K.-S., Wang, Y.-M., Poon, G. K. K., & Yang, J.-B. (2009). Failure mode and effects analysis by data envelopment analysis. Decision Support Systems, 48(1), 246–256.

Curso de Análisis de Criticidad (Tibaldo) Tibaldo, D. Análisis de Criticidad. Predyc. https://predyc.com/
Curso de Fundamentos (Andrés González) González Giraldo, A. E. Fundamentos de Confiabilidad. Predyc. https://predyc.com/
Curso de RCM (Andrés González) González Giraldo, A. E. Mantenimiento Centrado en Confiabilidad (RCM). Predyc. https://predyc.com/

Dinos qué te ha parecido el artículo

¡Gracias por tu valoración!