Priorización de Equipos y Sistemas Productivos para el RCM
Técnico - Articulo27 de abril de 2026
La priorización de equipos, en el contexto del Mantenimiento Centrado en la Confiabilidad, es el proceso de preselección y selección mediante el cual una organización determina qué activos físicos justifican la inversión de tiempo y recursos que implican realizar los análisis y determinar hasta qué nivel de profundidad deben llevarse, y que puede desarrollarse siguiendo su enfoque tradicional con diagramas lógicos de decisión según el RCM II y los estándares SAE J1011/1012, o desde su enfoque Riguroso presentado en 1978 por los pioneros F. Stanley Nowlan y Howard F. Heap
El propósito final de una correcta priorización es garantizar que los activos cuyas fallas podrían poner en riesgo a las vidas humanas, provocar contaminación ambiental o detener la producción durante semanas, reciban el tratamiento que se merecen con los análisis técnicos más exhaustivos disponibles en la capacidad de la organización. De modo que, al blindar estos sistemas críticos, la gestión adquiere la madurez necesaria para que el resto de los componentes menores se administren bajo una óptica de eficiencia de costos, asegurando que ningún recurso sea desperdiciado.
¿Por qué el RCM no se aplica igual a toda la cadena de activos?
Lo principal es que debemos tener muy en claro que, así como un motor (como equipo) tiene cientos de componentes también una planta industrial típica contiene cientos o miles de activos físicos de diferentes clases y funciones. Desde grandes compresores centrífugos hasta pequeñas válvulas de corte manual, todos estos activos están registrados en el inventario del CMMS, pero su impacto sobre el negocio varía en varios órdenes de magnitud.
Pretender un nivel de análisis uniforme para todos ignora esa gran realidad y distribuye el esfuerzo de ingeniería de manera desproporcionada respecto al riesgo que se intenta gestionar.
Mantener esta coherencia entre el esfuerzo analítico y el impacto potencial es lo que hace sostenible un programa de confiabilidad a largo plazo.
Desde la historia, el RCM surgió en la aviación comercial debido a la crisis sobre las fallas que se enfrentaban, entonces con parte de estos principios como bases iniciales. Los ingenieros del Maintenance Steering Group en 1968 necesitaban concentrar el rigor analítico en los sistemas cuya falla podía comprometer la seguridad del vuelo, no en cada componente del avión por igual. Ese criterio se trasladó a la industria general sin modificaciones esenciales el esfuerzo debe ser proporcional a las consecuencias.
⚠️ Los sistemas más críticos, es decir, los que resultan con mayor criticidad, son gestionados con el máximo rigor metodológico que se pueda aplicar para mitigar su riesgo de falla, asegurando que cada fase del proceso cumpla con los más altos estándares.
📋 En contraste, aquellos de criticidad intermedia pueden adoptarse a otras estrategias menos exigentes o hacer sobre optimizaciones en sus planes de mantenimiento preventivos, lo que evita un consumo excesivo de los recursos operativos. Ahora, si se demuestra que corresponden a un menor impacto se administran mediante enfoques menos intensivos, y cuidadosamente seleccionados para responder de manera precisa y adecuada a sus necesidades específicas, operando entonces sin un mantenimiento proactivo e inclusive hasta la falla que pueda cumplirse sin comprometer la seguridad ni los objetivos de producción.
El razonamiento de fondo detrás de estos análisis es muy claro, si buscamos realizar un análisis de modos de falla que sea muy riguroso para un sistema complejo puede consumir una cantidad de horas considerable, digamos que alrededor de veinte y cuarenta horas o más de trabajo de un equipo multidisciplinario.
El punto clave de esta lógica es que aplicar ese nivel minucioso de detalle a cada motor de bombeo, válvula de cierre y ventilador auxiliar en una planta industrial consumiría demasiados recursos del departamento de mantenimiento & confiabilidad sin generar un beneficio proporcional al esfuerzo realizado.
La Priorización de Equipos tiene diferentes Niveles, Enfoques, y Aplicaciones ¿Entonces, que se usa en cada uno?
La priorización de activos es un proceso estratificado según el nivel taxonómico y la etapa analítica, esencial para la toma de decisiones en mantenimiento.
Dentro de esta gestión, tres metodologías destacan por sus funciones, enfoques y niveles de aplicación específicos según la necesidad operativa.
Estas herramientas fundamentales son: el Análisis de Criticidad, el Número Prioritario de Riesgo (NPR) y el Análisis de Pareto (Ley 80-20).
El Análisis de Criticidad como Método de Preselección.
El método que organiza a la preselección es el Análisis de Criticidad, y, algo sumamente interesante de esta es que puede formularse de manera cualitativa, semicuantitativa o cuantitativa según la disponibilidad de datos y la madurez del programa. En cualquiera de sus formas, evalúa cada activo frente a criterios definidos por la organización y lo clasifica en un nivel que corresponde a una estrategia de mantenimiento específica.
Este análisis es considerado una de las metodologías fundamentales de la confiabilidad, puesto que, mediante el uso de una matriz basada en la criticidad o el riesgo operativo, nos guía en la selección de estrategias como el RCM y otros modelos de gestión de fallas, así como en la asignación eficiente de los presupuestos de mantenimiento.
En la práctica básicamente nos permite evaluar el impacto potencial de cada equipo u sistemas sobre los objetivos del negocio en diferentes categorías como la seguridad, el ambiente, la capacidad productiva y los costos de ciclo de vida, y produce como resultado una jerarquía que orienta la asignación del esfuerzo analítico.
Clasificación Análisis de Criticidad y sus modelos
-1779829877122.png%3Falt%3Dmedia%26token%3D2141f4ed-87e5-4401-9958-8ca65c914ac0&w=3840&q=75)
Tipo Cualitativo (Análisis Descriptivo)
Se fundamenta primordialmente en el juicio de ingeniería por opinión de expertos y la experiencia del Equipo Natural de Trabajo (ENT).
Sus entradas de datos: Utilizan información descriptiva y rangos de datos en lugar de valores discretos. Se apoya en técnicas como la tormenta de ideas (brainstorming), entrevistas estructuradas y el método Delphi.
Resultados: Los riesgos se categorizan en escalas descriptivas como Alto, Medio y Bajo. Aunque se asocien números a estas categorías, no representan cálculos matemáticos reales, sino jerarquías de percepción.
Fortalezas: Es la técnica más rápida y económica. Es ideal para el tamizaje inicial (screening) de grandes parques de activos para decidir dónde aplicar métodos más profundos. Es la única opción viable cuando no existe un historial de fallas registrado.
Debilidades: Presenta un alto nivel de subjetividad, ya que los resultados dependen totalmente del conocimiento del analista y el equipo. Es difícil de reproducir con exactitud por diferentes evaluadores y tiende a generar recomendaciones conservadoras.
Modelos de Nivel Cualitativo
Metodología de NORSOK Standard Z-008: Este enfoque estructural define los límites de riesgo y la jerarquía de los activos evaluando funciones de seguridad esenciales mediante lógicas cualitativas de toma de decisiones.
Tipo Semi-cuantitativo (Análisis de Rangos Relativos)
Se trata de un enfoque híbrido enfoque híbrido que busca obtener la agilidad y rapidez del análisis cualitativo con la precisión y el rigor del cuantitativo. Esta modalidad se ha consolidado como la más empleada en el ámbito petrolero e industrial, ya que los datos que requiere resultan accesibles y manejables, permitiendo así un equilibrio óptimo entre eficiencia y solidez metodológica.
Entradas de datos: Establece escalas ordinales (típicamente del 1 al 5 o del 1 al 10) para la frecuencia y las consecuencias. Combina datos objetivos (como conteo de fallas) con razonamiento cualitativo valorado numéricamente.
Resultados: Provee un valor de criticidad o Número de Prioridad de Riesgo (NPR/RPN) que es proporcional al riesgo real. Permite generar una Matriz de Criticidad (ej. 4x4 o 5x5) para visualizar la distribución de activos.
Fortalezas: Mejora la precisión estandarizada y la repetibilidad de los resultados. Facilita la identificación de los malos actores y permite realizar seguimientos de tendencias de riesgo a lo largo del tiempo.
Debilidades: Al no utilizar unidades absolutas (como $ / año), no es adecuado para establecer la tolerabilidad del riesgo en términos financieros ni legales estrictos.
Modelos de Nivel Semi-cuantitativo
API-RP-691: Risk-based Machinery Management: Integra enfoques basados en riesgo que permiten transitar desde evaluaciones cualitativas hacia métodos más rigurosos, utilizando criterios de tolerancia al riesgo para la selección preliminar de maquinaria crítica.
MIL-STD-882E (2012): Aplica una matriz de evaluación de riesgos estandarizada que cruza rangos de probabilidad con niveles de severidad descriptivos ponderados.
Método de los puntos Mar del Norte: Utiliza un sistema híbrido que asigna puntuaciones fijas a variables como costos de reparación, frecuencia de fallas y afectación ambiental para calcular un impacto total.
NORSOK Z-013 – "Risk and Emergency Preparedness Analysis": Emplea matrices de riesgo relativas basadas en consecuencias e intervalos de frecuencia para la preparación ante emergencias industriales.
PEMEX - México: Utiliza una matriz de criticidad específica ponderada por colores (alto, medio, bajo) y asociada a puntajes definidos para la priorización de rutina en activos petroleros.
PDVSA MM-02-15-03: Emplea una matriz bidimensional estándar que cruza niveles proporcionales de frecuencia de fallas contra consecuencias operacionales.
Análisis de Criticidad Metodología de Ciliberti: Se fundamenta en un algoritmo jerárquico que pondera numéricamente la flexibilidad operacional, los costos de mantenimiento y la seguridad.
Tipo Cuantitativo (Análisis Numérico Probabilístico)
Es la modalidad más compleja y objetiva, orientada a determinar valores de riesgo que pueden tratarse como egresos probables.
Entradas de datos: Requiere datos de alta calidad y precisión, utilizando distribuciones de probabilidad (como Weibull o Normal) en lugar de valores fijos. También, podría utilizar modelos lógicos (árboles de fallas y de eventos) y simulaciones de Monte Carlo para propagar la incertidumbre.
Resultados: Expresa el riesgo en unidades específicas (ej. fatalidades por año, barriles perdidos o costo económico total). Los resultados se comparan contra criterios de tolerancia de riesgo preestablecidos por la organización.
Fortalezas: Proporciona un dimensionamiento objetivo que permite realizar análisis de sensibilidad para identificar qué variables (ej. temperatura, corrosión) impactan más en el riesgo. Es indispensable para evaluaciones financieras de Costo de Ciclo de Vida (LCC) y para justificar inversiones en activos de alta criticality.
Debilidades: Exige una inversión significativa de tiempo y recursos. La calidad de la salida depende críticamente de la veracidad y cantidad de la data histórica evaluada.
Modelos de Nivel Cuantitativo
ISO 31010 Técnicas de Gestión de Riesgo: Proporciona las bases normativas para modelados probabilísticos de consecuencias y niveles de verosimilitud numéricos frente a incertidumbres.
API-RP-581: Risk-based Inspection: Representa la modalidad más compleja al calcular de forma numérica y probabilística el riesgo real mediante la multiplicación exacta de la probabilidad de falla por la consecuencia financiera de la misma.
Cuadro Comparativo de los Niveles de Análisis
Atributo | Cualitativo | Semi-cuantitativo | Cuantitativo |
Complejidad | Baja | Media | Alta |
Tiempo/Esfuerzo | Mínimo | Moderado | Elevado |
Precisión | Menor | Estandarizada | Alta resolución |
Foco | Opinión de expertos | Factores ponderados | Modelos probabilísticos |
Uso Principal | Selección preliminar | Priorización de rutina | Decisiones financieras/seguridad |
Los enfoques y el cálculo del Análisis de Criticidad.
Hablemos sobre el análisis de criticidad semi-cuantitativo del método de los puntos (que es el más utilizado) desde la gestión de la integridad física del activo, este mismo se puede implementar bajo dos enfoques diferenciados que dependen de la naturaleza de los activos y de los datos disponibles para la gestión.
El método del cálculo de la criticidad va a depender del enfoque que es utilizado; respecto a si es basado en el hoy (con las frecuencias) o en la predicción (el riesgo futuro). En ambos casos, cada uno de estos criterios se multiplica por sus consecuencias, y opcionalmente se puede incluir a la detectabilidad.
Las fórmulas son muy variadas, pues pueden cambiar según los modelos que adopte o que pueda crear la organización, pues el análisis de criticidad es un traje a la medida; por ello, los criterios y factores de cálculo contienen ponderaciones que la empresa debe adoptar según sus propias necesidades y contexto operacional.
De forma muy general, después de seleccionar los criterios y factores que conformarán las columnas de estudio = [frecuencia o riesgo x consecuencias (x detectabilidad; opcional)], se asignan esas ponderaciones a estos factores mediante el consenso de un Equipo Natural de Trabajo (ENT). Cada una de estas columnas de estudio requiere un cálculo individual totalmente ajustado y personalizado al contexto de los objetos de estudio.
No es lo mismo realizar un análisis de criticidad para toda una planta que enfocarlo únicamente a una familia de equipos; el nivel de personalización y profundidad cambia según el nivel jerárquico y los límites de batería definidos.
⚠️Como las corporaciones manejan desde cientos hasta decenas de miles de equipos, la premisa fundamental de este análisis es la administración de recursos agotables.
Así que, los recursos que tengamos disponibles para la optimización de los esfuerzos dictarán el nivel de profundidad del análisis; por tanto, la segmentación depende de si se evalúa la planta completa o una familia en particular.
El objetivo es alcanzar un equilibrio contextualizado entre la complejidad del estudio y la capacidad de tiempo del equipo de confiabilidad, evitando análisis tan complejos que no puedan terminarse o tan simples que carezcan de valor. Continuando con este flujo, tras las evaluaciones individuales, se llega a un cálculo total de la criticidad que permite generar la lista jerarquizada para la toma de decisiones.
Respecto a la constructibilidad geométrica de una matriz de criticidad o riesgo, esta debe aclararse que no es un proceso estandarizado, sino que esta ligada a lo mencionado anteriormente con una arquitectura técnica que se adapta a la realidad específica de cada organización para facilitar la toma de decisiones informadas. Esta estructura básica de la matriz es un arreglo rectangular de celdas que representa la intersección de dos ejes.
Eje de Probabilidad o Frecuencia: Suele dividirse en rangos que van desde eventos "muy probables" o "frecuentes" hasta eventos "remotos" o "extremadamente improbables".
Eje de Consecuencia (Impacto): Clasifica la severidad de los fallos, generalmente en términos de seguridad, ambiente, producción y costos, con escalas que van desde "insignificante" o "marginal" hasta "catastrófico" o "muy severo".
Dimensiones de la Configuración: No existe un tamaño obligatorio, las configuraciones comunes son de 4x4, 5x5, 6x6, e incluso matrices asimétricas como 4x5 o 7x5... La elección depende de la necesidad de discriminación de los activos.
Estrategias de Mantenimiento, el Mapa de Calor, y las Regiones del Riesgo
El análisis de criticidad no produce únicamente una clasificación; el mayor atractivo de este es la asignación de cada activo a una familia de estrategias de mantenimiento, que nos señalan o indican a donde se debería atacar primero, y la respuesta de cómo es que se van a atacar, pues dependerá del modelo de la confiabilidad de cada organización, además del nivel de riesgo tolerable de la misma para cada activo dentro de este grupo de estrategias.
Por eso mismo, esta correspondencia entre el nivel de criticidad y la profundidad del análisis en sí, es lo que hace útil y operativo el proceso de priorización.
El mapa de calor es la representación visual de la intensidad del riesgo mediante un código de colores. Generalmente, las matrices se dividen en tres o cuatro regiones fundamentales, es muy importante mencionar que el trato que se les dará a los activos será según el resultante de que entren en cada una estas áreas/celdas (además, así como los equipos tienden a degradarse con el tiempo y cambiar su comportamiento, también lo hará la criticidad y el riesgo moviendo a través de estos puntos):
Riesgo Alto (🔴- Roja): Representa riesgos inaceptables o intolerables que requieren las estrategias más exhaustivas con metodologías como el RCM y el IBR, con acciones de mitigación inmediatas, cambios permanentes o rediseños.
Riesgo Moderado (🟠 - Naranja/ 🟡- Amarilla): Indica los límites hasta dónde puede llegar el riesgo máximo tolerable con controles específicos, y donde empieza a generarse de forma alarmante. De modo que, requieren una evaluación detallada y posibles actividades de monitoreo constante para no migrar a la zona roja. Por ello, el foco de acciones de estos equipos en estos rangos, donde en la generación de planes de mantenimiento por familia y tipo de equipo.
Región de Riesgo Bajo (🟢- Verde/⚪ - Blanca): Se considera un nivel de riesgo ampliamente aceptable. Destinado a estrategias preventivas o RTF, pero guiadas por evaluaciones costo-riesgo-beneficio (OCR).
Opcionalmente, es común encontrar un cuarto estrato como: 🟡- Región de Riesgo Semi-crítica (antes del riesgo medio/moderado): Algunas organizaciones añaden esta categoría (usualmente asociada al color amarillo) para identificar activos que, aunque no son críticos, están llegando a un punto meritorio de atención.
Simetría vs. Asimetría y el Modelo ALARP
La distribución de las áreas de color no siempre es simétrica respecto a la diagonal de la matriz.
Matrices Balanceadas (Simétricas): El riesgo se distribuye de forma equitativa entre probabilidad y consecuencia.
Matrices No Balanceadas (Asimétricas): Las empresas suelen dar mayor peso a las consecuencias (especialmente en seguridad y ambiente) que a la probabilidad. Bajo esta lógica, un evento con baja probabilidad pero consecuencia catastrófica puede ubicarse directamente en la zona de riesgo alto, mientras que un evento de alta probabilidad pero impacto insignificante se mantendrá en la zona baja.
Modelo ALARP (As Low As Reasonably Practicable): Este principio se aplica visualmente en la banda media de la matriz. Representa una zona de "tolerabilidad" donde se asume el riesgo solo si reducirlo es impracticable o si los costos de la mejora son desproporcionados frente al beneficio obtenido.
Definición de Tolerancias
La configuración de estas áreas y sus límites de tolerancia no es una decisión unilateral de un analista, sino el resultado de un proceso colaborativo y de consenso.
Equipos Naturales de Trabajo (ENT): Para marcar las áreas y definir los puntajes, se reúnen representantes multidisciplinarios de operaciones, mantenimiento, procesos, finanzas, seguridad y ambiente.
Establecimiento de la Tolerancia: Cada empresa tiene distintos niveles de riesgo que son diferentes.
El Proceso de Marcaje: Durante las reuniones, el equipo valida los resultados del análisis estadístico y de escenarios hipotéticos para ajustar la matriz a la filosofía de gestión de la organización.
El proceso de determinar la criticidad
Según sus enfoques:

⏳Basado en la Frecuencia: Define lo que está ocurriendo actualmente, apoyándose en registros históricos de fallas reales. Es el método idóneo para jerarquizar equipos dinámicos o rotativos con eventos recurrentes o fallas crónicas, bajo la fórmula:
Frecuencia de Ocurrencia × Consecuencia (Impactos)
Para calcular la frecuencia de falla se tienen en cuenta ciertos factores determinantes:
Historial de fallas: Fundamentado en el conteo de eventos registrados en el Sistema de Gestión de Mantenimiento (CMMS).
Frecuencia de eventos: Totalización de la ocurrencia de fallas, expresada generalmente como fallas por año.
Tasa de falla λ y TPEF: Uso del Tiempo Promedio Entre Fallas (TPEF o MTBF por sus siglas en inglés) calculado a partir del tiempo real transcurrido entre paradas.
Datos comparativos: Ante la ausencia de datos propios, se emplean bases de datos estandarizadas (como OREDA) para establecer una tasa de falla de referencia.
Propósito: Identificar activos con comportamientos recurrentes o los malos actores que impactan negativamente la disponibilidad operativa actual.
🎲Basado en el Riesgo: según ISO 31000. (2018). se define al riesgo como el "efecto de la incertidumbre sobre los objetivos", trasladando esto a este enfoque profesional; proyecta lo que puede ocurrir, como la probabilidad de que ocurra un evento potencial que generalmente no es deseado por sus consecuencias), utilizando entonces un carácter predictivo para evaluar escenarios potenciales y sus efectos. Resulta ideal para jerarquizar equipos estáticos o críticos donde la falla es inaceptable, la probabilidad se define comúnmente como el Índice de Probabilidad de Falla (IPF) o solo probabilidad de falla dependiendo de la literatura, integrando en su cálculo:
Índice de Probabilidad de Falla (IPF) × Consecuencia (Impactos)
Para determinar el Índice de Probabilidad de Falla (IPF) se consideran los siguientes factores de susceptibilidad:
Integridad mecánica: Diagnóstico del estado físico, espesores remanentes y cumplimiento de las normativas de diseño original.
Factores de integridad: El IPF se determina mediante una suma ponderada de variables técnicas que condicionan el estado del activo.
Mecanismos de degradación: Evaluación de tasas de corrosión (interna o externa) y tendencias de deterioro activo.
Variables operacionales: Análisis de presión, temperatura, presencia de fluidos corrosivos (H2S, CO2) y el cumplimiento de los límites operativos de diseño.
Sistemas de protección: Verificación del estado de lazos de control, alarmas y dispositivos de seguridad instalados.
Efectividad de la inspección: Evaluación de la calidad y frecuencia de las intervenciones de inspección previas.
Factores de edad: Análisis de la relación entre el tiempo en servicio y la vida útil remanente estimada.
Propósito: Evaluar el riesgo potencial y la susceptibilidad a la falla basada en la física del deterioro del activo.
(🚨+💥+💸) El cálculo de las consecuencias:
Independientemente del método, las consecuencias se definen como las afectaciones derivadas del efecto de materialización de un modo de falla.
Los criterios evaluados, derivados de estándares de confiabilidad como el RCM, incluyen:
Seguridad, Higiene y Ambiente (SHA): Impacto en la integridad humana, daño a instalaciones o violación de regulaciones ecológicas.
Impacto Operacional: Pérdida de producción, paradas de sistema, afectación a inventarios o calidad.
Costos: Gastos directos en mano de obra, materiales y repuestos.
Flexibilidad Operacional: Existencia de repuestos o redundancias que mitigan el efecto.
Su cálculo tiene diferentes fórmulas, dependiendo el modelo a seleccionar, pues cada uno de ellos puede o no considerar los factores mencionados, si hablamos desde una perspectiva global podemos presentar diversos modelos las siguientes desde diferentes categorías: Sistémicos (es decir, integrales), Operacionales (basados en la integridad de los equipos) y la Financieros (costos globales):
Modelo Generalista de Jerarquización de Consecuencias:
Fórmula: C = (IO x FO) + CM + SHA
Abreviaturas:
IO: Impacto Operacional (pérdida de capacidad productiva).
FO: Flexibilidad Operacional (factor de atenuación, como redundancias o stock).
CM: Costos de Mantenimiento (directos de reparación).
SHA: Impacto en Seguridad, Higiene y Ambiente.
Prioridad: Alta (Priorización de Activos en Plantas de Alta Densidad de Equipos).
Modelo Operacional de Jerarquización de Consecuencias:
Fórmula: C = (NP x %I x TPFS) + CR + IS + IA
Abreviaturas:
NP: Nivel de Producción (valor del flujo o capacidad).
%I: Porcentaje de Impacto (afectación directa sobre la capacidad).
TPFS: Tiempo Promedio Fuera de Servicio.
CR: Costo de Reparación.
IS: Impacto en Seguridad.
IA: Impacto Ambiental.
Prioridad: Media-Alta (Gestión de Sistemas Críticos de Equipos Dinámicos y Estáticos).
Modelo Financiero para Costos Globales de Falla
Fórmula: Cf = ingresos (perdidos) + gastos (extra) + materia prima(desperdiciada)
Abreviaturas:
Cf: Costo total de falla (expresado exclusivamente en unidades monetarias).
Ingresos (perdidos): Lucro cesante por parada.
Gastos (extra): Costos administrativos, penalizaciones, horas extras, logística de emergencia.
Materia prima (desperdiciada): Valor de los insumos perdidos durante la falla.
Prioridad: Estratégica (Toma de decisiones de inversión).
(🔍+ 📡+🎯+ 🧠) La detectabilidad: es un factor opcional que también entra en la evaluación, para disminuir la incertidumbre que se puede añadir o no, y de igual manera estará desglosado más adelante con otro sentido en el RPN (Risk Priority Number) correspondiente al método del RCM como complemento de los pasos del FMEA (Failure Modes Effects Analysis).
La justificación del uso de detectabilidad también es básicamente porque un activo cuyo deterioro se manifiesta con síntomas anticipados puede gestionarse predictivamente con mayor efectividad que uno cuyas fallas son abruptas o silenciosas.
Su cálculo en el análisis de criticidad modificaría la formula inicial:
Criticidad = Frecuencia/Riesgo * Consecuencias (Impactos) * Detectabilidad
Independientemente de la metodología utilizada, su evaluación se fundamenta en la cuantificación de cinco factores de diagnóstico universales:
Existencia de Señales y Síntomas (Señales Débiles): Presencia de evidencias físicas (vibraciones, ruidos, cambios de temperatura) que preceden a la falla.
Sistemas de Monitoreo y Sensores: Disponibilidad y confiabilidad de instrumentación en línea (DCS, alarmas) para captar condiciones precursoras.
Accesibilidad e Inspeccionabilidad: Facilidad física para acceder al componente y realizar pruebas; la inaccesibilidad genera incertidumbre absoluta.
Intervalo P-F (Margen de Respuesta): Tiempo transcurrido entre la detección de la falla potencial (P) y la falla funcional (F). Un intervalo corto reduce la detectabilidad efectiva.
Efectividad de Técnicas de Inspección: Capacidad de los métodos de ensayos no destructivos (NDT) o rondas operativas para identificar el deterioro con precisión.
El RPN (Risk Priority Number)
El Número de Prioritario de Riesgo, conocido como NPR o por sus siglas en inglés RPN, es una parte complementaria del FMEA, y, se incluye como medida semicuantitativa de la criticidad que permite jerarquizar los riesgos para priorizar a nivel Micro a los modos de falla, con cada línea de sus causas y efectos.
Recordemos que las primeras 4 preguntas del RCM; están basadas en el FMEA
El Cálculo Matemático y sus Factores
El RPN se obtiene mediante el producto de tres escalas de valoración, generalmente puntuadas del 1 al 10
Según SAEJ1739. (1995). Su fórmula fundamental es RPN = S x O x D
Severidad (S): Califica la gravedad del efecto potencial de la falla desde la perspectiva del usuario o del negocio
Ranking | Descripción | Criterio |
1 | Ninguna | No hay efecto |
2 | Muy menor | Efecto muy menor |
3 | Menor | Efecto menor |
4 | Moderadamente menor | Efecto moderadamente menor |
5 | Moderado | Efecto moderado |
6 | Moderadamente mayor | Efecto moderadamente mayor |
7 | Mayor | Efecto mayor |
8 | Muy mayor | Efecto muy mayor |
9 | Extremadamente mayor | Efecto extremadamente mayor |
10 | Catastrófico | Efecto catastrófico |
Ocurrencia (O): Estima la probabilidad o frecuencia con la que el modo de falla se manifestará en un periodo determinado
Ranking | Descripción | Criterio |
1 | Remoto | Menos de 1 vez en 10 años |
2 | Muy bajo | Menos de 1 vez en 5 años |
3 | Bajo | Menos de 1 vez en 2 años |
4 | Moderadamente bajo | Menos de 1 vez por año |
5 | Moderado | 1 vez por año |
6 | Moderadamente alto | 2 veces por año |
7 | Alto | 1 vez cada 3 meses |
8 | Muy alto | 1 vez por mes |
9 | Extremadamente alto | 1 vez por semana |
10 | Muy frecuente | 1 vez por día |
Detectabilidad (D): Mide la capacidad de los controles actuales (de diseño o mantenimiento) para identificar la falla antes de que el impacto sea percibido por el sistema o usuario
Ranking | Descripción | Criterio |
1 | Muy alta | El efecto es casi seguro que será detectado |
2 | Alta | El efecto es muy probable que sea detectado |
3 | Moderadamente alta | El efecto es probable que sea detectado |
4 | Media | El efecto es posible que sea detectado |
5 | Moderadamente baja | El efecto es moderadamente improbable que sea detectado |
6 | Baja | El efecto es improbable que sea detectado |
7 | Muy baja | El efecto es muy improbable que sea detectado |
8 | Extremadamente baja | El efecto es extremadamente improbable que sea detectado |
9 | Casi nula | El efecto es casi seguro que no será detectado |
10 | Nula | El efecto es seguro que no será detectado |
Cursos recomendados
Limitaciones Técnicas del RPN
El RPN presenta desafíos que deben ser gestionados por expertos:
Escala No Continua: En una escala de 1 a 1,000, solo se pueden generar alrededor de 120 combinaciones numéricas únicas utilizando números enteros, lo que puede causar que riesgos distintos obtengan el mismo puntaje. Esto significa que el 88% de la escala de 1 a 1,000 está vacía, creando saltos artificiales que pueden dificultar un poco la comparación real entre riesgos.
Peso Equitativo: El cálculo otorga la misma importancia a la severidad que a la detección, lo cual es técnicamente discutible; un fallo fatal y difícil de detectar podría llegar a tener el mismo RPN que un fallo menor muy frecuente
Ratios sin significado: En el RPN tradicional, un valor de 200 no es necesariamente el doble de grave que uno de 100, ya que los pesos de S, O y D son iguales pero sus impactos físicos no son lineales.
Sensibilidad Matemática: Pequeños cambios en un solo parámetro pueden causar saltos drásticos en el resultado, citando a IEC 60812. (2018) observemos el siguiente ejemplo:
Escenario A: 9×9×3= 243.
Escenario B (cambio de un solo punto en un factor): 9×9×4= 324.
Resultado: Un cambio de 1 punto en la detectabilidad generó un salto de 81 puntos en el RPN. Esto hace que el método sea muy inestable ante errores de apreciación.
⚠️ Para mitigar estas limitaciones sin abandonar la estructura del método, la ingeniería de confiabilidad ha desarrollado variantes que sí modifican el peso relativo de cada factor sobre el resultado final. Donde el modelo más directo es el aditivo ponderado (NPRw), cuya expresión es:
NPRw = (Ws × S) + (Wo × O) + (Wd × D)
A diferencia del producto tradicional, la suma sí permite que los coeficientes Ws, Wo y Wd alteren la jerarquía entre modos de falla, porque cada factor opera de forma independiente sobre el total. El resultado ya no está acotado en 1 a 1000, sino que depende directamente de los pesos asignados, razón por la cual la organización debe redefinir sus umbrales de acción antes de aplicar el modelo.
Criterios para la Asignación de Pesos
La utilidad de este enfoque depende de que los coeficientes se definan en función del perfil de riesgo real de la organización y no de forma arbitraria:
(Ws > Wo ≈ Wd): prioriza la gravedad del efecto, lo que resulta adecuado en entornos donde la seguridad del personal o la integridad del activo son el objetivo primario.
(Wo > Ws ≈ Wd): privilegia la frecuencia de ocurrencia, orientado a organizaciones que buscan maximizar la disponibilidad operativa reduciendo fallas recurrentes.
(Wd > Ws ≈ Wo): centraliza la detectabilidad, útil cuando se desea auditar la eficacia de los sistemas de monitoreo y los programas de Ensayos No Destructivos (END).
La determinación de estos valores debe ser producto de una sesión de trabajo técnico multidisciplinario, y la organización debe estandarizar los coeficientes antes de iniciar el análisis para garantizar coherencia entre activos.
El RPN; siempre suele ser de carácter debatible entre organizaciones y profesionales, por ello, quienes deseen profundizar en los fundamentos académicos de las variantes ponderadas del RPN pueden consultar las siguientes referencias.
Chin, Wang, Poon y Yang (2009) formalizaron matemáticamente la distinción entre el modelo aditivo y el multiplicativo, enunciando de forma explícita la expresión Rᵢ = Σ wⱼ · rᵢⱼ como definición del riesgo aditivo ponderado, que es la base directa del NPRw desarrollado en este artículo.
Chin, K.-S., Wang, Y.-M., Poon, G. K. K., & Yang, J.-B. (2009). Failure mode and effects analysis by data envelopment analysis. Decision Support Systems, 48(1), 246–256.
Braglia (2000) sentó las bases al proponer el MAFMA, un modelo multicriterio que trata la severidad, la ocurrencia y la detectabilidad como atributos ponderables mediante el Proceso Analítico Jerárquico (AHP), alejándose por primera vez del producto tradicional.
Braglia, M. (2000). MAFMA: Multi-attribute failure mode analysis. International Journal of Quality & Reliability Management, 17(9), 1017–1033.
Bevilacqua, Braglia y Gabbrielli (2000) llevaron este principio a la práctica en una planta industrial real, definiendo el RPN como una suma ponderada de seis parámetros operativos en una refinería italiana, lo que demuestra que la adaptación de los pesos al contexto de cada instalación es técnicamente viable.
Bevilacqua, M., Braglia, M., & Gabbrielli, R. (2000). Monte Carlo simulation approach for a modified FMECA in a power plant. Quality and Reliability Engineering International, 16(4), 313–324.
El Análisis del Diagrama/Ley/Principio de Pareto (80/20)
Esta distribución, conocida como principio de Pareto o regla 80/20, en mantenimiento este principio es llamado como los "pocos vitales", pues nos ayuda también a orientar dónde concentrar las acciones de mantenimiento y los análisis de confiabilidad para obtener el mayor retorno en disponibilidad y reducción de costos.
Identificar esos porcentajes requiere de datos reales del historial de fallas, órdenes de trabajo correctivas y registros de producción diferida.
Cuando esos datos existen y están correctamente codificados en el sistema de gestión, el análisis de Pareto produce una lista clara de sistemas problemáticos que justifican la inversión en un análisis de modos de falla detallado.
Cuando los datos son deficientes, el equipo de trabajo debe apoyarse en mayor medida en el conocimiento empírico del personal de campo, lo que introduce más incertidumbre en la clasificación, pero no invalida el proceso.
Pasos para la Construcción del Análisis de Pareto
Identificar el objetivo: ¿Qué quieres analizar? (Ej. causas de paradas de planta, tipos de fallos, costo de repuestos, quejas de clientes).
Recolección: Obtén los datos sobre la frecuencia (cuántas veces ocurre) o el impacto (cuánto cuesta, cuántas horas pierde) de cada categoría durante un periodo específico.
Veamos cómo se ven algunos ejemplos;
El Diagrama de Pareto para los resultados del Análisis de Criticidad a nivel de Equipos
# | Elemento / Activo | Criticidad (0-100) | % Peso Individual | % Acumulado |
1 | Compresor de Gas Principal | 100 | 19.65% | 19.65% |
2 | Turbina de Generación Eléctrica | 95 | 18.66% | 38.31% |
3 | Caldera de Vapor de Alta Presión | 85 | 16.70% | 55.01% |
4 | Bomba de Alimentación de Crudo | 65 | 12.77% | 67.78% |
5 | Intercambiador de Calor Principal | 45 | 8.84% | 76.62% |
6 | Transformador de Potencia Planta | 30 | 5.89% | 82.51% |
7 | Ventilador de Tiro Forzado | 25 | 4.91% | 87.42% |
8 | Bomba de Agua de Enfriamiento | 15 | 2.95% | 90.37% |
9 | Compresor de Aire de Instrumentos | 10 | 1.96% | 92.33% |
10 | Sistema de Filtrado de Combustible | 8 | 1.57% | 93.90% |
11 | Bomba de Sumidero de Planta A | 6 | 1.18% | 95.08% |
12 | Bomba de Sumidero de Planta B | 5 | 0.98% | 96.06% |
13 | Válvula de Control de Recirculación | 4 | 0.79% | 96.85% |
14 | Motor de Agitador de Tanque | 4 | 0.79% | 97.64% |
15 | Extractor de Aire de Techo | 3 | 0.59% | 98.23% |
16 | Transportador de Banda Secundario | 3 | 0.59% | 98.82% |
17 | Bomba de Dosificación Química | 2 | 0.39% | 99.21% |
18 | Sistema de Alumbrado de Planta | 2 | 0.39% | 99.60% |
19 | Trampa de Vapor de Línea 3 | 1 | 0.20% | 99.80% |
20 | Sensor de Temperatura de Respaldo | 1 | 0.20% | 100.00% |
-1779996560539.png%3Falt%3Dmedia%26token%3D1666c2ba-1668-4f16-9a31-5877bc3a3b4c&w=3840&q=75)
El Diagrama de Pareto desde el Nivel Micro con Modos de Fallo (Análisis de causas en Motor Eléctrico)
Modo de Fallo (ISO 14224) | Frecuencia Absoluta (n°) | Frecuencia Relativa (%) | Frecuencia Acumulada (%) | TPPF (Horas) | TPPR (Horas) | |
1 | Desgaste y degradación de rodamientos | 15 | 20% | 20% | 19.960 | 20 |
2 | Lubricación deficiente o contaminada | 12 | 15% | 35% | 14.960 | 15 |
3 | Falla por bajo aislamiento | 8 | 10% | 45% | 29.996 | 24 |
4 | Sobrecargas eléctricas | 6 | 8% | 53% | 24.957 | 25 |
5 | Desalineación motor-bomba | 5 | 7% | 60% | 17.992 | 10 |
6 | Cortocircuitos en bobinados | 5 | 7% | 67% | 34.992 | 56 |
7 | Desbalanceo del rotor | 4 | 5% | 72% | 21.944 | 15 |
8 | Alineación incorrecta rodamiento | 3 | 5% | 77% | 19.971 | 15 |
9 | Fallas en el rotor (barras rotas) | 4 | 5% | 82% | 39.970 | 75 |
10 | Ventilador sucio o bloqueado | 2 | 3% | 85% | 14.976 | 5 |
11 | Soltura de pernos de anclaje | 2 | 3% | 88% | 24.953 | 7 |
12 | Fallas en caja de bornes | 2 | 3% | 91% | 27.968 | 20 |
13 | Ventilador defectuoso | 2 | 2% | 93% | 19.982 | 10 |
141 | Falla de resistencia de calefacción | 2 | 2% | 95% | 29.919 | 12 |
15 | Contaminación y humedad ambiental | 2 | 2% | 97% | 34.997 | 20 |
16 | Temperaturas ambiente extremas | 1 | 1% | 98% | 39.939 | 10 |
17 | Unidad de control defectuosa | 1 | 1% | 99% | 49.966 | 30 |
18 | Cableado y caja de conexiones dañados | 1 | 1% | 100% | 44.911 | 15 |
TOTALES | 77 | 100% | 100% | 24.468 | 23 |
-1779998693754.png%3Falt%3Dmedia%26token%3Dafe75721-4564-42e7-b2cb-591d197a63bd&w=2048&q=75)
El Caracter Reactivo y el Proactivo
El Pareto es una herramienta estrictamente reactiva; requiere de un historial de datos sólido y validado para poder realizar la jerarquización. A nivel macro (especialmente en fases de diseño o proyectos de capital), se necesita un enfoque proactivo y predictivo para evaluar riesgos potenciales de eventos que aún no han ocurrido. El Análisis de Criticidad permite manejar esta incertidumbre mediante el juicio de expertos y matrices de riesgo, algo que el Pareto no puede hacer por sí solo.
Análisis de Pareto (Enfoque Reactivo): Es una herramienta estrictamente reactiva que jerarquiza los "pocos vitales" basándose en un historial sólido de fallas y costos reales. Su función es identificar visualmente a los "malos actores" actuales para concentrar los esfuerzos en eventos que ya están impactando negativamente la disponibilidad operativa.
Análisis de Criticidad (Enfoque Proactivo/Macro): Adopta un carácter proactivo y predictivo al evaluar riesgos potenciales en niveles macro (plantas o sistemas) mediante el juicio de expertos y matrices de riesgo. Permite manejar la incertidumbre en fases de diseño o proyectos de capital al proyectar escenarios de falla antes de que estos se materialicen.
RPN en el FMEA/RCM (Enfoque Proactivo/Micro): El Número de Prioridad de Riesgo (RPN) es el motor cuantitativo del FMECA que opera a nivel micro. Es intrínsecamente proactivo porque se fundamenta en el FMEA, el cual analiza modos de falla potenciales para establecer contramedidas antes de que el impacto ocurra. No opera de forma aislada; requiere como insumo la identificación detallada de funciones y fallas para priorizar técnicamente las tareas de mantenimiento.
Resumen de las herramientas de Priorización
Metodología | Nivel de Aplicación | Enfoque Principal | Objetivo |
Análisis de Criticidad |
|
|
|
Análisis de Pareto |
|
|
|
NPR (RPN) |
|
|
|
Conclusión
La priorización de equipos es la decisión que hace que cualquier metodología de confiabilidad como el RCM sea manejable desde la práctica industrial.
La priorización de equipos es el factor clave de decisión que permite que cualquier metodología de confiabilidad, como el RCM, sea aplicable (en el sentido del control) de manera efectiva en la práctica industrial. Sin esta guía, dichos métodos se ven obligados a elegir entre aplicarse exhaustivamente a todos los equipos o de forma superficial a ninguno, y ninguna de estas opciones genera los beneficios esperados.
Con una clasificación de criticidad bien elaborada permite concentrar el esfuerzo analítico en aquellos casos donde el impacto es significativo, asegurando que cada tarea de mantenimiento esté respaldada por el riesgo que mitiga y no por la costumbre o por recomendaciones genéricas del fabricante.
Lo que distingue a las organizaciones que obtienen resultados de sus programas de confiabilidad es que decidieron con criterio cuáles activos merecen el análisis más profundo. Esa decisión, respaldada en datos operativos y en el conocimiento del equipo de campo, es la que convierte un inventario de activos en una estrategia de mantenimiento coherente con los objetivos reales del negocio.
Referencias Bibliográficas
American Petroleum Institute. (2017). Risk-based machinery management (API Recommended Practice 691, 1.ª ed.). American Petroleum Institute.
American Petroleum Institute. (2020). Risk-based inspection technology (API Recommended Practice 581, 3.ª ed.). American Petroleum Institute.
International Electrotechnical Commission. (2018). Analysis techniques for system reliability: Procedure for failure mode and effects analysis (FMEA) (IEC 60812:2018). IEC.
Ciliberti, H. (2005). Análisis de criticidad: Una metodología para mejorar la confiabilidad operacional. Reliabilityweb.
International Organization for Standardization. (2019). Risk management: Risk assessment techniques (ISO/IEC 31010:2019). ISO.
Mobley, R. K. (2008). Maintenance fundamentals (2.ª ed.). Butterworth-Heinemann.
Moubray, J. (1997). Reliability-centered maintenance (2.ª ed.). Industrial Press.
Nowlan, F. S., & Heap, H. F. (1978). Reliability-centered maintenance. U.S. Department of Defense.
Petróleos de Venezuela, S.A. (2004). Manual del proceso de mantenimiento de rutina: Clasificación de la criticidad del activo (Norma PDVSA MM-02-15-03). PDVSA.
SAE International. (2002). A guide to the reliability-centered maintenance (RCM) standard (SAE Standard JA1012).
SAE International. (2009). Evaluation criteria for reliability-centered maintenance (RCM) processes (SAE Standard JA1011).
Standards Norway. (2010). Risk and emergency preparedness assessment (NORSOK Standard Z-013, Rev. 3). Standards Norway.
Standards Norway. (2011). Criticality analysis for maintenance purposes (NORSOK Standard Z-008, Rev. 3). Standards Norway.
U.S. Department of Defense. (2012). Standard practice: System safety (MIL-STD-882E). U.S. Department of Defense.
Wireman, T. (2004). Benchmarking best practices in maintenance management. Industrial Press.
Chin, K.-S., Wang, Y.-M., Poon, G. K. K., & Yang, J.-B. (2009). Failure mode and effects analysis by data envelopment analysis. Decision Support Systems, 48(1), 246–256.
Curso de Análisis de Criticidad (Tibaldo) Tibaldo, D. Análisis de Criticidad. Predyc. https://predyc.com/
Curso de Fundamentos (Andrés González) González Giraldo, A. E. Fundamentos de Confiabilidad. Predyc. https://predyc.com/
Curso de RCM (Andrés González) González Giraldo, A. E. Mantenimiento Centrado en Confiabilidad (RCM). Predyc. https://predyc.com/
Dinos qué te ha parecido el artículo
Priorización de Equipos y Sistemas Productivos para el RCM
Técnico - Articulo 27 de abril de 2026La priorización de equipos, en el contexto del Mantenimiento Centrado en la Confiabilidad, es el proceso de preselección y selección mediante el cual una organización determina qué activos físicos justifican la inversión de tiempo y recursos que implican realizar los análisis y determinar hasta qué nivel de profundidad deben llevarse, y que puede desarrollarse siguiendo su enfoque tradicional con diagramas lógicos de decisión según el RCM II y los estándares SAE J1011/1012, o desde su enfoque Riguroso presentado en 1978 por los pioneros F. Stanley Nowlan y Howard F. Heap
El propósito final de una correcta priorización es garantizar que los activos cuyas fallas podrían poner en riesgo a las vidas humanas, provocar contaminación ambiental o detener la producción durante semanas, reciban el tratamiento que se merecen con los análisis técnicos más exhaustivos disponibles en la capacidad de la organización. De modo que, al blindar estos sistemas críticos, la gestión adquiere la madurez necesaria para que el resto de los componentes menores se administren bajo una óptica de eficiencia de costos, asegurando que ningún recurso sea desperdiciado.
¿Por qué el RCM no se aplica igual a toda la cadena de activos?
Lo principal es que debemos tener muy en claro que, así como un motor (como equipo) tiene cientos de componentes también una planta industrial típica contiene cientos o miles de activos físicos de diferentes clases y funciones. Desde grandes compresores centrífugos hasta pequeñas válvulas de corte manual, todos estos activos están registrados en el inventario del CMMS, pero su impacto sobre el negocio varía en varios órdenes de magnitud.
Pretender un nivel de análisis uniforme para todos ignora esa gran realidad y distribuye el esfuerzo de ingeniería de manera desproporcionada respecto al riesgo que se intenta gestionar.
Mantener esta coherencia entre el esfuerzo analítico y el impacto potencial es lo que hace sostenible un programa de confiabilidad a largo plazo.
Desde la historia, el RCM surgió en la aviación comercial debido a la crisis sobre las fallas que se enfrentaban, entonces con parte de estos principios como bases iniciales. Los ingenieros del Maintenance Steering Group en 1968 necesitaban concentrar el rigor analítico en los sistemas cuya falla podía comprometer la seguridad del vuelo, no en cada componente del avión por igual. Ese criterio se trasladó a la industria general sin modificaciones esenciales el esfuerzo debe ser proporcional a las consecuencias.
⚠️ Los sistemas más críticos, es decir, los que resultan con mayor criticidad, son gestionados con el máximo rigor metodológico que se pueda aplicar para mitigar su riesgo de falla, asegurando que cada fase del proceso cumpla con los más altos estándares.
📋 En contraste, aquellos de criticidad intermedia pueden adoptarse a otras estrategias menos exigentes o hacer sobre optimizaciones en sus planes de mantenimiento preventivos, lo que evita un consumo excesivo de los recursos operativos. Ahora, si se demuestra que corresponden a un menor impacto se administran mediante enfoques menos intensivos, y cuidadosamente seleccionados para responder de manera precisa y adecuada a sus necesidades específicas, operando entonces sin un mantenimiento proactivo e inclusive hasta la falla que pueda cumplirse sin comprometer la seguridad ni los objetivos de producción.
El razonamiento de fondo detrás de estos análisis es muy claro, si buscamos realizar un análisis de modos de falla que sea muy riguroso para un sistema complejo puede consumir una cantidad de horas considerable, digamos que alrededor de veinte y cuarenta horas o más de trabajo de un equipo multidisciplinario.
El punto clave de esta lógica es que aplicar ese nivel minucioso de detalle a cada motor de bombeo, válvula de cierre y ventilador auxiliar en una planta industrial consumiría demasiados recursos del departamento de mantenimiento & confiabilidad sin generar un beneficio proporcional al esfuerzo realizado.
La Priorización de Equipos tiene diferentes Niveles, Enfoques, y Aplicaciones ¿Entonces, que se usa en cada uno?
La priorización de activos es un proceso estratificado según el nivel taxonómico y la etapa analítica, esencial para la toma de decisiones en mantenimiento.
Dentro de esta gestión, tres metodologías destacan por sus funciones, enfoques y niveles de aplicación específicos según la necesidad operativa.
Estas herramientas fundamentales son: el Análisis de Criticidad, el Número Prioritario de Riesgo (NPR) y el Análisis de Pareto (Ley 80-20).
El Análisis de Criticidad como Método de Preselección.
El método que organiza a la preselección es el Análisis de Criticidad, y, algo sumamente interesante de esta es que puede formularse de manera cualitativa, semicuantitativa o cuantitativa según la disponibilidad de datos y la madurez del programa. En cualquiera de sus formas, evalúa cada activo frente a criterios definidos por la organización y lo clasifica en un nivel que corresponde a una estrategia de mantenimiento específica.
Este análisis es considerado una de las metodologías fundamentales de la confiabilidad, puesto que, mediante el uso de una matriz basada en la criticidad o el riesgo operativo, nos guía en la selección de estrategias como el RCM y otros modelos de gestión de fallas, así como en la asignación eficiente de los presupuestos de mantenimiento.
En la práctica básicamente nos permite evaluar el impacto potencial de cada equipo u sistemas sobre los objetivos del negocio en diferentes categorías como la seguridad, el ambiente, la capacidad productiva y los costos de ciclo de vida, y produce como resultado una jerarquía que orienta la asignación del esfuerzo analítico.
Clasificación Análisis de Criticidad y sus modelos
-1779829877122.png%3Falt%3Dmedia%26token%3D2141f4ed-87e5-4401-9958-8ca65c914ac0&w=3840&q=75)
Tipo Cualitativo (Análisis Descriptivo)
Se fundamenta primordialmente en el juicio de ingeniería por opinión de expertos y la experiencia del Equipo Natural de Trabajo (ENT).
Sus entradas de datos: Utilizan información descriptiva y rangos de datos en lugar de valores discretos. Se apoya en técnicas como la tormenta de ideas (brainstorming), entrevistas estructuradas y el método Delphi.
Resultados: Los riesgos se categorizan en escalas descriptivas como Alto, Medio y Bajo. Aunque se asocien números a estas categorías, no representan cálculos matemáticos reales, sino jerarquías de percepción.
Fortalezas: Es la técnica más rápida y económica. Es ideal para el tamizaje inicial (screening) de grandes parques de activos para decidir dónde aplicar métodos más profundos. Es la única opción viable cuando no existe un historial de fallas registrado.
Debilidades: Presenta un alto nivel de subjetividad, ya que los resultados dependen totalmente del conocimiento del analista y el equipo. Es difícil de reproducir con exactitud por diferentes evaluadores y tiende a generar recomendaciones conservadoras.
Modelos de Nivel Cualitativo
Metodología de NORSOK Standard Z-008: Este enfoque estructural define los límites de riesgo y la jerarquía de los activos evaluando funciones de seguridad esenciales mediante lógicas cualitativas de toma de decisiones.
Tipo Semi-cuantitativo (Análisis de Rangos Relativos)
Se trata de un enfoque híbrido enfoque híbrido que busca obtener la agilidad y rapidez del análisis cualitativo con la precisión y el rigor del cuantitativo. Esta modalidad se ha consolidado como la más empleada en el ámbito petrolero e industrial, ya que los datos que requiere resultan accesibles y manejables, permitiendo así un equilibrio óptimo entre eficiencia y solidez metodológica.
Entradas de datos: Establece escalas ordinales (típicamente del 1 al 5 o del 1 al 10) para la frecuencia y las consecuencias. Combina datos objetivos (como conteo de fallas) con razonamiento cualitativo valorado numéricamente.
Resultados: Provee un valor de criticidad o Número de Prioridad de Riesgo (NPR/RPN) que es proporcional al riesgo real. Permite generar una Matriz de Criticidad (ej. 4x4 o 5x5) para visualizar la distribución de activos.
Fortalezas: Mejora la precisión estandarizada y la repetibilidad de los resultados. Facilita la identificación de los malos actores y permite realizar seguimientos de tendencias de riesgo a lo largo del tiempo.
Debilidades: Al no utilizar unidades absolutas (como $ / año), no es adecuado para establecer la tolerabilidad del riesgo en términos financieros ni legales estrictos.
Modelos de Nivel Semi-cuantitativo
API-RP-691: Risk-based Machinery Management: Integra enfoques basados en riesgo que permiten transitar desde evaluaciones cualitativas hacia métodos más rigurosos, utilizando criterios de tolerancia al riesgo para la selección preliminar de maquinaria crítica.
MIL-STD-882E (2012): Aplica una matriz de evaluación de riesgos estandarizada que cruza rangos de probabilidad con niveles de severidad descriptivos ponderados.
Método de los puntos Mar del Norte: Utiliza un sistema híbrido que asigna puntuaciones fijas a variables como costos de reparación, frecuencia de fallas y afectación ambiental para calcular un impacto total.
NORSOK Z-013 – "Risk and Emergency Preparedness Analysis": Emplea matrices de riesgo relativas basadas en consecuencias e intervalos de frecuencia para la preparación ante emergencias industriales.
PEMEX - México: Utiliza una matriz de criticidad específica ponderada por colores (alto, medio, bajo) y asociada a puntajes definidos para la priorización de rutina en activos petroleros.
PDVSA MM-02-15-03: Emplea una matriz bidimensional estándar que cruza niveles proporcionales de frecuencia de fallas contra consecuencias operacionales.
Análisis de Criticidad Metodología de Ciliberti: Se fundamenta en un algoritmo jerárquico que pondera numéricamente la flexibilidad operacional, los costos de mantenimiento y la seguridad.
Tipo Cuantitativo (Análisis Numérico Probabilístico)
Es la modalidad más compleja y objetiva, orientada a determinar valores de riesgo que pueden tratarse como egresos probables.
Entradas de datos: Requiere datos de alta calidad y precisión, utilizando distribuciones de probabilidad (como Weibull o Normal) en lugar de valores fijos. También, podría utilizar modelos lógicos (árboles de fallas y de eventos) y simulaciones de Monte Carlo para propagar la incertidumbre.
Resultados: Expresa el riesgo en unidades específicas (ej. fatalidades por año, barriles perdidos o costo económico total). Los resultados se comparan contra criterios de tolerancia de riesgo preestablecidos por la organización.
Fortalezas: Proporciona un dimensionamiento objetivo que permite realizar análisis de sensibilidad para identificar qué variables (ej. temperatura, corrosión) impactan más en el riesgo. Es indispensable para evaluaciones financieras de Costo de Ciclo de Vida (LCC) y para justificar inversiones en activos de alta criticality.
Debilidades: Exige una inversión significativa de tiempo y recursos. La calidad de la salida depende críticamente de la veracidad y cantidad de la data histórica evaluada.
Modelos de Nivel Cuantitativo
ISO 31010 Técnicas de Gestión de Riesgo: Proporciona las bases normativas para modelados probabilísticos de consecuencias y niveles de verosimilitud numéricos frente a incertidumbres.
API-RP-581: Risk-based Inspection: Representa la modalidad más compleja al calcular de forma numérica y probabilística el riesgo real mediante la multiplicación exacta de la probabilidad de falla por la consecuencia financiera de la misma.
Cuadro Comparativo de los Niveles de Análisis
Atributo | Cualitativo | Semi-cuantitativo | Cuantitativo |
Complejidad | Baja | Media | Alta |
Tiempo/Esfuerzo | Mínimo | Moderado | Elevado |
Precisión | Menor | Estandarizada | Alta resolución |
Foco | Opinión de expertos | Factores ponderados | Modelos probabilísticos |
Uso Principal | Selección preliminar | Priorización de rutina | Decisiones financieras/seguridad |
Los enfoques y el cálculo del Análisis de Criticidad.
Hablemos sobre el análisis de criticidad semi-cuantitativo del método de los puntos (que es el más utilizado) desde la gestión de la integridad física del activo, este mismo se puede implementar bajo dos enfoques diferenciados que dependen de la naturaleza de los activos y de los datos disponibles para la gestión.
El método del cálculo de la criticidad va a depender del enfoque que es utilizado; respecto a si es basado en el hoy (con las frecuencias) o en la predicción (el riesgo futuro). En ambos casos, cada uno de estos criterios se multiplica por sus consecuencias, y opcionalmente se puede incluir a la detectabilidad.
Las fórmulas son muy variadas, pues pueden cambiar según los modelos que adopte o que pueda crear la organización, pues el análisis de criticidad es un traje a la medida; por ello, los criterios y factores de cálculo contienen ponderaciones que la empresa debe adoptar según sus propias necesidades y contexto operacional.
De forma muy general, después de seleccionar los criterios y factores que conformarán las columnas de estudio = [frecuencia o riesgo x consecuencias (x detectabilidad; opcional)], se asignan esas ponderaciones a estos factores mediante el consenso de un Equipo Natural de Trabajo (ENT). Cada una de estas columnas de estudio requiere un cálculo individual totalmente ajustado y personalizado al contexto de los objetos de estudio.
No es lo mismo realizar un análisis de criticidad para toda una planta que enfocarlo únicamente a una familia de equipos; el nivel de personalización y profundidad cambia según el nivel jerárquico y los límites de batería definidos.
⚠️Como las corporaciones manejan desde cientos hasta decenas de miles de equipos, la premisa fundamental de este análisis es la administración de recursos agotables.
Así que, los recursos que tengamos disponibles para la optimización de los esfuerzos dictarán el nivel de profundidad del análisis; por tanto, la segmentación depende de si se evalúa la planta completa o una familia en particular.
El objetivo es alcanzar un equilibrio contextualizado entre la complejidad del estudio y la capacidad de tiempo del equipo de confiabilidad, evitando análisis tan complejos que no puedan terminarse o tan simples que carezcan de valor. Continuando con este flujo, tras las evaluaciones individuales, se llega a un cálculo total de la criticidad que permite generar la lista jerarquizada para la toma de decisiones.
Respecto a la constructibilidad geométrica de una matriz de criticidad o riesgo, esta debe aclararse que no es un proceso estandarizado, sino que esta ligada a lo mencionado anteriormente con una arquitectura técnica que se adapta a la realidad específica de cada organización para facilitar la toma de decisiones informadas. Esta estructura básica de la matriz es un arreglo rectangular de celdas que representa la intersección de dos ejes.
Eje de Probabilidad o Frecuencia: Suele dividirse en rangos que van desde eventos "muy probables" o "frecuentes" hasta eventos "remotos" o "extremadamente improbables".
Eje de Consecuencia (Impacto): Clasifica la severidad de los fallos, generalmente en términos de seguridad, ambiente, producción y costos, con escalas que van desde "insignificante" o "marginal" hasta "catastrófico" o "muy severo".
Dimensiones de la Configuración: No existe un tamaño obligatorio, las configuraciones comunes son de 4x4, 5x5, 6x6, e incluso matrices asimétricas como 4x5 o 7x5... La elección depende de la necesidad de discriminación de los activos.
Estrategias de Mantenimiento, el Mapa de Calor, y las Regiones del Riesgo
El análisis de criticidad no produce únicamente una clasificación; el mayor atractivo de este es la asignación de cada activo a una familia de estrategias de mantenimiento, que nos señalan o indican a donde se debería atacar primero, y la respuesta de cómo es que se van a atacar, pues dependerá del modelo de la confiabilidad de cada organización, además del nivel de riesgo tolerable de la misma para cada activo dentro de este grupo de estrategias.
Por eso mismo, esta correspondencia entre el nivel de criticidad y la profundidad del análisis en sí, es lo que hace útil y operativo el proceso de priorización.
El mapa de calor es la representación visual de la intensidad del riesgo mediante un código de colores. Generalmente, las matrices se dividen en tres o cuatro regiones fundamentales, es muy importante mencionar que el trato que se les dará a los activos será según el resultante de que entren en cada una estas áreas/celdas (además, así como los equipos tienden a degradarse con el tiempo y cambiar su comportamiento, también lo hará la criticidad y el riesgo moviendo a través de estos puntos):
Riesgo Alto (🔴- Roja): Representa riesgos inaceptables o intolerables que requieren las estrategias más exhaustivas con metodologías como el RCM y el IBR, con acciones de mitigación inmediatas, cambios permanentes o rediseños.
Riesgo Moderado (🟠 - Naranja/ 🟡- Amarilla): Indica los límites hasta dónde puede llegar el riesgo máximo tolerable con controles específicos, y donde empieza a generarse de forma alarmante. De modo que, requieren una evaluación detallada y posibles actividades de monitoreo constante para no migrar a la zona roja. Por ello, el foco de acciones de estos equipos en estos rangos, donde en la generación de planes de mantenimiento por familia y tipo de equipo.
Región de Riesgo Bajo (🟢- Verde/⚪ - Blanca): Se considera un nivel de riesgo ampliamente aceptable. Destinado a estrategias preventivas o RTF, pero guiadas por evaluaciones costo-riesgo-beneficio (OCR).
Opcionalmente, es común encontrar un cuarto estrato como: 🟡- Región de Riesgo Semi-crítica (antes del riesgo medio/moderado): Algunas organizaciones añaden esta categoría (usualmente asociada al color amarillo) para identificar activos que, aunque no son críticos, están llegando a un punto meritorio de atención.
Simetría vs. Asimetría y el Modelo ALARP
La distribución de las áreas de color no siempre es simétrica respecto a la diagonal de la matriz.
Matrices Balanceadas (Simétricas): El riesgo se distribuye de forma equitativa entre probabilidad y consecuencia.
Matrices No Balanceadas (Asimétricas): Las empresas suelen dar mayor peso a las consecuencias (especialmente en seguridad y ambiente) que a la probabilidad. Bajo esta lógica, un evento con baja probabilidad pero consecuencia catastrófica puede ubicarse directamente en la zona de riesgo alto, mientras que un evento de alta probabilidad pero impacto insignificante se mantendrá en la zona baja.
Modelo ALARP (As Low As Reasonably Practicable): Este principio se aplica visualmente en la banda media de la matriz. Representa una zona de "tolerabilidad" donde se asume el riesgo solo si reducirlo es impracticable o si los costos de la mejora son desproporcionados frente al beneficio obtenido.
Definición de Tolerancias
La configuración de estas áreas y sus límites de tolerancia no es una decisión unilateral de un analista, sino el resultado de un proceso colaborativo y de consenso.
Equipos Naturales de Trabajo (ENT): Para marcar las áreas y definir los puntajes, se reúnen representantes multidisciplinarios de operaciones, mantenimiento, procesos, finanzas, seguridad y ambiente.
Establecimiento de la Tolerancia: Cada empresa tiene distintos niveles de riesgo que son diferentes.
El Proceso de Marcaje: Durante las reuniones, el equipo valida los resultados del análisis estadístico y de escenarios hipotéticos para ajustar la matriz a la filosofía de gestión de la organización.
El proceso de determinar la criticidad
Según sus enfoques:

⏳Basado en la Frecuencia: Define lo que está ocurriendo actualmente, apoyándose en registros históricos de fallas reales. Es el método idóneo para jerarquizar equipos dinámicos o rotativos con eventos recurrentes o fallas crónicas, bajo la fórmula:
Frecuencia de Ocurrencia × Consecuencia (Impactos)
Para calcular la frecuencia de falla se tienen en cuenta ciertos factores determinantes:
Historial de fallas: Fundamentado en el conteo de eventos registrados en el Sistema de Gestión de Mantenimiento (CMMS).
Frecuencia de eventos: Totalización de la ocurrencia de fallas, expresada generalmente como fallas por año.
Tasa de falla λ y TPEF: Uso del Tiempo Promedio Entre Fallas (TPEF o MTBF por sus siglas en inglés) calculado a partir del tiempo real transcurrido entre paradas.
Datos comparativos: Ante la ausencia de datos propios, se emplean bases de datos estandarizadas (como OREDA) para establecer una tasa de falla de referencia.
Propósito: Identificar activos con comportamientos recurrentes o los malos actores que impactan negativamente la disponibilidad operativa actual.
🎲Basado en el Riesgo: según ISO 31000. (2018). se define al riesgo como el "efecto de la incertidumbre sobre los objetivos", trasladando esto a este enfoque profesional; proyecta lo que puede ocurrir, como la probabilidad de que ocurra un evento potencial que generalmente no es deseado por sus consecuencias), utilizando entonces un carácter predictivo para evaluar escenarios potenciales y sus efectos. Resulta ideal para jerarquizar equipos estáticos o críticos donde la falla es inaceptable, la probabilidad se define comúnmente como el Índice de Probabilidad de Falla (IPF) o solo probabilidad de falla dependiendo de la literatura, integrando en su cálculo:
Índice de Probabilidad de Falla (IPF) × Consecuencia (Impactos)
Para determinar el Índice de Probabilidad de Falla (IPF) se consideran los siguientes factores de susceptibilidad:
Integridad mecánica: Diagnóstico del estado físico, espesores remanentes y cumplimiento de las normativas de diseño original.
Factores de integridad: El IPF se determina mediante una suma ponderada de variables técnicas que condicionan el estado del activo.
Mecanismos de degradación: Evaluación de tasas de corrosión (interna o externa) y tendencias de deterioro activo.
Variables operacionales: Análisis de presión, temperatura, presencia de fluidos corrosivos (H2S, CO2) y el cumplimiento de los límites operativos de diseño.
Sistemas de protección: Verificación del estado de lazos de control, alarmas y dispositivos de seguridad instalados.
Efectividad de la inspección: Evaluación de la calidad y frecuencia de las intervenciones de inspección previas.
Factores de edad: Análisis de la relación entre el tiempo en servicio y la vida útil remanente estimada.
Propósito: Evaluar el riesgo potencial y la susceptibilidad a la falla basada en la física del deterioro del activo.
(🚨+💥+💸) El cálculo de las consecuencias:
Independientemente del método, las consecuencias se definen como las afectaciones derivadas del efecto de materialización de un modo de falla.
Los criterios evaluados, derivados de estándares de confiabilidad como el RCM, incluyen:
Seguridad, Higiene y Ambiente (SHA): Impacto en la integridad humana, daño a instalaciones o violación de regulaciones ecológicas.
Impacto Operacional: Pérdida de producción, paradas de sistema, afectación a inventarios o calidad.
Costos: Gastos directos en mano de obra, materiales y repuestos.
Flexibilidad Operacional: Existencia de repuestos o redundancias que mitigan el efecto.
Su cálculo tiene diferentes fórmulas, dependiendo el modelo a seleccionar, pues cada uno de ellos puede o no considerar los factores mencionados, si hablamos desde una perspectiva global podemos presentar diversos modelos las siguientes desde diferentes categorías: Sistémicos (es decir, integrales), Operacionales (basados en la integridad de los equipos) y la Financieros (costos globales):
Modelo Generalista de Jerarquización de Consecuencias:
Fórmula: C = (IO x FO) + CM + SHA
Abreviaturas:
IO: Impacto Operacional (pérdida de capacidad productiva).
FO: Flexibilidad Operacional (factor de atenuación, como redundancias o stock).
CM: Costos de Mantenimiento (directos de reparación).
SHA: Impacto en Seguridad, Higiene y Ambiente.
Prioridad: Alta (Priorización de Activos en Plantas de Alta Densidad de Equipos).
Modelo Operacional de Jerarquización de Consecuencias:
Fórmula: C = (NP x %I x TPFS) + CR + IS + IA
Abreviaturas:
NP: Nivel de Producción (valor del flujo o capacidad).
%I: Porcentaje de Impacto (afectación directa sobre la capacidad).
TPFS: Tiempo Promedio Fuera de Servicio.
CR: Costo de Reparación.
IS: Impacto en Seguridad.
IA: Impacto Ambiental.
Prioridad: Media-Alta (Gestión de Sistemas Críticos de Equipos Dinámicos y Estáticos).
Modelo Financiero para Costos Globales de Falla
Fórmula: Cf = ingresos (perdidos) + gastos (extra) + materia prima(desperdiciada)
Abreviaturas:
Cf: Costo total de falla (expresado exclusivamente en unidades monetarias).
Ingresos (perdidos): Lucro cesante por parada.
Gastos (extra): Costos administrativos, penalizaciones, horas extras, logística de emergencia.
Materia prima (desperdiciada): Valor de los insumos perdidos durante la falla.
Prioridad: Estratégica (Toma de decisiones de inversión).
(🔍+ 📡+🎯+ 🧠) La detectabilidad: es un factor opcional que también entra en la evaluación, para disminuir la incertidumbre que se puede añadir o no, y de igual manera estará desglosado más adelante con otro sentido en el RPN (Risk Priority Number) correspondiente al método del RCM como complemento de los pasos del FMEA (Failure Modes Effects Analysis).
La justificación del uso de detectabilidad también es básicamente porque un activo cuyo deterioro se manifiesta con síntomas anticipados puede gestionarse predictivamente con mayor efectividad que uno cuyas fallas son abruptas o silenciosas.
Su cálculo en el análisis de criticidad modificaría la formula inicial:
Criticidad = Frecuencia/Riesgo * Consecuencias (Impactos) * Detectabilidad
Independientemente de la metodología utilizada, su evaluación se fundamenta en la cuantificación de cinco factores de diagnóstico universales:
Existencia de Señales y Síntomas (Señales Débiles): Presencia de evidencias físicas (vibraciones, ruidos, cambios de temperatura) que preceden a la falla.
Sistemas de Monitoreo y Sensores: Disponibilidad y confiabilidad de instrumentación en línea (DCS, alarmas) para captar condiciones precursoras.
Accesibilidad e Inspeccionabilidad: Facilidad física para acceder al componente y realizar pruebas; la inaccesibilidad genera incertidumbre absoluta.
Intervalo P-F (Margen de Respuesta): Tiempo transcurrido entre la detección de la falla potencial (P) y la falla funcional (F). Un intervalo corto reduce la detectabilidad efectiva.
Efectividad de Técnicas de Inspección: Capacidad de los métodos de ensayos no destructivos (NDT) o rondas operativas para identificar el deterioro con precisión.
El RPN (Risk Priority Number)
El Número de Prioritario de Riesgo, conocido como NPR o por sus siglas en inglés RPN, es una parte complementaria del FMEA, y, se incluye como medida semicuantitativa de la criticidad que permite jerarquizar los riesgos para priorizar a nivel Micro a los modos de falla, con cada línea de sus causas y efectos.
Recordemos que las primeras 4 preguntas del RCM; están basadas en el FMEA
El Cálculo Matemático y sus Factores
El RPN se obtiene mediante el producto de tres escalas de valoración, generalmente puntuadas del 1 al 10
Según SAEJ1739. (1995). Su fórmula fundamental es RPN = S x O x D
Severidad (S): Califica la gravedad del efecto potencial de la falla desde la perspectiva del usuario o del negocio
Ranking | Descripción | Criterio |
1 | Ninguna | No hay efecto |
2 | Muy menor | Efecto muy menor |
3 | Menor | Efecto menor |
4 | Moderadamente menor | Efecto moderadamente menor |
5 | Moderado | Efecto moderado |
6 | Moderadamente mayor | Efecto moderadamente mayor |
7 | Mayor | Efecto mayor |
8 | Muy mayor | Efecto muy mayor |
9 | Extremadamente mayor | Efecto extremadamente mayor |
10 | Catastrófico | Efecto catastrófico |
Ocurrencia (O): Estima la probabilidad o frecuencia con la que el modo de falla se manifestará en un periodo determinado
Ranking | Descripción | Criterio |
1 | Remoto | Menos de 1 vez en 10 años |
2 | Muy bajo | Menos de 1 vez en 5 años |
3 | Bajo | Menos de 1 vez en 2 años |
4 | Moderadamente bajo | Menos de 1 vez por año |
5 | Moderado | 1 vez por año |
6 | Moderadamente alto | 2 veces por año |
7 | Alto | 1 vez cada 3 meses |
8 | Muy alto | 1 vez por mes |
9 | Extremadamente alto | 1 vez por semana |
10 | Muy frecuente | 1 vez por día |
Detectabilidad (D): Mide la capacidad de los controles actuales (de diseño o mantenimiento) para identificar la falla antes de que el impacto sea percibido por el sistema o usuario
Ranking | Descripción | Criterio |
1 | Muy alta | El efecto es casi seguro que será detectado |
2 | Alta | El efecto es muy probable que sea detectado |
3 | Moderadamente alta | El efecto es probable que sea detectado |
4 | Media | El efecto es posible que sea detectado |
5 | Moderadamente baja | El efecto es moderadamente improbable que sea detectado |
6 | Baja | El efecto es improbable que sea detectado |
7 | Muy baja | El efecto es muy improbable que sea detectado |
8 | Extremadamente baja | El efecto es extremadamente improbable que sea detectado |
9 | Casi nula | El efecto es casi seguro que no será detectado |
10 | Nula | El efecto es seguro que no será detectado |
Cursos recomendados
Limitaciones Técnicas del RPN
El RPN presenta desafíos que deben ser gestionados por expertos:
Escala No Continua: En una escala de 1 a 1,000, solo se pueden generar alrededor de 120 combinaciones numéricas únicas utilizando números enteros, lo que puede causar que riesgos distintos obtengan el mismo puntaje. Esto significa que el 88% de la escala de 1 a 1,000 está vacía, creando saltos artificiales que pueden dificultar un poco la comparación real entre riesgos.
Peso Equitativo: El cálculo otorga la misma importancia a la severidad que a la detección, lo cual es técnicamente discutible; un fallo fatal y difícil de detectar podría llegar a tener el mismo RPN que un fallo menor muy frecuente
Ratios sin significado: En el RPN tradicional, un valor de 200 no es necesariamente el doble de grave que uno de 100, ya que los pesos de S, O y D son iguales pero sus impactos físicos no son lineales.
Sensibilidad Matemática: Pequeños cambios en un solo parámetro pueden causar saltos drásticos en el resultado, citando a IEC 60812. (2018) observemos el siguiente ejemplo:
Escenario A: 9×9×3= 243.
Escenario B (cambio de un solo punto en un factor): 9×9×4= 324.
Resultado: Un cambio de 1 punto en la detectabilidad generó un salto de 81 puntos en el RPN. Esto hace que el método sea muy inestable ante errores de apreciación.
⚠️ Para mitigar estas limitaciones sin abandonar la estructura del método, la ingeniería de confiabilidad ha desarrollado variantes que sí modifican el peso relativo de cada factor sobre el resultado final. Donde el modelo más directo es el aditivo ponderado (NPRw), cuya expresión es:
NPRw = (Ws × S) + (Wo × O) + (Wd × D)
A diferencia del producto tradicional, la suma sí permite que los coeficientes Ws, Wo y Wd alteren la jerarquía entre modos de falla, porque cada factor opera de forma independiente sobre el total. El resultado ya no está acotado en 1 a 1000, sino que depende directamente de los pesos asignados, razón por la cual la organización debe redefinir sus umbrales de acción antes de aplicar el modelo.
Criterios para la Asignación de Pesos
La utilidad de este enfoque depende de que los coeficientes se definan en función del perfil de riesgo real de la organización y no de forma arbitraria:
(Ws > Wo ≈ Wd): prioriza la gravedad del efecto, lo que resulta adecuado en entornos donde la seguridad del personal o la integridad del activo son el objetivo primario.
(Wo > Ws ≈ Wd): privilegia la frecuencia de ocurrencia, orientado a organizaciones que buscan maximizar la disponibilidad operativa reduciendo fallas recurrentes.
(Wd > Ws ≈ Wo): centraliza la detectabilidad, útil cuando se desea auditar la eficacia de los sistemas de monitoreo y los programas de Ensayos No Destructivos (END).
La determinación de estos valores debe ser producto de una sesión de trabajo técnico multidisciplinario, y la organización debe estandarizar los coeficientes antes de iniciar el análisis para garantizar coherencia entre activos.
El RPN; siempre suele ser de carácter debatible entre organizaciones y profesionales, por ello, quienes deseen profundizar en los fundamentos académicos de las variantes ponderadas del RPN pueden consultar las siguientes referencias.
Chin, Wang, Poon y Yang (2009) formalizaron matemáticamente la distinción entre el modelo aditivo y el multiplicativo, enunciando de forma explícita la expresión Rᵢ = Σ wⱼ · rᵢⱼ como definición del riesgo aditivo ponderado, que es la base directa del NPRw desarrollado en este artículo.
Chin, K.-S., Wang, Y.-M., Poon, G. K. K., & Yang, J.-B. (2009). Failure mode and effects analysis by data envelopment analysis. Decision Support Systems, 48(1), 246–256.
Braglia (2000) sentó las bases al proponer el MAFMA, un modelo multicriterio que trata la severidad, la ocurrencia y la detectabilidad como atributos ponderables mediante el Proceso Analítico Jerárquico (AHP), alejándose por primera vez del producto tradicional.
Braglia, M. (2000). MAFMA: Multi-attribute failure mode analysis. International Journal of Quality & Reliability Management, 17(9), 1017–1033.
Bevilacqua, Braglia y Gabbrielli (2000) llevaron este principio a la práctica en una planta industrial real, definiendo el RPN como una suma ponderada de seis parámetros operativos en una refinería italiana, lo que demuestra que la adaptación de los pesos al contexto de cada instalación es técnicamente viable.
Bevilacqua, M., Braglia, M., & Gabbrielli, R. (2000). Monte Carlo simulation approach for a modified FMECA in a power plant. Quality and Reliability Engineering International, 16(4), 313–324.
El Análisis del Diagrama/Ley/Principio de Pareto (80/20)
Esta distribución, conocida como principio de Pareto o regla 80/20, en mantenimiento este principio es llamado como los "pocos vitales", pues nos ayuda también a orientar dónde concentrar las acciones de mantenimiento y los análisis de confiabilidad para obtener el mayor retorno en disponibilidad y reducción de costos.
Identificar esos porcentajes requiere de datos reales del historial de fallas, órdenes de trabajo correctivas y registros de producción diferida.
Cuando esos datos existen y están correctamente codificados en el sistema de gestión, el análisis de Pareto produce una lista clara de sistemas problemáticos que justifican la inversión en un análisis de modos de falla detallado.
Cuando los datos son deficientes, el equipo de trabajo debe apoyarse en mayor medida en el conocimiento empírico del personal de campo, lo que introduce más incertidumbre en la clasificación, pero no invalida el proceso.
Pasos para la Construcción del Análisis de Pareto
Identificar el objetivo: ¿Qué quieres analizar? (Ej. causas de paradas de planta, tipos de fallos, costo de repuestos, quejas de clientes).
Recolección: Obtén los datos sobre la frecuencia (cuántas veces ocurre) o el impacto (cuánto cuesta, cuántas horas pierde) de cada categoría durante un periodo específico.
Veamos cómo se ven algunos ejemplos;
El Diagrama de Pareto para los resultados del Análisis de Criticidad a nivel de Equipos
# | Elemento / Activo | Criticidad (0-100) | % Peso Individual | % Acumulado |
1 | Compresor de Gas Principal | 100 | 19.65% | 19.65% |
2 | Turbina de Generación Eléctrica | 95 | 18.66% | 38.31% |
3 | Caldera de Vapor de Alta Presión | 85 | 16.70% | 55.01% |
4 | Bomba de Alimentación de Crudo | 65 | 12.77% | 67.78% |
5 | Intercambiador de Calor Principal | 45 | 8.84% | 76.62% |
6 | Transformador de Potencia Planta | 30 | 5.89% | 82.51% |
7 | Ventilador de Tiro Forzado | 25 | 4.91% | 87.42% |
8 | Bomba de Agua de Enfriamiento | 15 | 2.95% | 90.37% |
9 | Compresor de Aire de Instrumentos | 10 | 1.96% | 92.33% |
10 | Sistema de Filtrado de Combustible | 8 | 1.57% | 93.90% |
11 | Bomba de Sumidero de Planta A | 6 | 1.18% | 95.08% |
12 | Bomba de Sumidero de Planta B | 5 | 0.98% | 96.06% |
13 | Válvula de Control de Recirculación | 4 | 0.79% | 96.85% |
14 | Motor de Agitador de Tanque | 4 | 0.79% | 97.64% |
15 | Extractor de Aire de Techo | 3 | 0.59% | 98.23% |
16 | Transportador de Banda Secundario | 3 | 0.59% | 98.82% |
17 | Bomba de Dosificación Química | 2 | 0.39% | 99.21% |
18 | Sistema de Alumbrado de Planta | 2 | 0.39% | 99.60% |
19 | Trampa de Vapor de Línea 3 | 1 | 0.20% | 99.80% |
20 | Sensor de Temperatura de Respaldo | 1 | 0.20% | 100.00% |
-1779996560539.png%3Falt%3Dmedia%26token%3D1666c2ba-1668-4f16-9a31-5877bc3a3b4c&w=3840&q=75)
El Diagrama de Pareto desde el Nivel Micro con Modos de Fallo (Análisis de causas en Motor Eléctrico)
Modo de Fallo (ISO 14224) | Frecuencia Absoluta (n°) | Frecuencia Relativa (%) | Frecuencia Acumulada (%) | TPPF (Horas) | TPPR (Horas) | |
1 | Desgaste y degradación de rodamientos | 15 | 20% | 20% | 19.960 | 20 |
2 | Lubricación deficiente o contaminada | 12 | 15% | 35% | 14.960 | 15 |
3 | Falla por bajo aislamiento | 8 | 10% | 45% | 29.996 | 24 |
4 | Sobrecargas eléctricas | 6 | 8% | 53% | 24.957 | 25 |
5 | Desalineación motor-bomba | 5 | 7% | 60% | 17.992 | 10 |
6 | Cortocircuitos en bobinados | 5 | 7% | 67% | 34.992 | 56 |
7 | Desbalanceo del rotor | 4 | 5% | 72% | 21.944 | 15 |
8 | Alineación incorrecta rodamiento | 3 | 5% | 77% | 19.971 | 15 |
9 | Fallas en el rotor (barras rotas) | 4 | 5% | 82% | 39.970 | 75 |
10 | Ventilador sucio o bloqueado | 2 | 3% | 85% | 14.976 | 5 |
11 | Soltura de pernos de anclaje | 2 | 3% | 88% | 24.953 | 7 |
12 | Fallas en caja de bornes | 2 | 3% | 91% | 27.968 | 20 |
13 | Ventilador defectuoso | 2 | 2% | 93% | 19.982 | 10 |
141 | Falla de resistencia de calefacción | 2 | 2% | 95% | 29.919 | 12 |
15 | Contaminación y humedad ambiental | 2 | 2% | 97% | 34.997 | 20 |
16 | Temperaturas ambiente extremas | 1 | 1% | 98% | 39.939 | 10 |
17 | Unidad de control defectuosa | 1 | 1% | 99% | 49.966 | 30 |
18 | Cableado y caja de conexiones dañados | 1 | 1% | 100% | 44.911 | 15 |
TOTALES | 77 | 100% | 100% | 24.468 | 23 |
-1779998693754.png%3Falt%3Dmedia%26token%3Dafe75721-4564-42e7-b2cb-591d197a63bd&w=2048&q=75)
El Caracter Reactivo y el Proactivo
El Pareto es una herramienta estrictamente reactiva; requiere de un historial de datos sólido y validado para poder realizar la jerarquización. A nivel macro (especialmente en fases de diseño o proyectos de capital), se necesita un enfoque proactivo y predictivo para evaluar riesgos potenciales de eventos que aún no han ocurrido. El Análisis de Criticidad permite manejar esta incertidumbre mediante el juicio de expertos y matrices de riesgo, algo que el Pareto no puede hacer por sí solo.
Análisis de Pareto (Enfoque Reactivo): Es una herramienta estrictamente reactiva que jerarquiza los "pocos vitales" basándose en un historial sólido de fallas y costos reales. Su función es identificar visualmente a los "malos actores" actuales para concentrar los esfuerzos en eventos que ya están impactando negativamente la disponibilidad operativa.
Análisis de Criticidad (Enfoque Proactivo/Macro): Adopta un carácter proactivo y predictivo al evaluar riesgos potenciales en niveles macro (plantas o sistemas) mediante el juicio de expertos y matrices de riesgo. Permite manejar la incertidumbre en fases de diseño o proyectos de capital al proyectar escenarios de falla antes de que estos se materialicen.
RPN en el FMEA/RCM (Enfoque Proactivo/Micro): El Número de Prioridad de Riesgo (RPN) es el motor cuantitativo del FMECA que opera a nivel micro. Es intrínsecamente proactivo porque se fundamenta en el FMEA, el cual analiza modos de falla potenciales para establecer contramedidas antes de que el impacto ocurra. No opera de forma aislada; requiere como insumo la identificación detallada de funciones y fallas para priorizar técnicamente las tareas de mantenimiento.
Resumen de las herramientas de Priorización
Metodología | Nivel de Aplicación | Enfoque Principal | Objetivo |
Análisis de Criticidad |
|
|
|
Análisis de Pareto |
|
|
|
NPR (RPN) |
|
|
|
Conclusión
La priorización de equipos es la decisión que hace que cualquier metodología de confiabilidad como el RCM sea manejable desde la práctica industrial.
La priorización de equipos es el factor clave de decisión que permite que cualquier metodología de confiabilidad, como el RCM, sea aplicable (en el sentido del control) de manera efectiva en la práctica industrial. Sin esta guía, dichos métodos se ven obligados a elegir entre aplicarse exhaustivamente a todos los equipos o de forma superficial a ninguno, y ninguna de estas opciones genera los beneficios esperados.
Con una clasificación de criticidad bien elaborada permite concentrar el esfuerzo analítico en aquellos casos donde el impacto es significativo, asegurando que cada tarea de mantenimiento esté respaldada por el riesgo que mitiga y no por la costumbre o por recomendaciones genéricas del fabricante.
Lo que distingue a las organizaciones que obtienen resultados de sus programas de confiabilidad es que decidieron con criterio cuáles activos merecen el análisis más profundo. Esa decisión, respaldada en datos operativos y en el conocimiento del equipo de campo, es la que convierte un inventario de activos en una estrategia de mantenimiento coherente con los objetivos reales del negocio.
Referencias Bibliográficas
American Petroleum Institute. (2017). Risk-based machinery management (API Recommended Practice 691, 1.ª ed.). American Petroleum Institute.
American Petroleum Institute. (2020). Risk-based inspection technology (API Recommended Practice 581, 3.ª ed.). American Petroleum Institute.
International Electrotechnical Commission. (2018). Analysis techniques for system reliability: Procedure for failure mode and effects analysis (FMEA) (IEC 60812:2018). IEC.
Ciliberti, H. (2005). Análisis de criticidad: Una metodología para mejorar la confiabilidad operacional. Reliabilityweb.
International Organization for Standardization. (2019). Risk management: Risk assessment techniques (ISO/IEC 31010:2019). ISO.
Mobley, R. K. (2008). Maintenance fundamentals (2.ª ed.). Butterworth-Heinemann.
Moubray, J. (1997). Reliability-centered maintenance (2.ª ed.). Industrial Press.
Nowlan, F. S., & Heap, H. F. (1978). Reliability-centered maintenance. U.S. Department of Defense.
Petróleos de Venezuela, S.A. (2004). Manual del proceso de mantenimiento de rutina: Clasificación de la criticidad del activo (Norma PDVSA MM-02-15-03). PDVSA.
SAE International. (2002). A guide to the reliability-centered maintenance (RCM) standard (SAE Standard JA1012).
SAE International. (2009). Evaluation criteria for reliability-centered maintenance (RCM) processes (SAE Standard JA1011).
Standards Norway. (2010). Risk and emergency preparedness assessment (NORSOK Standard Z-013, Rev. 3). Standards Norway.
Standards Norway. (2011). Criticality analysis for maintenance purposes (NORSOK Standard Z-008, Rev. 3). Standards Norway.
U.S. Department of Defense. (2012). Standard practice: System safety (MIL-STD-882E). U.S. Department of Defense.
Wireman, T. (2004). Benchmarking best practices in maintenance management. Industrial Press.
Chin, K.-S., Wang, Y.-M., Poon, G. K. K., & Yang, J.-B. (2009). Failure mode and effects analysis by data envelopment analysis. Decision Support Systems, 48(1), 246–256.
Curso de Análisis de Criticidad (Tibaldo) Tibaldo, D. Análisis de Criticidad. Predyc. https://predyc.com/
Curso de Fundamentos (Andrés González) González Giraldo, A. E. Fundamentos de Confiabilidad. Predyc. https://predyc.com/
Curso de RCM (Andrés González) González Giraldo, A. E. Mantenimiento Centrado en Confiabilidad (RCM). Predyc. https://predyc.com/
Dinos qué te ha parecido el artículo



%252FIBR.webp%3Falt%3Dmedia%26token%3D72562ceb-5a2a-4e67-aeae-44febda5eb13&w=3840&q=75)




