PROYECTO FINAL DE PROBABILIDAD Y ESTADÍSTICA

1

Confiabilidad en Sistemas SCADA.
Jaime F. Ricardo B.
MTTF =
1 λSistema

Resumen—En este documento, se presentará información sobre la confiabilidad en sistemas SCADA tanto a nivel de sistemas en serie como en paralelo. Adicionalmente se muestra un ejemplo de la utilización del árbol de fallas, como también dos modelos de la confiabilidad de sistemas SCADA. Index Terms—Árbol de fallas, Confiabilidad, Paralelo, SCADA, serie.

(2)

I.

I NTRODUCCIÓN

N los sistemas SCADA se integran soportes tanto de sistemas electrónicos como mecánicos, y por lo tanto se deben realizar diseños en donde la confiabiliad y la disponibilidad alcancen la meta de 0.999999 de probabilidad. La confiabilidad es la probabilidad de que un componente o un sistema bajo ciertas condiciones y en un tiempo predefinido, realice su tarea requerida; también se puede expresar en otras palabras como la probabilidad de que un sistema ejerza o sea capaz de ejercer su función en un período de tiempo estipulado, por ejemplo, un sistema que tiene una confiabilidad de 0.999999 para una misión específica, tiene una oportunidad del 99.9999 % de que funcione sin falla en ese mismo período. Por otro lado, la disponibilidad se define como la fracción de tiempo a largo plazo en el cual un sistema funcione o pueda funcionar apropiadamente; por ejemplo, un sistema con una disponibilidad de 0.999999 tendrá un promedio tiempo fuera de servico de 31 segundos en un año, esto no significa que la duración promedio de la falla vaya a a ser 31 segundos, significa que en todo el año los tiempos de las fallas sumarán máximo 31 segundos. En la teoría de confiabilidad, para los componentes mecánicos se asumen que tienen una distribuación de Poisson, mientras que para los componentes electrónicos se asumen una distribución de Exponencial. Durante el desarrollo de este documento, las tasas de fallas se han asumido con valores constantes. Cuando algún dato necesario no está disponible, entonces se toma una estimación de este.

E

Si un sistema la falla ocurre cada millón de horas, entonces se puede decir que el sistema tiene una Tasa de Fallas de 1 × 10−6 F allas/Hora, por lo tanto el MTTF es el inverso de la Tasa de Fallas. En este documento las Tasas de Fallas se toman como constantes; si una tasa de fallas tiene una distribución diferente (Por ejemplo Weibull), entonces el MTTF se halla de acuerdo a la distribución correspondiente. El Tiempo Promedio para arreglar un componente está dado por el MTTR, el cual se calcula de la siguiente manera, MTTR =
1 µ

(3)

donde µ es la constante de la Tasa de Reparación. A manera de ejemplo, si el MTTR de un componente es 24 horas, esto significa que hay 365 Reparaciones/Año. El MTBF se define como la suma de MTTF y el MTTR. M T BF = M T T F + M T T R (4)

Si el tiempo para reparación es pequeño, entonces el MTBF es aproximado a MTTF. La Disponibilidad e Indisponibilidad de un componente se extraen del MTBF y el MTTR. Disp.Comp. =
T iempo en F unc T iempo en F unc+T iempo F uera de Serv MT T F M T T F +M T T R

(5) (6)

Disp.Componente =

=

µ µ+λ

Por lo tanto, la disponibilidad de un sistema que posee n componentes es Disp.Sistema =
n i=1

DispComponente i

(7)

Asumiendo constante la tasa de fallas del sistema (λSistema ), la confiabilidad de un sistema es: R(t) = e−λSistema t III. SCADA. (8)

II.

C ONCEPTOS BÁSICOS DE C ONFIABILIDAD .

La confiabilidad (Realiability = R) se caracteriza por varios parámetros, tales como, tasa de fallas (λ), Tiempo Medio Entre Fallas (Mean Time Between Failures = MTBF), Tiempo Medio Para Fallar (Mean Time To Failure = MTTF), Tiempo Medio Para Reparar (Mean Time To Repair = MTTR), Disponibilidad e Indisponibilidad (1 - Disponibilidad). En un sistema con n componentes en donde λi , i = 1, ..., n son las tasas de fallas de sus componentes, la tasa de fallas de dicho sistema es λSistema =
n i=1

λi

(1)

MTTF es el valor esperado del tiempo para fallar, si la Tasa de Fallas es constante,

Un Sistema SCADA (Supervisory Control And Data Acquistion) cumple básicamente dos funciones: Seguridad del Sistema de Procesos y Eficiencia en la Operación. Seguridad del Sistema de Procesos: El sistema permite observar y verificar continuamente las variables críticas de operación tales como; Presión, Temperatura, Alarmas, etc., y posibilita una acción remota tal como el cierre de válvulas en los casos que sea necesario. De esta forma los operadores pueden tomar las acciones correctivas del caso con la debida anterioridad para prevenir o minimizar cualquier incidente. Eficiencia en la Operación: El sistema envía automaticamente al Centro de Control la información del estado del sistema, por ejemplo, los volúmenes horarios y diarios de cada consumidor. Estos datos los toma el computador de flujo en los diferentes puntos del sistema aumentando confiabilidad en

PROYECTO FINAL DE PROBABILIDAD Y ESTADÍSTICA

2

la medición y evitando la necesidad de tener que desplazarse fisicamente a los sitios. III-A. Partes de un Sistema SCADA.

Un Sistema SCADA está conformado por un conjunto de elementos y dispositivos que poseen hardware y software, los cuales pueden clasificarse en cuatro niveles: Instrumentación, Unidades Terminales Remotas (RTUs), Comunicaciones y Centro de Control.

otros, con los cuales puede manejar los procesos que desee. 3. Finalmente existe la parte de puertos de comunicaciones cuya función es tomar la información en forma digital y ubicarla en un puerto (Usualmente tipo RS232) para ser posteriormente transmitida al Centro de Control mediante el Nivel de Comunicaciones.

Fig. 1. Ejemplo gráfico de un sistema SCADA.

Fig. 2. Ejemplo gráfico de un sistema SCADA. III-A1. Nivel de Instrumentación.: En este nivel se toma la variable física (presión, flujo, convirtiendola en una señal que puede ser leída o interpretada por el operador. Para el caso específico del Sistema SCADA, se maneja la instrumentación de tipo electrónico, allí la variable física se convierte a una señal eléctrica (usualmente de corriente de 4-20 mA o de voltaje de 1-5 voltios). Ejemplos de las señales básicas a transmitir son: Presión, Temperatura, Flujo, estado de las válvulas de línea, entre otras. III-A2. Nivel de Unidades Terminales Remotas RTUs.: La Unidad Terminal Remota, RTU, es un dispositivo, inteligente microprocesado que recoge, almacena y procesa la información que viene de la instrumentación de campo. La RTU consta básicamente de tres partes: Entradas y salidas, CPU y comunicaciones. 1. La parte de entradas / salidas está compuesta por una serie de tarjetas de diversos tipos de acuerdo a la señal que va a recibir. 2. La CPU es la parte inteligente de la RTU; se basa en procesadores modelo 80186, 80386, 6800 o más avanzados. Allí existen también memorias RAM, PROM y EPROM, que poseen varios módulos preprogramados que permiten hacer cálculos controles, comandos, entre

Fig. 3. Ejemplo de una RTU. III-A3. Nivel de Comunicaciones.: Es el encargado de tomar la información de la RTU y transmitirla por el medio escogido hasta el Centro de Control. Existen muchos de medios de comunicación y la elección de cual es el más apropiado depende de las diferentes circunstancias dentro de las cuales se cuenta el costo, la disponibilidad del medio, la velocidad de transmisión, la confiabilidad requerida, entre otras. A continuación se indican ejemplos de equipos usados en algunos medios de comunicaciones como lo son el Aire y el Vacío: 1. Equipos de RadioFrecuencia: Usualmente se emplean equipos de radio en la banda de UHF (ultra-altafrecuencia) o VHF (muy -alta-frecuencia). Se requiere hacer estudio de propagación, disponer de estaciones repetidoras; es moderadamente costoso y brinda mayor confiabilidad que la línea telefónica. 2. Equipos de Microondas Terrestres: Es también un sistema de radio pero en frecuencias del orden de los Gigahertz. Es más costoso que los anteriores pero más confiable, tiene el inconveniente de requerir línea de vista para su propagación, lo que limita la distancia de cubrimiento. 3. Equipos de Microondas Satelitales: Se basa en la transmisión y recepción mediante un satélite geoestácionario ubicado aproximadamente a 36.000 kms de la tierra, de tal forma que no hay obstáculo y la comunicación es continua (salvo en los equinoccios donde hay interrupción de 5-8 minutos cuando ocurre). Su confiabilidad es alta, comparable con los microondas. Se utiliza para cubrir grandes distancias y en sitios de difícil cubrim-

PROYECTO FINAL DE PROBABILIDAD Y ESTADÍSTICA

3

iento. III-A4. Nivel de Centro de Control: Está compuesto por un conjunto de computadores, periféricos y programas de software que realizan el procesamiento de las señales. Usualmente existe también un equipo de interface de comunicaciones (llamado Front-End) cuya función es recibir la información de los diferentes canales de comunicaciones para procesarlas y agruparlas y ser enviada a los computadores servidores mediante una red LAN. A está red estan conectados los diferentes dispositivos del Centro de Control, los cuales constan de los siguientes: 1. Computadores Servidores: Son las unidades principales de mayor capacidad y rapidez. Recibe la información de las innumerables señales desde los sitios remotos del Sistema y los maneja en una gran base de datos de tiempo real. Una configuración muy utilizada es la de Hot-Stand by, donde se conectan dos computadores similares en paralelo (a través de la red) de tal forma que uno es el principal y el otro es el de respaldo. 2. Consolas de Trabajo: Son computadores dedicados para el manejo y operación del proceso. Allí se muestra en forma gráfica los diferentes procesos, en forma de despliegues y se pueden observar los valores de flujo, presión, temperatura y alarma obteniendo tendencias, reportes, entre otros. 3. Otros Computadores: Dependiendo de las necesidades pueden existir otros computadores tales como el de ingeniería, el administrativo, de entrenamiento, que realiza las respectivas funciones.

Fig. 5. Posibles fallas en un sistema SCADA. IV-A. Sistema de Controlador Redundante Doble.

Un sistema de estos está comprendido típicamente de dos módulos controladores independientes y en paralelo, interconectados a la vez con con los módulos de entradas y salidas de los dispositivos de campo.

Fig. 6. Sistema de Controlador Redundante. IV-B. Puerta de Enlace de Entrada y Salida.

Para interconectar las entradas y salidas de campo con los controladores Primario y Secundario, un tercer controlador se configura y utiliza como Puerta de Enlace de Entrada y Salida.

Fig. 4. Software de un sistema SCADA. IV. FALLAS EN S ISTEMAS SCADA.

Las fallas en sistemas SCADA tanto a nivel de Software como de Hardware pueden ser causadas por varios factores tales como: Relámpagos, agua, fallas de componentes, entre otras. Todo o parte del sistema SCADA podría quedar inoperante por fallas, dependiendo de la naturaleza de ellas, provocando pérdida parcial o total del control y de la obtención de datos. Las fallas generamente están dentro de las siguientes tres categorías: 1. CPU. 2. Suministro de Energía. 3. Comunicaciones.

Fig. 7. Sistema de Puerta de Entrada y Salida. V. Á RBOL DE FALLAS .

El modelo de árbol de fallas sirve para varios propósitos importantes. Primero, el árbol de fallas provee un marco lógico para el análisis de fallas y de manera precisa documenta cuales escenarios de fallas han sido considerados y cuales no.

PROYECTO FINAL DE PROBABILIDAD Y ESTADÍSTICA

4

Segundo, el árbol de fallas está basado en un algebra de Bool bien definida y en la teoría de probabilidad. El árbol de fallas muestra cómo los eventos al combinarse causan un evento de más alta jerarquía o evento final, y al mismo tiempo define cómo calcular la probabilidad del evento final en función de las probabilidades de los eventos base o de baja jerarquía. Por lo tanto, el árbol de de fallas puede ser cambiado fácilmente para acomodar sistemas compuestos de diferentes fabricantes (Ejemplo, diferentes Hardware y Software). Este árbol también sirve para mostrar los puntos débiles de un sistema y así permitir realizar evaluaciones y generaciones de sugerencias.

q9- Falla del actuador para cerrar la vávula de seguridad. q10- Falla del sensor de posición de la vávula de seguridad. q11- Falla de la RTU2. VI. C ONFIABILIDAD EN S ERIE .

En el siguiente ejemplo se debe hallar el valor de la confiabilidad del sistema en serie a las 10 horas.

Fig. 8. Ejemplo de secuencia de una falla.

Fig. 10. Ejemplo de la confiabilidad en sistema serie. 1. λA = 0,010, t = 10 horas 2. λB = 0,0015, t = 10 horas 3. RA (10) = e−λt = e−0,0010∗10 = 0,99004 4. RB (10) = e−λt = e−0,0015∗10 = 0,98511 5. RSistema (10) = RA (10) ∗ RB (10) = = 0,99004 ∗ 0,98511 6. RSistema (10) = 0,975298 VII. C ONFIABILIDAD EN PARALELO .

En el siguiente ejemplo se debe hallar el valor de la confiabilidad del sistema en paralelo a las 10 horas. λA1 = λA2 = 0,0010, t = 10 horas λB1 = λB2 = 0,0015, t = 10 horas

Fig. 9. Ejemplo de Árbol de Fallas. Estados mostrados en la figura 9. G1- Falla del cerrado seguro de la válvula y hay una fuga de aceite. G2- Falla de la detección de una fuga de aceite. G3- Falla de la detección del estado de apertura de una válvula de seguridad. G4- Falla del cerrado de una válvula de seguridad. Estados mostrados en la figura 9. q1- Falla del Sistema SCADA. q2- Falla del enlace 2 de comunicaciones. q3- Falla del servidor. q4- Falla del enlace 1 de comunicaciones. q5- Falla de la RTU2. q6- Falla del sensor de acite. q7- Falla del sistema: Una fuga de aceite. q8- Falla de la vávula de seguridad para cerrarse.

Fig. 11. Ejemplo de la confiabilidad en sistema paralelo. 1. Conf iabilidad del Sistema = 1 − N o Conf iabilidad del Sistema 2. N o Conf iabilidad del Sistema = N o Conf. del lazo Sup. ∗ N o Conf. del lazo Inf. 3. N o Conf iabilidad del lazo Superior = 1 − Conf iabilidad del lazo Superior 1 − (e−λA1 ∗t ∗ e−λB1 ∗t ) 1 − (e−0,0010∗10 e−0,0015∗10 ) = 0,024702 4. N o Conf iabilidad del lazo Inf erior = 1 − Conf iabilidad del lazo Inf erior 1 − (e−λA2 ∗t ∗ e−λB2 ∗t ) 1 − (e−0,0010∗10 e−0,0015∗10 ) = 0,024702 5. Conf iabilidad del Sistema = 1 − (0,024702 ∗ 0,024702) = 0,999389 VIII. C ONFIABILIDAD EN UN S ISTEMA SCADA.

Para los siguientes 2 modelos de confiabilidad en sistemas SCADA, se utilizan los valores que están descritos en la Tabla 1.

PROYECTO FINAL DE PROBABILIDAD Y ESTADÍSTICA

5

Tabla. 1. Valores usados en los ejemplos de confiabilidad en SCADA. En el primer ejemplo se puede apreciar que hay redundancia en dos RTUs y en un Multiplexor de datos (DM).

4. ABRAMS, Marshall; WEISS, Joe. Control System Cyber Security Case Study1. Applied Control Solutions. 2003. 5. KEMAL, Egemen. Reliability analysis of SCADA systems used in the offshore oil and gas industry. Thesis, University of Missouri-Rolla. 2001. 6. ERICKSON, Kelvin. Survey of SCADA System Technology and Reliability in the Offshore Oil and Gas Industry. Reporte final al departamento del Interior. University of Missouri-Rolla. 2000. 7. Supervisory Control And Data Acquisition (SCADA) Systems for command, control, communications, computer, intelligence, surveillance, and reconnaissance (C4ISR) facilities. Oficina Central, departamento del ejercito, 21 de Enero de 2006.} 8. KRUTZ, Ronald. Securing SCADA Systems. Wiley Publishing. 2006. 9. BRUCE, A. Reliability Analysis of Electric Utility SCADA Systems. IEEE. 1997 10. www.wendangdoc.com

Fig. 13. Ejemplo del modelo de confiabilidad en SCADA. En el segundo ejemplo se puede apreciar que hay redundancia en dos RTUs, en un Multiplexor de datos (DM) y una en un nivel de comunicaciones más cerca del Centro Principal, empleando un Enrutador.

Fig. 14. Ejemplo del modelo de confiabilidad en SCADA. IX. C ONCLUSIÓN .

La confiabilidad en los sistemas SCADA se puede aumentar mediante la utilización de redundancias para los elementos en su estructura de componentes principales; es decir, ubicar los elementos de redundancia en forma paralela. Los árboles de fallas permiten generar de una forma muy sencilla las rutas de las posibles fallas, y a su vez facilidad para saber ubicar los elementos redundantes en paralelo con el fin de aumentar la confiabilidad. X. B IBLIOGRAFÍA .

1. Bentley Systems, Incorporated. The Fundamentals of SCADA . 2004 . 2. CHARTRAND, Martin 2. Dual Redundant Controller Systems. Control Microsystems White Paper. Octubre de 2004 . 3. EDSTRÖM, F; SÖDER, L. A Circuit Breaker Reliability Model for Restoration Planning Considering Risk of Communication Outage. Royal Institute of Technology, Stockholm, Sweden 2005.