Validación de datos

Metodología para la validación y reconstrucción de datos

La validación de datos consiste
validaciondatos.jpg
en capturar los datos con una frecuencia temporal fija (por ejemplo horarios) de la base de datos operacional del sistema de telecontrol, que permiten conocer el estado de la red, de forma periódica (una vez al día) o mediante petición expresa del operador del sistema de telecontrol, analizar con diferentes niveles de test todos los datos del intervalo en cuestión y del resultado obtenido etiquetar los datos como datos validos especificando los test que han superado o inválidos especificando el test de validación que no han superado y almacenarlos en la misma base de datos operativa del sistema de telecontrol.

 

El conjunto de test que deben pasar cada uno de los datos con una frecuencia fija (diezminutal, horarios o diarios) del estado de la red está inspirado con los niveles de calidad de datos de las estaciones meteorológicas automáticas definidas en la norma UNE 500540.


  • Test 1. Errores de comunicaciones Se trata de saber si el dato ha llegado en el instante esperado (diezminutal, horario  o diario).
  • Test 2. Se analiza si el dato supera los valores máximos y mínimos físicos que son imposibles de superar por un dato coherente.
  • Test 3. Se analiza la variación temporal del dato ya que la diferencia entre dos valores consecutivos no debe superar unos valores de referencia.
  • Test 4. Se analiza si los sensores de una misma estación son coherentes entre sí. Por ejemplo, si la posición de una válvula indica que está cerrada no puede circular agua y el sensor de caudal debe ser cero o muy cercano a cero.
  • Test 5. Se analiza la coherencia espacial de los datos de la red a partir de un modelo que relacione estas medidas, y
  • Test 6. Se analiza la coherencia temporal de los datos y se compara la estimación del dato a partir de su histórico con el dato por validar.


Si un dato no pasa alguno de estos test el dato no es fiable y debe ser reconstruido mediante la aplicación de un o diversos modelos (redundancia analítica) que permitan estimar su valor.

Esta metodología ya se ha implementado en la red de distribución de Barcelona con 400 cuadalimetros y actualmente se está implementando con los datos horarios y diarios de la red de transporte de agua de ATLL y se considera que será un gran beneficio para aumentar la confianza en los datos del sistema de telecontrol y su posterior explotación para llevar a cabo una correcta gestión de la red, como es el cálculo del rendimiento hidráulico de los sectores de la red y/o detectar fugas en los mismos.