Resumen
El proyecto Gigafer se centra en la mejora del análisis de los datos procedentes de la auscultación dinámica de vía por medio de
tecnologías basadas en inteligencia artificial aplicadas al procesamiento digital de imágenes. Actualmente, las administraciones
ferroviarias analizan los datos de las auscultaciones dinámicas únicamente en el dominio del tiempo, clasificando el defecto según la
magnitud del pico observado. Con este proyecto se pretende, además, identificar el tipo de defecto y su origen.
Sobre las aceleraciones convertidas en imágenes mediante espectrogramas, se hará uso de arquitecturas de deep learning basadas en
redes neuronales convolucionales (CNNs) para extraer características de los espectrogramas y clasificarlos según su deterioro de forma
conjunta. En primer lugar, se analizarán los cruzamientos de desvíos, por ser uno de los puntos críticos de la vía. En un paradigma de
aprendizaje supervisado, las CNNs requiren grandes cantidades de datos para extraer características robustas en la clasificación. Por
ello, se hará uso de técnicas de self-training basadas en contrastive learning y data augmentation aplicado en datos no anotados, para
entrenar un extractor de características más generalizable. Con el codificador entrenado, combinarán pérdidas basadas en entropía
cruzada con regresiones lineales para aportar una escala de deterioro continua para cada tipo de elemento de vía analizado.
Para la aplicación a otro tipo de singularidades de la vía, debido a la común escasez de nuevos ejemplos de cada grado de nuevos
defectos a estudiar en este tipo de aplicaciones industriales, se seguirá un enfoque basado en few-shot learning para dicha transferencia
de conocimiento. En concreto, se entrenarán módulos de relational learning capaces de obtener métricas de aprendizaje profundo
capaces de comparar espectrogramas de singularidades de vía con un número reducido de ejemplos de cada tipo de nuevo desgaste,
aportando una puntuación de similitud para cada uno. Estos modelos serán testeados en bases de datos externas, las cuales pueden
presentar un cambio de dominio debido a las características del sistema ferroviario. Para paliar este desafío, se estudiará el uso de
técnicas de domain adaptation que acoplen los subespacios obtenidos por el codificador para singularidades de vía del dominio origen y
objetivo. Los disintos modelos predictivos serán validados y testeados de forma adecuada, siguiendo una partición basasda en hold out.
Según datos consultados del Administrador de Infraestructuras Ferroviarias (Adif) y de empresas constructoras adjudicatarias del
mantenimiento de algún tramo de red de alta velocidad, el mantenimiento de la superestructura ferroviaria (balasto, traviesas, sujeciones
y carriles) puede llegar a suponer un coste 1.250 millones de euros al año. Considerando los resultados previos del equipo de
investigación, los algoritmos desarrollados obtuvieron mejoras en la detección de cruzamientos deteriorados en desvíos del 8% de acierto
respecto a métodos previamente utilizados, alcanzando una puntuación F1 del 73%. Con esto se obtendría un aumento de la fiabilidad y
disponibilidad del sistema a la vez que se reducirían los costes de inspección.