Resumen
La creciente digitalización de las empresas en el contexto de la industria 4.0 está permitiendo disponer de grandes
bases de datos de procesos industriales con una serie de características típicas del Big Data que requieren nuevas
tecnologías para ser procesadas y extraer la información que contienen. La optimización de procesos requiere la
inversión de modelos causales que relacionen los cambios en las variables de entrada con los resultados del proceso.
Esta causalidad puede conseguirse usando primeros principios o mediante técnicas de diseño de experimentos. Sin
embargo, ambas aproximaciones son generalmente inviables en muchos procesos industriales. En este proyecto se
pretende desarrollar técnicas de optimización de procesos mediante la inversión de modelos estadísticos
multivariantes de variables latentes. En particular se usará la regresión en mínimos cuadrados parciales (PLS) por ser
especialmente adecuada para abordar con éxito las 4 V's características del Big Data y, sobre todo, porque, a
diferencia de otros modelos predictivos como los modelos de regresión o las técnicas de aprendizaje supervisado del
machine learning, el PLS es capaz de proporcionar modelos causales en las variables latentes incluso aunque los datos
no procedan de ningún diseño experimental, sino de la producción histórica diaria. De ahí su papel estratégico en la
optimización de procesos en la industria 4.0.