Resumen
La aparición de las técnicas de secuenciación masiva o NGS y de los ensayos basados en la utilización de lecturas cortas para medir propiedades de ácidos nucleicos ha tenido un profundo impacto en nuestro conocimiento de la biología de los genomas y ha facilitado el desarrollo de nuevas técnicas de diagnóstico con aplicaciones en biomedicina y biotecnología. Conforme se han ido reduciendo costes y las tecnologías de NGS han ido avanzando, aparecen nuevas potenciales aplicaciones que requieren del desarrollo de herramientas computacionales de análisis que sean capaces de traducir el dato de secuencia en conocimiento sobre el genoma. El objetivo de este proyecto es el de anticiparse a estas necesidades bioinformáticas desarrollando nuevos métodos que estén disponibles en el momento en que estas nuevas aplicaciones se generalicen. En concreto, proponemos incidir en tres aspectos candentes de las tecnologías genómicas: la aplicación de lecturas largas al estudio del transcriptoma, los ensayos de transcriptómica de células individuales (single cell), y la integración de datos multiómicos. En concreto este proyecto plantea el desarrollo de la metodología computacional para el estudio de la funcionalidad asociada a la expresión alternativa de isoformas a partir de datos de secuenciación con lecturas largas que puede proporcionar secuencias de tránscritos enteras sin necesidad de ensamblaje. Este tipo de datos se combinará con métodos avanzados de anotación funcional de secuencias y análisis funcional para crear una nueva tecnología de análisis transcriptómico-funcional que opere al nivel de tránscritos y no ya de genes. Por otro lado, proponemos estudiar la dinámica de la expresión de isoformas en poblaciones heterogéneas celulares mediante la integración de datos de single cell RNA-seq y de lecturas largas obtenidas sobre el mismo sistema experimental. Finalmente proponemos el desarrollo de métodos estadísticos de integración de datos multiómicos, incluyendo proteómica y metabolómica, que puedan utilizar diferentes capas de información molecular a fin de crear métodos de diagnóstico más eficientes. En este proyecto trabajaremos con datos generados en el propio laboratorio con el fin de apoyar el desarrollo de nuestras nuevas metodologías de análisis. El proyecto pretende proporcionar nuevos recursos bioinformáticos que se ofrecerán de manera abierta a la comunidad genómica internacional, a la vez de promover su transferencia hacia implementaciones de software profesionales que revalorice el desarrollo académico.