Resumen
Actualmente, la mayoría de estudios basados en el análisis crítico del discurso recurren a técnicas de la lingüística de corpus con el fin de
realizar un análisis cuantitativo y cualitativo del discurso. Aunque la incorporación de la lingüística de corpus al análisis crítico del discurso
ha permitido dotar a los resultados de la actividad investigadora de una mayor objetividad, por basarse empíricamente en una mayor
cantidad de datos textuales, los métodos computacionales que se han empleado se limitan a recurrir a métricas estadísticas que destacan
la relevancia de las palabras o a explorar patrones léxicos a través de concordancias. Este proyecto propone la incorporación de métodos
y técnicas provenientes de la inteligencia artificial en general y de la minería de datos en particular al análisis crítico del discurso, donde la
sinergia entre estas disciplinas resulta en un campo de investigación incipiente. Con este propósito, se construirá un corpus formado por
comentarios publicados en YouTube, el cual se anotará a partir de un inventario extenso de rasgos léxico-gramaticales basados en el
modelo de la Lingüística Sistémico-Funcional. En concreto, los rasgos que formen este inventario, los cuales abordarán el significado del
discurso desde diversas perspectivas (i. e., interpersonal, experiencial, lógico y textual), se seleccionarán con respecto a su significancia
dentro del marco del análisis crítico del discurso. La elección de YouTube como fuente textual está motivada por el hecho de que esta
plataforma de vídeos se ha convertido en una destacada fuente de noticias en línea, donde los usuarios suelen reflejar su perfil ideológico
en los comentarios que publican. Sobre este corpus, se aplicará la minería de reglas de asociación para la detección de patrones de
rasgos léxico-gramaticales que no podrían ser identificados a simple vista debido al gran volumen de datos que se procesa. De esta
forma, el descubrimiento y la extracción de estos patrones podrá ayudar a los investigadores a interpretar y explicar las estrategias
discursivas empleadas por los autores, respaldándose en evidencias más empíricas y objetivas. Con el fin de demostrar la utilidad de esta
metodología, nuestro estudio de caso se basará en comentarios publicados en YouTube sobre vídeos que traten diversos tipos
específicos de problemas vinculados al dominio temático de la desigualdad (principalmente, económica y racial/étnica) dentro de la
sociedad española y estadounidense. Por consiguiente, el objetivo de este estudio de caso es determinar si los patrones lingüísticos que
son computacionalmente significativos sirven para identificar la posición ideológica no solo de los autores sino también de la sociedad en
la que viven. Igualmente, se pondrá énfasis en el contraste interlingüístico (i. e., español e inglés) para el estudio de una realidad social
transnacional a través del análisis de un mismo tipo específico de problemas. Destacamos que el proyecto tiene un marcado carácter
multidisciplinar, requiriendo el conocimiento de diversos campos de la lingüística (p. ej., lingüística teórica, lingüística de corpus y análisis
crítico del discurso) y de las ciencias de la computación (p. ej., minería de datos), donde estas últimas se ponen al servicio de la
investigación lingüística.