Software para la identificación de la variedad geográfica del lenguaje de usuarios en redes sociales a partir de sus textos.

La posibilidad de conocer rasgos de una persona a partir únicamente de los textos que escribe se ha convertido en un área de gran interés denominada perfil de autoría (o author profiling por su nombre en inglés). Ser capaz de inferir de un usuario su sexo, edad, idioma nativo o los rasgos de su personalidad, simplemente analizando sus textos, abre todo un abanico de posibilidades desde el punto de vista forense, de la seguridad o del marketing. Además, la proliferación de los medios sociales, que favorece nuevos modelos de comunicación y relación humana, potencia este abanico de posibilidades. La idiosincrasia inherente a estos medios sociales hace de ellos un entorno de comunicación especial, donde la libertad de expresión, la informalidad y la generación espontánea de temáticas y tendencias propician el acercamiento a la realidad diaria de las personas en su uso de la lengua. Sin embargo, esa misma idiosincrasia hace que en muchas ocasiones la aplicación de técnicas lingüísticas de análisis no sea posible, o sea extremadamente costoso. En este software se aborda la modelización mediante grafos del modo en el que los usuarios expresan sus emociones haciendo hincapie en la diferenciación entre hablantes de diferentes variedades de una misma lengua, por ejemplo españoles, mexicanos o argentinos, o portugueses y brasileños. Se han considerado las las variaciones lexicográficas de los textos, representadas de modo que se considera para los análisis de los textos, el vocabulario completo pero reduciendo el número de características a analizar, de modo que resulta un método idóneo para su aplicación en entornos big data como los medios sociales.

Ficha técnica

Tipo de tecnología SOFTWARE
Inventores Francisco Manuel Rangel Pardo, Paolo Rosso
Responsable Rosso Paolo