Big Data: El español destaca como la lengua más positiva en la web

.

En un estudio publicado en Febrero de 2015, Peter Sheridan Dodds y sus colaboradores de la Universidad de Vermont combinaron estadística y big data para analizar el contenido emocional de las palabras utilizadas en diferentes medios de publicación electrónica. En el resultado global detectaron sesgo hacia el “sentido positivo de las palabras”, y entre los resultados segmentados nos ha llamado la atención la “positividad del español en la web”, que obtuvo el mejor resultado.

El estudio recogía millones de palabras en 10 lenguas a partir de 24 fuentes diferentes, incluyendo libros, revistas, prensa y redes sociales. Para cada lengua se identificaban las 5.000 palabras más frecuentes, y sobre ellas se solicitaba a los encuestados que clasificaran su sentido en una escala de “triste a alegre” (o “pesimista a optimista” o “negativo a positivo”). La escala era de 9 puntos, donde 1 representa “muy negativo” y 9 “muy positivo”. Así, por debajo de 5 tendríamos “negatividad”, 5 sería neutro, y por encima de 5 “positividad”.

Sobre una muestra de 5 millones de respuestas, el resultado global (todas las palabras y lenguas) es de 5,54, lo que indica un sesgo hacia lo positivo. Aún mejor, el resultado para el español y para las palabras utilizadas en los sitios web es de 6,00. Celebramos este resultado, que tienta a pensar “vaya, el espacio web en español trasmite positividad”.

Puedes encontrar más detalles del estudio en http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4345622/.

Nuestro departamento de desarrollo participa en proyectos intensos en procesamiento de datos y análisis estadístico, habiendo realizado diferentes aplicaciones y colaborado con universidades y empresas. Bienvenido sea el “sentido positivo de las palabras”.

Distribuciones de positivdad de las palabras.