Un recorrido por la historia del SID de la mano de la IA

A través de este experimento, nos proponemos brindar una visión integral sobre cómo se ha tratado la temática de la discapacidad en los medios digitales asociados, desglosando el tipo de lenguaje utilizado, la evolución de las palabras más usadas cada año y los cambios en los temas abordados con el tiempo.

La discapacidad, entendida en su amplio espectro, implica una diversidad de condiciones que afectan a las personas en distintos niveles y de varias maneras. Es esencial que la comunicación sobre este tema sea precisa, inclusiva y respetuosa, reflejando no solo los desafíos sino también las capacidades y logros de las personas con discapacidad. Con este objetivo en mente, hemos desarrollado una herramienta analítica que revisa sistemáticamente el corpus de noticias emitidas, proporcionando así una base de datos robusta para investigadores, periodistas, decisores políticos y el público en general interesado en la evolución del discurso sobre la discapacidad.

Metodología de Análisis

Nuestro análisis comienza con la recolección de todas las noticias publicadas en la web del Servicio de Información sobre Discapacidad. Utilizamos técnicas avanzadas de procesamiento de lenguaje natural para identificar patrones, tendencias y cambios en el uso del lenguaje a lo largo del tiempo. Este enfoque nos permite detectar no solo las palabras más frecuentes cada año, sino también cómo las connotaciones y el contexto en el que se usan estas palabras han evolucionado.

Además, llevamos a cabo un seguimiento de los temas predominantes en las noticias. Este análisis temático ayuda a entender mejor las preocupaciones predominantes en la sociedad respecto a la discapacidad, así como las áreas que están ganando atención o aquellas que están siendo gradualmente olvidadas.

Resultados Visuales e Interactivos

Para facilitar la comprensión de nuestros análisis, el sitio incluye una serie de gráficos dinámicos e imágenes que ilustran la evolución del lenguaje y los temas a lo largo de los años. Estos recursos visuales no solo enriquecen la experiencia del usuario sino que también permiten interactuar con los datos, ofreciendo a los visitantes la oportunidad de explorar tendencias específicas más a fondo.

Impacto y Utilidad

Esperamos que este análisis contribuya a una mayor conciencia sobre la importancia de un lenguaje adecuado y una cobertura equitativa en las noticias sobre discapacidad. Al ofrecer una visión clara de la trayectoria histórica y las tendencias actuales, este sitio aspira a ser una fuente de referencia que apoye la creación de políticas más informadas y una narrativa mediática más inclusiva.

Invitamos a todos nuestros visitantes a explorar los distintos apartados del análisis y a reflexionar sobre cómo la manera en que hablamos de discapacidad puede influir en la percepción pública y en las vidas de las personas afectadas.

Información estadística

Número de noticias por año y longitud media de las mismas (por palabras)

AñoNumero de noticiasLongitud media (palabras)
19991834.17
20002233264.04
20013507317.16
20024060335.95
20034338343.20
20044998361.50
20052808341.14
20062705329.08
20073342331.18
20083338359.91
20092718306.78
20102445303.75
20112968340.33
20123157408.31
20132307390.78
20142688382.16
20152655362.47
20161677355.39
20171637418.35
20187224394.63
20192390450.65
20201406501.63
20211099492.81
20221252493.69
2023963582.23

En los siguientes gráficos e imágenes podemos ver la distribución y la evolución de estos datos a lo largo de los años.

Longitud media de las noticias (número de palabras)

En la gráfica podemos ver una tendencia general al alza en cuanto a la longitud de las noticias, en particular en los últimos años (desde el 2016 hasta la actualidad)

Número de artículos (noticias) publicados por año

Esta gráfica muestra el número de noticias publicadas por año.
Vemos cierta fluctuación en el número de artículos a lo largo del tiempo, con picos en ciertos años (como 2002, 2003, 2004 y 2018).

Histograma de la distribución de la longitud de las noticias de toda la muestra

La tercera visualización es un histograma que muestra la distribución de la longitud de los artículos en todo el conjunto de datos. Muestra la frecuencia de artículos (eje Y) dentro de diferentes rangos de recuento de palabras eje X), lo que ilustra que la mayoría de los artículos tienen recuentos de palabras en el extremo inferior del espectro, y menos artículos tienen recuentos de palabras muy altos. La longitud más común de los artículos está entre 180 y 400 palabras)

Mapa de calor de los términos utilizados en las noticias del SID desde el año 2000 al 2024

En la gráfica se muestran las palabras más frecuentes, con un marcador de color indicando la frecuencia de las mismas en cada año del rango de estudio.

Se han excluido de la gráfica los años 1999, 2018 y 2024, por no contener datos suficientemente fiables para el análisis por parte de la IA.

Gráficos de “nubes de palabras” utilizadas en las noticias del SID

A continuación se muestran los términos más utilizados para cada año, en forma de tag cloud nube de palabras. Esta forma de respresentación es bastante descriptiva e intuitiva para analizar este tipo de datos.