Mapeo sobre la responsabilidad en datos en el Estado

Datos para un Estado inteligente

Los datos son un insumo fundamental para diseñar, implementar y evaluar políticas públicas. Un buen manejo de la información permite ser más eficiente, dar mejores respuestas y hacer una mejor gestión de los bienes públicos.

El Estado es uno de los principales generadores de datos del país. Sin embargo, la información que recolecta está fragmentada en distintas dependencias y sin explotar en todo su potencial. Para aprovecharlos mejor, los datos tienen que ser considerados un activo del cual es posible sacar valor. Es decir, los datos tienen que ser gobernados.

¿Cuál es el estado de los datos de la Administración pública hoy? ¿Se recolectan? ¿De qué manera se gestionan? Este informe presenta un diagnóstico de responsabilidades sobre datos en los distintos organismos del gobierno local, respondiendo a dos preguntas. ¿Cuáles son los organismos estatales que más —y que menos— trabajan con data? ¿Qué tareas realizan con ella?

Mapear los datos en el Estado

¿Qué hicimos?

Realizamos un diagnóstico de responsabilidades sobre los datos en la Administración Pública mediante el análisis de las competencias presentadas en el Organigrama del Estado.

¿Con qué datos?

Mediante un scraping de Infoleg obtuvimos el texto de las competencias de 513 dependencias, incluyendo organismos centralizados (Ministerios, Secretarías y Subsecretarías) y descentralizados.

¿De qué manera?

Elaboramos una lista de palabras clave relacionadas con temas de datos y evidencia. Las buscamos dentro de los textos de las competencias.
A partir de esto calculamos diversas métricas y rankings.

Responsabilidad de datos según dependencia

En los organismos estatales

Habiendo buscado las palabras clave en las competencias mencionadas, se encontró que sólo un 39% de los organismos mapeados dice trabajar con datos. El 61% restante no menciona los datos como parte de sus tareas.

A su vez, dentro de las dependencias que trabajan con datos, la mayoría (66%) son organismos descentralizados.

En los organismos centralizados

La mayor parte de las dependencias centralizadas no gestionan datos. Esto señala una falta de jerarquización del problema de los datos en el poder ejecutivo.

Tomando sólo a la Administración Central, el 22% de las dependencias analizadas hacen referencia a datos. 

De los Ministerios, los que más gestionan con datos son: Justicia, Obras públicas y Seguridad.

Este ranking ordena a los Ministerios según la cantidad de dependencias que reportan a ellos que mencionan las palabras clave de datos. Está relativizado y expresado en porcentajes según las dependencias totales que tiene cada Ministerio. Por ejemplo, en el Ministerio del Interior la mitad de las dependencias analizadas mencionan temas de datos.

Para ponderar aquellas dependencias que hacen más referencia a datos, se desarrolló un puntaje que suma la cantidad de veces que el texto de una dependencia menciona cada palabra. 

Si solo se analizan los organismos centralizados, las 10 dependencias que más puntaje acumulan son las siguientes.

En los organismos descentralizados

El 64% de las dependencias descentralizadas analizadas hacen referencia a datos. Esto puede deberse a dos motivos:

1_ Los textos de las dependencias descentralizadas son más extensos y menos homogéneos que los de las centralizadas. 

2_Dentro de las dependencias centralizadas sólo se tienen en cuenta ministerios, secretarías y subsecretarías, por lo que la referencia a datos puede estar entre las competencias de dependencias menos jerárquicas.

Se evaluó la totalidad de los organismos analizados y las 10 dependencias que más puntaje acumularon son todas dependencias descentralizadas.

La responsabilidad de datos según tareas

Búsqueda de palabras clave

Para detectar qué dependencias usan datos buscamos palabras clave dentro de los textos de las resoluciones donde fueron creadas. Se crearon 4 dimensiones de trabajo con datos que surgen de agrupar palabras clave.

Almacenamiento

sistematización de información
almacenar datos
almacenar información
almacenamiento de datos
almacenamiento de información
diseñar bases de datos
diseñar una base de datos
crear bases de datos
crear una base de datos
almacenar bases de datos
almacenamiento de bases de datos

Recolección

encuestar
encuesta
censo
censar
registros administrativos
relevamiento
relevar
recolección de datos
recolectar datos
recolectar información

Evaluación

estadística
evaluar impacto
evaluación de impacto
indicadores
métricas
analizar información
análisis de datos
analizar datos
analizar bases de datos
análisis de bases de datos

Confidencialidad

anonimizar datos
seguridad de datos
proteger datos
protección de datos
anonimizar bases de datos
privacidad de datos
privacidad de los datos

Dependencias según las tareas que realizan

 

Pocas dependencias hacen referencia a almacenar datos y a su privacidad, esto puede señalar una falta de jerarquización de este problema.

Para evaluar la participación que tienen las dependencias en cada una de las dimensiones, se suman las dependencias que hablan de datos y luego se normaliza por dimensión.

Si bien son 201 dependencias que hacen mención a datos (las que mostramos en el gráfico «Dependencias en los organismos del Estado»), en este caso el total suma 287 porque hay dependencias que hacen referencia a más de una dimensión entre sus tareas.

Llama la atención que ARSAT no aparezca entre las dependencias que almacenan datos. Al revisar manualmente los textos de su resolución tampoco se encontró referencia alguna.

Se observa una alta correlación entre Recolección y Evaluación. Lo que señala que la dependencia que recolecta datos tiende a ser la misma que los evalúa. Sin embargo, no suele mencionar cómo los almacena.

Estas son las 10 dependencias que más mencionan dentro de sus tareas, actividades vinculadas con la confidencialidad.

¿Qué sugieren estos resultados?

¿Hay poca transversalización del uso de datos en el Estado?


¿Las competencias referidas a datos están expresadas a nivel de Direcciones Nacionales o inferiores?

¿Hay una desjerarquización de los temas referidos a datos? ¿El almacenamiento está realmente desatendido?

¿Hay otros factores que determinan estos números? Por ejemplo, se analizó la participación presupuestaria de cada Ministerio pero no había relación con su ranking de datos.

Publicaciones relacionadas