Datos

Metodología

Cómo se recogen, normalizan y publican los datos del observatorio. Sin atajos y sin huecos rellenados a ojo.

Metodología

Principio general: nunca inventamos cifras

Toda cifra publicada se acompaña de la fuente oficial original y su fecha de consulta. Si una fuente no publica un dato, lo dejamos como «sin dato» y rediseñamos la pieza para que tenga sentido sin él, en lugar de mostrar placeholders del tipo «dato no disponible».

Qué hacemos

  • Descarga diaria del sumario del BOE (Sección II.B) y filtrado por regex de títulos de convocatoria.
  • Persistencia del documento crudo en data/raw/ y de la versión normalizada en data/staging/.
  • Carga en Turso con identificadores estables y registros trazables en tabla cita.
  • Auto-descubrimiento de cuerpos: si el epígrafe BOE empieza por «Cuerpo de» o «Escala de», el cuerpo se da de alta automáticamente con el nombre textual del epígrafe. El grupo EBEP queda sin asignar hasta que se confirme con fuente oficial.

Qué NO hacemos

  • No interpolamos series temporales con huecos.
  • No estimamos notas de corte cuando el tribunal no las publica.
  • No estimamos plazas ofertadas a partir de prensa o filtraciones.
  • No rellenamos tablas con cifras «razonables».
  • No usamos prensa como fuente primaria de cifras; solo como contexto.

Derivaciones permitidas

Sí se publican cifras derivadas matemáticamente sobre datos oficiales: medias, ratios aspirantes/plaza, diferencias interanuales, totales anuales. Cada derivación se etiqueta como tal y se documenta el método.

Actualización

Las convocatorias se actualizan diariamente desde el BOE. Las tablas retributivas se actualizan cuando se publica una nueva Resolución de la Secretaría de Estado de Hacienda. Las series del INAP, semestralmente.

Preguntas frecuentes

¿Cómo se construyen los datos de oposicionesde.com?

Se descargan diariamente el sumario del BOE y los boletines autonómicos disponibles, se filtran las convocatorias por regex de títulos, se normalizan a un esquema común y se cargan en una base de datos Turso. Cada cifra registrada se asocia a su fuente, URL del documento original y fecha de consulta.

¿Qué fuentes se utilizan?

El BOE como fuente principal (Sección II.B "Oposiciones y concursos") más los boletines autonómicos cuya integración está disponible. Se complementa con estadísticas del INE (EPA por sector institucional), Eurostat (sector NACE O-Q), Anexos de Personal de los PGE y Resoluciones anuales de la Secretaría de Estado de Hacienda. El catálogo completo está en /datos/fuentes.

¿Qué hacéis cuando una fuente no publica un dato?

Se queda como "sin dato" y se rediseña la pieza para que tenga sentido sin él. No interpolamos series temporales con huecos, no estimamos cifras a partir de prensa, no rellenamos tablas con valores "razonables". La regla operativa es: si no lo publica una fuente oficial, no aparece en la web.

¿Qué tipo de derivaciones permitís sobre los datos?

Las matemáticas directas: medias, ratios aspirantes/plaza, diferencias interanuales, totales agregados. Se etiquetan como tales y se documenta el método. No se incluyen estimaciones discrecionales ni cifras "razonables" sin sustento en el dato fuente.

¿Con qué frecuencia se actualizan los datos?

Las convocatorias del BOE, diariamente. Las tablas retributivas, cuando se publica la Resolución anual de la Secretaría de Estado de Hacienda. Las series estadísticas del INE y Eurostat se sincronizan con sus calendarios oficiales de publicación. Cada ficha indica su fecha de actualización.