Bajo Lupa

Metodología

Cómo construimos los datos de Bajo Lupa, desde la fuente hasta la ficha pública.

Fuentes

No hacemos scraping de HTML salvo casos excepcionales documentados. Si una administración no publica en API ni acepta Excel, lo registramos en /incumplimientos.

Normalización y deduplicación

Una empresa puede aparecer con 10 variantes en 10 administraciones ("Construcciones Majoreras S.L.", "CONSTRUCCIONES MAJORERAS, S.L.U.", "Constru. Majoreras"...). Aplicamos:

Clasificación de empresas

Multi-tag con confianza. Cada empresa puede ser, por ejemplo, constructora Y local_fuerteventura a la vez. Reglas automáticas por CNAE, CPV dominante y nombre comercial. Tags con confianza ≥ 70% se muestran al público. Reglas dudosas se encolan para revisión editorial.

Trazabilidad

Cada registro guarda su origen, hash sha256 de campos canónicos, URL de la fuente y snapshot del payload original. Si una administración rectifica, podemos regenerar sin perder histórico.

Frecuencia y latencia

¿Has visto un error?

Cada ficha tiene un enlace de rectificación. Escríbenos a hola@bajolupa.org con la corrección y la evidencia.