En este artículo se publica un conjunto de datos (dataset) con estadísticas de casos sometidos a la Procuraduría General de la República Dominicana, publicados en este link: https://transparencia.pgr.gob.do/Inicio/i/5698_Estad%c3%adsticas_de_Casos_Sometidos
Estos datos cubren 113112 casos sometidos desde enero de 2017 hasta octubre de 2022.
Adicionalmente, el equipo de ML4Data creó dos nuevos campos que recategorizan la provincia y la tipificación de los delitos. También se crearon campos de latitud y longitud para georreferenciar cada caso. El dataset puede descargarse en este link.
Las columnas en el dataset son las siguietnes:
- Delito: detalle del delito (imputado en el conjunto de datos original)
- Provincia: provincia donde corresponde el delito (imputado en el dataset original)
- provincia_norm: provincia recatogirizada por el equipo de ML4Data (columna añadida)
- Cantidad: número de casos registrados (imputado en el conjunto de datos original)
- fecha: fecha de registro del caso (imputado en el conjunto de datos original)
- tipo_delito: recategorización del delito realizada por el equipo de ML4Data (columna añadida)
- latitud: georeferencia de latitud de la provincia donde se registró el delito (columna añadida)
- longitude: georeferencia de longitud de la provincia donde se registró el delito (columna añadida).
Algunas visualizaciones interesantes de este dataset:
Todas estas visualizaciones fueron realizadas en el siguiente google-colab:
https://colab.research.google.com/drive/1tr8PD8RNYWgvzVhN_qgt3GwAOePWh4F7?usp=sharing