• Publicado: 09 Aug 2015

  • Archivado en: Monterrey, DataScience

Como combatir a los baches en Monterrey

Pocas cosas en esta ciudad tienen el potencial de desquiciar tanto como los famosos “baches” (hoyos, a veces inexplicables, en calles). Todos hemos tenido un encuentro desafortunado con uno, hasta el punto de casi matarnos.

El descontento es tal, que casi todos los candidatos a alcaldías en esta pasada elección tocaron el tema, prometiendo acabar con ellos.

Aunque las razones de los baches varían desde las técnicamente correctas (la lluvia y los camiones que atraviesan a la ciudad) hasta las penosas (conviene más, para el corrupto, estar gastando cada 6 meses en re carpeteo), al menos podríamos encontrar un manera más eficiente de combatirlas.

Mi hipótesis es que si las causas son muy grandes para combatir, deberíamos usar el poder de twitter y los datos para aligerar los síntomas más eficientemente.

El Centro de Integración Ciudadana (CIC), una ONG que mantiene una cuenta de twitter dónde puedes reportar desde balaceras hasta baches, subió hace tiempo una base de datos con estos reportes. Veamos lo que podemos hacer.

Primero que nada, bien por el CIC en abrir sus datos y en un formato relativamente amable. Pero, estos terminan abruptamente en febrero del 2014. Una actualización no estaría de más.

En fin, incluso desde entonces, vemos una alza en los baches reportados por día (y a lo que eh vivido, no creo que ahí haya sido su pico).

foto1

Pero una cosa son número de baches reportados y otra muy distinta son afectados. Al fin de cuenta, un solo bache puede bloquear una avenida importante, afectando más que 10 baches en colonias con poco tráfico.

Para trata de medir esto, usé el paquete de inegiR para traer las estadísticas del DENUE por cada bache. Como tenemos la ventaja de que los tweets tienen coordenadas geográficas, buscamos esa coordenada y todos los negocios a 250 metros a sus alrededores. El DENUE tiene también los empleados estimados por negocio, entonces podemos estimar cuantos empleados hay a la redonda de cada bache reportado. Esto debe ser tomado con cierto escepticismo por que es una estimación y pueden duplicarse los negocios si los baches están muy cercanos, pero aún así arroja resultados interesantes

Contando cada empleado como un afectado, obtenemos que no solamente iban a la alza los baches reportados en ese entonces, sino la afectación de cada uno (lo que explica nuestra irritabilidad):

foto2

Pero, si la idea es poder identificar mejor la afectación de los peores baches, debemos agrupar de cierta manera la información. Primero, hago esto por la cantidad de negocios a su redonda.

foto3

Esos pocos baches con más de 400 negocios a su redonda, claramente afectan más que los que están en zonas menos densamente pobladas.

Para número de empleados, la distribución es parecida (pocos baches afectan a muchos usuarios potenciales):

foto4

Todo esto es interesante, pero para algo como los baches, nos tiene sentido más sentido verlos plasmados en un buen mapa. Para este mapa usé el paquete de leaflet que es bastante amigable para crear mapas.

(Por cierto, el icono no es coincidencia)…

foto5

Desafortunadamente no pude poner el mapa como lo veo en R o un sitio web con zoom porque Blogger (la plataforma sobre la que está este blog) no me deja embedir el html directamente sin afectar el source code. Entonces les dejo aquí tanto el script que usé para crear todo lo de este post y los html ya creados (pueden bajarlos y verlos en un browser):

Continuando con el tema, hagamos un zoom a la zona más concurrida de la ciudad:

foto6

Alcanzamos a ver las avenidas más problemáticas, pero aún así no nos dejan claro todavía que bache es el que debería tener prioridad.

Entonces, hagamos una simple medición.

Los baches con mayor prioridad deberían ser aquellos que afectan a más usuarios (más de 1500) y que tienen ya muchos días de ser reportados (los usuarios a los que afectan incrementan con cada día que pasa). En el siguiente mapa estos están en rojo.

Después deberíamos quitar el factor de tiempo. Ya una vez que arreglas los más viejos, debemos priorizar arreglar los que afectan a más gente (sin importar si se reportó ese mismo día). Estos los vemos en naranja.

Pasando estos, los baches que afectan a entre 500 y 1500 usuarios potenciales (en azul) y finalmente los baches que afectan a pocos usuarios (en café).

foto7

Si nos acercamos más, vemos a estos baches culpables de nuestra mayor aflicción en el día a día:

foto8

Como se puede observar, esta medición no está considerando el flujo de la avenida para agrupar a los baches. Por ejemplo, un bache podría afectar a pocos usuarios a su alrededor, pero si detiene el flujo en una avenida como Constitución, la seriedad del bache incrementa enormemente.

¿Qué se podría hacer para aligerar este error? Escoger un bache rojo o naranja y arreglar todos los que están en la misma avenida.

Aprovechando las redes de personas que se mueven por la ciudad esta información básicamente se podría mantener al día, sin la necesidad de pagar un solo centavo.


Fuentes