Mapas conversacionales en español: diseño y arquitectura
Los mapas conversacionales son interfaces donde el usuario escribe o habla en español y el sistema responde con resultados geográficos: ubicaciones, rutas, estadísticas zonales o recomendaciones. En España, el reto es doble: interpretar matices lingüísticos y ejecutar operaciones GIS precisas. La arquitectura ganadora integra un modelo de lenguaje (LLM) con un orquestador de herramientas geoespaciales y un motor de visualización que explique cada paso.
Todo empieza con el entendimiento de la intención. La frase “búscame cafeterías tranquilas con terraza al sol cerca de Atocha” combina categorías de lugares, atributos subjetivos, una relación de proximidad y un punto de referencia. Un parser semántico, apoyado en un LLM afinado en español peninsular, extrae una plantilla de tarea: categoría=cafetería, filtro=terraza, atributo=soleado, proximidad=500m, ancla=Atocha. A continuación, el orquestador resuelve “Atocha” a coordenadas con un geocodificador robusto, genera un buffer y ejecuta consultas espaciales sobre un catálogo de POIs.
El diseño de prompts merece atención. Incluir ejemplos con abreviaturas españolas (C/, Avda., Pl.) y referencias culturales (“tapeo en La Latina”, “subidita a Montjuïc”) mejora el reconocimiento. Los prompts deben guiar al LLM a producir un plan de operaciones declarativo y verificable, no resultados finales inventados. Un buen patrón: “identifica intención, parámetros, herramientas necesarias y valida disponibilidad de datos; si falta información, solicita aclaración en español claro”.
Para conectar con GIS, el agente necesita herramientas. Las más comunes son: geocodificación, búsqueda de lugares, buffers y uniones espaciales, ruteo, análisis raster (p. ej., pendientes u orientación solar) y agregaciones por polígonos administrativos españoles. Cada herramienta define su firma y precondiciones. El LLM propone una secuencia; el orquestador la valida, ejecuta y captura evidencias (consultas, geometrías, estadísticas). Este enfoque “LLM como planificador” reduce alucinaciones y facilita auditoría.
La explicación en español es parte del producto. No basta con mostrar puntos en un mapa; hay que contar cómo se llegó al resultado: “Filtramos 124 cafeterías en un radio de 600 m alrededor de Estación de Atocha, priorizando orientación sur y valoraciones altas en horario de tarde. Se excluyeron locales en calles con sombra según orientación de fachadas”. Esta narrativa, acompañada de capas activables, incrementa la confianza y habilita correcciones del usuario.
Modelar atributos subjetivos exige creatividad y datos. “Tranquilo” puede correlacionar con ruido histórico, aforo en tiempo real y densidad peatonal. “Al sol” se aproxima con la orientación de fachadas y sombras proyectadas por edificios según la hora. En España, los datos catastrales, de movilidad y meteorológicos abren la puerta a estos proxies. La clave está en documentar supuestos y permitir feedback: el usuario puede marcar resultados acertados o erróneos en español y entrenar un reranker.
La cooficialidad entra en juego. En Barcelona es habitual “carrer” y en Galicia “rúa”. Los topónimos bilingües deben mapearse a un identificador canónico, respetando forma preferente local. Incluir corpus mixtos (castellano, catalán, euskera, gallego) y listas de sinónimos mejora la desambiguación. Además, la experiencia debe aceptar la consulta en cualquier variante y devolver resultados coherentes, explicando si hubo normalización.
Privacidad y cumplimiento no son opcionales. El sistema debe minimizar datos personales, registrar consultas sin identificadores persistentes y aplicar límites de resolución: no mostrar trayectorias individuales ni estadísticas por debajo de umbrales poblacionales. El RGPD y las guías de la AEPD orientan decisiones. La comunicación en español claro sobre qué se guarda y por cuánto tiempo es tan importante como el cifrado y los controles de acceso.
En cuanto a métricas, combinamos exactitud geográfica (distancia al lugar esperado), cobertura lingüística (variantes regionales), robustez a faltas ortográficas y satisfacción de usuario. Las pruebas con conjuntos representativos españoles evitan sesgos, e incluyen temporadas turísticas y eventos que alteran patrones. Un cuadro de mando en español con estas métricas facilita la mejora continua.
Finalmente, el rendimiento. Los asistentes deben responder en segundos. Para ello, se cachean geocodificaciones frecuentes, se precalculan índices espaciales y se limita el contexto del LLM con retrieval de snippets relevantes. La arquitectura híbrida —reglas + embeddings + GIS— consigue precisión y latencia aceptable, sin sacrificar la naturalidad del diálogo.
Datos curiosos
5 cosas que no sabías sobre este tema:
- Las consultas con puntos de referencia superan el 60% en movilidad urbana española.
- “Cerca” en lenguaje natural suele interpretarse entre 300 y 800 metros según la ciudad.
- La orientación de fachadas explica parte de la preferencia por terrazas en invierno.
- Un diccionario de abreviaturas locales reduce hasta un 20% los errores de geocodificación.
- Los prompts con ejemplos regionales (Eixample, Casco Vello) mejoran la desambiguación.