Mapas conversacionales en español: diseño y arquitectura

Interfaz conversacional con mapas en español
IANLPGISEspaña

Los mapas conversacionales son interfaces donde el usuario escribe o habla en español y el sistema responde con resultados geográficos: ubicaciones, rutas, estadísticas zonales o recomendaciones. En España, el reto es doble: interpretar matices lingüísticos y ejecutar operaciones GIS precisas. La arquitectura ganadora integra un modelo de lenguaje (LLM) con un orquestador de herramientas geoespaciales y un motor de visualización que explique cada paso.

Todo empieza con el entendimiento de la intención. La frase “búscame cafeterías tranquilas con terraza al sol cerca de Atocha” combina categorías de lugares, atributos subjetivos, una relación de proximidad y un punto de referencia. Un parser semántico, apoyado en un LLM afinado en español peninsular, extrae una plantilla de tarea: categoría=cafetería, filtro=terraza, atributo=soleado, proximidad=500m, ancla=Atocha. A continuación, el orquestador resuelve “Atocha” a coordenadas con un geocodificador robusto, genera un buffer y ejecuta consultas espaciales sobre un catálogo de POIs.

El diseño de prompts merece atención. Incluir ejemplos con abreviaturas españolas (C/, Avda., Pl.) y referencias culturales (“tapeo en La Latina”, “subidita a Montjuïc”) mejora el reconocimiento. Los prompts deben guiar al LLM a producir un plan de operaciones declarativo y verificable, no resultados finales inventados. Un buen patrón: “identifica intención, parámetros, herramientas necesarias y valida disponibilidad de datos; si falta información, solicita aclaración en español claro”.

Para conectar con GIS, el agente necesita herramientas. Las más comunes son: geocodificación, búsqueda de lugares, buffers y uniones espaciales, ruteo, análisis raster (p. ej., pendientes u orientación solar) y agregaciones por polígonos administrativos españoles. Cada herramienta define su firma y precondiciones. El LLM propone una secuencia; el orquestador la valida, ejecuta y captura evidencias (consultas, geometrías, estadísticas). Este enfoque “LLM como planificador” reduce alucinaciones y facilita auditoría.

La explicación en español es parte del producto. No basta con mostrar puntos en un mapa; hay que contar cómo se llegó al resultado: “Filtramos 124 cafeterías en un radio de 600 m alrededor de Estación de Atocha, priorizando orientación sur y valoraciones altas en horario de tarde. Se excluyeron locales en calles con sombra según orientación de fachadas”. Esta narrativa, acompañada de capas activables, incrementa la confianza y habilita correcciones del usuario.

Modelar atributos subjetivos exige creatividad y datos. “Tranquilo” puede correlacionar con ruido histórico, aforo en tiempo real y densidad peatonal. “Al sol” se aproxima con la orientación de fachadas y sombras proyectadas por edificios según la hora. En España, los datos catastrales, de movilidad y meteorológicos abren la puerta a estos proxies. La clave está en documentar supuestos y permitir feedback: el usuario puede marcar resultados acertados o erróneos en español y entrenar un reranker.

La cooficialidad entra en juego. En Barcelona es habitual “carrer” y en Galicia “rúa”. Los topónimos bilingües deben mapearse a un identificador canónico, respetando forma preferente local. Incluir corpus mixtos (castellano, catalán, euskera, gallego) y listas de sinónimos mejora la desambiguación. Además, la experiencia debe aceptar la consulta en cualquier variante y devolver resultados coherentes, explicando si hubo normalización.

Privacidad y cumplimiento no son opcionales. El sistema debe minimizar datos personales, registrar consultas sin identificadores persistentes y aplicar límites de resolución: no mostrar trayectorias individuales ni estadísticas por debajo de umbrales poblacionales. El RGPD y las guías de la AEPD orientan decisiones. La comunicación en español claro sobre qué se guarda y por cuánto tiempo es tan importante como el cifrado y los controles de acceso.

En cuanto a métricas, combinamos exactitud geográfica (distancia al lugar esperado), cobertura lingüística (variantes regionales), robustez a faltas ortográficas y satisfacción de usuario. Las pruebas con conjuntos representativos españoles evitan sesgos, e incluyen temporadas turísticas y eventos que alteran patrones. Un cuadro de mando en español con estas métricas facilita la mejora continua.

Finalmente, el rendimiento. Los asistentes deben responder en segundos. Para ello, se cachean geocodificaciones frecuentes, se precalculan índices espaciales y se limita el contexto del LLM con retrieval de snippets relevantes. La arquitectura híbrida —reglas + embeddings + GIS— consigue precisión y latencia aceptable, sin sacrificar la naturalidad del diálogo.

Datos curiosos

5 cosas que no sabías sobre este tema: