You are on page 1of 9

3.

Datos geográficos

Los datos son proposiciones referentes a experiencias efectuadas. Éstas se almacenan para ser
utilizadas como evidencias de un fenómeno u objeto una vez interpretado; los datos que la
ciencia utiliza son los que se refieren a hechos comprobados.
Los datos geográficos son entidades espacio–temporales que cuantifican la distribución, el
estado y los vínculos de los distintos fenómenos u objetos naturales y sociales. Un dato se
caracteriza por tener:
• Posición absoluta: sobre un sistema de coordenadas (x, y, z).
• Posición relativa: frente a otros elementos del paisaje (topología, incluido, adyacente,
cruzado, entre otros).
• Figura geométrica que lo representa (punto, línea, polígono).
• Atributos que lo describen (características del elemento o fenómeno).
Desde la perspectiva tecnológica, los SIG deben ser capaces de manipular y analizar entidades,
atributos, geometría y topología de forma integrada.
Los datos geográficos son la clave para diferenciar un SIG de otro sistema de información.
Además, antes de discutir operaciones SIG, se debe comprender la naturaleza de los datos
geográficos; por ejemplo, si tomamos el elemento vías, podemos referirnos a su ubicación con
la pregunta ¿dónde está? Y a sus características, como longitud, nombre, límite de velocidad y
dirección.
La ubicación, también llamada geometría o forma (figura), representa datos espaciales. Así, el
elemento vías tiene dos componentes: el espacial y sus atributos.
3.1 Componentes de los datos geográficos
Los datos geográficos cuentan con tres componentes que hacen referencia a su localización,
atributos y a la variable tiempo, conozcamos sobre cada una de ellas:
3.1.1. Componente espacial
Hace referencia a la localización geográfica, las propiedades espaciales de los objetos y las
relaciones espaciales que existen entre ellos:
Elementos de la componente espacial Descripción
Localización geográfica La localización geográfica o posición de los objetos
en el espacio se expresa mediante
un sistema de coordenadas, que debe ser el mismo
para las distintas capas o “estratos de la
información”, como se está presentando la realidad
del área de estudio.
Propiedades espaciales Los objetos que representan la realidad tienen
ciertas propiedades espaciales; por ejemplo, para
una línea, longitud, forma, pendiente y orientación.
Relaciones espaciales Los objetos espaciales mantienen relaciones entre sí
basadas en el espacio, como conectividad,
contigüidad, proximidad, inclusión, etc.

Las relaciones espaciales se pueden diferenciar en: relaciones topológicas (de tipo cualitativo)
y relaciones geométricas (calculadas a partir de las coordenadas de los objetos).
“La topología expresa las relaciones entre los objetos de forma cualitativa: si dos polígonos son
colindantes (contigüidad), si uno está contenido en el otro (inclusión), si dos líneas están
conectadas (conectividad)”.
El ser humano tiene distintas formas de conceptualizar el mundo real, pero al desplazarnos de
un lugar a otro utilizamos relaciones topológicas (cerca, lejos, dentro de, al norte de, etc.), nos
orientamos por referencias relativas con respecto a un lugar conocido (cerca a la Plaza de
Bolívar, junto a la Alcaldía, etc.).
Las relaciones topológicas más importantes son:
• Adyacencia (entre polígonos).
• Contigüidad (entre línea y polígono).
• Pertenencia (arcos a polígonos).
• Conectividad (entre arcos, en redes).
• Inclusión (punto en polígono, línea en polígono, polígono en polígono).
3.1.2. Componente temática
Son las características que se conocen como atributos de los objetos con los que
representamos el mundo real. Cada objeto puede registrar un determinado valor para sus
atributos (variables), los cuales pueden presentar cierta regularidad en el espacio y en el
tiempo y, además, pueden ser de distinto tipo y escala de medida.
Los atributos se expresan como variables, que pueden ser:
• Continuas: es decir, que admiten cualquier valor en un rango.
• Discretas: son aquellas que sólo admiten valores en números enteros.
• Fundamentales: se obtienen directamente del proceso de medición. Por ejemplo, población.
• Derivadas: se obtienen al relacionar dos o más variables fundamentales. Por ejemplo,
densidad de la población.


Para que las variables (atributos) puedan ser almacenadas en un SIG, deben ser descritas
mediante categorías. Esta descripción se realiza por medio de escalas
Elementos de la componente temática Descripción
Variación temática
en el espacio y en
el tiempo
Autocorrelación
espacial
Los objetos temáticos tienden a ser más parecidos
entre objetos próximos en el espacio que entre
objetos lejanos entre sí.
Autocorrelación
temporal
Los datos próximos en el tiempo tienden a ser más
parecidos entre sí que los más lejanos.
Tipos de Variables

Variables
continuas
Son características que existen espacialmente entre
observaciones, como la altitud o la precipitación.
Variables
discretas
Son aquellas que se pueden distinguir de manera
individual entre observaciones.
Las variables discretas incluyen puntos (pozos,
postes), líneas (caminos, vías) y polígonos (parcelas).
Variables
fundamentales
y variables
derivadas
Las variables fundamentales son obtenidas
directamente, mientras que las derivadas son el
producto de alguna operación aritmética entre dos o
más variables fundamentales (Bosque, 1992).
Escalas de medida
Escala nominal
Son aquellos descritos por su nombre sin ningún
orden específico, de naturaleza cualitativa, involucran
agrupación o clasificación con respecto a criterios
predefinidos. Establece simplemente una
diferenciación, una clasificación de las unidades
espaciales en categorías o clases. Por razones de tipo
informático, es frecuente asignar números a los
valores nominales, pero sólo por efectos de
codificación. Por ejemplo, los municipios de Perú se
clasifican o diferencian según el departamento donde
se ubican.
Escala ordinal
No sólo se establece una diferenciación, como en las
variables nominales, sino también un orden
jerárquico entre las distintas unidades espaciales.
Corresponden a las listas de clases con
un orden natural inherente, representan una
información más cuantitativa que la nominal; sin
embargo, representan una escala discontinua en la
que la magnitud de la diferencia entre dos categorías
no puede expresarse por medio de operaciones
matemáticas, por ejemplo: en estudios hidrológicos
es normal trabajar con este tipo de datos, en una
cuenca hidrográfica se tienen afluentes de primer,
segundo y tercer orden, la amenaza potencial de
inundación de una zona puede ser alta o baja, los
valores definidos son operaciones estadísticas que
permiten este tipo de ordenamiento.
Escala de
intervalo
No sólo establece una diferenciación y una
jerarquización, sino que además indica la distancia
que existe entre las distintas unidades espaciales.
También cuenta con una secuencia natural, pero las
distancias entre los valores tienen un significado
propio, estas variables representan medidas físicas y
permiten la expresión de magnitudes cuantitativas.
Ejemplo: temperatura, horas promedio, sol
multianual.
Escala de razón

Tienen características similares a los datos de
intervalo, pero además disponen de una referencia
lineal o areal. Ejemplo: la precipitación se expresa en
mm, producción de un cultivo ton/ha.
Escala temporal

Refleja el cambio de clases de atributos con el paso
del tiempo. Ejemplo: dinámica de población en una
región. Los atributos temporales son: Edad:
normalmente utilizado para el análisis multitemporal,
con el fin de analizar tendencias por medio de un
modelo probabilístico, con fines predictivos.
Resolución: intervalos de tiempo en los cuales ciertos
datos son recolectados, agrupados o promediados
por unidad de tiempo (por ejemplo, precipitación o
temperatura), presentando intervalos diarios,
mensuales o anuales.
Frecuencia: relacionada con los requerimientos de
toma de datos para el sistema de información en el
cual se determina cuántas muestras o datos se
tomaron en una unidad de tiempo.

3.1.3. Componente temporal
El tiempo juega un papel fundamental en la geografía. El mundo real solo puede ser explicado
a partir de procesos espacio-temporales. Los geógrafos clásicos franceses se referían a esta
cuestión cuando afirmaban que la Historia explica el presente, Hartshorne se mostraba en esa
misma línea cuando indicaba que la interpretación de las configuraciones geográficas
presentes requiere cierto conocimiento de su desarrollo histórico y proponía como forma de
captar los procesos el proyectar sucesivas imágenes de la geografía histórica de una misma
región: “un intento de desarrollar una imagen en movimiento produciría una variación
continua tanto en el tiempo como en el espacio que reflejaría, en efecto, la realidad en toda su
complejidad”. Algunos geógrafos contemporáneos han situado al tiempo como eje central de
sus reflexiones teóricas y de sus contribuciones metodológicas. La consideración de la
dimensión temporal en un SIG supone la necesidad de almacenar y tratar grandes volúmenes
de datos, ya que cada estrato, capa o nivel de información se debe almacenar tantas veces
como momentos temporales se consideren para el análisis del área de estudio.
Cambio en las componentes espacial y temática, Las distribuciones espaciales se van
modificando con el paso del tiempo, así el tiempo lleva asociada la idea de cambio.
Representación de los procesos espacio-temporales
Secuencia de mapas, Ello equivale a una sucesión de instantáneas referidas a determinados
momentos temporales. Es lo que se hace, por ejemplo, cuando se quiere presentar la
evolución del uso del suelo de una región.

Fig.1 Equivale a la sucesión de mapas indicando el uso del suelo en una región, referidos en determinados momentos en el
tiempo
Mapa de diferencias temporales, Se trata de expresar las diferencias entre dos momentos
temporales para las distintas unidades de observación. Ello es posible tanto cuando se trabaja
con variables cuantitativas.

Fig. 2. Mapa de diferencias temporales: expresa las diferencias entre dos momentos temporales para las distintas
unidades de observación




Es importante tener presentes los siguientes conceptos sobre el tema de los datos.
Topología
La representación espacial de los atributos espaciales, como puntos, líneas y polígonos, es el
primer paso en la construcción del modelo de datos vector. Para algunas aplicaciones de los
SIG, el siguiente paso es generar topología, para así poder expresar las relaciones espaciales
entre las características.
La topología es el estudio de las propiedades de los objetos geométricos que permanecen
invariantes bajo ciertas transformaciones.
Se consideran tres relaciones topológicas básicas
Conectividad: arcos (segmentos de línea) conectados a nodos (puntos finales).
Definición de área: un área es definida por una serie de arcos conectados.
Contigüidad: los arcos tienen direcciones y polígonos a derecha e izquierda.
Historia de los datos
Debe hacer el recuento del ciclo de vida del conjunto de datos desde la colección y adquisición
hasta su compilación y derivación a su forma actual.
La historia de los datos debe contener dos componentes:
• La fuente de información: debe registrar la procedencia y las características de los datos
originales.
• La secuencia de procesos: debe registrar el orden y la relación de eventos o de
transformaciones realizadas al conjunto de datos durante su vida.
3.2. Calidad de datos
Para proceder a aplicar con éxito los diferentes procesos de análisis espacial, se requiere que la
información georreferenciada presente calidad en términos de accesibilidad, integridad,
precisión, actualidad, consistencia, fuentes de información y procesos de producción.
El énfasis de calidad cartográfica se centra en analizar los errores de posición y atribución
introducidos durante la fase de procesamiento de datos y sus repercusiones sobre las
sucesivas operaciones. La generación de nueva información que puede provenir de un SIG
depende significativamente de la información que posee la base de datos disponible. La
calidad de esta base de datos y sus contenidos determinan la cantidad y calidad de los
resultados obtenidos del SIG.
En la geometría de datos geográficos, un SIG debe cumplir con la calidad en la consistencia
topológica, o sea, en las relaciones entre los objetos, los cuales no varían cambiando su escala
o aplicando transformaciones de rotación o traslación.
La Norma contempla la siguiente definición de calidad, así:

Calidad: conjunto de características de los datos geográficos que describen su capacidad para
satisfacer necesidades establecidas e implícitas.
Los componentes para describir la calidad de un conjunto de datos son:
• Los elementos de calidad.
• Los elementos generales de calidad.
Un elemento de calidad es un aspecto de la calidad de los datos que puede ser medido
cuantitativamente. El propósito de estos elementos es identificar las inconsistencias de un
conjunto de datos con respecto a sus especificaciones de producto.
Los siguientes elementos son usados para describir los aspectos cuantitativos de calidad:

3.2.1. Consistencia lógica
Hace referencia a las relaciones descritas en la estructura de datos. En general se trata de
errores que pueden ser detectados cuando el sistema genera topología. Así, por ejemplo, un
polígono tiene que ser cerrado y tener una única etiqueta y un solo identificador, y dos líneas
deben tener un nodo como punto de enlace. No sólo debe haber una consistencia lógica
dentro de cada capa, sino también entre las distintas capas. Supongamos que tenemos dos
capas temáticas (secciones censales e hidrografía) y que un río marca el límite entre dos
secciones censales: al superponer ambas capas debería coincidir el trazado del río con el límite
entre ambas secciones censales y sin embargo frecuentemente esto no ocurre así. En tal caso
no existiría consistencia lógica entre ambas capas.

3.2.2. Exactitud de posición
Se refiere a la exactitud en la localización de los elementos sobre el plano en relación con la
posición que realmente ocupan en el espacio. En la localización de un punto, un error de 1 mm
sobre un plano 1:10.000 supone una diferencia de 10 metros en la realidad. La exactitud
posicional se puede verificar sobre una serie de puntos, de los que se conoce exactamente su
localización real en el espacio. Una forma de medirla es determinar el error posicional de esos
puntos elevando al cuadrado las desviaciones individuales y obteniendo la raíz cuadrada de su
media. Algunas instituciones han fijado unos estándares para controlar los errores
relacionados con la exactitud posicional, de manera que el usuario final conozca hasta qué
punto es exacta la localización de los puntos de un mapa.

3.2.3. Exactitud temática
Se refiere a la exactitud de los valores de los atributos. Cuando se trabaja con variables
cuantitativas, como la altitud o el número de habitantes, se sabe que casi nunca la información
es del todo exacta, ya que siempre existe un cierto nivel de error tanto en la medición de los
datos del medio físico como en las estadísticas oficiales de carácter socioeconómico. De la
misma forma, cuando nos enfrentamos a variables cualitativas, como el uso del suelo,
conocemos previamente que existe un cierto nivel de inexactitud: un polígono industrial puede
no ser industrial al 100 % y un bosque de pinos puede no contener exclusivamente pinos en el
100 % de su superficie. Un caso muy ilustrativo es el de la clasificación de imágenes de satélite,
donde el valor cuantitativo de cada celda es asimilado a una clase de uso del suelo, en función
de la diferencia que ese valor presente con respecto a un valor que se considera prototipo de
esa clase, es decir, en función de un cierto error tolerable, con lo que de hecho se acepta de
antemano un cierto grado de inexactitud temática.

3.2.4. La temporalidad
El tiempo es una componente esencial de los datos geográficos y por lo tanto afecta a la propia
calidad de los datos. En general la información debe ser lo más actualizada posible y toda ella
estar referida al mismo tiempo. Pero esto no siempre es posible, ya que con frecuencia se
utilizan fuentes que son actualizadas cada cierto período de tiempo, como la cartografía oficial
o los datos censales. En muchas actividades, especialmente en las de gestión, es fundamental
una constante labor de actualización para que la base de datos sea útil. Es lo que ocurre, por
ejemplo, en las aplicaciones en la gestión urbanística o en los inventarios para el
mantenimiento de carreteras. A veces no se presta la suficiente atención al tiempo cuando se
recoge información de distintas fuentes, con la consecuencia de que ésta puede ser
inconsistente.
3.2.5. La integridad
Se deben tener en cuenta determinados criterios durante el proceso de creación de la base de
datos para que ésta sea coherente y homogénea. Esos criterios se refieren a cuestiones como
qué elementos deben ser seleccionados, que dimensiones mínimas deben tener para que sean
incluidos, en cuántas clases se divide una variable nominal, cuáles son las definiciones de las
clases, etc. El fijar y aplicar de forma adecuada estos criterios hace que la base de datos sea
homogénea en su totalidad.

3.3. Tipos de errores
Los errores son consustanciales a los datos. No es posible encontrar ni un mapa
analógico ni una base de datos espacial sin errores. La cuestión que se plantea no es eliminar
el error, sino ser capaces de controlarlo. Los errores pueden surgir en distintas etapas de la
representación de la realidad y el análisis en un SIG, en función de lo cual Aronoff (1989)
presenta una tipología en la que sólo las cuatro primeras categorías se refieren propiamente a
errores en la base de datos (CUADRO 2.5):
1) Errores inherentes a la recogida de información. Tanto los mapas como las
estadísticas oficiales contienen forzosamente un cierto nivel de error, que se incorpora
lógicamente a la base de datos espacial que se genera. Algo semejante sucede cuando
se recurre al trabajo de campo o la interpretación de imágenes de satélite, en las que
también es frecuente que se introduzcan ciertos niveles de error ligados a la medición
o a la clasificación.
2) Errores derivados de la captura de datos. En los procesos de captura de datos en el
ordenador se pueden generar errores que no existen en las fuentes originales. Esto
puede ocurrir en un proceso de digitalización manual, donde puede quedar un
polígono sin representar; o en la importación de ficheros con información locacional o
de atributos, donde un determinado carácter alfanumérico puede no ser reconocido
por el sistema. Por otro lado, es importante observar que en algunos casos nos
encontramos con inexactitudes ligadas a una indefinición o variabilidad de las líneas
frontera en la propia realidad. Si el error es considerado como la desviación (o
distancia) entre un valor medio y el valor real, en este caso no existe un valor real
único con el que efectuar las comparaciones. Esto puede ser debido a que en la
realidad no existe una línea frontera entre dos áreas sino una suave transición (por
ejemplo, entre dos tipos de suelos) o a que esa línea frontera es cambiante en el
tiempo (por ejemplo la línea de costa oscila a lo largo del día y la orilla de un lago que
varía a lo largo del año por efecto de las precipitaciones).
3) Errores derivados del almacenamiento. Las coordenadas de los puntos se almacenan
en formato digital con un determinado nivel de precisión. Cuando se almacenan en
simple precisión se utilizan 32 bits (4 bytes) de memoria para cada valor y se puede
trabajar con siete dígitos significativos. La doble precisión utiliza 64 bits, pero permite
trabajar con 15 ó 16 dígitos significativos. En algunas aplicaciones se requiere una gran
exactitud en el almacenamiento de las coordenadas, que solo puede ser alcanzada
utilizando doble precisión, si bien ello conlleva un mayor consumo de memoria.
4) Errores derivados de la manipulación y análisis de datos. Pueden surgir, por ejemplo,
cuando varias capas se superponen y no coinciden exactamente ciertas líneas que
deberían hacerlo, formándose polígonos que en realidad no existen, los polígonos
ficticios. Cuanto más precisa sea la forma de estas líneas frontera, más fácil es que se
produzcan errores en las operaciones de superposición de capas. Por otro lado, los
errores tienden a incrementarse en número cuanto mayor es la cantidad de capas a
superponer.
5) Errores debidos a las salidas cartográficas. El error puede ser debido tanto a los
dispositivos de salida como al material sobre el que se realiza la impresión. Los
monitores de los ordenadores y los plotter o trazadores trabajan con un sistema de
coordenadas que tienen una precisión limitada, lo que puede producir ciertas
imprecisiones en las salidas cartográficas. Por otra parte, en material (generalmente
papel) en el que se realiza la impresión es deformable en mayor o menor medida.
6) Errores debidos a la utilización de los resultados. Los mapas o informes generados por
un SIG pueden ser utilizados de forma inapropiada, sin considerar el nivel de exactitud
con el que se ha trabajado, lo que puede llevar a conclusiones equivocadas.