Professional Documents
Culture Documents
1112-Texto Del Artículo-3023-2-10-20160728
1112-Texto Del Artículo-3023-2-10-20160728
ABSTRACT
In aquatic ecosystems is monitored the water to determine their space-temporary variations, generating large
and complex arrays of data that require tools that assist in the interpretation thereof, for managers of water
resources can inform society the deterioration of these and take corrective action. This review is a revision of
multivariate statistical techniques used to examine the spatial and temporal variability of water quality. We
consider few techniques like Factor Analysis, which is used in order to reduce the dimensionality of the data
and build underlying latent variables or factors that produce the observed variables, these factors can be used
as water quality indexes built from the data collected; we also consider cluster and discriminant analysis than is
commonly used to study the spatial variability and studying similarities between periods or sampling stations,
these three techniques are commonly used for exploratory purposes; for more complex goals such as modeling
and prediction, hierarchical models, Multiple Regression and Structural Equations are presented. For all methods,
we present their functionality and usability methods and illustrated using case studies. This review describes how
these methods can be used in order to study water quality for monitoring spatial and temporal variability of the
measures taken.
MUTIS, Journal of the Faculty of Sciences and Engineering, Jorge Tadeo Lozano University, is licensed under the Creative Commons 4.0: Attribution - Noncommercial -
No Derivative Works
Gómez, I & Peñuela, G. (2016).
55
correctivas. El presente artículo es una revisión de peratura, oxígeno disuelto y conductividad eléctrica
tema cuyo objetivo es el examen de técnicas estadís- pueden favorecer la transformación biótica o abióti-
ticas multivariadas usadas para examinar la variabi- ca de los contaminantes. Igualmente ocurre con las
lidad espacio-temporal de la calidad del agua. En él condiciones hidráulicas del recurso hídrico que pue-
se presentan diversas técnicas como el análisis fac- den favorecer la sedimentación de los contaminan-
torial, que se usa con el fin de disminuir la dimen- tes. Un contaminante puede estar evaluado por uno
sionalidad de los datos y construir factores subya- o más parámetros, y un parámetro puede evaluar
centes o variables latentes que generen las variables uno o más tipos de contaminantes; por esto, varios
observadas, estos factores pueden usarse e interpre- parámetros están relacionados. Por lo tanto, los pa-
tarse como índices de calidad del agua construidos rámetros de calidad de aguas pueden variar de un
a partir de los datos recolectados; también se pre- sitio a otro y de un día a otro, y por esto, para la in-
senta en análisis de clúster y el análisis discriminan- terpretación de los datos que se obtengan de los di-
te que se usan comúnmente para estudiar la varia- ferentes parámetros en un recurso hídrico, se hace
bilidad espacial, estudiando similaridades entre pe- imperante contar con métodos de análisis de datos
ríodos o estaciones de muestreo, estas tres técnicas que permitan evaluar, de manera simultánea, las
se usan comúnmente con fines exploratorios; para múltiples relaciones que existen entre las variables
objetivos más complejos como el modelamiento y (parámetros) y su evolución espacial y temporal, pa-
la predicción, se presentan los modelos jerárquicos, pel que cumplen a cabalidad los métodos estadísti-
de regresión múltiple y de ecuaciones estructurales. cos multivariados.
Para todos los métodos se presenta su funcionalidad
y aplicabilidad y se ilustran usando casos de estudio. La aplicación de diferentes métodos estadísticos
Esta revisión describe cómo estos métodos pueden multivariados como análisis de clúster (Clúster
utilizarse con miras a estudiar la calidad del agua con Analysis CA), análisis de componentes principales
el fin de monitorear espacial y temporalmente la va- (Principal Component Analysis PCA), Análisis
riabilidad de las medidas tomadas. Factorial (Factor Analysis FA), y análisis discriminante
(Discriminant Analysis DA), son de gran ayuda en
Palabras clave: métodos estadísticos multivariados, la interpretación de matrices de datos complejas
modelos de ecuaciones estructurales, modelos jerár- para un mejor entendimiento de la calidad del
quicos, modelos de regresión múltiple multivariada, agua, que permiten la identificación de posibles
calidad de aguas. factores o fuentes que afectan los sistemas
acuáticos y ofrecen una valiosa herramienta para
la administración confiable de los recursos hídricos
INTRODUCCIÓN así como soluciones rápidas a los problemas de
El agua es un recurso escaso e indispensable para la contaminación (Shrestha & Kazama, 2007). También
supervivencia humana y de la mayoría de las espe- existen otros métodos estadísticos que estudian las
cies en el planeta, es por ello que se hace necesario relaciones de causalidad y dependencia, como son el
administrar eficientemente el recurso hídrico y es- análisis de correlación canónica (Canonic Correlation
tudiar los impactos que han generado las activida- Analysis CCA), los modelos jerárquicos (Hierarchical
des antropogénicas y los cambios ambientales que Models), modelos de regresión múltiple multivariada
ocurren en las cuencas hídricas, lo que se logra es- (Multiple Multivariate Regession Models) y los
tudiando la calidad del agua. La calidad del agua in- modelos de ecuaciones estructurales (Structural
volucra muchos parámetros que pueden variar espa- Equation Models SEM). El análisis de correlación
cial y temporalmente, de acuerdo a los vertimientos canónica es ampliamente usado en calidad de aguas
y cambios climáticos. Estos parámetros están rela- con el fin de estudiar las relaciones entre grupos de
cionados con la presencia de diferentes contaminan- parámetros, entregando dos vectores de variables,
tes en el agua, disueltos o en suspensión, en con- uno que representa las variables endógenas y
centraciones que varían a lo largo del recurso hídrico otro las exógenas, con la particularidad de que la
por los vertimientos, las transformaciones bióticas o correlación entre estos vectores es máxima, se ha
abióticas, sedimentación, etc. Las condiciones am- usado en calidad de aguas por ejemplo estudiando
bientales del agua como pH, potencial redox, tem- las relaciones entre los parámetros físicos (vector
Análisis de componentes principales (PCA) 3. PCA es una herramienta descriptiva, mientras que
FA presupone un modelo estadístico formal de gene-
El PCA es un procedimiento matemático que transfor- ración de la muestra dada.
ma un conjunto de variables correlacionadas en un
conjunto menor de variables no correlacionadas lla- Adicionalmente,
madas componentes principales. Esta técnica tiene
dos objetivos: (1) Reducción de dimensión y (2) Fa- 4. En PCA los componentes son ortogonales. En FA
cilitar la interpretación de los datos ( Johnson & Wi- existen varias metodologías para estimar los factores,
chern, 2002). En el análisis de componentes principa- si se cumplen los supuestos del método, se puede es-
les se busca maximizar la varianza de una combina- timar el modelo ortogonal usando el método de máxi-
ción lineal de variables, con la menor pérdida de in- ma verosimilitud.
formación posible.
5. En FA los ejes se pueden rotar usando rotación va-
Suponga que X es un vector aleatorio de px1 con ma- rimax para capturar más varianza. En PCA se pueden
triz de varianzas covarianzas Σpxp, entonces: rotar pero esto no garantiza que se esté capturando
más varianza.
Yi=aiTX (1)
6. Los factores son invariantes ante transformaciones
Donde Yi es la i-ésima componente principal de X lineales de las variables. PCA es muy sensible a estas
y ai es el i-ésimo vector propio de Σ. transformaciones, incluso si se estandarizan las varia-
bles, los componentes son diferentes.
Análisis factorial (FA)
Agrupamiento y clasificación
El FA tiene por objeto explicar un conjunto de varia-
bles observadas por un pequeño número de variables Los métodos de agrupamiento tienen por objeto
latentes o no observadas llamadas factores (Peña, agrupar unidades experimentales en grupos homogé-
2002). En el análisis factorial se representan las varia- neos en función de las similaridades entre ellas, estos
bles X1, X2, ..., Xp como combinaciones lineales de un métodos se conocen como métodos de aprendizaje
pequeño conjunto de variables aleatorias f1, f2, ..., fm no supervisado porque son las unidades experimen-
(con m<<p), llamadas factores, donde los factores son tales las que deciden la manera en la que conforman
constructos latentes que generan las X’2. El modelo los grupos homogéneos. Los métodos de clasificación
factorial sería: se denominan de aprendizaje supervisado porque los
grupos están conformados a priori, y el método con-
(X-μ) = LF + ε (2) firma qué tan buenos son los agrupamientos, qué va-
riables son las que los determinan y en qué grupo se
Donde μ es el vector de medias de X, L , es la matriz
ubicaría una nueva unidad experimental.
que contiene las cargas o pesos del j-ésimo factor fj
en la i-ésima variable X1, F es la matriz que contiene Métodos de agrupamiento: análisis de clúster
los factores y ε es el vector de errores que da cuenta
de la parte de la variable que es única (no común con El agrupamiento se realiza aplicando el análisis de
otras variables). clúster, cuyo objetivo es encontrar un agrupamiento
óptimo en el cual las observaciones u objetos dentro
Las diferencias entre PCA y FA son señaladas por Ren- de cada clúster (grupo) son similares, pero los clús-
cher (2003) y Peña (2002) así: teres son diferentes unos de otros (Rencher, 2003).
Existen dos enfoques para el análisis de clúster: el je-
1. Los componentes principales están definidos como
rárquico y el no jerárquico (Johnson, 1998), y básica-
combinaciones lineales de las variables originales. En
mente dependen del objetivo del investigador. El más
FA, las variables originales son expresadas como com-
usual es el jerárquico, observándose el agrupamiento
binaciones lineales de los factores.
en un gráfico llamado dendograma.
2. En PCA se explica una gran parte de la varianza total
de las variables. En FA se busca dar cuenta de las cova-
rianzas o correlaciones entre las variables.
ecuaciones estructurales es a través de la gráfica de- puestos de normalidad e independencia de las varia-
nominada diagrama de secuencias, debido a que en bles ( Johnson & Wichern, 2002; Rencher, 2003); los
esta las relaciones de interdependencia se represen- supuestos de la regresión múltiple multivariada son
tan a través de flechas directas que señalan el impac- los mismos de la regresión múltiple, (Gujarati, 1988);
to o causalidad de la variable exógena sobre la varia- tanto en los modelos jerárquicos (Montgomery, 2008)
ble endógena y, las flechas curvadas señalan la corre- como en SEM (Hair, 2010) existen supuestos.
lación entre las variables. Las ecuaciones del modelo
de ecuaciones estructurales son:
APLICACIONES EN CALIDAD DE AGUAS
η=βη+Γξ+ς (4)
Los métodos estadísticos multivariados han sido am-
Donde: pliamente usados desde la década de 1980 debido al
desarrollo de paquetes estadísticos que facilitan el
η es el vector de variables aleatorias latentes endó- modelamiento matemático. En calidad de aguas se
genas, ξ el vector de variables aleatorias latentes exó- encuentran aplicaciones con todos los métodos men-
genas, β la matriz de coeficientes entre latentes de- cionados previamente.
pendientes, Γ la matriz de coeficientes entre variables
latentes dependientes e independientes y ς vector de La construcción de índices de calidad de aguas es una
perturbaciones. de las principales aplicaciones de los métodos de reduc-
ción de dimensión, por ejemplo Coletti et al. ( 2010),
x=Λx ξ+δx (5) construyeron un índice de calidad del agua aplicando el
análisis factorial para determinar la influencia de las ac-
y=Λyη+εx (6) tividades agrícolas en la calidad del recurso hídrico del
río Das Pedras ubicado en las regiones de Mogi Guaçu
Donde:
y Estiva Gerbi en Brasil; para ello se analizaron los si-
x es el vector de p variables observadas, Λx la matriz guientes parámetros de calidad de aguas: conductivi-
de coeficientes que muestran las relaciones entre las dad eléctrica, pH, nitrógeno amoniacal, amonio, nitra-
variables latentes y observadas exógenas, ξ la latente tos, fósforo total, sólidos suspendidos, turbiedad y oxí-
exógena y δ el vector de errores asociados a las varia- geno disuelto, durante trece meses, demostrándose, a
bles exógenas. partir de dicho índice, que la calidad del agua en el río
Das Pedras se ha deteriorado progresivamente debido
y el vector de q variables observadas, Λy la matriz de a las actividades agrícolas.
coeficientes que muestran las relaciones entre las va-
riables latentes y observadas endógenas, η la latente Los modelos SEM se han usado para proponer
endógena y el vector de errores asociados a variables valores estándar de los parámetros que inciden en
endógenas. la eutrofización con el fin de apoyar los procesos
de legislación y establecer límites en una ecoregión
La ecuación (4) se conoce como el modelo estructural de China (Ji et al., 2013)there has been no nutrient
y las ecuaciones (5) y (6) como los modelos de medida. standard established for LE control in many
developing countries such as China. This study
Validación de supuestos proposes a structural equation model to assist in the
establishment of a lake nutrient standard for drinking
En estadística, los supuestos son condiciones que se water sources in Yunnan-Guizhou Plateau Ecoregion
deben cumplir para que los modelos puedan usarse (Yungui Ecoregion; la metodología partió con una
de manera confiable y no llegar a conclusiones erra- consulta a expertos que arrojó una serie de modelos
das en la interpretación de los mismos. En PCA no estructurales evaluando datos históricos por más de
existen los supuestos porque es un método matemá- diez (10) años, determinándose que el fósforo total
tico pero no estadístico, en cambio en el FA sí existen y la clorofila a fueron las variables determinantes en
supuestos y se deben hacer validaciones ( Johnson la eutrofización, inclusive fijaron valores límites para
& Wichern, 2002); en el análisis de clúster, indepen- estas. De igual manera, Grace et al. (2010), but also
diente del método elegido, se deben cumplir los su- because of its promise as a means of representing
theoretical concepts using latent variables. In this datos altamente complejas, mientras que recomien-
paper, we discuss characteristics of ecological theory dan el uso de PCA y FA para identificar relaciones en-
and some of the challenges for proper specification tre las variables, identificar variables representativas
of theoretical ideas in structural equation models (SE de un conjunto grande de ellas y crear un conjunto
models desarrollaron dos modelos SEM; en el primero menor de variables que reemplace las originales en
pretendieron estudiar la relación entre la recuperación análisis posteriores. También recomiendan usar ma-
de la vegetación después de una conflagración con la pas autoorganizados (Self-organising maps-SOM) que
edad de las plantas y la severidad del incendio, en el son una forma de redes neuronales (no son métodos
segundo tenían como objetivo predecir el conteo de estadísticos), para extraer patrones en grandes con-
especies en un río con base en cuatro variables latentes juntos de datos, y los semivariogramas para obtener
(estrés abiótico, disturbancia, biomasa y diversidad una medida de la variabilidad entre mediciones, con-
de plantas); adicionalmente, los investigadores forme su separación espacial se incrementa. Shrestha
presentaron propuestas de desarrollos teóricos en los & Kazama (2007), aplicaron estos métodos en la cuen-
SEM. Grace (2008) hace una brevísima descripción de ca del río Fuji en Japón para extraer información acer-
los SEM, análisis de dos casos de estudio, descripción ca de las similaridades o disimilaridades entre sitios
de la notación LISREL (Linear Structural Relations) y de muestreo usando CA, identificación de las varia-
un breve recuento histórico del desarrollo de los SEM. bles responsables de las variaciones espaciales y tem-
porales en la calidad del agua del río usando DA, de-
Aplicación de los métodos estadísticos terminación de los factores subyacentes que explican
la estructura de la base de datos usando PCA y FA, y la
De otro lado, se ha realizado la combinación de va-
influencia de posibles fuentes antropogénicas en los
rias técnicas estadísticas con el fin de enriquecer la in-
parámetros de calidad del agua. Se midieron 12 pará-
terpretación de los fenómenos estudiados y comple-
metros de calidad del agua en 13 sitios de muestreo
mentar los aportes de las técnicas individuales.
a lo largo del río durante las 4 estaciones del año. Los
Métodos de reducción de dimensión, agrupamiento y resultados a los que llegaron son: los principales pa-
clasificación rámetros responsables de la calidad del agua son los
relacionados con las descargas al río, la temperatura
El análisis de componentes principales se usó, acom- ambiente y la contaminación orgánica; la cuenca del
pañado del análisis de correlación canónica, CCA río se clasifica, según su grado de contaminación, en
(Noori et al., 2010), para estudiar el río Karoon en tres áreas, alta, media y baja, cuyo grado de conta-
Irán. Se monitorearon 12 parámetros entre los que minación es debido principalmente a las fuentes an-
estaban la turbiedad, los sólidos suspendidos tota- tropogénicas como las aguas residuales domésticas,
les, la demanda química de oxígeno, los sulfatos y los los fertilizantes y las industrias. También Varol et al.
nitratos. El objetivo fue identificar las estaciones de (2012) aplicaron estas metodologías estadísticas en la
muestreo más significativas para el monitoreo de la cuenca del río Tigris en Turquía.
calidad del agua y los parámetros de calidad más im-
portantes, mediante el PCA, y relacionar los paráme- Modelos SEM y otros métodos estadísticos
tros físicos versus los químicos en dicho río, mediante
Los modelos SEM se usan combinados con técnicas
el CCA. Aplicando el análisis de componentes princi-
como PCA, FA, regresión múltiple, los modelos je-
pales se descartaron 4 de las 17 estaciones de mues-
rárquicos y el análisis de series de tiempo. Zou & Yu
treo y se determinó una correlación de 0.993 entre los
(1994), desarrollaron un modelo SEM para modelar la
parámetros físicos y químicos.
calidad del agua en el río Arkansas en Estados Unidos,
Bierman et al. (2011), realizaron una revisión biblio- monitoreando 14 parámetros mensualmente durante
gráfica del uso combinado de PCA, FA, CA y DA para 14 años en una estación de muestreo; el modelo de-
el monitoreo de la calidad del agua en zonas coste- sarrollado se combinó con el análisis factorial para de-
ras. Los autores recomiendan el uso de los métodos terminar el número de constructos a usar (se eligieron
de agrupamiento y clasificación (CA y DA) tanto en el cinco). Obtuvieron cinco modelos que se compararon
análisis exploratorio, confirmatorio como predictivo, tanto desde el punto de vista teórico como técnico
porque resumen e identifican patrones en bases de con el fin de elegir aquel que cumpliera los supues-
tos y que mejor describiera las interacciones entre los decir de manera simultánea los sólidos disueltos tota-
diferentes parámetros. Zou & Yu (1994), muestran la les y el cloro, con base en el magnesio, calcio, sodio,
validez de los supuestos. HCO3- y el SO42-, con el fin de proveer una explicación
adecuada de las interacciones simultáneas de las va-
De igual manera, Wu et al. (2014which was first con- riables en el modelo conceptual.
ducted to determine four types of factors, respecti-
vely, those for organic pollution, eutrophication, sea- Otra aplicación en aguas subterráneas, la realizaron
sonal influence, and sediment pollution. The analysis Liu et al. (1997), quienes usaron los modelos SEM y
results effectively help to determine water quality in las series de tiempo para investigar la influencia del
the watershed of the reservoir. The authors reutilize clima, la hidrología y la dosificación de nitrógeno en
analysis of moment structures (AMOS) combinaron la producción agrícola, sobre el área de Big Spring en
los SEM y el análisis factorial, para construir un con- Iowa, Estados Unidos. Los investigadores eligieron
junto estándar de métodos que pudieran usar las au- como variables endógenas la concentración de nitró-
toridades que manejan los embalses, para mejorar la geno y las descargas; como variables exógenas la pre-
calidad de aguas, tanto en las cuencas como en los cipitación, la temperatura del aire, la evapotranspira-
embalses. Wu et al. (2014) usaron 6 estaciones de ción potencial y el balance de nitrógeno, que se midie-
monitoreo a lo largo de la reserva Fetsui en Taiwán, ron mensualmente entre 1982 y 1991. En el modela-
en las que se midieron 9 parámetros de calidad de miento se incluyó un rezago de un período de tiempo
agua: pH, temperatura, oxígeno disuelto, demanda para las variables endógenas, incorporando las series
bioquímica de oxígeno, sólidos suspendidos, surfac- de tiempo en el modelo SEM. Se ajustó un modelo
tantes aniónicos, nitrógeno amoniacal, fósforo total, para cada una de las cuatro estaciones del año: vera-
y clorofila_a durante dos años y medio. Comprobaron no, invierno, primavera y otoño, comprobando que la
que las 9 variables son generadas por 4 constructos: influencia del clima, la producción agrícola y la ten-
contaminación orgánica, eutrofización, estacionali- dencia creciente en el tiempo de la concentración de
dad y contaminación por sedimentos. Se evaluaron nitrógeno en el suelo, son los factores que más afec-
tres modelos estructurales a partir de estas variables, tan la dinámica de la contaminación por nitrógeno en
pero uno de ellos (modelo 3) fue el más adecuado el agua subterránea del área bajo estudio.
para el propósito inicial. Esta aplicación presenta el
inconveniente de que no valida los supuestos. Pätynen et al. (2013), muestran la aplicación de los
modelos SEM y los modelos jerárquicos en el estudio
La calidad de las aguas subterráneas también se ha de la ecología acuática, indicando que estos modelos
estudiado usando los SEM combinados con los mo- son una importante alternativa para evaluar la inte-
delos de regresión, el análisis de componentes prin- racción entre diferentes variables, conocer la inciden-
cipales y el análisis de clúster. Un ejemplo de ello es cia de factores subyacentes que pueden explicar di-
el trabajo de Chenini & Khemiri (2009) quienes estu- versas situaciones en el modelamiento ecológico, mo-
diaron un área de 1250 km2 localizados en la región delar espacialmente y desarrollar la creatividad (prin-
de Atlas en Túnez, en la cual se monitoreó un siste- cipalmente en el uso de los SEM). Señalan desventajas
ma de tres acuíferos tomando 28 muestras de agua, de estos modelos, como la gran cantidad de datos que
midiendo 10 parámetros entre octubre y noviembre requieren, que no siempre se pueden obtener desde
de 2005. Iniciaron con un PCA para determinar las re- el punto de vista técnico, y la alta capacidad de las he-
laciones entre las propiedades del agua analizadas e rramientas computacionales para el modelamiento.
identificar los factores que afectan la concentración
de cada uno, encontrándose tres componentes princi- Comparación de métodos
pales que acumulan el 70 % de la varianza total; segui-
Los métodos expuestos, más que ser rivales y que
damente realizaron CA en las variables para conocer
el investigador tenga que decidir cuál usar, son
las semejanzas entre ellas; luego se encuentra un mo-
complementarios. Los métodos de reducción de
delo usando la regresión lineal para predecir los sóli-
dimensión FA y PCA se pueden usar si se incumple
dos disueltos totales a partir de los valores de magne-
el supuesto de independencia de las variables, sin
sio, calcio, sodio, cloro, HCO3- y el SO42-; y, finalmente,
embargo, se debe elegir uno de ellos, se recomienda
construyeron un modelo estructural, SEM, para pre-
el uso de FA cuando las variables sean normales
(se pueden usar tranformaciones de potencia para ponden a fines confirmatorios más que exploratorios.
normalizar) y se apliquen otros métodos estadísticos Además, tienen fuertes supuestos de normalidad, co-
posteriormente. integración y demás, propios de los modelos estadís-
ticos complejos.
En análisis de clúster se puede realizar de dos formas,
jerárquica y no jerárquica. El CA jerárquico se reco- El investigador puede usar las técnicas exploratorias y
mienda para tamaños de muestra pequeños dado que de modelación estadística de manera simultánea en el
el objetivo es conocer las similaridades entre las va- análisis de un mismo fenómeno, esto le permitirá tener
riables o individuos, el clúster no jerárquico es el ade- una visión más completa del comportamiento univaria-
cuado para grandes tamaños de muestra, en este caso do, multivariado y de las relaciones entre las variables.
observar la separación de los grupos es lo primordial.
Generalmente las aplicaciones de CA van seguidas de
DA, con el fin de conocer las variables responsables CONCLUSIONES
de la separación entre los grupos (o clústeres); y tam- Los métodos estadísticos multivariados son herra-
bién, aunque menos común, clasificar unidades (esta- mientas muy valiosas en los estudios de la calidad
ciones de muestreo por ejemplo) que no habían sido del agua. Permiten reducir la dimensionalidad de los
tenidas en cuenta en la observación inicial, en los gru- datos, determinar factores subyacentes que generen
pos ya existentes. El CA y DA tienen los supuestos de las variables involucradas en los estudios, conocer las
normalidad e independencia de las variables, lo que variaciones espaciales y temporales de las dinámicas
provoca que la confiabilidad en los resultados se vea presentes en los cuerpos de agua, obtener modelos
limitada, incluso restringida, cuando no se cumplen. que permiten evaluar las relaciones entre las varia-
bles de manera simultánea y, principalmente, apoyar
Los métodos de FA, PCA, CA y DA, son para fines ex-
la toma de decisiones mediante el diagnóstico y pre-
ploratorios. Mientras que el modelamiento usando
dicción de los fenómenos estudiados. Estos métodos
modelos SEM, jerárquicos, de regresión y demás, son
pueden complementarse con otros análisis como los
para análisis más profundos que involucran descrip-
de redes neuronales y los geoestadísticos para tener
ción, control y predicción de las relaciones de asocia-
una visión más amplia de los fenómenos bajo estudio.
ción y dependencia entre las variables.
En la actualidad existe la tendencia en la aplicación de
Los modelos de regresión son una gran familia que
los modelos de ecuaciones estructurales en la calidad
agrupa todo el modelamiento estadístico basado en
de aguas, esto se debe a su gran potencia al evaluar
el ANOVA. Sin lugar a dudas son los modelos estadís-
las relaciones de entrada, los procesos y las salidas a
ticos más usados en todas las áreas del conocimien-
través de variables exógenas y endógenas, en los que
to, comprenden la regresión simple, múltiple, múlti-
las variables endógenas pueden convertirse en varia-
ple multivariada, los modelos lineales generalizados
bles exógenas en otros momentos, e incorpora con-
(MLG), las series de tiempo, y demás; su gran ventaja
ceptos no observados, llamados constructos, lo que
es que entregan una o varias ecuaciones que sirven,
permite un mayor y mejor acercamiento al comporta-
entre otros, para obtener pronósticos confiables. Tie-
miento de las dinámicas en los cuerpos de agua.
nen los supuestos de normalidad, independencia de
las variables exógenas, varianza constante (homoce- En varias de las aplicaciones se encontró que no se va-
dasticidad) y no autocorrelación de los residuales; el lidan los supuestos, lo cual puede ocasionar una falta
no cumplimiento de estos supuestos presenta diag- grave a la confiabilidad de los modelos. Se recomien-
nósticos y pronósticos poco confiables. da que siempre que se use un método estadístico se
validen los supuestos del modelo, en caso de violarse
Los SEM son una combinación del análisis factorial
alguno o varios de ellos, se deben hacer los procedi-
confirmatorio y los modelos de regresión, por ello tie-
mientos a que haya lugar para corregirlos.
nen la gran ventaja de que permiten modelar simul-
táneamente múltiples relaciones de causalidad y de- Es de resaltar que estos métodos requieren de un alto
pendencia; sin embargo, requieren un conocimiento poder computacional y de altos volúmenes de datos,
a priori del fenómeno estudiado y las posibles rela- lo que en muchas ocasiones no es viable económica y
ciones entre las variables, debido a que los SEM res- técnicamente.