You are on page 1of 6

Ensayo sobre el Método de Muestreo Hipercubo Latino

2

El  Método  de  Muestreo  Hipercubo  Latino  
Introducción  
El método muestreo hipercubo latino (LHS por las siglas en ingles de “Latin Hypercube
Sampling”) es un método estadístico para generar una muestra de colecciones plausibles de valores
de los parámetros de una distribución multidimensional. El método de muestreo se utiliza a
menudo para la construcción de experimentos por computadora.
El LHS fue descrito por McKay en 1979 ([MC79], [McK92]). Ronald L. Iman y colaboradores
contribuyeron a su elaboración en 1981 ([IH88], [Hel08]). La implementación detallada y
manuales se publicaron más tarde ([WJ98]).

Muestreo  Aleatorio  Simple  
El muestreo aleatorio simple implica formar repetidamente vectores aleatorios de los parámetros
de distribuciones de probabilidad prescritos. Una variable aleatoria ? distribuida normalmente con
media ? y desviación estándar ? puede ser generada por
? ∗ = ??' + ?
donde ?' son números aleatorios con distribución normal con media 0 y varianza 1.
Una distribución normal multivariada con matriz de varianza-covarianza ? puede ser muestreada
utilizando el método de descomposición de la matriz triangular inferior y superior (LU) - [Dav87].
La matriz de varianza-covarianza ? se descompone por la factorización de Cholesky:
? = ?  ?,
donde ? es la matriz triangular inferior. Para generar el vector de variables aleatorias ?, la matriz
? es multiplicada por el vector ?? de números aleatorios normales e independientes con media 0 y
varianza 1
? = ?  ?? + ?
El procedimiento se repite para un tamaño de la muestra ?? lo que resulta en un conjunto de
variables con un vector de medias ? y una matriz de varianza-covarianza ?  ??? ??  ?, . Ya que
los números aleatorios son independientes, la matriz de covarianza ??? ?? debe ser igual a ? (la
matriz identidad)
?  ??? ??  ?, = ?  ?  ?, = ?    ?, = ?

 

•   Transformar los valores de probabilidad de la muestra en el valor de ? usando la inversa de la función de distribución ? C8 ? = ? C8 ???? los ? valores obtenidos para cada variable ? se emparejan al azar con los ?? valores de las otras variables. la probabilidad acumulativa muestreada se puede expresar como ([WJ98]) ????@ = 8 A ?B + @C8 A donde ?B es un número aleatorio con distribución uniforme entre 0 y 1. .Ensayo sobre el Método de Muestreo Hipercubo Latino 3 Muestreo  Hipercubo  Latino   El muestreo hipercubo latino. ?< . El método se basa en la suposición de que las variables son independientes entre sí. es un procedimiento estratificado aleatorio que proporciona una forma eficiente de generación de variables de sus distribuciones ([MC79]). La distribución acumulada para cada variable se divide en ? equiprobables intervalos. A diferencia del muestreo aleatorio simple. ?: . El método LHS puede resumirse de la siguiente manera: •   Dividir la distribución acumulada de cada variable en ? intervalos equiprobables. •   En cada intervalo seleccionar un valor al azar. pero en realidad la mayor parte de las variables de entrada se correlacionan en alguna medida. al estratificar al máximo cada distribución marginal. El emparejamiento aleatorio de variables correlacionadas podría resultar en combinaciones imposibles. Se selecciona al azar un valor de cada intervalo (ver Figura 1). para el i-ésimo intervalo. … . este método asegura una cobertura completa del rango de cada variable. LHS implica generar ?? valores de muestreo de la distribución prescrita de cada una de las ? variables ?8 . Los ? valores obtenidos para cada variable son juntados (apareados o emparejados) al azar con las otras variables.

4 Probabilidad de x2 CDF Ensayo sobre el Método de Muestreo Hipercubo Latino CDF x1 Probabilidad de x1 x2 Figura 1. Ejemplo del método LHS: muestreo aleatorio estratificado de variables ?1 y ?2 a intervalos de 5 (izquierda) y apareamiento aleatorio de ?1 y ?2 formando un hipercubo latino (derecha)   .

La matriz ? puede ser definida como ? = ?  ?J donde ? es la matriz triangular inferior. •   Calcular la matriz triangular inferior de la matriz de correlación ? usando la factorización de Cholesky ? = ?  ?J y también ?. la matriz triangular inferior de ?. •   Obtener la muestra del hipercubo latino ?@. ?. … . Al igual que en el muestreo aleatorio simple. ? por medio de ?@. •   Reorganizar los valores de cada variable en ? ya que tienen el mismo rango (orden) que la matriz objetivo ?∗ . Supongamos que la matriz ? se compone de variables aleatorias independientes con matriz de correlación ? y ? es la matriz de correlación deseada.Ensayo sobre el Método de Muestreo Hipercubo Latino 5 Inducción  de  Correlación  en  el  Muestreo  Hipercubo  Latino   [IC82] propone un método para inducir la correlación entre las variables restringiendo la forma en que las variables son apareadas basado en la correlación de rangos de algunos valores objetivo. •   Obtener la matriz ? tal que ? = ?  ?  ?J que se calcula a partir de ? = ?  ?C? . •   Calcular ?. •   Definir la matriz ? de ? columnas y ? filas que contienen el orden o rango correspondiente a la matriz de correlación objetivo. … . los valores de la muestra producen aproximadamente una distribución conjunta. •   Obtener la matriz ? de ? variables y tamaño de la muestra ? mediante un muestreo aleatorio simple.P − ?B ? Con esta transformación. la multiplicación del vector ?  ?J produce variables aleatorias con matriz de correlación ?. la matriz de correlación de ?. que tiene una matriz de correlación igual a ?.     . El método se resume de la siguiente manera: •   Generar la matriz ? utilizando el método de muestreo hipercubo latino de ? variables y ?? tamaño de la muestra. El método se basa en la descomposición de Cholesky de la matriz de correlación. En [PH99] y [ZP03] se puede obtener información más detallada. Por lo tanto el objetivo es reorganizar las variables de entrada cerca de la matriz de correlación deseada.P ? = 1.P = ?PC8 ?@. [Ste87] también propone un método para el muestreo de variables dependientes en base al rango de una distribución multivariada objetivo. ? = 1. •   Calcular la matriz de correlación objetivo ?∗ = ?  ?J . ? = ?  ?J .

haciendo una simulación más práctica con las herramientas computacionales disponibles en ese momento. una técnica atractiva porque permitía que fuese posible obtener una salida estable con un número mucho menor de muestras de una simulación Monte Carlo. pero debido a que no utilizan el método de inversión no se pueden implementar con LHS. LHS sólo funciona si se generan las muestras de distribuciones de probabilidad utilizando el método de inversión descrito anteriormente. lo que puede provocar largos tiempo de espera antes de que inicie la simulación de modelos grandes. Sin embargo. LHS se basa en el modelo se ejecute para todo el número de muestras especificado originalmente. 4.Ensayo sobre el Método de Muestreo Hipercubo Latino 6 Crítica  al  método  LHS   El método se remonta a 1979. el muestreo estratificado tiene que hacerse para cada distribución antes de iniciar la simulación. Con LHS. etc. técnicas aprendidas en la escuela mucho tiempo atrás. Una corrida de simulación a menudo se detiene antes de que el número predeterminado de muestras esté completa. en ese momento.   Ampliar el número de muestras.   Correlación. No es posible utilizar copulas como mecanismo para representar correlaciones objetivo con LHS. 2. Era. El uso de LHS en la época actual probablemente se deba a factores anacrónicos. . Esto es posible tanto con el método Monte Carlo y LHS. ya sea porque los resultados se ven bien.   Detener la ejecución de la simulación antes de su finalización. o el nivel de precisión requerido se ha alcanzado. 3. técnicas legadas. no hay tales pruebas estadísticas disponibles si se utiliza LHS. A menudo sucede que se quiere ampliar el número de muestras.   Precisión de resultados. el número de distribuciones en un modelo era extremadamente modesto y las simulaciones tardaban horas o días en completarse. Existen pruebas estadísticas para determinar el nivel de precisión que se ha logrado mediante la ejecución de una simulación de Monte Carlo basado en la proximidad de los resultados reales con el teórico.   5. LHS proporcionaría beneficios marginales en la simulación si no trajera consigo una serie de restricciones.000 veces más rápidas que a principios de 1980. La siguiente lista describe algunas de esas restricciones: 1.   Velocidad. las computadoras ahora son al menos 1. y proporcionará poca o ninguna precisión adicional si esto no se produce. y el valor de LHS ha desaparecido como consecuencia de ello. reduciendo cualquier beneficio que podría ofrecer LHS. Sin embargo. el extender una simulación requiere que LHS realice un nuevo conjunto de estratificaciones que se se superponen con las anteriores. cuestión de tiempo o paciencia. cuando la capacidad de cómputo era escasa. Existen muchos algoritmos para generar muestras aleatorias de distribuciones que son tan precisos como el método de inversión o incluso mejores y que pueden ser ordenes de magnitud más rápidos que el método de inversión.

41(4). Technometrics. J. Latin hypercube sampling of Gaussian random fields. aspectos importantes en el análisis de riesgos. [IC82] Iman. Esta es una situación técnica muy específica que aplica sobre todo en el trabajo científico y de ingeniería donde LHS es una mejor opción que Monte Carlo. Beckman. E.   2. 311-334. Large sample properties of simulations using Latin hypercube sampling. (2008). (1979). (1999). ACM. G.. 557-564). Mathematical Geology. February 13.   Muestreo para una integración numérica ([Ste87]). Technometrics. Referencias   Latin hypercube sampling. 39(8). 19(2).wikipedia. . & Conover. NM. J.php?title=Latin_hypercube_sampling&oldid=694518257 [Dav87] Davis. A distribution-free approach to inducing rank correlation among input variables. Y. An investigation of uncertainty and sensitivity analysis techniques for computer models. 71-90. J. & Jorgensen. (1987). [IH88] Iman.Ensayo sobre el Método de Muestreo Hipercubo Latino 7 LHS es útil en los siguientes casos: 1.. 8(1). Water Resources Research. [McK92] McKay. 239-245.. (2003). L. K. Uncertainty and sensitivity analysis for models of complex systems. la media se estabilizará más rápidamente con LHS. 29(2). (1998).. J. [PH99] Pebesma. & Heuvelink. Production of conditional simulations via the LU triangular decomposition of the covariance matrix. 143-151. In Wikipedia. Albuquerque. B.. J. C. D. J. para la mayoría de los modelos. Sandia National Laboratories. December 9). 21(2). (1992). & Helton.   Modelos con una o dos distribuciones y necesidad de una respuesta rápida. aunque la propagación y la forma de la distribución de salida no se estabilizarán mucho más rápidamente que con Monte Carlo. C. W. M. 91-98. Communications in Statistics-Simulation and Computation. [ZP03] Zhang. (1988). 303-312. M. (1982). 2016. [WJ98] Wyss. & Conover. 11(3). Comparison of Three Methods for Selecting Values of Input Variables in the Analysis of Output from a Computer Code. Springer. In Computational Methods in Transport: Verification and Validation (pp. L. [Hel08] Helton. [Ste87] Stein. R. M. (2015. D. 207-228). M. W. H. (1987). In Proceedings of the 24th conference on Winter simulation (pp. A user’s guide to LHS: Sandia’s Latin hypercube sampling software. SAND98-0210. Retrieved 01:07. G. R. [MC79] McKay. Latin hypercube lattice sample selection strategy for correlated random hydraulic conductivity fields. W.. Latin hypercube sampling as a tool in uncertainty analysis of computer models. En esta situación. Technometrics. from https://en. D. The Free Encyclopedia.org/w/index. & Pinder. Risk analysis.. R. G.