You are on page 1of 18

1 Trabajo de Investigación Formativa

2 Métodos eficientes de Runge-Kutta de dos pasos para simula-


3 ciones de dinámica de fluidos
4 Ramón Cevallos-Holguín1, Marjorie González-Chavarrea2, Jonathan López-Zapata3 , Karla Moncayo-Silva 4 y Gus-
5 tavo Romero-Caiza 5

6
7 1 Escuela Superior Politécnica de Chimborazo

8 Resumen: Runge- Kutta aplica procedimientos explícitos en dos pasos el cual da una alternativa
9 eficiente en los esquemas explícitos de bajo almacenamiento (LSRK) este resuelve ecuaciones de
10 Navier-Stokes. Provienen métodos especiales RSRK donde estos reducen requisitos en comparación
11 con esquemas precedentes de TSRK. Aplican y prueban esquemas de cuarto, quinto y sexto orden.
12 Nuevos esquemas valúan con dos casos, un cilindro 2D y un vórtice Taylor-Green 3D.

13 Estos cotejan estrategias clásicas de discretización del tiempo. Explicando tres configuraciones de
14 Hadware indican que los métodos de TSRK de cuarto orden son 25% rápidos que los esquemas de
15 LSRK.

16 En los métodos de sexto y quinto orden de TSRK experimentan en las pruebas de 3D que comparan
17 con los resultados de algoritmos de LSRK, aquellos resultados enseñan esquemas de quinto y sexto
18 orden de TSRK que son rivalizantes en comparación con métodos LSRK, puesto que en los métodos
19 de segundo orden LSRK son de sistemas diferenciales no lineales.

20 Keywords: Simulación, Métodos de Runge-Kutta de dos pasos, Orden de etapas y condiciones de


21 orden, Verificación de Código.

22 1. Introducción

23 Jackiewicz y Tracogna propusieron una formulación general de métodos Runge-Kutta


24 (TSRK) de dos pasos. Hicieron uso de fórmulas para pares de dos pasos de métodos
25 TSRK construidos, obteniendo resultados para pares de orden 8 que no muestran este
26 orden designado, la implementación de los métodos TSRK ilustra que los métodos de
27 inicio cuidadosamente diseñados son esenciales para códigos de producción eficientes
28 basados en métodos de bajo orden de etapa. Al estimar pares de fórmulas TSRK de ór-
29 denes 7 y 8 surge un error, pudiendo resolverse por orden 6, debido a que los métodos
30 que se implementan usan pasos de variables, la causa de esta reducción del orden lo ex-
31 plicó Philip Sharp quien sugirió dos pruebas usando implementaciones de orden fijo que
32 podrían ayudar a resolver el problema y por lo tanto se aplican nuevos métodos de or-
33 den 6 a los problemas (1).

34 En cuanto a lo que menciona (2), la familia de pares explícitos Runge-Kutta-Nyström de


35 órdenes siete y cinco, su principal ventaja es que pasa solo seis etapas por paso. Esta es
36 una mejora notable ya que hasta ahora solo se ha logrado pares de órdenes 6 como se
37 menciona en el párrafo anterior. Cabe recalcar que se presenta también un par particular
38 con coeficientes de error de truncamiento mínimos y los resultados numéricos muestran
39 superioridad sobre un conjunto de problemas relevantes.

40 Por otra parte, los códigos para la solución numérica de problemas de valores en la fron-
41 tera de dos puntos pueden manejar problemas generales de una manera bastante rutina-
42 ria y confiable. Cuando se enfrentan a ecuaciones particularmente desafiantes, como
2 of 18

43 problemas de perturbaciones singulares, los códigos más eficientes utilizan una cuadrí-
44 cula altamente no uniforme para resolver las partes no uniformes de la trayectoria de la
45 solución. Sin embargo, si el problema está mal condicionado, los algoritmos de refina-
46 miento de cuadrícula pueden ser ineficientes porque se pueden requerir muchas itera-
47 ciones para alcanzar una malla adecuada sobre la cual calcular la solución, esto de al-
48 guna manera afecta en los resultados que se quieren llegar a obtener de un proceso quí-
49 mico (3)

50 Hoy en día es común la práctica de la ciencia computacional que se implementa para


51 investigar simulaciones a gran escala en un entorno de resolución de problemas (PSE)
52 como MATLAB o MAPLE. Además, las tareas de visualización y verificación requieren a
53 menudo tanto esfuerzo computacional como el que implica generar la solución aproxi-
54 mada. El uso del "índice de efectividad" en MATLAB, es ampliamente utilizado por los
55 investigadores en la comunidad PDE de malla adaptativa, para cuantificar la credibili-
56 dad de las herramientas de verificación, mediante ejemplos numéricos para ilustrar la
57 efectividad de las herramientas cuando se aplican a un método numérico estándar en
58 dos problemas de prueba modelo (4).

59 Hay que mencionar, además que según (5)la mayoría de las simulaciones requieren aco-
60 plar las ecuaciones de continuidad para la resolución de problemas aplicados en estas
61 herramientas, inevitablemente requiere resolver la ecuación de Poisson mediante un
62 procedimiento numérico iterativo, que representa la mayor parte de la carga compu-
63 tacional de un marco tan convencional, en tal caso de querer evitar resolver la ecuación
64 de Poisson se proponen varios procedimientos técnicos con un nuevo algoritmo cono-
65 cido como método de compresibilidad artificial (ACM), en el que se considera cierto
66 grado de compresibilidad artificial a pesar de tratarse de un fluido incompresible por
67 ejemplo y esto permite que el método resuelva la evolución temporal de un proceso de
68 iteración.
69 Los métodos lineales generales se han aplicado como generalizaciones naturales de
70 los métodos clásicos de Runge-Kutta y lineales de varios pasos. Hoy en día existen códi-
71 gos altamente eficientes que son basados en métodos Runge-Kutta y métodos lineales de
72 varios pasos (6).
73 (7), explicaron que los métodos de Runge-Kutta basados en la presión requieren la
74 solución de una de una ecuación Poisson que se usa posteriormente para imponer la
75 conservación de la materia. En la mayoría de ocasiones la ecuación de Poisson es una
76 propuesta de alto costo, sobre todo en la informática de alto rendimiento. Cuando es
77 combinado un esquema Runge-Kutta para lograr una alta presión, estos métodos que
78 están basados en la presión requieren una resolución de Poisson en cada etapa interme-
79 dia de RK, por este motivo estos métodos generan costos elevados.
80 (8) desarrollaron nuevas técnicas para lograr la resolución de grandes sistemas li-
81 neales acoplados que surgen de los métodos de Runge-Kutta totalmente implícitos. Al
82 transformar el sistema lineal de ecuaciones resultantes, puede ser obtenido un sistema
83 que representa un menor costo desde punto de vista computacional.
84 (9), propusieron la utilización de métodos implícitos-explícitos de Runge Kutta que
85 disminuyen la variación total para la integración temporal de las ecuaciones de movi-
86 miento asociadas con el problema de la semiconvección en la simulación de la convec-
87 ción estelar.
88 (10), investigaron sobre el uso de elementos finitos RKDG para la simulación de
89 flujo compresible de dos medios con un tratamiento que es conservador de las interfases
90 de material en movimiento. Establecieron que el método Galerkin discontinuo de
91 Runge-Kutta (RKDG) para la resolución de leyes de conservación hiperbólicas es un mé-
92 todo de elementos finitos de alto orden.
93
3 of 18

94 En las últimas décadas, se han dedicado muchos esfuerzos computacionales a simu-


95 lar las ecuaciones de Navier-Stokes en el campo de la dinámica de fluidos computacio-
96 nal (CFD). Muchos de los métodos numéricos clásicos para las ecuaciones de Navier-
97 Stokes implican resolver los términos de convección y viscosos por separado en un con-
98 junto de cuadrícula computacional. Para el término de convección no lineal, el diseño de
99 flujos numéricos en las interfaces de los elementos es crucial para el éxito de los algorit-
100 mos numéricos (11).
101 Los métodos explícitos de Runge-Kutta son métodos estándar para simular problemas
102 de forma 𝑑𝑦/𝑑𝑡 = 𝑓(𝑡, 𝑦). Los métodos RK se han utilizado ampliamente en simulacio-
103 nes de fluidos incompresibles y compresibles. En el presente estudio usamos como mé-
104 todo de línea base el método clásico RK de cuarto orden (RK4) en el cual la solución
105 𝑦𝑛 progresa a 𝑦𝑛+1 de acuerdo con la conocida secuencia de actualización (12).
106 Se basa en esquemas de Runge-Kutta explícitos estabilizados extrapolados de
107 quinto orden (ESERK). Son métodos explícitos y, por lo tanto, no es necesario emplear
108 software complicado para sistemas de ecuaciones lineales o no lineales. Según (13), vale
109 añadir que tienen regiones de estabilidad extendidas a lo largo del semieje real negativo,
110 por lo que pueden considerarse para resolver problemas rígidos que surgen de proble-
111 mas muy comunes de difusión o reacción-difusión. Este tipo de problemas son habitua-
112 les en una gran cantidad de aplicaciones como fenómenos atmosféricos, biología, quí-
113 mica, problemas de combustión, matemáticas financieras, mecánica de fluidos, ingenie-
114 ría industrial, modelado láser, propagación de malware, medicina, dinámica molecular,
115 cinética nuclear, etc (14).
116 Extendiendo el proceso de discretización a cada volumen de control discreto, obte-
117 nemos un sistema de ecuación diferencial ordinaria (EDO) (15). En nuestro enfoque, este
118 sistema se maneja utilizando técnicas de Runge-Kutta de alto orden, considerando tanto
119 métodos explícitos como implícitos (16).
120 Los solucionadores iterativos en combinación con cuadrículas múltiples se han uti-
121 lizado ampliamente para resolver grandes sistemas algebraicos. Una de las más conoci-
122 das es la iteración de Runge-Kutta el cual la solución numérica de modelos adjuntos de
123 primer y segundo orden lineales tangentes con pares de Runge-Kutta continuos explíci-
124 tos tenemos al de alto orden. El marco de análisis de sensibilidad que se está conside-
125 rando comprende modelos directos continuos, lineales tangentes y adjuntos de los méto-
126 dos de Runge-Kutta, centrando así en la solución de EDO de sensibilidad con esquemas
127 de Runge-Kutta continuos y explícitos. Los adjuntos de modelos no lineales dependen
128 de la trayectoria del modelo original (17).
129 Figueroa y Lohner, gracias a respectivas investigaciones las últimas dos décadas
130 han visto un mayor énfasis en la dinámica de fluidos computacional (CFD) en el desa-
131 rrollo y aplicación de esquemas con discretización espacial de alto orden (18).
132 Jameson y Schmidt a lo largo de diferentes análisis notaron que existe un énfasis
133 similar y no se ha producido una discretización temporal completamente explícita de
134 orden, a pesar de que los derivados temporales y espaciales los cuales son principales
135 para las ecuaciones de Navier-Stokes en grandes números de Reynolds son del mismo
136 orden (19).
137 Arnold y Cockburn, luego de un concreto estudio asegura que, con matriz triangu-
138 lar A, los métodos explícitos de Runge-Kutta de dos pasos ofrecen una alternativa efi-
139 ciente a los métodos tradicionales. (20).
140 Butcher, luego de análisis con métodos numéricos considera que para resolver las
141 ecuaciones de Navier-Stokes, los métodos TSRK (1.2) con u = 0 y θ = 0 son de especial
142 interés en aplicaciones a solucionadores de CFD. Este tipo de métodos requieren menos
143 operaciones de almacenamiento y menos puntos flotantes (FLOP) para calcular las dife-
144 rentes etapas del proceso, además queda demostrado que se busca mejorar el rendi-
145 miento de las simulaciones realizadas en unidades gráficas de procesamiento (21).
4 of 18

146 Una simulación se ejecuta para evaluar el impacto de posibles cambios en las reglas
147 de este procedimiento, los resultados se ven reflejados en esta investigación según los
148 análisis de Figueroa (22).
149 Para una simulación de dinámica de fluidos computacional (CFD), las actividades de ve-
150 rificación y validación son útiles para evaluar la exactitud del código, cuantificar la preci-
151 sión numérica de la simulación y determinar la aplicabilidad del modelo matemático se-
152 leccionado. Los diferentes criterios para evaluar la verificación del código son: juicio ex-
153 perto, cuantificación de errores, consistencia/convergencia y orden de precisión (23). De
154 estos, la prueba de orden de precisión es la prueba de aceptación recomendada para la
155 verificación rigurosa del código (23).
156 La prueba de orden de precisión requiere la evaluación del error de discretización en múl-
157 tiples niveles de cuadrícula. Aquí se puede utilizar una técnica llamada Método de Solu-
158 ciones Manufacturadas (MMS) (24),donde una solución se "fabrica" y se utiliza como una
159 solución exacta.
160 En algunos trabajos recientes han acoplado el PBE para un NDF multivariante con las
161 ecuaciones de flujo, incluyendo una segunda coordenada interna como la composición
162 química (25). que puede ser utilizado para verificar los códigos especializados de diná-
163 mica de fluidos computacional (CFD) escritos para resolver numéricamente el PBE que
164 contiene múltiples coordenadas internas y externas4 independientes.
165

166 2. Metodologia

167 2.1 Una clase especial del método TSRK

168 En esta sección, nuestra atención se restringe a una clase del método TSRK con u =
169 0 and 𝜃 = 0. Estos métodos toman la forma:

𝒊−𝟏 𝒔
[𝒏] [𝒏]
𝒀𝒊 = 𝒚𝒏−𝟏 + 𝒉 ∑ 𝒂𝒊𝒋 𝐅𝒋 ̅𝒊𝒋 𝐅𝒋 [𝒏−𝟏] , 𝒊 = 𝟏, 𝟐, … , 𝒔,
+ 𝒉∑𝒂
𝒋=𝟏 𝒋=𝟏
[𝒏]
170 𝑭𝒊 = 𝒇(𝒕𝒏−𝟏 + 𝒄𝒊 𝒉, 𝒀𝒋 [𝒏] ), 𝒊 = 𝟏, 𝟐, … , 𝒔,
𝒔 𝒔
[𝒏]
𝒚𝒏 = 𝒚𝒏−𝟏 + 𝒉 ∑ 𝐯𝒋 𝐅𝒋 + 𝒉 ∑ 𝐯̅𝒋 𝐅𝒋 [𝒏−𝟏]
{ 𝒋=𝟏 𝒋=𝟏

171 Con n=1, 2,…,N. Siguiendo la notación adoptada, estos métodos ahora estarán re-
172 presentados por el Butcher tableau:

173 𝒄𝟏 𝟎 ̅𝟏𝟏
𝒂 ̅ 𝟏𝟐
𝒂 ⋯ 𝒂
̅𝟏𝒔
𝒄𝟐 𝟎 ̅𝟐𝟏
𝒂𝟐𝟏 𝒂 ̅ 𝟐𝟐
𝒂 ⋯ 𝒂
̅𝟐𝒔
̅ ⋮ ⋮ ⋱ ⋱ [ ⋮ ]
174 c A 𝑨 = ⋮ ⋱ ⋮
𝐯𝑻 𝐯̅ 𝑻 𝒄𝒔 𝒂𝒔𝟏 ⋯ 𝒂𝒔,𝒔−𝟏 𝟎 ̅𝒔𝟏
𝒂 ̅𝒔𝟏
𝒂 ̅𝒔𝒔
⋯ 𝒂
175 𝐯𝟏 ⋯ 𝐯𝒔−𝟏 𝐯𝒔 𝐯̅𝟏 𝐯̅𝟐 ⋯ 𝐯̅𝒔

176 ̂𝑣 , 𝑣 = 1,2, …, por


Definir los vectores de error 𝐶𝑣 y las constantes de error 𝐶

𝑐𝑣 𝐴𝑐 𝑣−1 𝐴̅(𝑐 − 𝑒)𝑣−1


177 𝐶𝑣 = − − ,
𝑣! (𝑣 − 1)! (𝑣 − 1)!

1 v 𝑇 𝑐 𝑣−1 v̅ 𝑇 (𝑐 − 𝑒)𝑣−1
178 ̂𝑣 =
𝐶 − − ,
𝑣! (𝑣 − 1)! (𝑣 − 1)!
5 of 18

179 Donde 𝑒 = [1, … ,1]𝑇 ∈ 𝑅 𝑠 , y 𝑐 𝑣 = [𝑐1 𝑣 , … , 𝑐𝑠 𝑣 ]𝑇 Entonces un método TSRK tiene orden de
180 etapa 𝑞 si:

181 𝐶𝑣 = 0, 𝑣 = 1,2, … , 𝑞.

182 Para una clase especial de métodos TSRK, supondremos que el método satisface la rela-
183 ción:

184 ̅ )𝒆 = 𝟎,
𝐶1 = 𝒄 − (𝑨 + 𝑨

185 denominada condición de consistencia de etapa. Condiciones de la orden, hasta el orden


186 p=6, están dadas por:

187 𝑝 = 1:

188 ̂
𝐶1 = 0;

189 𝑝 = 2:

190 ̂2 = 0;
𝐶

191 𝑝 = 3:

192 ̂3 = 0,
𝐶

193 (v 𝑇 + v̅ 𝑇 )𝐶2 = 0;

194 𝑝 = 4:

195 ̂4 = 0,
𝐶

196 (v 𝑇 + v̅ 𝑇 )𝐶3 − v̅ 𝑇 𝐶2 = 0,

197 (v 𝑇 + v̅ 𝑇 )(𝐴 + 𝐴̅)𝐶2 = 0,

198 (v 𝑇 + v̅ 𝑇 )Γc 𝐶2 − v̅ 𝑇 𝐶2 = 0;

199 𝑝 = 5:

200 ̂5 = 0,
𝐶

201 2(v 𝑇 + v̅ 𝑇 )𝐶4 + v̅ 𝑇 (𝐶2 − 2𝐶3 ) = 0,

202 (v 𝑇 + v̅ 𝑇 )((𝐴 + 𝐴̅)Γc 𝐶2 − 𝐴̅𝐶2 ) − v̅ 𝑇 (𝐴 + 𝐴̅)𝐶2 = 0,

203 (v 𝑇 + v̅ 𝑇 )((𝐴 + 𝐴̅)𝐶3 − 𝐴̅𝐶2 ) − v̅ 𝑇 (𝐴 + 𝐴̅)𝐶2 = 0,

204 (v 𝑇 + v̅ 𝑇 )(𝐴 + 𝐴̅)2 𝐶2 = 0,

205 (v 𝑇 + v̅ 𝑇 )Γc 𝐶3 + v̅ 𝑇 (𝐶2 − 𝐶3 − Γc 𝐶2 = 0,

206 (v 𝑇 + v̅ 𝑇 )Γc (𝐴 + 𝐴̅)𝐶2 − v̅ 𝑇 (𝐴 + 𝐴̅)𝐶2 = 0,

207 (v 𝑇 + v̅ 𝑇 )Γc 2 𝐶2 + v̅ 𝑇 (𝐶2 − 2Γc 𝐶2 ) = 0,

208 (v 𝑇 + v̅ 𝑇 )𝐶22 = 0;

209 Aquí, Γc es la matriz diagonal definida por:


6 of 18

210 Γc = 𝑑𝑖𝑎𝑔(𝑐) = 𝑑𝑖𝑎𝑔(𝑐1 , … , 𝑐𝑠 ).

211 𝑝 = 6:

212 Tabla 1. El número de condiciones de orden #oc, el número de condiciones de orden de


213 etapa #soc y el número total de condiciones de orden y orden de etapa #total para méto-
214 dos TSRK con p=4, q=1 o q =3, y s=3, p=5, q=1 o q=4, y s=4, y p=6, q=1 o q=5, y s=5. Fuente:
215 (6).
Método TSRK con p, q, s #oc #soc #total
216
p=4, q=1, s=3 8 3 11
217
p=4, q=1, s=3 4 9 13
218
p=5, q=1, s=3 17 4 21
219
p=5, q=1, s=3 5 16 21
220
p=6, q=1, s=3 37 5 221
42
p=6, q=1, s=3 6 25 222
31
223
224

225 Para una clase restringida de métodos de orden TSRK p=6 y orden de etapa q=5,
226 que se construirá en este artículo, las condiciones de orden toman una forma simple:

227 ̂𝟎 = 𝟎
𝑪 y 𝑪𝟏 = 𝑪𝟐 = 𝑪𝟑 = 𝑪𝟒 = 𝑪𝟓 = 𝟎.

228 En la tabla 2.1, listamos el número de condiciones de orden #oc, el número de con-
229 diciones de orden de etapa #soc y el número total de condiciones de orden y orden de
230 etapa #total para métodos TSRK con p=4, q=1 o q=3, y s=3, p=5, q=1 o q=4, y s=4, y p= 6,
231 q=1 o q=5, y s=5.

232 2.2 Análisis de estabilidad de los métodos TSRK

233 El primer paso para analizar un método TSRK con respecto a la ecuación de prueba,
234 es reformularlos como una subclase de GLM. Esta reformulación para la clase especial
235 de métodos TSRK toma la forma0:0

𝑌 [𝑛] [𝑛]
𝑈] [ ℎ𝐹 ]
236 [ [𝑛] ] = [𝐴
𝑦 𝐵 𝑉 𝑦 [𝑛−1]

237 n = 1, 2, ……, N. Aquí, los vectores Y[n] y F[n] e y[n] de aproximaciones internas, están
238 definidos por:

𝑌 [𝑛] 𝐹 [𝑛] 𝑦𝑛
239 𝑌 [𝑛] = [ 1 [𝑛] ], 𝐹 [𝑛] = [ 1[𝑛] ], 𝑦 [𝑛] = [ [𝑛] ]
𝑌𝑠 𝐹𝑠 ℎ𝐹

240 Los GLM tienen el mismo vector de abscisas c que los métodos TSRK, y las matrices
241 de coeficientes A, U, B y V están definidas por:

242

243

244
7 of 18

245 Aquí, I es la matriz identidad de la dimensión s y 0 representa un vector cero o una


246 matriz cero de dimensiones apropiadas. Esta representación es más sencilla que la repre-
247 sentación de la clase general de métodos TSRK, con u ≠ 0 y θ ≠ 0, considerad. Observe
248 que la matriz V tiene valores propios iguales a 1 y valores propios iguales a 0 de multi-
249 plicidad s, lo que implica que el GLM es estable en cero.

250 La aplicación de GLM a la ecuación de prueba conduce a la relación de recurrencia


251 vectorial de la forma:

252 𝑦 [𝑛] = 𝑀(𝑧)𝑦 [𝑛−1] , 𝑛 = 1,2, … ,

253 𝑧 = ℎ𝜆, con matriz de estabilidad M(z) dada por:

254 𝑀(𝑧) = 𝑉 + 𝑧𝐵(𝐼 − 𝑧𝐴)−1 𝑈

255 y función de estabilidad 𝑝(𝑤, 𝑧) definida por:

256 𝑝(𝑤, 𝑧) = 𝑑𝑒𝑡((𝑤𝐼 − 𝑀(𝑧))

257 Denotemos por 𝑤𝑖(𝑧), 𝑖 = 1, 2, . . ., s, las raíces de la función de estabilidad 𝑝(𝑤, 𝑧)


258 para 𝑧 ∈ ℂ. Entonces la región de estabilidad absoluta del método con respecto a la
259 ecuación de prueba está definida por:

260 𝐴 = {𝑧 ∈ ℂ ∶ |𝑤𝑖 (𝑧)| ≤ 1, 𝑖 = 1,2, … , 𝑠}.

261

262 Figura 1. Región de estabilidad, región de estabilidad escalada del método TSRK con p = 4, q
263 = 2, s = 3 de [6], y del método de Runge-Kutta con p = s = 4. Fuente: (18)

264

265 4. Ejemplos del método TSRK de orden p=4 con s=3 etapas

266 En esta sección buscaremos métodos TSRK (2.1) de orden p = 4, con s = 3 etapas, y
267 con grandes regiones o intervalos de estabilidad absoluta. Estos métodos están definidos
268 por la tabla de coeficientes:
269
270
271

272

273

274 Un ejemplo del método TSRK de orden p = 4, orden de etapa q = 2 con s = 3 etapas, y con
275 coeficientes racionales simples. Este método está definido por:
8 of 18

276
277
278
279
280

281 y se denominará TSRK423. En esta figura, el límite de la región de estabilidad absoluta


282 se traza como una línea discontinua delgada y el límite de la región escalada de estabili-
283 dad absoluta como una línea continua delgada.

284 Resolviendo el problema de minimización tenemos:

285

286 Figura 2. Región de estabilidad, región de estabilidad escalada del método TSRK con
287 p=4,s=3, obtenido al resolver, y del método de Runge-Kutta con p=s=4. Fuente: (18)

288

289 Figura 3. Región de estabilidad, región de estabilidad escalada del método TSRK con p=4,
290 s=3, obtenido al resolver, y del método de Runge-Kutta con p=s=4. Fuente: (18).

291

292 Este método se denominará TSRK413A.


9 of 18

293

294 Este método se denominará TSRK413I.

295 Luego buscamos métodos de orden TSRK p=4 y orden de etapas q=3, con s=3. Estos mé-
296 todos satisfacen las condiciones de orden y orden de etapa.

297

298 Figura 4.Región de estabilidad, región de estabilidad escalada del método TSRK con p=4,
299 q=3, s=3 y del método de Runge-Kutta con p=s=4. Fuente: (18)

300

301 Figura 5. Región de estabilidad, región de estabilidad escalada del método TSRK con p=4,
302 q=3, s=3 y del método de Runge-Kutta con p=s=4. Fuente: (18)f

303

304

305 Resolviendo el problema de minimización con las restricciones anteriores y las mis-
306 mas restricciones sobre el vector de abscisas c que antes, obtenemos el método con coefi-
307 cientes:
10 of 18

308

309 Este método se denominará TSRK433A.

310 Resolviendo el problema de minimización con las mismas restricciones que antes
311 conduce al método TSRK con coeficientes:

312

313 Este método se denominará TSRK433I.

314 3. Resultados y Discusión

315 3.1. Cilindro 2D en el número de Reynolds Re = 500

316 Este caso de prueba clásico se utiliza para medir las velocidades obtenidas con los méto-
317 dos TSRK y LSRK. El tamaño de dominio considerado es de −4 ≤ x ≤ 20, −8 ≤ y ≤ 8, con
318 las incógnitas libres de cambiar en ymin, ymax, flujo de entrada uniforme prescrito y
319 características prescritas en el flujo de salida. Los detalles sobre los parámetros físicos y
320 el sistema de red utilizado están disponibles en [12]. Se utilizaron cuatro esquemas para
321 la integración temporal: a) un esquema LSRK de 4 etapas (LSRK4), b) un esquema TSRK
322 de cuarto orden presentado en [12] (TSRK4), c) el nuevo esquema TSRK de cuarto orden
323 obtenido al resolver (3.2) (TSRK413A), y d) el método TSRK de cuarto orden obtenido al
324 resolver el problema de minimización (3.3) (TSRK413I). La discretización espacial es de
325 cuarto orden y el cilindro se resuelve utilizando condiciones de contorno sumergidas. Se
326 colocaron varios puntos del historial de tiempo de la estación en el flujo y se registraron
327 los resultados. Las Figs. 9.1–9.2 muestran los valores para las velocidades x e y en dos
328 Posiciones:

329 • Posición 1: x = 1,91 e y = 0,12

330 • Posición 2: x = 3,82 e y = 0,24

331 Los valores de velocidad obtenidos son similares a los resultados presentados en [1]. No
332 se puede observar ninguna diferencia notable en las velocidades x e y entre los métodos
333 LSRK y TSRK utilizando diferentes números de Courant. El mayor número de Courant
334 encontrado es Cmax = 0.50, Cmax = 0.85, Cmax = 0.75 y Cmax = 0.86 para los métodos
11 of 18

335 LSRK4, TSRK4, TSRK413A y TSRK413I respectivamente. Tenga en cuenta que TSRK4 y
336 TSRK413A permiten números de Courant un 70% más altos en comparación con el
337 LSRK4. Las simulaciones se realizaron en 8 núcleos utilizando OpenMP y los tiempos
338 totales de cálculo se resumen en la Tabla 9.1. La aceleración obtenida utilizando el nuevo
339 método TSRK de cuarto orden TSRK2 en comparación con un esquema LSRK de cuarto
340 orden en el número máximo permitido de Courant es de aproximadamente el 50%.

341 9.2. Vórtice Taylor-Green

342 El vórtice verde de Taylor (TGV) en Re = 1600 es un punto de referencia clásico que
343 ejemplifica cómo una condición de flujo inicial simple causa una desintegración total-
344 mente isotrópica a un estado turbulento en el tiempo. Este caso se ha utilizado repetida-
345 mente como validación para esquemas de alto orden, véase, por ejemplo, [13,7,2,3]. Ade-
346 más, el TGV ha sido estudiado previamente por los autores en [12](ver para detalles de
347 configuración) utilizando métodos TSRK. El objetivo de esta sección es evaluar los nue-
348 vos esquemas TSRK desarrollados en este artículo y compararlos con algoritmos TSRK
349 anteriores. Las simulaciones se realizaron con discretizaciones espaciales y temporales
350 de 4º orden utilizando esquemas LSRK y TSRK. Los resultados esperados a medida que
351 avanza el tiempo consisten en una serie de procesos físicos clave en la turbulencia: roll-
352 up de vórtice, estiramiento e interacción de vórtice, y finalmente total disipación de la
353 energía en el fluido que conduce a un estado estacionario.

354

355

356 Figura 6. Cilindro: velocidades x e y en la posición 1. LS = método LSRK4, TS = método


357 TSRK4, TS1 = método TSRK413A, TS2 = método TSRK413I. El número en la clave repre-
358 senta el número de Courant utilizado en las simulaciones (por ejemplo, LS 35 = método
359 LSRK4 con número de Courant igual a 0,35). Fuente:(7).
12 of 18

360 En la Fig. 6, la tasa de vorticidad y disipación de energía cinética obtenida utilizando


361 diferentes esquemas de integración temporal se comparan con un esquema de disper-
362 sión-relación-preservación (DRP) en una malla de 5123 elementos y con los resultados
363 presentados en [3] que implementa un esquema de reconstrucción de flujo que recupera
364 un método de diferencia espectral (FR-SD). Como era de esperar, los resultados utili-
365 zando los métodos LSRK y TSRK son comparables. La Tabla 9.2 muestra los tiempos
366 obtenidos para el caso de prueba TGV. El tiempo se expresa como un valor no dimensio-
367 nal t definido como

𝑡𝑒𝑥𝑒
368 t = ,
𝑡𝑠𝑖𝑚

369 donde texe representa el tiempo de ejecución y tsim representa el tiempo de simulación.
370 Las simulaciones en las mallas gruesas y medianas se llevaron a cabo en una CPU In-
371 tel(R) Xeon(R) Silver 4208 con 16 núcleos. El esquema TSRK de cuarto orden es aproxi-
372 madamente un 30% más rápido que el LSRK de cuarto orden regular en esta configura-
373 ción de hardware. Las simulaciones para un caso de prueba similar se llevaron a cabo en
374 un Intel Xeon E5-2698v4 Broadwell con 512 núcleos. La Tabla 9.3 presenta el tiempo para
375 la malla media y fina. Para este caso de prueba, los esquemas TSRK son aproximada-
376 mente un 25% más rápidos que el método LSRK.

377 Los esfuerzos de programación recientes permiten que FDFLO se ejecute en GPU. El
378 código ha sido portado a un dispositivo GPU utilizando el estándar OpenACC incluido
379 en el compilador PGI Fortran. La GPU utilizada en todas las simulaciones es una NVI-
380 DIA V100 con una memoria de 32GB. Tres mallas con tamaños 1003, 2003 y 3003 se utili-
381 zan para fines de prueba con discretización temporal y espacial de cuarto orden. En la
382 Tabla 9.4 se presentan varios tiempos obtenidos con los esquemas LSRK y TSRK. El algo-
383 ritmo TSRK413I exhibe el mejor rendimiento entre los métodos probados y es aproxima-
384 damente un 20% más rápido que la versión LSRK implementada en el código.

385
13 of 18

386

387 Figura 7. Cilindro: velocidades x e y en la posición 2. LS = método LSRK4, TS = método


388 TSRK4, TS1 = método TSRK413A, TS2 = método TSRK413I. Fuente: (7).

389

390 Tabla 2. Tiempos de ejecución para el cilindro 2D. LSRK4 = Método RK de bajo almace-
391 namiento, TSRK4 = RK de dos pasos descrito en [12]. TSRK413A y TSRK413I son los re-
392 gímenes definidos en la sección 4. Fuente: (6).
14 of 18

393

394 Figura 8. Vórtice verde de Taylor: Tasas de disipación de energía cinética (tke) y vortici-
395 dad (vor) utilizando esquemas LSRK4, TSRK4 y TSRK413I en una malla con 1003 no-
396 dos. FR-SD-63X4 es una solución p3 que utiliza el método FR-SD en una malla 643.
397 Fuente: (7)

398

399

400
15 of 18

401

402 Además, cuatro esquemas TSRK de quinto orden obtenidos en la Sección 5 se implemen-
403 taron y probaron en FDFLO. Se utilizaron dos rejillas de tamaño 1003 y 2003 para fines
404 de prueba. El objetivo de estas pruebas es evaluar la estabilidad de los métodos y esti-
405 mar las posibles ganancias en los tiempos de ejecución. El rendimiento de estos esque-
406 mas se compara con un esquema LSRK de quinto orden.

407

408 Figura 9.Vórtice verde de Taylor: Tasas de disipación de energía cinética (tke) y vortici-
409 dad (vor) utilizando esquemas LSRK5, TSRK514A, TSRK514I, TSRK544A, TSRK544I en
410 una malla con 1003 nodos. Fuente: (7).

411

412

413 La discretización espacial utilizada en todas las simulaciones es de cuarto orden. En la


414 secuencia LSRK5 se refiere a un esquema RK de bajo consumo de quinto orden. Todos
415 los esquemas TSRK de quinto orden resolvieron correctamente el caso TGV y obtuvieron
16 of 18

416 soluciones similares en ambos casos. Esto se puede apreciar en la Fig. 9.4. La Tabla 9.5
417 muestra el número máximo de Courant para cada método, donde el método TSRK544I
418 alcanza el número de Courant más alto permitido Cmax = 0.49. El método TSRK544I ex-
419 hibe el mejor rendimiento entre todos los esquemas de quinto orden, con una acelera-
420 ción del 10% en comparación con el método LSRK5. Finalmente, el caso de prueba TGV
421 se resuelve con los métodos TSRK de sexto orden desarrollados en la Sección 6 y con una
422 discretización espacial de sexto orden. Además, los resultados y los tiempos se compa-
423 ran con un LSRK de orden seis (LSRK6) y el esquema RK "Luther" de sexto orden intro-
424 ducido anteriormente. El esquema TSRK655I ofrece un rendimiento que es un 35% más
425 rápido que el esquema RK67, sin embargo, sigue siendo más lento que el algoritmo
426 LSRK6. Fig. 5 y Tabla 2 resumir los resultados y tiempos obtenidos con los distintos mé-
427 todos.

428

429

430

431

432

433

434

435

436 Figura 10. Vórtice verde de Taylor: Tasas de disipación de energía cinética (tke) y vorti-
437 cidad (vor) utilizando esquemas RK67, LSRK6, TSRK655A, TSRK655I en una malla con
438 1003 nodos. Fuente: (7).

439 4. Conclusión

440 En el presente artículo, se definió una clase especial de métodos TSRK con demandas
441 reducidas de almacenamiento y computación (las variables u y θ se establecen en cero).
442 Las principales ventajas de los esquemas TSRK recientemente desarrollados sobre los
443 métodos TSRK anteriores son: a) reducción de los requisitos de almacenamiento, b) me-
444 nor cantidad de operaciones aritméticas y, c) simplificación de la implementación numé-
445 rica. En [12], se ha demostrado que los métodos explícitos de Runge-Kutta de dos pasos
446 son una alternativa eficiente a los esquemas tradicionales explícitos de Runge-Kutta para
447 resolver las ecuaciones de Navier-Stokes. Los métodos TSRK exhiben regiones e interva-
448 los más grandes de estabilidad absoluta (es decir, permitiendo el uso de tamaños escalo-
449 nados más grandes) en comparación con los métodos tradicionales de Runge-Kutta de
450 los mismos órdenes. Los nuevos métodos se prueban con dos casos de prueba comunes,
451 un cilindro 2D y un vórtice Taylor-Green 3D, y se comparan con las estrategias clásicas
452 de discretización del tiempo.

453 Los tiempos obtenidos en varias configuraciones de hardware (CPU y GPU) muestran
454 que el método TSRK413I exhibe el mejor rendimiento sobre todos los métodos de cuarto
455 orden. El método TSRK413I es al menos un 25% más rápido para dos configuraciones de
456 CPU y un 20% más rápido para simulaciones realizadas en una GPU, en comparación
457 con los métodos LSRK comúnmente utilizados. Además, los métodos TSRK de quinto y
458 sexto orden se desarrollan aplicando los mismos criterios de diseño que los esquemas
17 of 18

459 TSRK de orden cuatro. El esquema TSRK544I muestra resultados prometedores en com-
460 paración con el método LSRK de quinto orden ya implementado en FDFLO. Los dos
461 métodos de sexto orden obtenidos en la Sección 6 presentan una reducción del 20-30%
462 en los tiempos de ejecución en comparación con el esquema de sexto orden desarrollado
463 por Luther, sin embargo, todavía son un 60% más lentos que el método LSRK6. Las prin-
464 cipales razones por las que el método LSRK de sexto orden es más rápido que el
465 TSRK544A y TSRK544I se deben al mayor número de Courant permitido y al número
466 bajo de FLOPs. Es importante tener en cuenta que los métodos LSRK son solo de se-
467 gundo orden para los ODE no lineales, mientras que los métodos TSRK mantienen el
468 orden para los ODE no lineales.

469

470 References
471 1. Verner JH. Starting methods for two-step Runge-Kutta methods of stage-order 3 and order 6. J Comput Appl Math.
472 2006;185(2):292-307.
473 2. Simos TE, Tsitouras C. On high order Runge–Kutta–Nyström pairs. J Comput Appl Math [Internet]. 2022;400:113753.
474 Disponible en: https://doi.org/10.1016/j.cam.2021.113753
475 3. Cash JR, Mazzia F, Sumarti N, Trigiante D. The role of conditioning in mesh selection algorithms for first order systems of
476 linear two point boundary value problems. J Comput Appl Math. 2006;185(2):212-24.
477 4. Enright WH. Verifying approximate solutions to differential equations. J Comput Appl Math. 2006;185(2):203-11.
478 5. Nagata K, Ikegaya N, Tanimoto J. Consideration of artificial compressibility for explicit computational fluid dynamics
479 simulation. J Comput Phys [Internet]. 2021;443:110524. Disponible en: https://doi.org/10.1016/j.jcp.2021.110524
480 6. Butcher J. General linear methods for ordinary differential equations. Math Comput Simul. 2009;79(6):1834-45.
481 7. Karam M, Sutherland JC, Saad T. Low-cost Runge-Kutta integrators for incompressible flow simulations. J Comput Phys
482 [Internet]. 2021;443:110518. Disponible en: https://doi.org/10.1016/j.jcp.2021.110518
483 8. Pazner W, Persson PO. Stage-parallel fully implicit Runge–Kutta solvers for discontinuous Galerkin fluid simulations. J
484 Comput Phys [Internet]. 2017;335(January):700-17. Disponible en: http://dx.doi.org/10.1016/j.jcp.2017.01.050
485 9. Kupka F, Happenhofer N, Higueras I, Koch O. Total-variation-diminishing implicit-explicit Runge-Kutta methods for the
486 simulation of double-diffusive convection in astrophysics. J Comput Phys [Internet]. 2012;231(9):3561-86. Disponible en:
487 http://dx.doi.org/10.1016/j.jcp.2011.12.031
488 10. Qiu J, Liu T, Khoo BC. Runge-Kutta discontinuous Galerkin methods for compressible two-medium flow simulations: One-
489 dimensional case. J Comput Phys. 2007;222(1):353-73.
490 11. Ren T, Hu J, Xiong T, Qiu JM. Runge-Kutta central discontinuous Galerkin BGK method for the Navier-Stokes equations. J
491 Comput Phys [Internet]. 2014;274:592-610. Disponible en: http://dx.doi.org/10.1016/j.jcp.2014.06.045
492 12. Vuorinen V, Keskinen JP, Duwig C, Boersma BJ. On the implementation of low-dissipative Runge-Kutta projection methods
493 for time dependent flows using OpenFOAM®. Comput Fluids [Internet]. 2014;93:153-63. Disponible en:
494 http://dx.doi.org/10.1016/j.compfluid.2014.01.026
495 13. García-Herrera CM, Celentano DJ, Cruchaga MA, Loewe C. Thermomechanical simulation of an industrial quenching
496 process applied to a centrifugal pump impeller. Rev Int Metod Numer para Calc y Disen en Ing [Internet]. 2015;31(3):182-7.
497 Disponible en: http://dx.doi.org/10.1016/j.rimni.2014.06.002
498 14. Martín-Vaquero J, Kleefeld A. ESERK5: A fifth-order extrapolated stabilized explicit Runge–Kutta method. J Comput Appl
499 Math. 2019;356:22-36.
500 15. Staia MH, Kossman S, Contreras V, Chicot D, Iost A, Van Gorp A. Recubrimientos nanoestructurados de circoniaestabilizada
501 con itria (YSZ) depositados mediantetermorrociado por plasma por suspensión. Bol la Soc Esp Ceram y Vidr [Internet].
18 of 18

502 2018;58(4):151-60. Disponible en: https://doi.org/10.1016/j.bsecv.2018.10.003


503 16. D’Alessandro V, Binci L, Montelpare S, Ricci R. On the development of OpenFOAM solvers based on explicit and implicit
504 high-order Runge–Kutta schemes for incompressible flows with heat transfer. Comput Phys Commun [Internet]. 2018;222:14-
505 30. Disponible en: http://dx.doi.org/10.1016/j.cpc.2017.09.009
506 17. Alexe M, Sandu A. Forward and adjoint sensitivity analysis with continuous explicit Runge-Kutta schemes. Appl Math
507 Comput [Internet]. 2009;208(2):328-46. Disponible en: http://dx.doi.org/10.1016/j.amc.2008.11.035
508 18. Figueroa A, Jackiewicz Z, Löhner R. Explicit two-step Runge-Kutta methods for computational fluid dynamics solvers. Int J
509 Numer Methods Fluids. 2021;93(2):429-44.
510 19. Gassner GJ, Beck AD. On the accuracy of high-order discretizations for underresolved turbulence simulations. Theor Comput
511 Fluid Dyn. 2013;27(3-4):221-37.
512 20. Sitaraman J, Katz A, Jayaraman B, Wissink AM, Sankaran V. Evaluation of a multi-solver paradigm for CFD using overset
513 unstructured and structured adaptive cartesian grids. 46th AIAA Aerosp Sci Meet Exhib. 2008;(January).
514 21. Bazilevs Y, Hsu M, Kiendl J, Wüchner R, Bletzinger K. 3D Simulation of Wind Turbine Rotors at Full Scale. Part II: Fluid –
515 Structure Interaction Modeling with Composite Blades. Int J Numer Methods Fluids. 2011;65(October 2010):236-53.
516 22. D’Ambrosio R, Jackiewicz Z. Continuous two-step Runge-Kutta methods for ordinary differential equations. Numer
517 Algorithms. 2010;54(2):169-93.
518 23. Choudhary A, Roy CJ, Dietiker JF, Shahnam M, Garg R, Musser J. Code verification for multiphase flows using the method
519 of manufactured solutions. Int J Multiph Flow. 2016;80:150-63.
520 24. Navah F, Nadarajah S. A comprehensive high-order solver verification methodology for free fluid flows. Aerosp Sci Technol
521 [Internet]. 2018;80:101-26. Disponible en: https://doi.org/10.1016/j.ast.2018.07.006
522 25. Bhutani G, Brito-Parada PR. Analytical solution for a three-dimensional non-homogeneous bivariate population balance
523 equation—a special case. Int J Multiph Flow [Internet]. 2017;89:413-6. Disponible en:
524 http://dx.doi.org/10.1016/j.ijmultiphaseflow.2016.11.005
525

You might also like