You are on page 1of 196

INDICE DEL LIBRO GUÍA DE FISICA PARA ING.

EN CIENCIAS ECONÓMICAS Y
FINANCIERAS

1.TEORÍA CINÉTICA DE LOS GASES...................................................................................................2


1.1.GAS IDEAL........................................................................................................................................3
1.2.PRESIÓN DEL GAS..........................................................................................................................3
1.3.TEMPERATURA...............................................................................................................................8
1.4.ECUACIÓN DE ESTADO DEL GAS IDEAL................................................................................15
1.5.MOVIMIENTO BROWNIANO.......................................................................................................17
1.6.FORMULA BAROMÉTRICA ........................................................................................................23
1.7.LEY DE BOLTZMANN...................................................................................................................26
1.8.CONCEPTO DE PROBABILIDAD..............................................................................................27
1.9.CONCEPTO DE DISTRIBUCIÓN. FUNCIÓN DE DISTRIBUCIÓN......................................31
1.10.DISTRIBUCION DE LAS MOLECULAS SEGÚN LAS COMPONENTES DE LA
VELOCIDAD.........................................................................................................................................33
1.11.DISTRIBUCIÓN DE LAS MOLÉCULAS POR VELOCIDADES..............................................37
1.12.VELOCIDADES MEDIAS DE LAS MOLECULAS....................................................................44
1.13.VELOCIDAD MÁS PROBABLE DE LAS MOLECULAS.........................................................46
1.14. FOMULAS DE MAXWELL PARA LAS VELOCIDADES RELATIVAS..................................47
2.TEORÍA CINÉTICA DEL CALOR......................................................................................................51
LEY DE CONSERVACIÓN DE LA ENERGÍA.....................................................................................51
2.1.ENERGÍA INTERNA DEL GAS IDEAL........................................................................................51
2.2.CANTIDAD DE CALOR.................................................................................................................52
2.3.EQUIVALENTE MECÁNICO DEL CALOR..................................................................................53
2.4.PRIMER PRINCIPIO DE LA TERMODINÁMICA.......................................................................54
2.5.CAPACIDAD CALORÍFICA DE LOS GASES IDEALES.............................................................58
2.6.CAPACIDAD CALORÍFICA DE LOS GASES Y NÚMERO DE GRAOS DE LIBERTAD DE
LAS MOLÉCULAS................................................................................................................................60
2.7.CAMBIO DEL ESTADO AL VARIAR EL VOLUMEN DEL GAS...............................................61
2.8.TRABAJO DURANTE EL CAMBIO ISOTÉRMICO DEL VOLUMEN DEL GAS IDEAL........62
2.9.CAMBIO ADIABÉTICO DEL VOLUMEN DEL GAS IDEAL.....................................................63
2.10. TRABAJO DURANTE EL CAMBIO ADIABÁTICO DEL VOLUMEN DEL GAS..................66
3.ELEMENTOS DE LA TERMODINÁMICA.......................................................................................69
3.1.ESTADOS DE EQUILIBRIO...........................................................................................................69
3.2.PROCESOS REVERSIBLES E IRREVERSIBLES........................................................................71
3.3.PROCESOS CUASIESTÁTICOS....................................................................................................74
3.4.IRREVERSIBILIDAD Y PROBABILIDAD...................................................................................75
3.5.TRANSFORMACIONES MUTUAS DE LA ENERGÍA MECÁNICA Y TÉRMICA...................78
3.6.PRIMER PRINCIPIO DE LA TERMODINÁMICA.......................................................................78
3.7.TRANSFORMACIÓN DEL CALOR EN TRABAJO MECÁNICO...............................................80
3.8.CICLO DE CARNOT.......................................................................................................................82
3.9.MÁQUINA REFRIGERADORA.....................................................................................................88
3.10. DEMOSTRACIÓN DE LOS TEOREMAS DE CARNOT...........................................................88
3.11.ENERGÍA LIBRE...........................................................................................................................91
3.12.ENTROPÍA.....................................................................................................................................94
3.13. ENTROPIA DURANTE LOS PROCESOS REVERSIBLES EN UN SISTEMA CERRADO..102
3.14. SEGUNDO PRINCIPIO DE LA TERMODINÁMICA Y TRANSFORMACIÓN DEL CALOR
EN TRABAJO......................................................................................................................................103
3.15. SENTIDO FISICO DE LA ENTROPIA. ENTROPIA Y PROBABILIDAD..............................107
3.16. ENTROPIA Y DESORDEN........................................................................................................111
3.17. DIABLO DE MAXWELL..........................................................................................................113
1
4.FUNDAMENTOS BÁSICOS...............................................................................................................114
4.1.DE LA NECESIDAD DE FUNDAMENTOS BÁSICOS..........................................................................................114
4.2.LEYES BÁSICAS DE LA MECÁNICA BÁSICA DE NEWTON Y VARIAS MANERAS DE EXPRESARLAS ..........................114
4.3.SELECCIÓN DE LA FORMULACIÓN............................................................................................................114
4.4.ORIGEN DE LAS LEYES BÁSICAS..............................................................................................................115
4.5.DE LOS CONCEPTOS Y MAGNITUDES BÁSICAS EMPLEADAS............................................................................115
4.6.CONDICIONES DE VALIDEZ DE LAS LEYES DE NEWTON ...............................................................................115
4.7.DOS TIPOS GENERALES DE PROBLEMAS DE DINÁMICA.................................................................................121
4.8.MÉTODOS GENERALES PARA SOLUCIONAR PROBLEMAS DE DINÁMICA.............................................................121
4.9.EJEMPLO ILUSTRATIVO DE LOS NUMERALES 1.7 Y 1.8...............................................................................122
4.10.RESUMEN Y OBSERVACIONES................................................................................................................124
4.11.PROBLEMAS Y PREGUNTAS DE REPASO...................................................................................................125
5.FUNDAMENTOS BÁSICOS II...........................................................................................................127
5.1.OBSERVACIONES INTRODUCTORIAS..........................................................................................................127
5.2.SISTEMAS DE COORDENADAS Y ECUACIONES DE TRANSFORMACIÓN...............................................................127
5.3.COORDENADAS GENERALIZADAS. GRADOS DE LIBERTAD.............................................................................134
5.4.GRADOS DE RESTRICCIÓN, ECUACIONES DE RESTRICCIÓN. COORDENADAS SUPERFLUAS....................................138
5.5.RESTRICCIONES MÓVILES.......................................................................................................................139
5.6.ECUACIONES DE TRANSFORMACIÓN “REDUCIDAS”....................................................................................139
5.7.VELOCIDAD EXPRESADA EN COORDENADAS GENERALIZADAS.......................................................................140
5.8.TRABAJO Y ENERGÍA CINÉTICA...............................................................................................................143
5.9.EJEMPLOS ILUSTRATIVOS DE LA ENERGÍA CINÉTICA....................................................................................145
5.10.TEOREMA DE “CENTRO DE MASA” PARA LA ENERGÍA CINÉTICA..................................................................148
5.11. UNA EXPRESIÓN GENERAL PARA LA ENERGÍA CINÉTICA DE P PARTÍCULAS....................................................149
5.12.DEFINICIÓN DE ACELERACIÓN Y EJEMPLOS.............................................................................................151
5.13.“DESPLAZAMIENTOS REALES Y VIRTUALES; TRABAJO VIRTUAL...................................................................153
5.14.RESUMEN Y OBSERVACIONES...............................................................................................154
6.ECUACIONES DEL MOVIMIENTO DE LAGRANGE PARA UNA PARTICULA....................156
6.1.CONSIDERACIONES PRELIMINARES...........................................................................................................156
6.2.DEDUCCIÓN DE LAS ECUACIONES DE LAGRANGE PARA UNA PARTÍCULA, SIN COORDENADAS NI RESTRICCIONES
MÓVILES. 156
6.3.COMPENDIO DE DETALLES IMPORTANTES RELACIONADOS CON LAS ECUACIONES DE LAGRANGE..........................161
6.4.INTEGRACIÓN DE LAS ECUACIONES DIFERENCIALES DEL MOVIMIENTO............................................................163
6.5.EJEMPLOS ILUSTRATIVOS.......................................................................................................................163
6.6.ECUACIONES DE LAGRANGE PARA UNA PARTÍCULA, SUPONIENDO U MARCO DE REFERENCIA MÓVIL, RESTRICCIONES
MÓVILES, O AMBAS CONDICIONES SIMULTÁNEAMENTE.......................................................................................166
6.7.DE LA ENERGÍA CINÉTICA, LAS FUERZAS GENERALIZADAS Y OTROS TÓPICOS, CUANDO EL MARCO DE REGENCIA, LAS
RESTRICCIONES, O AMBOS SE MUEVEN............................................................................................................168
6.8.DETERMINACIÓN DE LA ACELERACIÓN POR MEDIO DE LAS ECUACIONES DE LAGRANGE....................................171
6.9.UNA CONSIDERACIÓN ADICIONAL SOBRE LAS ECUACIONES DE LAGRANGE......................................................173
6.10.EXPERIMENTO SUGERIDOS:..................................................................................................................174
6.11.RESUMEN Y OBSERVACIONES................................................................................................................174
7.ECUACIONES DE LAGRANGE PARA UN SISTEMA DE PARTÍCULAS.................................175
7.1.OBSERVACIONES INTRODUCTORIAS..........................................................................................................175
7.2.DEDUCCIÓN DE LAS ECUACIONES DE LAGRANGE PARA UN SISTEMA DE PARTÍCULAS.........................................175
7.3.EXPRESIÓN DE T EN FORMA ADECUADA...................................................................................................178
7.4.SIGNIFICADO FÍSICO DE LAS TUERZAS GENERALIZADAS...............................................................................178
7.5.TÉCNICAS PARA HALLAR EXPRESIONES PARA LAS TUERZAS GENERALIZADAS...................................................179
7.6.EJEMPLOS ILUSTRATIVOS DE LA APLICACIÓN DE LAS ECUACIONES DE LAGRANGE A SISTEMAS QUE INCLUYEN VARIAS
PARTÍCULAS...............................................................................................................................................180
7.7.FUERZAS Y MOVIMIENTOS DE LAS PARTÍCULAS CARGADAS EN UN CAMPO ELECTROMAGNÉTICO..........................191
7.8.CONSIDERACIONES SOBRE EL SIGNIFICADO FÍSICO DE LAS ECUACIONES DE LAGRANGE.....................................192
7.9.EXPERIMENTO SUGERIDO.......................................................................................................................195

1. TEORÍA CINÉTICA DE LOS GASES


2
1.1. GAS IDEAL

En la mayoría de fenómenos a los que está dedicado este libro, no es necesario, no


sólo tener en cuenta el carácter cuántico de los procesos interatómicos, incluso
considerar el hecho mismo de la existencia de cualquier estructura de los átomos. En
nuestra tarea extra el estudio de los sistemas compuestos de un gran número de
moléculas, consideradas como cuerpos de pequeñas dimensiones y masa.
Está claro que el estudio teórico de tales sistemas moleculares está ligado con
grandes dificultades, ya que para esto es necesario tener en cuenta todas las fuerzas
que actúan sobre cada molécula por parte de todas las demás. Si suponemos que el
movimiento de las moléculas es puramente mecánico y se somete a las leyes de
Mecánica, entonces, para la descripción completa de cualquier sistema molecular,
parece necesario resolver la tarea mecánica del movimiento de todas las moléculas
bajo la acción de las fuerzas dadas. Esto significa que deben ser escritas y resueltas
las ecuaciones de movimiento, cuyo número es igual al número de moléculas del
sistema dado (hablando más exactamente, el número de ecuaciones debe ser tres
veces mayor, ya que la posición de la molécula se determina con tres coordenadas, es
decir, cada molécula tiene tres grados de libertad). Si tenemos en cuenta, por ejemplo,
que un centímetro cúbico de gas en condiciones corrientes encierra 2.7 x 10 elevado a
la 19 moléculas, queda claro que es imposible no solo resolver, sino incluso escribir un
número de ecuaciones tan monstruoso.
La grandiosidad del número de moléculas hace innecesario considerar el
movimiento de cada una de ellas por separado. Para un número tan grande de
partículas resulta ser posible el limitarse al conocimiento sólo de los valores medios de
las magnitudes que caracterizan su movimiento: su velocidad media, la energía media,
etc. Este método es el que vamos a utilizar al estudiar los sistemas moleculares.
De los tres estados de agregación en que se puede encontrar cualquier substancia,
el más sencillo es el gaseoso, ya que en este caso las fuerzas que actúan entre las
moléculas son muy pequeñas y en determinadas condiciones se pueden despreciar.
Por eso empezamos la exposición de la Física Molecular con el exámen de las
propiedades de los gases. Para ello supondremos al principio que las fuerzas
intermoleculares en los gases no sólo son pequeñas, sino que no existen en general.
Para simplificar, despreciamos también las dimensiones de las moléculas, es decir, las
consideramos como puntos materiales. Con tales suposiciones las moléculas del gas
se deben considerar completamente libres. Esto significa que ellas se mueven en línea
recta y uniformemente, como se mueven siempre los cuerpos que no están sometidos
a la acción de cualquier fuerza. Cada molécula se comporta, por consecuencia, como
si no hubiese ninguna otra molécula en la vasija.
En adelante, al examinar los gases reales, naturalmente, dejaremos las
suposiciones hechas, justificadas precisamente porque en determinadas condiciones
tal idealización no nos lleva muy lejos de la realidad.
El gas que tiene tales propiedades así como un conjunto de puntos materiales que
no actúan entre si, se llama gas ideal. Nuestra primera tarea será la exposición de la
teoría cinética de los gases ideales.

1.2. PRESIÓN DEL GAS

El cuadro de los movimientos de las moléculas en el gas no será completo, si no


examinásemos además la cuestión sobre los choques de las moléculas con la
superficie de cualquier cuerpo que se encuentra en el gas, y en particular con las
paredes de la vasija que contiene el gas y de unas con otras.

3
En efecto, al realizar las moléculas el movimiento desordenado, de cuando en
cuando se acercan a las paredes de la vasija o a la superficie de otros cuerpos a una
distancia bastante pequeña. Del mismo modo, las moléculas también se pueden
aproximar bastante cerca una a otra. En este caso, entre las moléculas del gas, o
entre las moléculas del gas y las de la substancia de la pared, se originas unas fuerzas
de interacción que disminuyen rápidamente con la distancia. Bajo la acción de estas
fuerzas las moléculas del gas cambian la dirección de su movimiento. Este proceso
(cambio de dirección), como sabemos, lleva el nombre de choque.
El choque de las moléculas entre sí juega un papel muy importante en el
comportamiento del gas. Esta cuestión la examinaremos detalladamente mas
adelante. Por ahora es importante considerar el choque de las moléculas con las
paredes de la vasija., o con otra superficie cualquiera que está en contacto con el gas.
La interacción de las moléculas del gas y de las paredes determina, precisamente, de
fuerza que experimentan las paredes por parte del gas y, naturalmente, la igual fuerza
de sentido contrario que experimenta el gas por parte de las paredes. Es claro, que la
fuerza que sufren las paredes por parte del gas será tanto mayor, cuanto mayos sea el
área de su superficie. Con objeto de no utilizar la magnitud que depende de tal factor
casual como son las dimensiones de la pared, se ha aceptado caracterizar la acción
del gas sobre las paredes no por la fuerza, sino por la presión p, es decir, por la fuerza
F relacionada a la unidad de superficie S de la pared, perpendicular a esa fuerza.

F
p=
S

La propiedad del gas de ejercer presión sobre las paredes de la vasija que lo
contiene, es una de las propiedades fundamentales del gas. Precisamente, por su
presión se puede frecuentemente descubrir su presencia. Por eso, la magnitud de la
presión es una de las características más importantes del gas.
La presión del gas sobre las paredes de la vasija, como ya propuso Daniel Bernoulli
en el siglo XVIII, es una consecuencia de los choques innumerables de las moléculas
gaseosas contra las paredes. Estos golpes de las moléculas contra las paredes
conducen a un determinado desplazamiento de las partículas del material de la pared,
o sea, a su deformación. La pared deformada actúa sobre el gas con una fuerza
elástica, dirigida en cada punto, perpendicularmente a la pared. Esta fuerza es igual en
su valor absoluto a la fuerza con la que el gas actúa sobre la pared y de sentido
contrario.
A pesar de que las fuerzas de interacción de cada molécula por separado con las
moléculas de la pared durante el choque son desconocidas, sin embargo, las leyes de
mecánica permiten hallar la fuerza media, originada por la acción conjunta de todas las
moléculas del gas, es decir, hallar la presión del gas.
Supongamos que el gas está encerrado en una vasija que tiene forma de
paralelepípedo (fig. 2), y que el gas se encuentra en estado de equilibrio. En el caso
dado, esto significa que el gas, como un todo, está en reposo en relación a las
paredes de la vasija: el número de moléculas que se mueven en una dirección
arbitraria determinada es igual en su media al número de moléculas, cuyas
velocidades estás dirigidas en sentido contrario.
Calculemos la presión del gas sobre una de las paredes de la vasija, por ejemplo,
sobre la pared derecha abcd. Dirijamos el eje de coordenadas X a lo largo de la arista
del paralelepípedo perpendicularmente a la pared abcd como está indicado en la fig.2.
Cualesquiera que sean las direcciones de las velocidades υ de las moléculas, solo nos
interesa la proyección v x de las velocidades de las moléculas sobre el eje X: en

4
dirección hacia la pared abcd las moléculas se mueven, precisamente, con la
velocidad v x .
Separemos mentalmente una capa de gas con espesor ∆x , adyacente a la pared
elegida. Por parte de la pared deformada sobre ella actúa la fuerza elástica F. Con una
fuerza de tal valor absoluto también actúa el gas sobre la pared. Según la segunda ley
de Newton el impulso de la fuerza F∆t (donde ∆t es un intervalo arbitrario de tiempo)
es igual al cambio del impulso del gas en nuestra capa. Pero el gas se encuentra en
estado de equilibrio, de modo que la capa no recibe ningún incremento del impulso en
dirección del impulso de la fuerza (contra la dirección positiva del eje X). Esto ocurre
porque,

debido a los movimientos moleculares, la capa elegida recibe un impulso en la


dirección contraria y naturalmente, de igual valor absoluto. Este no es difícil calcularlo.
Durante los movimientos desordenados de las moléculas gaseosas en un tiempo
∆t entra en nuestra capa de izquierda a derecha un número determinado de
moléculas y otras tantas moléculas salen de ella en dirección contraria, de derecha a
izquierda. Las moléculas entrantes aportan consigo un impulso determinado. Las
salientes aportan un impulso igual de signo contrario, de modo que el impulso total que
recibe la capa, es igual algebraicamente a la suma de los impulsos de las moléculas
entrantes y salientes de la capa.
Hallemos el número de moléculas entrantes en nuestra capa en el tiempo ∆t .
Durante este tiempo pueden llegar a la frontera a’b’c’d’, de la izquierda, las
moléculas que se encuentran de ella a una distancia no superior a v x ∆t . Todas ellas
se encuentran en el volumen del paralelepípedo con una base de superficie S (esta es
el área de la pared considerada) y longitud v x ∆t , es decir en el volumen Sv x ∆t . Si la
unidad de volumen contiene n moléculas, entonces en el volumen indicado se hallarán
nSv x ∆t moléculas. Pero sola la mitad de ellas se mueve de izquierda a derecha y cae
en la capa. La otra mitad se aleja de ella y no cae en la capa. Por consiguiente,
1
durante el tiempo ∆t entran en la capa, de izquierda a derecha nSv x ∆t moléculas.
2
Cada una de ellas posee un impulso mv x ( m es la masa de la molécula) y el
impulso total que ellas aportan a la capa es igual a
1
nmv x2 S∆t
2
Durante este tiempo abandona la capa, moviéndose de derecha a izquierda, un
número igual de moléculas con un mismo impulso total, pero de signo contrario. De tal
modo, debido a la entrada en la capa de moléculas son impulso positivo y a la salida

5
desde ella de moléculas con impulso negativo, el cambio total del impulso en la capa
será igual a
1  1 
nmv x2 S∆t −  − nmv x2 S∆t  = nmv x2 S∆t
2  2 
Este cambio del impulso de la capa compensa el cambio que debería ocurrir bajo la
acción del impulso de fuerza F∆t . Por eso, podemos escribir:
F∆t = nmv x2 S∆t
Dividiendo ambas partes de esta igualdad por S∆t obtenemos:
F
= p = nmv x2 (2.1)
S
Hasta ahora, sin decirlo suponíamos que todas las moléculas del gas tenían
velocidades, cuyas proyecciones v x eran iguales. En realidad esto no es así. Las
velocidades de las moléculas v y sus proyecciones v x sobre el eje X, naturalmente,
son distintas en las diferentes moléculas. La cuestión sobre la diferencia de
velocidades de las moléculas gaseosas en condiciones de equilibrio serán examinadas
detalladamente en el § 12. De momento tendremos en cuenta la diferencia de las
velocidades de las moléculas y de sus proyecciones en el eje de coordenadas,
2
sustituyendo la magnitud v x que entra en la fórmula (2.1) por su valor medio v x2 de
modo que a la fórmula de la presión del gas (2.1) le daremos la forma siguiente:

p = n mv x2 (2.2)

Para la velocidad v de cada molécula se puede escribir:

v 2 = v x2 + v y2 + v z2 , (2.3)

Por eso

v 2 = v x2 + v y2 + v z2 = v x2 + v y2 + v z2

(la última igualdad significa que se puede cambiar el orden de realización de las
operaciones de sumar y hallar la media). Debido al desorden completo de los
movimientos moleculares se puede suponer que el valor medio de los cuadrados de
las proyecciones de velocidades sobre los tres ejes coordenados son iguales entre sí,
es decir,

v x2 = v 2y = v z2

Esto significa, teniendo en cuenta (2.3) que

v2
v x2 =
3

Poniendo esta expresión en la fórmula (2.2) obtenemos que:

6
1
p = nmv 2
3

o, multiplicando y dividiendo la parte derecha de esta igualdad por dos,

2 mv 2
p= n (2.4)
3 2

Los raciocinios elementales expuestos son justos para cualquier pared de la vasija
y para cualquier superficie que se puede colocar mentalmente en el gas. En todos los
casos obtenemos para la presión del gas el resultado expresado en la fórmula (2.4).
mv 2
La magnitud en la fórmula (2.4) es una molécula de gas. Por consiguiente, la
2
presión del gas es igual a dos tercios de la energía cinética media de las moléculas de
la unidad de volumen de gas.
Esta es una de las conclusiones más importantes de la teoría cinética del gas ideal.
La fórmula (2.4) establece la relación entre las magnitudes moleculares, es decir, las
que se refieren a una molécula por separado y la magnitud de la presión que
caracteriza el gas como un todo, la magnitud macroscópica que se mide directamente
en la experiencia. La ecuación (2.4) algunas veces se llama ecuación fundamental de
la teoría cinética de los gases ideales.
Es importante subrayar que la presión del gas se determina por la energía cinética
media de sus moléculas. Esto significa que la presión del gas es una magnitud
orgánicamente ligada a la condición de que el gas está compuesto de un gran número
de moléculas. Por eso, no tiene sentido hablar, por ejemplo, de la presión creada por
una o muy pocas moléculas. Sobre los conceptos que solo tiene sentido para los
sistemas compuestos de muchas partículas se dice que tienen un carácter estadístico.
Observemos aquí que la magnitud del valor medio del cuadrado de la velocidad v 2
que figura en la fórmula (2.4) que hay que distinguirlo del cuadrado del valor medio de
la velocidad v 2 . Si la raíz cuadrada de v 2 es igual a la velocidad media de v , la v 2
no es igual a v .
La magnitud v 2 = v (y no v ) se llama velocidad media cuadrática de las
moléculas. Si el movimiento de las moléculas es completamente caótico, entonces su
velocidad media cuadrática es aproximadamente un 9% mayor que la velocidad
media.

Unidades de presión. En el sistema SI (se toma como unidad de presión la presión


que perpendicularmente ejerce la fuerza de 1 newton sobre la superficie de 1 m2. Tal
unidad se llama pascal (abreviadamente Pa):

1 Pa = 1 N/m2

Debido a la pequeñez de esta unidad se recomienda utilizar la unidad en 105 veces


mayor, a la cual se le ha asignado el nombre de bar:

1 bar = 105 Pa

En el sistema GGS la presión se mide en din/cm2:

1 din/cm2 =0,1 Pa
7
En la técnica se utiliza, ampliamente, la unidad de presión, denominada atmósfera
técnica (abreviadamente at) que es igual a 1 kgf/cm2. Esta unidad solo se diferencia en
un 2% del bar:

1 at = 1 kgf/cm2 = 98066,5 Pa ≈ 0,98 bar

Algunas veces se utiliza la unidad, atmósfera física (abreviadamente atm) que es


igual a la presión de una columna de mercurio con 76cm de altura. Teniendo en cuenta
que la densidad del mercurio es igual a 13,5951 g/cm 3 (13595,1 kg/m3) y la aceleración
de la caída libre es igual a 9,80665 m/s2, obtenemos que:

1 atm = 1,01325⋅106 din/cm2 = 101325 Pa (≈1,01 bar)

En el dominio de las bajas presiones se utiliza la unidad de presión, el tor (un


milímetro de la columna de mercurio):

1 tor = 1/760 atm = 133,322 Pa ≈ 1,33⋅103 din/cm2

Durante la resolución de problemas es necesario recordar que de las unidades de


presión expuestas solo el Pa corresponde al sistema (sistema SI) y la din/cm2 (al
sistema GGS)

1.3. TEMPERATURA

De la ecuación (2.4)

2 mv 2
p= n
3 2

Se deduce que la presión del gas ideal es proporcional a su densidad (la densidad
del gas se determina por el número n de moléculas en la unidad de volumen) y a la
energía cinética media del movimiento de translación de las moléculas. Cuando n es
invariable y, por lo tanto, para un volumen V invariable de gas ( n = N V , donde N
es el número de moléculas en la vasija), la presión del gas solo depende de la energía
cinética media de las moléculas.
Sin embargo, es conocido por la experiencia que para un volumen constante la
presión del gas solo se puede cambiar por un método: calentándolo o enfriándolo; al
calentar el gas crece su presión, al enfriarlo, disminuye. El gas calentado o enfriado,
como cualquier cuerpo, se caracteriza por su temperatura, que es una magnitud
especial utilizada desde hace mucho tiempo en la ciencia, técnica y vida doméstica.
Por consiguiente, deberá existir un enlace entre la temperatura y la energía cinética
media de las moléculas.
Antes de aclarar este enlace examinemos qué magnitud física representa la
temperatura.
Para nuestra vida cotidiana la temperatura es una magnitud que distingue lo
<caliente> de lo <frío>. Y la primera representación sobre la temperatura se originó de
la sensación de calor y frío. Podemos utilizar estas sensaciones conocidas por
nosotros para aclarar la particularidad principal de la temperatura como magnitud
física.
Tomemos tres vasijas. Rellenemos una de ellas con agua caliente y la otra con
agua fría y la tercera con una mezcla de agua fría y caliente. Introduzcamos una
8
mano, por ejemplo, la derecha en la vasija con agua caliente y la izquierda en la vasija
con agua fría. Manteniendo las manos en estas vasijas durante un tiempo
determinado, llevémoslas luego a la tercera vasija. ¿Qué nos indican nuestros
sentidos sobre el agua de esta vasija? A la mano derecha le parece que su agua está
fría, a la izquierda, que está caliente. Pero esta discordancia desaparece si
mantenemos largo rato ambas manos en la tercera vasija. Después de un tiempo
determinado ambas manos empiezan a sentir una sensación, exactamente igual,
correspondiente a la temperatura del agua de la tercera vasija.
Todo consiste en que las manos, que al principio estuvieron en las vasijas con agua
caliente y fría, tenían distintas temperaturas, diferentes una de otra y de la temperatura
en la tercera vasija. Se necesita un tiempo determinado para que la temperatura de
cada mano se haga igual a la temperatura del agua donde están sumergidas.
Entonces la temperatura de las manos se iguala. Las sensaciones serán iguales. Es
necesario, como suele decirse, que en sistema de cuerpos <mano izquierda – mano
derecha – agua> se establezca el equilibrio térmico.
Este experimento sencillo demuestra que la temperatura es una magnitud que
caracteriza el estado del equilibrio térmico: los cuerpos que se encuentran en estado
de equilibrio térmico tienen la misma temperatura, y viceversa, los cuerpos con una
misma temperatura se encuentran, uno con respecto al otro, en equilibrio térmico. Si
dos cuerpos se encuentran en equilibrio térmico con un tercer cuerpo cualquiera,
entonces ambos cuerpos se encuentran entre si en equilibrio térmico. Esta importante
afirmación es una de las leyes fundamentales de la Naturaleza. Sobre ella está basada
la propia posibilidad de medición de la temperatura. En el experimento descrito, por
ejemplo, se trataba del equilibrio térmico de ambas manos después de que cada una
de ellas resultó estar en equilibrio térmico con el agua.
Si un cuerpo o sistema de cuerpos no se encuentran en estado de equilibrio térmico
y si el sistema está aislado (no tiene interacción con otros cuerpos), entonces después
de un tiempo determinado se establece por sí mismo el estado de equilibrio térmico. El
estado de equilibrio térmico, es el estado al cual pasa cualquier sistema aislado.
Después de haber alcanzado tal estado, él no se cambia más y no ocurre en el
sistema ningún cambio macroscópico. Uno de los indicios del estado de equilibrio
térmico es la igualdad de temperaturas en todas las partes del cuerpo o de todo el
sistema de cuerpos. Es conocido que durante el proceso de establecimiento del
equilibrio térmico, es decir, durante el igualamiento de temperaturas de los dos
cuerpos, ocurre una transmisión de calor de un cuerpo a otro. Por consiguiente, desde
el punto de vista experimental, la temperatura del cuerpo es una magnitud que
determina si él transmitirá calor a otro cuerpo con temperatura distinta o lo recibirá de
él.
La temperatura ocupó un lugar especial entre la serie de magnitudes físicas. Esto
no es extraño si se tiene en cuenta que en la época, cuando apareció esta magnitud
en la ciencia, no era conocido precisamente, qué procesos internos originan en la
sustancia la sensación de frío o calor.
La particularidad de la temperatura como magnitud física consiste ante todo en que
ella a diferencia de muchas otras magnitudes no es aditiva. Esto significa, que si
dividimos mentalmente un cuerpo en partes, entonces la temperatura de todo el
cuerpo no será igual a la suma de temperatura de sus partes. En esto se diferencia la
temperatura de las magnitudes, como, por ejemplo, la longitud, volumen, masa, cuyos
valores en el cuerpo total constituyen la suma de los valores de las magnitudes
correspondientes de todas sus partes.
A consecuencia de esto, no se puede medir la temperatura del cuerpo directamente
como se mide la longitud o masa, es decir, por el método de comparación con el
patrón. Si podemos decir de una barra que su longitud es tantas veces mayor que la

9
longitud de otra barra, la pregunta sobre cuántas veces una temperatura se contiene
en otra no tiene sentido.
Para medir la temperatura ya hace mucho tiempo se utiliza el hecho de que un
cuerpo al cambiar su temperatura cambia sus propiedades. Por lo tanto, cambian las
magnitudes que caracterizan estas propiedades. Por eso, para crear un aparato que
mida la temperatura, es decir, el termómetro, se elige cualquier sustancia (sustancia
termométrica) y una determinada magnitud que caracteriza las propiedades del cuerpo
(magnitud termométrica). La elección de una y otra es completamente arbitraria. Por
ejemplo, en los termómetros de vida doméstica, el mercurio es la sustancia
termométrica y la longitud de la columna de mercurio es la magnitud termométrica.
Para que se puedan adjudicar determinados valores numéricos a la magnitud de la
temperatura, hay que dar de antemano tal o cual dependencia entre la magnitud
termométrica y la temperatura. La elección de esta dependencia también es arbitraria:
mientras no exista el termómetro no se puede establecer experimentalmente esta
dependencia. En el caso del termómetro de mercurio, por ejemplo, se elige la
dependencia lineal entre la longitud de la columna de mercurio (volumen de mercurio)
y la temperatura.
Aun nos queda establecer la unidad de temperatura, el grado (a pesar de que por
principio se lo podía expresar en las mismas unidades en que se mide la magnitud
termométrica, por ejemplo, ¡en centímetros, según el termómetro de mercurio!). La
magnitud del grado también se elige arbitrariamente (lo mismo que la sustancia
termométrica, la magnitud termométrica y la forma de la función que liga la magnitud
termométrica con la temperatura). La medida del grado se establece del modo
siguiente. So eligen, otra vez más, arbitrariamente, dos temperaturas (que se
denominan puntos de referencia) — corrientemente son la temperatura de fusión del
hielo y la de ebullición del agua a la presión atmosférica — y se divide este intervalo
de temperaturas en un número determinado (también arbitrario) de partes iguales, de
grados, y a una de estas dos temperaturas se le adjudica determinado valor numérico.
Con ello se determina el valor de la segunda temperatura y de cualquiera otra
intermedia. De tal modo se obtiene la escala de temperaturas. Está claro, que con
ayuda del método descrito se puede obtener un conjunto infinito de termómetros
diferentes y escalas de temperaturas.
La termometría actual está basada en la escala del gas ideal y abastecida con
ayuda del termómetro de gas. Por principio, el termómetro de gas es una vasija
cerrada, rellena de un gas ideal y abastecida con un manómetro para medir la presión
del gas. Esto significa que en tal termómetro sirve de sustancia termométrica un gas
ideal, y de magnitud termométrica, la presión del gas para volumen constante. La
dependencia entre la presión y la temperatura se toma (¡precisamente se toma!) como
si fuese lineal. Tal suposición conduce a que la relación entre las presiones para las
temperaturas de ebullición del agua ( p e ) y de fusión del hielo ( p o ) es igual a la
relación d e estas mismas temperaturas:

p e Te
=
p o To

La relación p e p o se determina fácilmente del experimento. Un gran número de


mediciones indicaron que

p e p o = 1,3661

Por consiguiente, tal es el valor de la relación de temperaturas:

10
TeTo = 1,3661

La medida del grado se elige dividiendo la diferencia Te − To en cien partes:

Te − To = 100

De las dos últimas igualdades se deduce que la temperatura de fusión del hielo To ,
según la escala que elegimos anteriormente, es igual a 273,15 grados y la temperatura
de ebullición del agua Te es igual a 373,15 grados. Para medir la temperatura de
cualquier cuerpo con ayuda del termómetro de gas es necesario poner el cuerpo en
contacto con el termómetro de gas y, esperando hasta el equilibrio, medir la presión p
del gas en el termómetro. Entonces la temperatura del cuerpo T se determina por la
fórmula

273,15
T= p
po
donde p o es la presión del gas en el termómetro, colocado en el hielo en fusión.
En la práctica se utiliza raramente el termómetro de gas. Sobre él recae un papel
más responsable: según él se gradúan todos los termómetros utilizados.
La temperatura igual a cero en nuestra escala, evidentemente, es la temperatura
para la cual sería igual a cero la presión del gas ideal. (Esto no significa que el gas
ideal en realidad se puede enfriar tanto que su presión se hace igual a cero). Si la
magnitud termométrica se hace nula para el cero de la escala termométrica, entonces
tal escala se denomina escala absoluta, y la temperatura contada sobre tal escala se
denomina temperatura absoluta. La escala del termómetro de gas aquí descrita se
considera absoluta. Frecuentemente, también la llaman escala Kelvin, y a la unidad de
temperatura en esta escala, el grado Kelvin (designación: K).
En la técnica y vida doméstica, frecuentemente se utiliza la escala de temperaturas
que se diferencia de la descrita en que a la temperatura de fusión del hielo se le
adjudica el valor cero (para uno misma medida del grado). Esta escala se denomina
escala de Celcius. La temperatura t contada por esta escala está ligada a la
temperatura absoluta T por la relación evidente:

t = T − 273,15
En lo sucesivo utilizaremos la escala Kelvin.
De lo dicho se deduce que la temperatura caracteriza el equilibrio térmico de los
cuerpos: pasando al estado de equilibrio se igualan las temperaturas de los cuerpos, y
en el estado de equilibrio la temperatura de todas las partes del cuerpo o sistema de
cuerpos es una misma: con esto está ligado el proceso de medición de la temperatura.
En efecto, para medir el valor de la magnitud termométrica a las temperaturas de
fusión del hielo y de ebullición del agua es necesario llevar el termómetro al estado de
equilibrio con el hielo en fusión y con el agua hirviendo, y para medir la temperatura de
cualquier cuerpo es necesario asegurar la posibilidad de establecer el equilibrio
térmico entre el termómetro y el cuerpo. Y solamente entonces, cuando se ha
conseguido tal equilibrio, se puede considerar que la temperatura del cuerpo es igual a
la temperatura contada por el termómetro.

11
Por lo tanto, la temperatura es lo que se iguala en el proceso del establecimiento
del equilibrio en el sistema. Pero el propio concepto de igualación significa que se
entrega algo de una parte del sistema a la otra. La ecuación
(2.4) que hemos obtenido para la presión del gas ideal nos
permite comprender qué significa el entregar «algo».
Imaginémonos un cilindro aislado con un gas ideal en el
que se estableció el equilibrio térmico, de modo que la
temperatura es igual en todas las partes del volumen gaseoso.
Supongamos que, sin alterar el equilibrio, colocamos en el
cilindro un émbolo móvil que divide el volumen del gas en dos
partes (fig. 3, a). En las condiciones de equilibrio el émbolo se
encontraría en reposo. Esto significa que durante el equilibrio
son iguales no sólo las temperaturas, sino también las presiones a ambos lados del
émbolo. De acuerdo con la ecuación (2.4) también son iguales las magnitudes
( )
n mv 2 / 2 :

 mv 2   mv 2 
n  = n 
 2   
  izquierda  2  derecha

Infrinjamos ahora, temporalmente, el aislamiento de nuestro cilindro con gas y


calentemos una de sus partes, por ejemplo, la que está al lado izquierdo del émbolo
después de lo cual restablecemos de nuevo el aislamiento. Ahora el gas en el cilindro
no se encuentra en equilibrio, la temperatura T1 en el compartimiento izquierdo es
mayor que en el derecho (fig. 3, b). Pero el gas está aislado y por sí mismo comienza
el paso al estado de equilibrio. Con ello observamos que el émbolo empieza a
moverse de izquierda a derecha. Y esto significa que realiza un trabajo y, por
consiguiente, desde el gas del compartimiento izquierdo se entrega una energía al gas
del compartimiento derecho. Es decir, lo que, se entrega en el proceso de
establecimiento del equilibrio térmico es energía. Después de un tiempo determinado
se suspende el movimiento del émbolo. Pero el émbolo se para después de una serie
de oscilaciones. Y él se para en el mismo sitio, donde se encontraba antes de que se
sometiese al calentamiento del compartimiento izquierdo. Se establece de nuevo el
estado de equilibrio en el cilindro con gas. Pero ahora, naturalmente, la temperatura y
presión del gas son mayores que antes del calentamiento.
Ya que el émbolo se para en el sitio anterior, entonces la concentración de n
moléculas (es decir, el número de moléculas en la unidad de volumen) quedó como
anteriormente. Esto significa, que como resultado del calentamiento del gas sólo
cambió la energía cinética media de sus moléculas. Por lo tanto, la igualación de la
temperatura significa la igualación de los valores de la energía cinética media de las
moléculas por ambos lados del émbolo. Al pasar al equilibrio se transmite una energía
desde una parte del gas a la otra, pero no se iguala la energía de todo el gas como un
todo, sino sólo la energía cinética media referida a una molécula. Precisamente, la
energía cinética media de la molécula se comporta como temperatura.
Estas magnitudes también se parecen en que la energía cinética media igual que la
temperatura es una magnitud no aditiva, es igual para todo el gas y para cualquiera de
sus partes (que contenga un número bastante grande de moléculas). La energía de
todo el gas es una magnitud, naturalmente, aditiva, ella se compone de las energías
de sus partes.
No se debe pensar que nuestros raciocinios sólo se refieren al caso, cuando el gas
del cilindro está dividido en dos partes por el émbolo. Y sin émbolo, al chocar las
moléculas entre sí se intercambiarían energía y se transmitiría de la parte más caliente

12
a la parte menos caliente, en resultado de lo cual se igualaría la energía cinética media
de las moléculas. El émbolo sólo hace visible la entrega de energía, ya que su
movimiento está ligado a la realización de un trabajo.
Los razonamientos sencillos expuestos a pesar de que no son muy rigurosos
demuestran que la magnitud conocida ya hace tiempo, bajo la denominación de
temperatura, es realmente la energía cinética media del movimiento de traslación de
las moléculas. El que hayamos recibido este resultado para el caso del gas ideal, no
cambia la cuestión. No existe fundamento para considerar que esto no se relaciona
también a los cuerpos líquidos y sólidos.
Es cómodo considerar, cuando se aplica el gas ideal, que la temperatura es igual a
dos tercios de la energía cinética media de las moléculas, ya que esto simplifica la
expresión de la fórmula (2.4) para la presión del gas. Designando por Θ la
temperatura determinada de tal forma podemos escribir:

2 mv 2

3 2

Entonces la ecuación (2.4) toma una expresión sencilla:

p = nΘ
Según esta definición, la temperatura debe, naturalmente, medirse en unidades de
energía (en julios para el sistema SI, y en ergios para el sistema CGS). Sin embargo,
no es cómodo utilizar tal unidad de temperatura. Incluso una unidad tan pequeña como
el ergio, es demasiado grande para servir de unidad de medición de la temperatura.
Con su empleo, las temperaturas que se encuentran con frecuencia estarían
expresadas por números ínfimamente pequeños. Por ejemplo, la temperatura de
fusión del hielo sería igual a 5,65⋅10-14 erg. Además, la medición de la temperatura
expresada en ergios, sería muy dificultosa.
Por esta causa e incluso porque se utilizaba la magnitud de temperatura mucho
antes de que fuesen desarrolladas las representaciones cinético-moleculares, que
aclararon el verdadero sentido de la temperatura, la miden en unidades viejas, en
grados, a pesar de la convencionalidad de esta unidad.
Pero si se mide la temperatura en grados, entonces es necesario introducir el
coeficiente correspondiente, que transforme las unidades de energía en grados. Está
admitido designarlo por la letra k. Entonces la ligazón entre la temperatura T, medida
en grados, y la energía cinética media se expresa por la igualdad:

2 mv 2
= kT
3 2

de aquí tenemos

mv 2 3
= kT (3.1)
2 2

Recordemos que la fórmula (3.1) se refiere a la molécula que convenimos en


considerar semejante a un punto. Su energía cinética es la energía cinética del
movimiento de traslación, cuya velocidad puede ser descompuesta en tres
componentes. A causa de los movimientos moleculares caóticos se puede admitir que
13
la energía de las moléculas se distribuye, uniformemente, por todas las tres
componentes de la velocidad, de modo que a cada una de ellas le corresponde la
1
energía kT
2
El factor k que expresa la relación entre la unidad de energía y la unidad de
temperatura, el grado Kelvin, se llama constante de Boltzmann. Es claro, que su valor
numérico se debe establecer experimentalmente. Debido a la importancia particular de
esta constante ella fue determinada por muchos métodos. Expongamos el valor más
exacto de esta constante en la actualidad. En el sistema SI

k = 1,380662 ⋅ 10 −23 J / K

En el sistema CGS

k = 1,380662 ⋅ 10 −16 erg / K

De la fórmula (3.1) se deduce que el cero de temperatura es la temperatura, para la


cual es igual a cero la energía cinética media de los movimientos desordenados de las
moléculas, es decir, la temperatura para la cual se suspende el movimiento caótico de
las moléculas. Esto es aquel cero absoluto, origen de lectura de la temperatura
absoluta, que se citó anteriormente.
De la fórmula (3.1) también se deduce que no pueden existir temperaturas
negativas, ya que la energía cinética es una magnitud esencialmente positiva. Sin
embargo, mas adelante, se mostrará que para determinados sistemas se puede
introducir, formalmente el concepto de temperaturas negativas. Sobre ellas
verdaderamente, no se puede decir que estas temperaturas son mas bajas que el cero
absoluto y que ellas se refieren al estado de equilibrio del sistema.
Ya que la temperatura se determina por la energía media del movimiento de las
moléculas, entonces ella igual que la presión es una magnitud estadística. No se
puede hablar de <temperatura> de una o de unas cuantas moléculas, sobre las
moléculas <calientes> o <frías>. No tiene sentido, por ejemplo, hablar sobre la
temperatura de un gas en el espacio cósmico, donde el número de moléculas en
unidad de volumen es tan insignificante que ellas no forman parte en el sentido
corriente de la palabra y no se puede hablar sobre la energía media del movimiento de
las moléculas.
Las energías ligadas a los movimientos caóticos de las partículas de un gas son
muy pequeñas. De la fórmula (3.1) y del valor expuesto de la constante de Boltzmann
se ve que a la temperatura de 1 K le corresponde una energía igual a 1,38⋅10-23J. Para
la temperatura más baja conseguida en la actualidad (del orden de 10-6 K) la energía
media de las moléculas es igual, aproximadamente, a 10-29J. Incluso la máxima
temperatura conseguida artificialmente, cerca de 100 millones de grados, desarrollada
durante la explosión de la bomba atómica, corresponde a una energía
insignificantemente pequeña de las partículas 10-15J.
En vista de que la temperatura juega un papel muy importante en la Física y
Técnica, ella junto con la longitud, masa y tiempo figura entre las magnitudes
fundamentales del sistema SI y la unidad de temperatura, el grado Kelvin, es una de
las unidades fundamentales de este sistema (la dimensión de la temperatura se
representa por la letra Θ ).
En el SI la unidad de temperatura (grado Kelvin) se establece no a base del
intervalo de temperaturas <temperatura del hielo en fusión – temperatura del agua en
ebullición>, sino a base del intervalo <cero absoluto – temperatura del punto triple del
agua>. El punto triple del agua es la temperatura, para la cual el agua, el vapor y el
14
hielo se encuentran en equilibrio (véase § 130). A la temperatura del punto triple del
agua se le adjudica el valor 273,16 K (exactamente).
De tal modo un grado Kelvin es igual a 1/273,16 parte del intervalo de temperaturas
desde el cero absoluto de temperatura hasta la temperatura del punto triple del agua.
Ya que la temperatura del punto triple del agua es igual a 0,01°C, entonces las
medidas del grado en las escalas de Celsius y de Kelvin son iguales, y cualquier
temperatura puede expresarse bien en grados Celsius(°C) o bien en grados Kelvin
(°K)

1.4. ECUACIÓN DE ESTADO DEL GAS IDEAL

Las representaciones cinético-moleculares desarrolladas anteriormente y las


ecuaciones obtenidas a base de ellas permiten hallar las relaciones, que ligan entre sí
las magnitudes que determinan el estado de un gas. Estas magnitudes son: la presión
P, bajo la cual se encuentra el gas, su temperatura T y el volumen V que ocupa una
determinada masa de gas. A ellas se les llama parámetros de estado.
Las tres magnitudes enumeradas no son independientes. Cada una de ellas es
función de las otras dos. La ecuación que enlaza todas las tres magnitudes –presión,
volumen y temperatura del gas, para su masa dada- se llama ecuación de estado y
puede ser escrita en forma general así:

p = f (V , T )

Esto significa que el estado de un gas se determina sólo por dos parámetros (por
ejemplo, la presión y el volumen, la presión y la temperatura o por ultimo, el volumen y
la temperatura) el tercer parámetro se determina por los otros dos de forma unívoca.
Si la ecuación de estado es conocida en forma explícita, entonces se puede calcular
cualquier parámetro conociendo los otros dos.
Para el estudio de los distintos procesos en los gases (y no sólo en los gases) es
cómodo utilizar la representación gráfica de la ecuación de estado, en forma de curvas
que relacionan uno de estos parámetros con el otro, cuando el tercero está dado y es
constante. Por ejemplo, cuando se da la temperatura constante, la relación entre la
presión del gas y su volumen tiene la forma representada en la fig. 4. A las diferentes
curvas les corresponden diferentes valores de temperatura: mientras más alta sea la
temperatura tanto más alta descansará la curva en el gráfico. En este diagrama el
estado del gas está representado por un punto. La curva que relaciona un parámetro
con otro indica el cambio de estado, llamado proceso en el gas. Así, por ejemplo, las
curvas do la fig. 4 representan el proceso de dilatación o compresión del gas para una
temperatura constante dada. En adelante, utilizaremos ampliamente gráficos
semejantes al estudiar los distintos procesos en los sistemas moleculares.
La ecuación de estado para los gases ideales
se puede obtener fácilmente de las ecuaciones
fundamentales de la teoría cinetica (2.4) y (3.1).
En efecto, poniendo en la ecuación (2.4) en
lugar de la energía cinética media de las
moléculas su expresión de la ecuación (3.1)
obtenemos:
p = nkT (4.1)

Si el volumen V contiene N partículas,


entonces pV = NkT ; poniendo esta expresión
en (4.1) tenemos:

15
pV = NkT (4.2)

Esta ecuación, en la cual entran los tres parámetros de estado, es la ecuación de


estado de los gases ideales.
Sin embargo, es útil transformarla de tal modo que en ella, en lugar del número de
partículas N, difícil de medir directamente, figure la magnitud M de la masa del gas,
fácil de medir. Para tal transformación utilizaremos el concepto de molecula-gramo o
mol. Recordamos que un mol se llama tal cantidad de sustancia, cuya masa
expresada en gramos es igual a la masa molecular relativa de la sustancia (a veces
dicen «al peso molecular»). Esta unidad singular de cantidad de sustancia es notable,
porque como se sabe, un mol de cualquier sustancia contiene un mismo número de
moléculas. En efecto, si designamos las masas relativas de dos cualesquiera
substancias por µ1 y µ 2 , y las masas de las moléculas de estas substancias por m1 y
m2 , entonces podremos escribir las igualdades evidentes:

µ1 = m1 N 1 , µ 2 = m2 N 2 (4.3)

en donde N1 y N2 son los números de partículas en el mol de estas substancias. Ya


µ1 m1
que de la misma definición de la masa relativa se deduce que = , entonces
µ 2 m2
dividiendo la primera de las igualdades (4.3) por la segunda, obtenemos que N1=N2, es
decir, que el mol de cualquier sustancia contiene el mismo número de moléculas. El
número de partículas en el mol que es igual para todas las sustancias se llama número
de Avogadro. Lo designaremos por N0. De tal modo podemos determinar el mol como
unidad de una magnitud especial, la cantidad de sustancia:
1 mol es la. cantidad de sustancia que contiene un numero de moléculas o de otras
partículas (por ejemplo, átomos, si la sustancia está compuesta de átomos), igual al
número de Avogadro.
Si dividimos el número de moléculas N que tiene una masa determinada de gas por
el número de Avogadro N0 obtenemos el número de moles de esta masa. Pero esta
misma magnitud se puede obtener dividiendo la masa M del gas por su masa relativa
µ así pues
M N M
= , de donde, N = N0
µ N0 µ

Pongamos esta expresión para N en la fórmula (4,2). Entonces la ecuación de


estado toma la forma:

M
pV = N 0 kT (4.4)
µ

En esta ecuación entran dos constantes universales, el número de Avogadro N0 y la


constante de Boltzmann k. Conociendo a una de ellas, por ejemplo, la constante de
Boltzmann se puede determinar la otra (número de Avogadro) con un experimento
sencillo, utilizando la misma ecuación (4.4.). Para esto, es necesario coger un gas
cualquiera, con una masa relativa conocida y, llenar con él una vasija de volumen V
conocido, medir la presión p de este gas y su temperatura T y determinar su masa M,
pesando la vasija vacía (evacuada) y luego rellena de gas. El número de Avogadro
resultó igual a 6,02⋅1023 mol-1.
16
El valor del número de Avogadro más exacto en la actualidad es:

N0= 6,0220943⋅1021 mol-1.

El producto de las constantes universales N0 k, evidentemente, también es una


constante universal. Ella recibió el nombre de constante universal de los gases, y,
corrientemente, se designa por R:

R = N0k ≈ 6,02⋅1023⋅1,38⋅10-23 = 8,31 J/mol⋅K = 8,31⋅107 erg/mol⋅K.


(Valor exacto: R = 8,31441 J/mol⋅K).

Sustituyendo en la ecuación (4.4) N0k por la constante universal de los gases R,


obtenemos:
M
pV = RT
µ
(4.5)
A la ecuación de estado del gas ideal representada en tal foram, frecuentemente,
M
se le llama ecuación de Clapeyron – Mendeliev. La magnitud que figura en la
µ
ecuación, representa el número de moles en la masa dada de gas. Para un mol de
gas, es decir. Para el caso cuando M = µ , la ecuación (4.5) tiene la forma:

pV = RT (4.6)

1.5. MOVIMIENTO BROWNIANO

El así llamado movimiento browniano sirve como una de las demostraciones más
convenientes de la realidad del movimiento de las moléculas. Fue descubierto en el
año 1827 por oí botánico ingles Brown al estudiar las pequeñísimas esporas de la
suspensión acuosa. Al mirar con un microscopio de gran aumento, el descubrió que
éstas se encuentran en movimiento desordenado continuo, como si ejecutasen un
baile salvaje y fantástico.
Los experimentos sucesivos demostraron que estos movimientos no están ligados
al origen biológico de las partículas o con cualquier movimiento del líquido.
Semejantes movimientos son realizados por cualesquier partículas pequeñas
suspendidas en el líquido o en el gas. Movimientos desordenados de tal género los
realizan, por ejemplo, las partículas de humo en el aire inmóvil. Tal movimiento
desordenado de las partículas suspendidas en el líquido o en el gas recibió el nombre
de movimiento browniano.
Experimentos especiales mostraron que el carácter del movimiento browniano
depende de las propiedades de líquido o gas en el que están suspendidas las
partículas y no depende de las propiedades de la sustancia de estas partículas. La
velocidad de movimiento de las partículas brownianas crece con el aumento de la
temperatura y con la disminución de las dimensiones de las partículas.
Todas estas leyes son fáciles de explicar si admitimos que los movimientos de las
partículas en suspensión se originan a consecuencia de los choques, que sufren ellas
por parte de las moléculas en movimiento del líquido o gas en que se encuentran
Naturalmente, cada partícula browniana está sometida a tales golpes por todas
partes. Durante el movimiento completamente desordenado de las moléculas,
parecería ser y era de esperar, que el número de choques que recibe la partícula
17
desde cualquier dirección debería ser exactamente igual al número de choques desde
dirección contraria, de manera que todos estos choques deben compensarse
completamente unos con otros y la partícula debe quedarse inmóvil.
Así, precisamente, ocurre si las partículas no son muy pequeñas. Pero cuando
tenemos partículas microscópicas (10-4, 10-5 cm) la cuestión es diferente. Del hecho
que los movimientos moleculares son caóticos, se deduce solamente que en termino
medio el número de choques es igual para las distintas direcciones. Pero en un
sistema tan estadístico como un líquido o gas son inevitables las desviaciones de los
valores medios. Tales desviaciones de los valores medios de unas u otras magnitudes,
que se realizan en un pequeño volumen o durante pequeños intervalos de tiempo, se
llaman fluctuaciones.
Si en un líquido o gas se encuentra un cuerpo de dimensiones corrientes, entonces
el número de choques que sufren por parte de las moléculas es tan grande que no se
pueden apercibir ni golpes separados, ni el predominio casual de golpea en una
dirección sobre los golpes en otra dirección. Para las partículas pequeñas el número
general de golpes que sufren no es relativamente grande, de modo que se hace
sensible el predominio de golpes, ya sea en una o en otra dirección. Precisamente,
gracias a tales fluctuaciones del número de choques, se originan los movimientos
convulsivos tan característicos de las partículas en suspensión que se llaman
movimiento browniano.
Está claro, que los movimientos de las partículas brownianas no son movimientos
moleculares: nosotros vemos no el resultado del choque de una molécula, sino el
resultado del predominio del número de choques en una dirección sobre el número de
golpes en dirección contraria. El movimiento browniano sólo descubre, claramente, la
misma existencia del movimiento molecular desordenado.
De tal modo, el movimiento browniano se explica por que se origina una fuerza
resultante de determinada dirección, como resultado de la desigualdad casual del
número de choques de las moléculas con la partícula en distintas direcciones. Ya que
las fluctuaciones son corrientemente momentáneas, después de un corlo intervalo de
tiempo cambia la dirección de la resultante y junto con ella cambia la dirección de
desplazamiento de la partícula. De aquí que el caos observado en los movimientos
brownianos refleje el caos de los movimientos moleculares.
La explicación cualitativa expuesta del movimiento browniano la completaremos con
el examen cuantitativo de este fenómeno. Su teoría cuantitativa fue dada por primera
vez por Einstein e independientemente por Smolujovsky (el año 1905). Aquí
expondremos la deducción de la consecuencia más fundamental de esta teoría, más
sencilla que la de estos autores.
A consecuencia de la compensación incompleta de los choques de las moléculas
sobre la partícula browniana, como vimos, actúa cierta fuerza resultante F, bajo cuya
acción se mueve la partícula. Además de esta fuerza sobre la partícula actúa la tuerza
de rozamiento f, originada por la viscosidad del medio y dirigida en sentido contrario a
la fuerza F.
Para sencillez supongamos que la partícula tiene forma de esfera con un radio a.
Entonces la fuerza de rozamiento puede ser expresada por la fórmula de Stokes

f = 6πηav
donde η es el coeficiente de rozamiento interno del líquido (o gas), y v es la
velocidad de movimiento de la partícula. La ecuación del movimiento de la partícula
(segunda ley de Newton) tiene por eso la forma:

mr = F − 6πηar (7.1)

18
Aquí, m es la masa de la partícula, r es su radio vector con relación a un sistema de
coordenadas arbitrario, r = v es la velocidad de la partícula y F es la resultante de las
fuerzas originadas por los choques de las moléculas.
Examinemos la proyección del radio vector r sobre uno de los ejes de coordenadas,
por ejemplo, sobre el eje X. Para esta componente la ecuación (7.1) se escribe en la
forma:

mx = Fx − 6πηax (7.2)

donde, Fx es la componente de la fuerza resultante F sobre el eje X.


Nuestra tarea consiste en hallar el desplazamiento x que la partícula browniana
recibe bajo la acción de los choques de las moléculas. Cada partícula está sometida
constantemente a los choques con las moléculas, después de lo cual cambia la
dirección de su movimiento. Las diferentes partículas reciben desplazamientos, que se
diferencian tanto en magnitud como en dirección. El valor probable de la suma de los
desplazamientos de todas las partículas es igual a cero, ya que los desplazamientos
pueden tener con igual probabilidad signo positivo o negativo. El valor medio de la
proyección del desplazamiento x de las partículas, por eso, será igual a cero. Sin
embargo, no será igual a cero el valor medio del cuadrado del desplazamiento, es
decir, la magnitud x 2 , ya que x 2 no cambia su signo cuando cambia el signo de x.
Transformemos, por eso, la ecuación (7.2) de tal modo, que entre en ella la magnitud
x 2 . Para ello, multipliquemos por x ambas partes de esta ecuación

mxx = xFx − 6πηaxx (7.3)

Utilicemos las identidades evidentes:

1 d 2 ( x 2 )  dx  1 d( x2 )
2

xx = −   , xx =
2 dt 2  dt  2 dt

Poniendo estas expresiones en (7.3) obtendremos:

m d 2 (x2 ) d(x2 )
2
 dx 
− m  = −3πηa + xFx
2 dt 2  dt  dt

Esta igualdad es justa para cualquier partícula y por lo cual también es justa para
los valores medios de las magnitudes que figuran en ella, si se toman los valores
medios de un número bastante grande de partículas. Por esta razón, se puede
escribir:

m d 2 (x2 ) d(x2 )
2
 dx 
− m  = −3πηa + xFx
2 dt 2  dt  dt

donde x 2 es el valor medio del cuadrado del desplazamiento de la partícula, y


2
 dx  es el valor medio del cuadrado de su velocidad.
 
 dt 

19
El valor medio de la magnitud xFx que entra en la igualdad es igual a cero ya que
para un gran número de partículas x y Fx pueden tomar con la misma frecuencia tanto
valores positivos como negativos.
Por eso la ecuación (7.2) toma la forma:

( )
m d 2 x2
− m
 dx 
  = −3πηa
2
d x2 ( ) (7.4)
2 dt 2  dt  dt

2
 dx  representa en esta ecuación el valor medio del cuadrado de la
La magnitud  
 dt 
proyección de la velocidad sobre el eje X. Ya que el movimiento de las partículas es
completamente caótico, entonces los valores medios de los cuadrados de las
proyecciones de la velocidad, según todos los tres ejes de coordenadas, deberán ser
iguales unos a otros, es decir,

2 2 2
 dx   dy   dz 
  +  + 
 dt   dt   dt 

Es también evidente, que la suma de estas magnitudes deberá ser igual al valor
medio del cuadrado de la velocidad v 2 de las partículas:

2 2 2
 dx   dy   dz 
  +  +  = v
2

 dt   dt   dt 

Por consiguiente,

2
 dx  1 2
  = v
 dt  3
De tal modo, la expresión que nos interesa, que figura en (7.4) es igual a:

2
 dx  1 2 mv 2
m  = mv 2 =
 dt  3 3 2

mv 2
La magnitud es la energía cinética media de la partícula browniana. Al chocar
2
las partículas brownianas con las moléculas del liquido o gas se intercambian con ellas
la energía y se encuentran en equilibrio térmico con el medio en donde se mueven.
Por eso la energía cinética media del movimiento de traslación de la partícula
browniana deberá ser igual a la energía cinética media de las moléculas de líquido (o
gas) que como sabemos es igual a 3/2 kT:

mv 2 3
= kT
2 2

y por consiguiente,

20
2
 dx  2 mv 2
m  = = kT
 dt  3 2

La circunstancia de que la energía cinética media de la partícula browniana sea


igual a 3/2 kT (lo mismo que para la molécula gaseosa) tiene una importancia de
principio. En efecto, la ecuación fundamental (3.1) deducida anteriormente, es justa
para cualesquiera partículas que no actúan una sobre la otra, que realizan un
movimiento caótico. Es indiferente que las partículas sean moléculas invisibles para el
ojo, o partículas brownianas mucho mayores que contengan miles de millones de
moléculas. La partícula browniana se puede considerar, desde el punto de vista
cinético-molecular como una molécula gigante. Por eso, la expresión de la energía
cinética media para tal partícula debe ser la misma que para las moléculas. Las
velocidades de las partículas brownianas, desde luego son incomparablemente
menores en correspondencia a su mayor masa.
Volvamos ahora a la ecuación (7.4) y teniendo en cuenta (7.5) escribámosla en la
forma:
( )
m d 2 x2
− kT = − 3πηa
d x2 ( )
2 dt 2 dt

Esta ecuación se integra fácilmente. Designando


d x2 ( )
obtenemos:
dt

m dZ
− kT = −3πηaZ
2 dt

y después de la separación de variables, nuestra ecuación se transforma en

dZ 6πηa
=− dt
kT m
Z−
3πηa

Integrando la parte izquierda de esta ecuación entre los límites de 0 hasta Z, y la


parte derecha desde 0 hasta t, obtenemos:

6πηa
Z t
dZ
∫0 kT
= −∫
m
dt
Z− 0
3πηa

o bien

 kT   kT  6πηa
In Z −  − In −  = − t
 3πηa   3πηa  m

De donde

Z=
kT 
1 − e

6πηa
m
t
= ( )
 d x2
3πηa  
 dt
21
6πηa
Fácilmente nos podemos cerciorar que la magnitud e − m t es insignificantemente
pequeña para las condiciones corrientes del experimento. En efecto, las medidas de
las partículas brownianas no sobrepasan de 10-4 cm, la viscosidad del líquido por lo
común es próxima a la viscosidad del agua, es decir, aproximadamente igual a 10 -2 (en
el sistema de unidades CGS), la densidad de la sustancia de las partículas es del
orden de la unidad. Teniendo presente, que la masa m de la particula es igual a
4 3 6πηa
πa ρ , obtenemos que el exponente −
m
t , para t > l0--5s, es tal que la magnitud
3
6πηa
− t
se puede despreciar. Por consiguiente, si el intervalo de tiempo entre las
e m

observaciones consecutivas de las partículas son superiores a 10-5s, lo que


naturalmente, siempre tiene lugar, entonces:

d 2
dt
( )
x =
kT
3πηa
(7.6)

Para intervalos de tiempo ∆t finitos y para los desplazamientos ∆x2


correspondientes, la ecuación (7.6) se puede escribir en la forma:

∆x2 kT
= (7.6a)
∆t 3πηa

de donde

kT
∆x2 = ∆t (7.7)
3πηa

El valor del cuadrado del desplazamiento de la partícula browniana en el intervalo


de tiempo ∆t a lo largo del eje X, o de cualquier otro eje, es proporcional a este
intervalo de tiempo.
La fórmula (7.7) permite calcular el valor medio del cuadrado de los
desplazamientos, tomándose la media para todas las partículas participantes del
fenómeno. Pero esta fórmula es justa, también, para el valor medio del cuadrado de
muchos desplazamientos sucesivos de una sola partícula en iguales intervalos de
tiempo. Desde el punto de vista experimental es más cómodo observar, precisamente,
los desplazamientos de una partícula. Estas observaciones fueron hechas por Perrin
en el año 1909.
Perrin observó el movimiento de las partículas a través de un microscopio, cuyo
ocular estaba dotado de una red de líneas perpendiculares entre sí, que servían de
sistema de coordenadas. Utilizando esta red, Perrin señaló en ella las posiciones
sucesivas de la partícula escogida por él después de determinados intervalos de
tiempo ∆t (30 s). Uniendo luego los puntos, que indicaban las posiciones de la
partícula, obtuvo un cuadro semejante al representado en la fig. 7. En esta figura están
indicados tanto los desplazamientos de las partículas, como de sus proyecciones
sobre el eje X.
Es necesario tener en cuenta, que los movimientos de la partícula son mucho más
complejos de lo que se puede juzgar según la fig. 7, ya que aquí están señaladas las
posiciones después de intervalos de tiempo no muy pequeños (del orden de 30 s). Si

22
disminuimos estos intervalos, entonces resulta que cada segmento rectilíneo de la fig.
7 se desarrolla en una trayectoria en zigzag, tan compleja, como la de toda la figura.

En sus observaciones, Perrin pudo medir los desplazamientos ∆x y calcular los


valores medios de sus cuadrados. Los datos de estas mediciones estaban en buena
concordancia con la fórmula (7.7). De esta forma se ratificó la justeza de la explicación
cinético-molecular del fenómeno del movimiento browniano y de la misma teoría
cinético-molecular.
La fórmula (7.7) puede ser utilizada para determinar la constante k de Boltzmann si
son conocidos los valores de la viscosidad η del líquido, de su temperatura T y del
radio a de la partícula. El valor de esta constante obtenida por Perrin y otros
investigadores a base de semejantes mediciones es próximo al valor citado
anteriormente de k = 1,380⋅10-16 erg/grad. Indiquemos aquí, que el mismo Perrin utilizó
los datos que obtuvo para determinar el número de Avogadro según la fórmula
R
N0 = ya que la constante R puede ser determinada de la ecuación de estado.
k
Los experimentos de Perrin tuvieron un gran valor para fundamentar por fin la teoría
cinético-molecular.

1.6. FORMULA BAROMÉTRICA

Los movimientos moleculares caóticos conducen a que las partículas del gas se
distribuyan uniformemente por el volumen de la vasija, de modo que en cada unidad
de volumen en término medio se contiene el mismo número de partículas. En el estado
de equilibrio, la presión y temperatura también son iguales en todo el volumen. Pero
esto ocurre así, sólo en el caso, cuando sobre las moléculas actúan fuerzas externas.
Con la existencia de tales fuerzas, los movimientos moleculares conducen a un
comportamiento particular de los gases.
Examinemos, por ejemplo, un gas (aire) que se
encuentra bajo la acción de la fuerza de gravedad. Si
no existiese el movimiento térmico de las moléculas,
todas ellas «caerían» sobre la Tierra bajo la acción
de la fuerza de gravedad y todo el aire formaría una
capa delgadísima sobre la superficie de la Tierra. Si no
existiese la fuerza de gravedad, pero existiesen los
movimientos moleculares, las moléculas se
dispersarían por todo el espacio universal. La
existencia de la atmosfera, como envoltura aérea de la
Tierra, en su forma actual, es debida a la presencia

23
conjunta del movimiento térmico de las moléculas y de la fuerza de atracción a la
Tierra. Con ello se establece una distribución de las moléculas, completamente
determinada, según la altura de la atmósfera. En correspondencia a esta distribución
de las moléculas se establece una ley determinada para el cambio de presión de un
gas con la altura que no es difícil hallar.
Examinemos una columna vertical de aire (fig. 8). Supongamos, que al nivel de la
Tierra, donde x=0, la presión es igual a p0 y a la altura x es igual a p. Al cambiar la
altura en dx la presión cambia en dp. La presión del aire a una altura determinada será
igual, como es sabido, al peso de la columna vertical de aire que se encuentra a esta
altura sobre una superficie igual a la unidad. Por eso, dp es igual a la diferencia de los
pesos de las columnas de aire sobre la unidad de superficie a las alturas x y x + dx, o
sea, igual al peso de la columna de aire de altura dx y superficie de la base de una
unidad dp=-pg dx, donde p es la densidad del aire (la masa de la unidad de volumen) y
g es la aceleración de la fuerza de gravedad. La densidad p del gas es igual,
evidentemente, al producto de la masa m de la molécula por el número n de ellas en la
unidad de volumen:

p = mn
p mp
De la teoría cinética se sabe [fórmula (4.1)] que n = . Por consiguiente, p =
kT kT
mg
y dp = − pdx
kT

Esta ecuación (para la separación de variables) se puede escribir en la forma:

dp mg
=− dx (8.1)
p kT

Si consideramos que la temperatura es la misma a cualquier altura (lo que no es


justo en general), entonces, integrando esta ecuación, obtenemos:

mg
In p = − x + In C (8.1a)
kT

donde C es la constante de integración. De aquí

mg
− x
p = Ce kT (8.1b)

La constante C se determina de la condición, que para x = O la presión p = p 0.


Poniendo en la ecuación (8.1b) estos valores de x y p, obtenemos

C = p0

Por consiguiente, la relación que nos interesa entre la presión del aire y la altura
sobre la superficie de la Tierra tiene la forma:

mg
− x
p = po e kT (8.2)

24
µ
O teniendo en cuenta que m = ( µ es el peso molecular, es decir, la masa del
N0
mol, N0 es el número de Avogadro), obtenemos:

µg
− x
p = p0 e RT (8.2a).

La ecuación (8.2) que establece la ley de disminución de la presión con la altura se


llama fórmula barométrica. De esta ecuación se ve que la presión del gas disminuye
con la altura según la ley exponencial. Para determinar la altura sobre la tierra se
utiliza esta ley, midiendo la presión a la altura dada y al nivel del mar (natural-mente, la
última es suficiente medirla una sola vez).
Los aparatos que sirven para medir la altura de cúspides montañosas, del vuelo de
los aviones, etc., son unos barómetros especiales, cuya escala está graduada
directamente en metros. Sin embargo, para casos finos es necesario introducir en la
ecuación (8.2) una corrección de la temperatura que, como se sabe, disminuye con el
aumento de altura, mientras que la fórmula barométrica fue obtenida por nosotros con
la suposición de la constancia de temperatura a cualquier altura.
Utilizando la fórmula barométrica (8.2), también se puede determinar la constante
de Boltzmann, pero en este caso la exactitud no es muy grande debido precisamente a
la corrección de temperatura.
Ya que la presión de un gas, como vimos anteriormente, es proporcional al número
n de moléculas en la unidad de volumen ( p = NkT ), entonces la fórmula (8.2) también
expresa la ley de disminución de la densidad de las moléculas con la altura

mg
− x
n = n0 e kT (8.3)

donde n y n0 son los números de moléculas en una unidad de volumen en los puntos,
entre los cuales la diferencia de alturas es igual a x. Esta fórmula, así como la fórmula
(8.2a), indica que la atmósfera de la Tierra debe prolongarse hasta el infinito.
Al deducir la fórmula barométrica (8.2a) o (8.3) suponíamos que la aceleración de la
fuerza de gravedad g era constante, es decir, no dependía de la altura x. A base de
esto, al integrar la ecuación (8.1) sacamos a g fuera del signo integral. Tal
simplificación es aceptable para valores de x relativamente pequeños (del orden de
decenas de kilómetros). Para grandes alturas es necesario tener en cuenta, que la
aceleración da la fuerza de gravedad disminuye a la medida que nos separamos de la
superficie de la Tierra. En efecto, de la ley de gravitación universal se deduce que a la
distancia r desde el centro de la Tierra, la aceleración de la gravedad es

M M
g = (r) = γ =γ
r 2
( r0 + x ) 2
donde γ es la constante de gravitación (en el sistema SI tiene el valor
γ = 6,67 × 10 −11 N ⋅ m 2 / kg 2 y en el sistema CGS γ = 6,67 ⋅ 10 −8 din ⋅ cm 2 / g 2 ), M es la
masa de la Tierra y r0 es el radio de la Tierra. Por eso, la ecuación (8.1) deberá ser
escrita en la forma

dp Mm dx
= −γ
p kT ( r0 + x ) 2
25
Después de la integración obtenemos:

Mm 1
In p = γ + In C
kT r0 + x

o bien

 Mm 1   M m r02   mg r02 
p = C exp γ  = C exp γ 2  = C exp 
 kT r0 + x   ro kT r0 + x   kT r0 + x 
(8.4)

La constante de integración C se determina de la condición que para x = 0, la


presión es p = p0. Poniendo estos valores de x y p en (8.4) obtenemos:

mgr0

C = p0 e kT

y la dependencia entre la presión y la altura tiene, finalmente, la forma:

 mgr0  r 
p = p 0 exp−  1 − 0  (8.5)
 kT  r0 + x 

De esta fórmula se deduce el resultado, paradojo a primera vista, de que incluso a


una distancia infinita de la Tierra, es decir, cuando x→∞ la presión no es igual a cero:

mgr0

p∞ = p 0 e kT

Esto significa, que la atmósfera de la Tierra (como la de otros planetas) debería


prolongarse hasta el infinito y en ningún lugar debería ser igual a cero la densidad de
su gas. Ya que esto es, físicamente, imposible (el número de moléculas es finito
mientras que el volumen del universo es infinito), entonces es necesario suponer que
la atmósfera de la Tierra no se encuentra en estado de equilibrio. La ausencia del
estado de equilibrio consiste en que el gas atmosférico ininterrumpidamente se
dispersa en el universo. Esto, sin embargo, no condujo (ni conducirá durante miles de
millones de años) a que la Tierra perdiese su atmósfera, ya que sólo una insignificante
parte de partículas de aire abandonan la envoltura atmosférica de la Tierra.
Pero esta situación pudo conducir a la pérdida de la atmósfera en la Luna, si es que
la tuvo en el pasado (véase abajo con más detalle).

1.7. LEY DE BOLTZMANN

La fórmula barométrica obtenida anteriormente, se refiere al caso cuando el gas se


encuentra bajo la acción de la fuerza de gravedad. La magnitud mgx en la fórmula
mg
− x
(8.3) n = n e kt representa la energía potencial de la molécula a la altura x. Por eso,
0
se puede decir que la fórmula (8.3) nos da el número n de partículas, cuya energía es
U = mgx, si el número de partículas con energía igual a cero es n0 (x se cuenta desde

26
el origen). No existe ningún fundamento para considerar que la conducta de un gas
cambia esencialmente si actúa sobre él, en lugar de la fuerza de gravedad otra fuerza
cualquiera, y que ja expresión de la energía toma otra forma. Si el Cas se encuentra
en cualquier campo de fuerzas, de modo que sus partículas poseen cierta energía
potencial, entonces el número de partículas quo poseen la energía U dada se
determina por la fórmula
U

n = no e kT
(9.1)

La fórmula (9.1) se llama ley de Boltzmann. Ella permite determinar la parte de


partículas que, en las condiciones de equilibrio térmico, poseen una energía U:

U

n =e kT
no (9.2)

n
De la fórmula (9.2) se ve que la parte de partículas con una energía U dada
n0
depende, además del valor de esa energía, solamente de la temperatura. Esto permite
tratar a la misma temperatura de una forma algo distinta, precisamente como magnitud
de la cual depende la forma de distribución de las partículas según su energía.
Para una temperatura dada la parte de moléculas, que poseen una u otra energía U',
depende del valor de U y disminuye, rápida mente, con el aumento de U. Esto
significa, que la parte de moléculas con una gran energía siempre es muy pequeña.
n
Cuanto más baja sea la temperatura, tanto más rápido disminuirá con el aumento
n0
de U.

1.8. CONCEPTO DE PROBABILIDAD

La ley de Boltzmann, así como la fórmula barométrica se puede tratar más


cómodamente desde otro punto de vista, utilizando el concepto de probabilidad.
Recurrimos a esté término, a diferencia de la «certeza» o «determinación», en los
casos, cuando se trata de sucesos casuales, es decir, aquellos cuyas condiciones de
aparición por unas u otras causas no son conocidas, y que por eso no se puede prever
de antemano-con seguridad.
Al adquirir, por ejemplo, un billete en el tranvía, corrientemente, no sabemos de
antemano si el número será par o impar. Por eso, tal «suceso» como la adquisición de
un billete, precisamente, con número par se puede considerar como un suceso casual.
Si adquirimos, por ejemplo, 10 billetes (claro está, no en una adquisición), entre ellos
pueden hallarse tres, seis u ocho billetes con números pares. Pero también puede
ocurrir que entre ellos no se halle ningún par, o al revés, que sean pares todos los 10
billetes.
Sin embargo, en esta aparente arbitrariedad completa existe una ley determinada.
Ella consiste en que, si repetimos el experimento (la compra de billetes) un número de
veces suficientemente grande, entonces en la mitad de los casos, aproximadamente,
el billete tendrá un número par. Y mientras mayor sea el número de tales
«experimentos», tanto más próxima a la mitad será la parte de billetes con números
pares. En tal caso se dice que la probabilidad de adquirir billetes con número par es
igual a ½.
Del mismo modo, podemos tener la seguridad de que al lanzar <muchas veces
la/moneda, aproximadamente en la mitad de los casos caerá con la parte del escudo
27
mirando hacia arriba. Y esto será tanto más cierto, cuanto mayor sea el número de
lanzamientos.
Estos experimentos y otros semejantes nos permiten dar la siguiente definición de
la probabilidad:
La probabilidad de un suceso se llama el límite al cual tiende el .cociente entre el
número de experimentos, que llevan a su realización, y el número total de
experimentos, cuando este último aumenta infinitamente.
Si del número N de experimentos (u observaciones), N' llevan a la realización del
suceso que nos interesa, entonces la probabilidad W de este suceso se expresará por
la fórmula:

N`
W = lim
N →∞ N

En el caso que hemos examinado con los números de los billetes, la probabilidad
del número par es igual a 1/2. Naturalmente, tal será la probabilidad del número impar.
La suma de estas dos probabilidades es igual a la unidad. Ella nos da, evidentemente,
la probabilidad del «suceso» consistente en que el billete tenga un número par o
impar. Pero tal suceso es inevitable, o sea que la probabilidad igual a la unidad,
significa la certeza. Por el contrario, si cualquier suceso no es posible (por ejemplo, la
falta absoluta de números), entonces su probabilidad es igual a cero.
En el ejemplo con los billetes (lo mismo que con el lanzamiento de las monedas) el
«experimento» (la compra de billetes'), puede llevar a uno de los dos resultados: el
número de billete puede ser par o impar, y ambos resultados tienen la misma
posibilidad. Pero no siempre ocurre así. Por ejemplo, del hecho de que al tirar sobre el
blanco son posibles sólo dos resultados, acertar o errar, no se deduce que la
probabilidad de acertar es igual a 1/2, ya que el acertado o yerro no son resultados de
tiro igualmente posibles. Y si se realiza un gran número de disparos, la relación entre
el número de aciertos y el número de disparos, es dudoso que sea igual a la mitad:
para el tirador hábil, abastecido con un arma de buen reglaje, será próximo a la
unidad, para el mal tirador se diferenciará poco de cero. Sin embargo, a pesar de que
la probabilidad de cada uno de los dos resultados de tiro posible no es igual a 1/2, su
suma también en este caso será igual a la unidad: |se puede afirmar con completa
seguridad que el tiro conduce a un resultado determinado, acierto o yerro!.
Teorema de la suma de probabilidades. Examinemos ahora otro ejemplo que nos
permite formular uno de los principios más importantes de la teoría de probabilidades,
y además nos da todavía otra definición do la propia magnitud de la probabilidad. Ella
será útil en lo sucesivo.
Supongamos que en una caja se encuentran 20 bolas pulidas, completamente
iguales según sus dimensiones y peso, y supongamos que 5 de ellas están pintadas
de color blanco y las restantes, de negro. Si sacamos ahora de la caja una bola, ya
que las bolas no se diferencian una de la otra en nada, a excepción del color, está
claro, que la probabilidad de sacar una bola cualquiera será igual a la probabilidad de
sacar otra cualquiera. Para cada bola que deseásemos señalar de cualquier forma, la
probabilidad de que sea sacada es evidentemente igual a 1/20.
Examinemos ahora ¿qué probabilidad hay para que sea sacada una bola blanca?
Ya que para cada bola (lo mismo da blanca que negra) la probabilidad de que sea
sacada es igual a 1/20 y en total hay 5 bolas blancas (y nos es igual cuál se sacará de
ellas), entonces la probabilidad buscada será igual a la suma de las probabilidades de
todas las bolas blancas:
1 1 1 1 1 5
W= + + + + =
20 20 20 20 20 20

28
Este resultado expresa uno de los principios más importantes de la teoría de
probabilidades, el teorema de la suma de probabilidades, que dice así:
Si Wlt Wa, W3, etc., son las probabilidades de varios sucesos que se excluyen unos
a otros, entonces la probabilidad de que se realice uno cualquiera de ellos es igual a la
misma de las probabilidades de todos estos sucesos.
Esto significa, que la suma de probabilidades de varios sucesos nos da la
probabilidad de que se realice o uno, o el otro, o el tercero, etc. Aquí suponemos que
estos sucesos, o aunque sea dos de ellos, no pueden ocurrir al mismo tiempo. De
modo que en nuestro ejemplo la probabilidad de sacar una de las bolas blancas es
5/20, y ya que la operación de sacar la bola se realiza sólo una vez, si se ha sacado
una bola blanca, ya no se puede sacar ninguna otra.
El ejemplo expuesto nos permite dar una nueva definición de la probabilidad que se
diferencia un poco de la anterior. Hemos halla-do que la probabilidad de ser sacada
una bola blanca es igual a 5/20. Pero el número 20 es el número de todos los
resultados posibles de la operación de sacar la bola, y el número 5 es el número de
casos (de los 20 posibles) que favorecen la realización del suceso dado, la aparición
de la boja blanca.
Esto precisamente, permite definir la probabilidad del suceso dado como el cociente
del número de casos que favorecen su realización y el número total de casos posibles
si iodos los casos son igualmente posibles,
Esta definición de la probabilidad pertenece a Laplace. Como se ve fácilmente, ella
no contradice a la definición anterior. En la definición de la probabilidad, que
acabamos de exponer, es de importancia el hecho de que todos los casos sean
igualmente posibles, igualmente probables. Precisamente así está planteada la
cuestión en nuestro ejemplo con las bolas.
En las aplicaciones de la teoría de probabilidades en la Física, corrientemente,
también solemos encontrarnos con sucesos igualmente probables.
Volvamos ahora a la fórmula .de la ley de Boltzmann (9.2). De todo la que fue dicho
aquí sobre la probabilidad, está claro que la magnitud n/na tiene en esta fórmula,
precisamente, el sentido de probabilidad. En efecto, cualquiera de las n0 moléculas
puede poseer la energía potencial U. Es decir, n0 es el número total de casos posibles.
Bn realidad, n moléculas poseen esta energía U. Por consiguiente, n es el número que
denominábamos anteriormente número de casos «favorables». Por eso, la relación
n/n0 que llamábamos (completamente fundamentado) parte de moléculas que poseían
la energía U, es al mismo tiempo la probabilidad de que cualquiera de las n0
moléculas posea tal energía.
Teorema de la multiplicación de probabilidades. Todavía nos | queda por
exponer otro principio importante de la teoría de probabilidades, el teorema de la
multiplicación de probabilidades. El se refiere al caso, cuando se determina la
probabilidad de un suceso complejo consistente en la simultaneidad de dos o más
sucesos independientes. Los sucesos se llaman independientes, si la probabilidad de
uno de ellos no depende de que se realice o no, otro cualquiera. Volviendo a los
ejemplos anteriores con los billetes y el tirador podemos, por ejemplo, plantear la tarea
siguiente: ¿cuál es la probabilidad de que el tirador, al dirigirse al campo de tiro en el
tranvía, adquiera un billete con número par, y que luego su primer disparo sea
coronado con el éxito? Es claro que estos dos sucesos son independientes.
Supongamos que para nuestro tirador la probabilidad W1 de acertado es igual a
0,8. Esto significa, que de las 10 asistencias al campo de tiro, en ocho casos caerá en
el blanco del primer disparo. Pero con esto, solamente en la mitad de ellas, al mismo
tiempo adquiere te billete con número par, ya que la probabilidad Wt de recibir tan
billete par es igual' a 1/2. Es decir, la probabilidad WJt buscada del suceso complejo,
la coincidencia de un número par con el disparo acertado, es igual al producto de las
probabilidades de cada uno de ellos:

29
W12 = W1W2 = 0.8 * 0.5 = 0.4

La probabilidad de simultaneidad de dos o varios sucesos independientes es igual


al producto de las probabilidades de cada uno de ellos por separado.
Probabilidad y valor medio de una magnitud. En los párrafos anteriores ya hemos
utilizado repetidamente los valores medios de distintas magnitudes físicas que
caracterizan el movimiento de las partículas: velocidad media, energía media, etc.
Recurrimos a este método de descripción de los sistemas moleculares, porque para el
gran número de partículas, de las que están compuestos, no existe posibilidad ni
necesidad de considerar las magnitudes referentes a cada una de ellas por separado.
Como vimos, la utilización de los valores medios de las magnitudes no nos estorbó
para obtener leyes completamente exactas, como, por ejemplo, la ecuación de estado
" de los gases ideales.
No es difícil ver que los valores medios de las magnitudes físicas también están
íntimamente ligados al concepto de probabilidad. A causa de los movimientos
desordenados continuos de las partículas, cualquier sistema molecular deberá pasar,
durante un intervalo de tiempo bastante amplio a través de una serie innumerable de
estados que se sustituyen unos a otros de un modo complicado, debido a las múltiples
acciones intermoleculares. Nuestro sistema permanecerá en cada estado no sólo una
vez, sino muchas veces. Supongamos que es necesario determinar una magnitud
cualquiera a, que se refiere al sistema o a una cualquiera de sus partes. Para eso,
tendremos que realizar (claro está, mentalmente) un conjunto de observaciones sobre
el sistema en sus distintos estados. Designemos por N el número de tales
observaciones. Entonces, resulta que para N1 observaciones (de las N), la magnitud
que nos interesa tiene valor a1, N2 observaciones nos dan para a el valor a2, etc. Por
definición el valor medio de a será igual a:

a=
N 1 a1 + N 2 a 2 + N 3 a 3 + ...
=
∑N a 1 1

N 1 + N 2 + N 3 + ... ∑N 1

Ya que la suma es igual al número total de observaciones N, entonces

a=
N1 N
a1 + 2 a 2 + ..... =
∑N 1
a1
N N ∑N
Pero N1/N, es decir, el cociente del número de observaciones para las cuales la
magnitud a tiene un valor a1 y del número total de observaciones N es la probabilidad
de este valor. Exactamente igual, N2/N es la probabilidad de que el valor de a sea
igual a a2, etc. Por consiguiente, el valor medio de la magnitud a es igual a la suma de
los productos de sus distintos valores por las probabilidades correspondientes.
a = W1 a1 + W2 a 2 + W2 a 2 + .... = ∑ Wi ai

Ya indicamos que las leyes de la Física Molecular siempre tienen un carácter


probable, pero no pierden a causa de esto su exactitud y precisión. Esto ocurre así,
porque las magnitudes físicas que describen cualquier sistema, que se encuentre en
condiciones externas invariables, también resultan ser, prácticamente, constantes e
iguales a sus valores medios. En estos casos se dice que el sistema se encuentra en
estado de equilibrio. Esta cuestión se examinará más detalladamente en adelante.

30
1.9. CONCEPTO DE DISTRIBUCIÓN. FUNCIÓN DE DISTRIBUCIÓN

Como sabemos, en las ecuaciones fundamentales de ip teoría: cinética de los


gases ideales-figura la energía cinética media de las moléculas, que a su vez se
determina por su velocidad cuadrática media. El sentido de velocidad cuadrática media
consiste en que es la velocidad que deberían poseer todas las moléculas (si las
magnitudes de sus velocidades fuesen iguales y sus direcciones, de igual
probabilidad), para que la presión del gas fuese la que es en realidad. De hecho, las
velocidades do las moléculas no son iguales, y esto incluso lo tuvimos en cuenta al
deducir la ecuación fundamental. Los hechos experimentales señalan esto.
Así, por ejemplo, en los experimentos de Stern; en los cuales se "inedia la
velocidad de las moléculas, la banda desplazada no resaltó ser nítida, sino borrosa
debido a que las moléculas con distintas velocidades caían en distintos lugares del
blanco. Sobre esto, también testimonia la ley, examinada en el § 8, de distribución de
las moléculas según su altura en el campo giratorio (fórmula barométrica). Si todas las
moléculas tuviesen la misma velocidad, su distribución sería completamente diferente.
En efecto, imaginémonos que todas las moléculas que se encuentran cerca de la
superficie de la Tierra tienen una misma velocidad, cuya componente vertical es igual
a u. Estas moléculas se elevarían hasta la altura x, determinada por la condición:

mu 2
= mgx
2 ,

es decir, hasta la altura


u2
x=
2g ,

después de lo cual volverían a la Tierra con la energía cinética inicial, es decir, se


comportarían corno se comporta cualquier cuerpo lanzado hacia arriba. En tales
condiciones, la atmósfera tendría una frontera brusca a la altura £, fuera de cuyos
límites no existiría. La experiencia, sin embargo, indica que la atmósfera no tiene
frontera brusca, su densidad disminuye con la altura de acuerdo con la fórmula
barométrica. De tal modo, la suposición sobre la igualdad de la velocidad de todas las
moléculas contradice a la experiencia.
Debido a los movimientos desordenados de las moléculas y a sus choques mutuos,
las moléculas de un gas se distribuyen según sus velocidades de tal modo que entre
ellas se encuentran tanto las muy rápidas como las muy lentas. A pesar del caos
completo de los movimientos moleculares, a pesar del carácter casual de los choques
y de los cambios de velocidad de las moléculas originados por ellos, la distribución de
las moléculas según sus velocidades, como demuestra la teoría y la experiencia,
resulta ser no casual, no arbitraria, sino completamente determinada. En su carácter
no influyen ni los choques entre las moléculas, ni incluso el campo exterior. Resulta ser
unívoco y el único posible. Y esto no sólo no contradice a la representación del
carácter caótico de los movimientos moleculares, sino que precisamente se condiciona
por éste.
Antes de comenzar la deducción de la ley de distribución de las moléculas según
sus velocidades, aclaremos la esencia de la tarea sobre la distribución. Determinar la
distribución de las moléculas según sus velocidades, parece ser que significa
determinar el número de moléculas que poseen una u otra velocidad dada. Sin
embargo, la pregunta no tiene sentido en este aspecto, ya que el número pro bable de
moléculas que tienen exactamente (matemáticamente exacta) la velocidad dad?, es
31
igual a cero, El número de valores de velocidades distintas es infinitamente grande y el
número de moléculas es finito. Por eso, el número de moléculas que corresponden a
cada valor de la velocidad dado arbitrariamente, es igual a cero. A consecuencia de
esto, la pregunta debe formularse de otro modo: ¿cuántas moléculas (o qué parte de
moléculas) poseen velocidades comprendidas en un determinado intervalo, próximo a
la velocidad dada?
Precisamente así se plantea siempre la tarea estadística. Si se exige, por ejemplo,
hallar la distribución de la población de un país según su edad, esto no significa que es
necesario determinar el número probable de personas que tienen una u otra edad
exacta (matemáticamente exacta). Tal pregunta no tiene sentido, ya que el número de
distintos valores de edad es infinitamente grande y el número de personas es finito. Se
puede, solamente, determinar el número probable de personas, cuya edad está
comprendida en un intervalo de valores determinado. Cuando hablamos en nuestra
conversación diaria que aquel hombre tiene 18 años, con esto no queremos decir que
al tiene justo 18 años, O días, O minutos, O segundos. Nuestra, afirmación significa,
solamente, que su edad so encuentra en el intervalo entre 18 y 19 años. Lo mismo,
por ejemplo, cuando el Ministerio de Instrucción Pública planifica el trabajo de las
escuelas en el año escolar, al interesarse del número de niños de siete años de edad
que ingresan en la escuela, no se interesa de aquellos niños que el 1 de septiembre, a
las 8 de la mañana cumplen exactamente los 7 años. En realidad, le interesa el
número de niños, cuya edad se encuentra entre los siete y ocho años.
Función de distribución. Al estudiar la distribución de las partículas según sus
velocidades, buscaremos también el número de' partículas cuyas velocidades (o
cuyas componentes de velocidad) se encuentran en un determinado intervalo de
valores de velocidad (o de sus componentes).
Es evidente, que el número de partículas Δn en una unidad de volumen cuyas
velocidades se encuentran en un determinado intervalo desde v hasta v + Δv será
tanto mayor, cuanto más grande sea el intervalo, es decir, Δn ~ Δv, o bien
Δn = aΔv (11.1)

donde a es el coeficiente de proporcionalidad.

También está claro, que Δn depende además de la misma velocidad, ya que en


intervalos iguales en magnitud pero con diferentes calores absolutos de velocidad, el
número de partículas será diferente, como es diferente, por ejemplo, el número de
personas en los hiérvalos de edades de 99 a 100 años y de 30 a 31 años, a pesar de
que en ambos casos son iguales los intervalos. Esto significa, que en la fórmula (11.1)
el coeficiente de proporcionalidad debe ser función de la velocidad:
a =f (v)

Por último, e1 número Δn también debo ser proporcional al número de partículas n


en la unidad de volumen. Por eso, la fórmula para. Δn deberá tener la forma:
Δn = nf(v) Δv

Corrientemente, esta fórmula se escribe en la forma siguiente:


Δn/n=f(v) Δn (11.2)

La magnitud, en esta fórmula, representa la parte de partículas en la unidad de


volumen del gas cuyas velocidades se encuentran en el intervalo desde v hasta v + Δv.
La función f(v) se llama función de distribución. El objeto de nuestra tarea es hallar
la forma de esta función. El sentido de la función de distribución está claro de la
fórmula (11.2). En efecto:
f(v) = Δn/n, para Δn=1

32
Esto significa, que (v) es igual a la parte de partículas, cuyas velocidades se
encuentran en el intervalo unitario de velocidades próximo a la velocidad v.
Pasando al límite, la fórmula (11.2) se puede volver a escribir en la forma:
dn/n = f(v) dv (11.3)

De lo dicho anteriormente sobre la probabilidad se deduce que la magnitud dn/n, en


la fórmula (11.3) tiene el sentido de probabilidad: esto es la probabilidad de que
cualquiera de las moléculas del gas, contenida en la unidad de su volumen, posea la
velocidad que descansa en el intervalo dv próximo a la velocidad v. La magnitud de la
función de distribución (v) se le puede adjudicar el sentido de probabilidad de que
cualquier molécula de gas en la unidad de su volumen tenga una velocidad,
comprendida en el intervalo unitario próximo a la velocidad v. A ella la llaman, por eso,
densidad de probabilidad.
La formula barométrica obtenida anteriormente debe su forma a que las
velocidades' de las moléculas no son iguales y están distribuidas de un modo
determinado. El carácter de esta distribución precisamente depende de la forma de la
función f (v). Utilizando la fórmula barométrica ya conocida, determinaremos la forma
de la función de distribución que conduce a la relación (8.3) entre la densidad do las
moléculas y la altura:
mg
−( )X
n = no e kT

Observemos que la función de distribución se puede hallar también por otros


caminos. Maxwell la obtuvo (en el año 1859) a partir de consideraciones basadas en la
teoría de probabilidad. Boltzmann (en el año 1877) dedujo esta fórmula, al considerar
los choques de las moléculas gaseosas, debido a los cuales se establece la
distribución. Como consecuencia de esta fórmula se puede obtener la fórmula "
barométrica. Para hallar la ley de distribución, utilizaremos la fórmula barométrica va
obtenida con el objeto de simplificar el cálculo.

1.10.DISTRIBUCION DE LAS MOLECULAS SEGÚN LAS COMPONENTES DE


LA VELOCIDAD.

Imaginemos una vasija con gas, colocada en el espacio vacío en el campo de


gravedad. Dentro de la vasija el gas se encuentra en equilibrio y sus moléculas están
distribuidas según sus velocidades de una forma determinada. Se exige hallar esta
distribución. Si en algún momento se rompe la vasija, entonces
las moléculas del gas empiezan a moverse en todas
direcciones y en particular hacia arriba, contra la dirección de la
fuerza de gravedad. La existencia de la fuerza de gravedad nos
ayudará a hallar aquella distribución que había en el gas antes
de romper la vasija.
Dirijamos uno de los ejes coordina dos, por ejemplo el eje Z,
según la vertical con el origen de referencia en aquel sitio
donde se encuentra la vasija. Está claro que la fuerza de
gravedad sólo influye en la componente z de las velocidades de las moléculas, de
manera que buscaremos la distribución de las moléculas no por sus velocidades, sino
por los valores de las componentes Vz de sus velocidades.
El movimiento de las moléculas hacia arriba a lo largo del eje Z va acompañado con
una disminución de la componente z de sus velocidades. Por ejemplo, si para una
molécula esta componente es vzo a una determinada altura inicial z0 , entonces a la
altura z será justa la relación de la ley de conservación de la energía:

33
mv 2 o mv 2 2
= + mgz
2 2 (12.1)
donde Vz es el valor de la componente z de la velocidad a la altura z.
Está claro, aquellas moléculas que tengan la energía cinética no pueden elevarse a
una altura mayor que z. Para ellas la máxima altura de elevación z se determina por la
igualdad z = vz 0 / 2 g . A esta altura, para tales moléculas Vz se hace igual a cero,
2

después de lo cual ellas caen acelerándose, cómo cualquier cuerpo lanzado


verticalmente hacia arriba.
Separemos a una altura arbitraria z una capa de gas de altura dz con el área de la
base igual a la unidad (fig. 10). En esta capa el gas se compone de moléculas en
movimiento! Estas son las moléculas que pasan a través de ella de abajo arriba y de
arriba abajo (recordemos que sólo nos interesan las componentes de las velocidades
de las moléculas según el eje Z). La diferencia entre las moléculas que llegan de abajo
y de arriba, consiste en que las moléculas que llegan de abajo tienen componentes z
de velocidades, que por su módulo, obligatoriamente, superan al valor √2gz, mientras
que las moléculas que llegan de arriba pueden tener componentes z de velocidades
con cualesquiera valores, desde O hasta oo.
En condiciones de equilibrio, cuando debe ser constante el número de moléculas
en la capa, el número de moléculas que llegan de arriba abajo, deberá ser igual al
número de moléculas que llegan de abajo arriba.
A la altura z0 el número de moléculas en la unidad de volumen con componentes z
de velocidades, que descansan en el intervalo desde vz0 hasta vz0 +dvz0 se
determina por la igualdad
dnzo = nzo f (v zo ) dv zo

En la unidad de tiempo atraviesa nuestra capa a la altura z un número


nz 0vz 0 f (vz 0 ) dvz 0 tales moléculas (véase la pág. 27). El número total de moléculas que
atraviesan la capa abajo arriba (designamos este número por Nt) será igual a
∞ ∞
Nt = ∫n
2 gt
zo v zo f (v zo )dv zo = nzo ∫v
2 gt
zo f (vzo )dv zo

De tal modo obtenemos que el número de moléculas que atraviesan la capa de


arriba abajo (NI) será igual a

∞ ∞
N t = ∫ n z v z f (v z )dv z = n z ∫ v z f (v z )dv z
0 0
Durante el equilibrio, como se indicó, N↑ y N↓ deberán ser iguales entre sí,

∞ ∞
n zo = ∫ f (v
2 gz
zo )v zo dv z = n z ∫ f (v z )v z dv z
0

Dividiendo ambas partes de esta igualdad por nz0 y teniendo en cuenta que, de
mgz
nz −
acuerdo a la fórmula barométrica = e kT obtenemos:
nz o

∞ mgz ∞


2 gz
f (v zo )v zo dv zo = e kT
∫ f (v
0
z )v z dv z

34
De la ley de conservación de la energía por medio de su diferenciación obtenemos

vz o dvz o = vz dvz

Sustituyendo bajo el signo de integral, en la parte izquierda de la igualdad, el valor


de vz y dvz. Con ello hay que cambiar el límite inferior de integración por el cero, de
modo que
∞ mgz ∞

∫ f (v
0
zo )vz dvz = e kT
∫ f (v )v dv
0
z z z

De aquí se deduce que f(vzo) = f(vz)

mgz

f (vz ) = f (vz o )e kT

Teniendo en cuenta la formula (12.1) de la ley de conservación de la energía, no es


difícil observar que la igualdad 12.3 puede ser justa solamente si
mv z2 mv z20
− −
y
f (vz ) = Ae kT
f (vz ) = Ae kT

Por lo tanto, la función de distribución de las moléculas según las componentes de


la velocidad por el eje Z tiene la forma

mv z2

f (vz ) = Ae kT

El número de moléculas en la unidad de volumen, cuyas componentes x descansan


dentro del intervalo desde vz hasta vz + dvz ahora se expresan por la formula

mv 2

mv z2
dn − z
d n = nAe 2 kT
dvz o = Ae 2 kT dvz
n

Aún nos queda determinar la constante A, que entra en la función de distribución.


Para esto es suficiente integrar dn/n para todos los valores posibles de vz desde –oo
hasta + oo. Entonces obtenemos la probabilidad de que la molécula de gas posea una
velocidad con un determinado valor de la componente z.
∞ mv z2

dn ∞


2 kT
=A
−∞
n ∫e
−∞
dvz = 1

De donde
mv z2
∞ −
2 kT
A=(∫e dvz ) −1
−∞

35
Para calcular la integral introduzcamos la nueva variable x2 = mv2z / 2KT
2kT 2kT
vz = x y dv z = dx
m m

Por eso
mv z2
∞ − ∞
2 kT 2kT
∫e ∫e
− x2
dv z = dx
−∞
m −∞

Se sabe que

∫ e dx = π
2
−x

−∞

Por consiguiente
mv z2
∞ −
2 kT 2πkT
∫e
−∞
dvz =
m

Y la constante A que nos interesa de la ecuación (12.4) será igual a:


1
 m  2
A= 
 2πkT 

La expresión de la función de distribución toma ahora la forma:


1 mv 2 1 mv 2
dn  m  2 − 2 kTz 1  m  2 − 2 kTz
f (v z ) = =  e =   e
ndv z  2πkT  π  2kT 

Gráficamente, esta función tiene la forma representada en la fig. 11. Del gráfico se
ve que la función f(uz) tiende a cero cuando vz —>oo. Pero la parte de moléculas con
la componente z de la velocidad, igual a cero, no es igual a cero. Como se ve de la
fórmula (12.5) y de la curva fig. 11, la parte de moléculas cuyas componentes z de
velocidades es próxima a cero, es igual a ÍA (en esto consiste el sentido físico de esta
(constante). Al elevar la temperatura disminuye esta parte de moléculas.
La función de distribución de las moléculas según las componentes de velocidad la
obtuvimos, considerando el gas en el campo de gravedad. Recordemos que esto no
significa que esto significa que la forma de la distribución de las moléculas según
sus componentes de velocidad esté de algún modo relacionada con la acción de
la fuerza de gravedad o que precisamente la fuerza de gravedad cree esta
distribución.
Como ya indicamos, la fórmula barométrica que utilizamos
en nuestra deducción, por sí misma, es una consecuencia de la distri-
bución de las moléculas según sus velocidades. El papel de la fuerza
de gravedad en nuestra deducción sólo consiste en que ella «reveló.»
la distribución que existía en el gas. El que la fuerza de gravedad no
juegue un papel en el establecimiento de la distribución ya se ve por
el hecho de que en la función de distribución no figura la magnitud g
que caracteriza la fuerza de gravedad.

36
1.11.DISTRIBUCIÓN DE LAS MOLÉCULAS POR VELOCIDADES

La expresión que acabamos de obtener para la función de distribución de las


moléculas de un gas según las componentes2 z de velocidades
mv
dn z − z
= Ae 2 kT
ndv z

No puede ser un <<privilegio>> precisamente de la componente z de la velocidad.


Es evidente que las expresiones, totalmente semejantes, deberán determinar también
la distribución de las moléculas por las otras componentes de velocidades, de modo
que mv 2 mv 2
dnx x
dn y −
y

= Ae ,
2 kT
= Ae 2 kT
ndv x ndv y
Ahora también podemos hallar la probabilidad de que la velocidad de la molécula
satisfaga al mismo tiempo las tres condiciones:
1) La componente según el eje X descansa en los límites de vx a vx + dvx
2) La componente según el eje Y descansa en los límites de vy a vy + dvy
3) La componente según el eje Z descansa en los límites de vz a vz + dvz
Los valores de las componentes de la velocidad según cada uno de los ejes. Por
eso, la probabilidad de que la velocidad de la molécula satisfaga al mismo tiempo las
tres condiciones indicadas es la probabilidad de un <<suceso>> complejo. Y como
sabemos ella es igual al producto de las probabilidades de cada uno de los sucesos
por separado. Si designamos por dnxyz el número de moléculas en la unidad de
volumen del gas, cuyas componentes sobre los ejes coordenados descansan en los
límites indicados anteriormente, entonces podemos escribir

mv 2
dn xyz −
= A3 e 2 kT
dv x dv y dv z
n
v 2 =v x2 +v y2 +v z2
donde de aquí
2
mv

dn xyz = nA e 3 2 kT
dv x dv y dv z

o 3
mv 2
 m  − 2 kT2
dnxyz = n  e dv x dv y dv z
 2πkT  (13.1)

Esta fórmula indica cuántas moléculas del número contenido en la unidad de


volumen de gas, poseen velocidades, cuyas componentes según los ejes coordenados
se encuentran en los intervalos entre vx y vx + dvx , vy y vy + dvy , vz y
vz + dvz es decir, poseen velocidad que descansa en el intervalo dado en magnitud
y en dirección. A esta fórmula se le puede dar una interpretación geométrica.

37
Imaginémonos que hemos reunido todas las moléculas de la unidad de volumen del
gas cuyas componentes de velocidad v están comprendidas en los intervalos
anteriormente indicados y luego las soltamos.
Después de 1 s todas se encontrarán a la distancia v de su posición inicial, en el
paralelepípedo con los lados dvx , dvy y dvz , es decir, en el volumen dw =
dvx dvy dvz . Esto está indicado en la fig. 12, en donde está representado
nuestro experimento mental en un sistema específico de coordenadas, sobre cuyos
ejes están colocados las componentes vx , vy , y vz . El número de moléculas,
referido a la unidad de volumen de este paralelepípedo (no confundirlo con el número

de moléculas en la unidad de volumen del gas; aquí se trata de la unidad de


volumen
en el <<espacio>> de velocidades, de acuerdo a (13.1) es igual a

3
mv 2
dnxyz  m  − 2 kT 2
= n  e
dw  2πkT 
Esta magnitud no puede depender, naturalmente, de la dirección del vector de
velocidad v. Por eso, no es difícil hallar ahora la función de distribución de las
moléculas según las velocidades, independientemente de su dirección. En realidad su
reunimos todas las moléculas de la unidad de volumen del gas, cuyas velocidades
están incluidas en el intervalo de v a v+ dv por todas las direcciones, y luego las
soltamos, entonces esparciéndose en todas direcciones, después de un segundo se
encontrarán distribuidas uniformemente en una capa esférica de espesor dv y de
radio v (fig. 13). Esta capa esférica está compuesta de aquellos <<paralelepípedos>>
sobre los que se habló anteriormente. El número de moléculas en la unidad de esta
capa (de nuevo, no se le puede confundir con el número de moléculas en la unidad de
volumen del gas) es el mismo que en cada paralelepípedo, es decir, se determina por
la fórmula (13.1). El número de moléculas en toda la capa es el número de moléculas

38
en la unidad de volumen del gas, cuyas velocidades descansan en el intervalo de v a
v+ dv.
Este número sería igual a
3
mv 2
 m  2 −
dn = n  e 2 kT
dΩ
 2π kT 
donde dΩ es el volumen de la capa esférica a 4лv2 dv. De tal modo,
3
mv 2
 m 2 2 − 2 kt
dn =4πn  v e dv =
2πkT 

3
mv 2
4 m 2 2 −2 kT
= n  v e dv,
π 2kT 

o
3
mv 2
dn 4  m 2 2 −2 kT
=   v e dv
n π  2kT 

Está fórmula expresa la ley de Maxwell de distribución de las moléculas según las
velocidades.
La magnitud dn/n es la probabilidad de que una molécula de gas, elegida
arbitrariamente, resulte que descansa en el intervalo entre v y v+ dv. En otras
palabras, dn/n es la parte de todas moléculas de la unidad de volumen, cuyas
velocidades descansan en el intervalo de v a v+ dv .
La magnitud
3
mv 2
dn 4  m  2 − 2 kT
f ( v) =
2
=   ve
ndv π  2kT 
Representa la función de distribución de las moléculas según sus velocidades. Ella
determina la parte de moléculas de la unidad de volumen de gas, cuyas velocidades
están comprendidas en el intervalo de velocidades igual a la unidad, que comprende a
la velocidad dada.
La forma gráfica de la función de distribución de Maxwell está representada en la
fig. 14. Como era de esperar ella se hace se hace cero para v=0 y para v→ ∞: en el
gas no hay moléculas inmóviles y no hay moléculas con velocidades infinitamente
grandes. Como se ve en la curva de la fig. 14, la función de distribución tiene un
máximo para un determinado valor de la velocidad vmp Esto significa que la parte
mayor de todas las moléculas del gas se mueven con velocidades, cuyos valores son
próximos a vmp. También se puede decir que las velocidades próximas a vmp se
registran en las moléculas del gas más frecuentemente que otras y la probabilidad de
que la velocidad de la molécula sea próxima a vmp es la máxima. Por eso, la velocidad
vmp que corresponde al máximo de la curva de distribución de Maxwell se llama la
velocidad más probable.
39
Con objeto de comprender mejor la diferencia entre distribución según las
velocidades y distribución según las componentes de las velocidades, examinemos la
analogía con otro proceso, en el cual las leyes de
causalidad juegan el papel principal, como en el caso del
establecimiento de la distribución de moléculas.
Imaginémonos que se realiza el tiro sobre el punto
central del blanco. Por muy hábil que sea el tirador y
perfecta su arma, las baladas no caerán cerca, a
diferentes distancias de él (fig. 15). Esto explica por
diferentes factores que son imposibles de tener en
cuenta: las cargas del cartucho no completamente
iguales, la influencia del viento y otras (en el caso de un
gas, el choque entre las moléculas juega el papel de tales factores causales, sobre el
que se hablará más adelante).

Para un número de disparos suficientemente grande, la distribución de las balas


alrededor del centro, es decir, la distribución según las distancias a él, resulta que se
somete a una ley completamente determinada. No es difícil aclarar el carácter de esta
ley. En la fig. 15 está representada la distribución de los impactos alrededor del blanco.
Esta distribución se puede valorar de dos formas.

40
41
Se puede dividir toda la superficie del blanco en bandas anulares (fig. 16) como se
hace en los concursos de tiro, trazando una serie de circunferencias a una misma
distancia ∆r una de la otra, y determinar
el número de impactos que
corresponden a una distancia dad r del
centro en el intervalo de r hasta r + ∆r.
En este caso, el número de impactos en
el círculo central, si éste es
suficientemente pequeño, será próximo
a cero, porque en un círculo
suficientemente pequeño no se puede
acertar. Al aumentar el número de
impactos en ella, alcanzando un
máximo determinado, después del cual
disminuirá y a una distancia lo
suficientemente alejada del centro se
hará igual a cero (véase la curva de la
fig. 16).
Se puede proceder de otro modo.
Dividimos la superficie del blanco en
bandas, trazando una serie de rectas
paralelas, situadas a la misma distancia
∆r una de la otro (fig, 17).
Si determinamos ahora el número de impactos ∆n, correspondientes a cada banda,
resulta, como se ve fácilmente en la figura, que decrece monótonamente a medida que
nos separamos de la banda central, tendiendo a cero a una distancia del blanco
suficientemente grande; esto se ve en la curva de la fig. 17 análoga a la curva de la fig.
11.
El primero de los métodos expuestos para describir la distribución, corresponde a la
determinación de la función f(vx), según las componentes de velocidades.
Utilizando la curva de distribución de las moléculas según sus velocidades, se
puede hallar, gráficamente, la parte dn/n de moléculas en la unidad de volumen del
gas, cuyas velocidades descansan en el intervalo dv dado de velocidades. Ella es
igual a la superficie de la franja rayada en la
fig. 14, con base dv y altura f(v). Está claro
que toda la superficie limitada por la curva de
distribución y el eje de las velocidades nos da
el número total de moléculas en la unidad de
volumen.
Como se ve la fórmula (13.3) la forma de la
curva de distribución depende de la
naturaleza del gas (en la fórmula ente la masa
m de la molécula) y de la temperatura. En la
fig. 18 están dadas las curvas de distribución
de las moléculas de nitrógeno según sus
velocidades para distintas temperaturas. De
ellas se ve que al elevar la temperatura,
crecen las velocidades de las moléculas, de
modo que toda la curva se desplaza al lado
de las grandes velocidades. Pero las
superficies limitadas por las curvas y el eje de
las velocidades, quedan, naturalmente,

42
invariables. A consecuencia de esto disminuye el máximo de la curva al elevar la
temperatura.

Al deducir la ecuación de
Maxwell de la distribución de las
moléculas según sus velocidades
no teníamos en cuenta los
choques entre las moléculas, a
pesar de que los choques no
pueden dejar de influenciar en las
velocidades de las moléculas y,
por lo tanto, también sobre su
distribución según las velocidades.
Precisamente debido a los
choques se establece la
distribución de Maxwell según las
velocidades. En efecto,
supongamos que el gas se
encuentra en tal estado en que
todas las moléculas tienen las mismas (en módulo) velocidades. Tal estado no puede
ser estable (equilibrado), porque los choques entre las moléculas, indiscutiblemente,
conducirán a que las velocidades de las moléculas dejen de ser iguales. En cada
choque entre las moléculas aumenta la velocidad de una de ellas y disminuye la
velocidad de la otra. Y, precisamente, Maxwell llamó la atención sobre el hecho de que
debía existir tal estado, durante el cual el número de moléculas, cuyas velocidades
aumentan al chocar, es igual al número de moléculas para las cuales disminuye la
velocidad a consecuencia de los choques. Tal estado es el de equilibrio.
Precisamente a este estado corresponde la distribución de Maxwell según las
velocidades. Después Boltzmann demostró que si un gas se encuentra en el estado,
para el cual las moléculas están distribuidas por sus velocidades no según Maxwell,
entonces tal el gas, debido a los choques de las moléculas pasa por sí mismo al
estado con la distribución de Maxwell.
La distribución de Maxwell (algunas veces la llama: distribución Maxwell –
Boltzmann) es la distribución equilibrada. Con esto empezamos nuestro análisis. Por
eso, por ejemplo, al deducir la fórmula (12.4) no nos era necesario tener en cuenta los
choques.
En efecto, si algunas moléculas que dejaron la capa de ∆z 0 no alcanzaron la capa
∆z debido a los choques, sin embargo, otras moléculas, que no debieron caer en ella,
llegaron a ella como resultado de los choques.
Los movimientos moleculares realizados en el gas, siempre los llamábamos
caóticos. Ahora podemos dar una definición exacta sobre el concepto caótico de los
movimientos térmicos: el movimiento de las moléculas es completamente
desordenado (caótico) si las velocidades de las moléculas están distribuidas según la
ley de Maxwell.
Tales movimientos completamente caóticos los realizan las moléculas cuando el
gas se encuentra en estado de equilibrio. Como vimos en el §3, este estado se
caracteriza por la magnitud de la temperatura, que a su vez se determina por la
energía cinética media del movimientote las moléculas. De aquí se deduce que la
temperatura se determina por la energía cinética media, precisamente, de los
movimientos caóticos. Cualquier movimiento dirigido de las moléculas, cualesquiera
que fuesen velocidades en tal movimiento, no tiene ninguna relación con la
temperatura. Por muy grande que sea la velocidad del aire que forma un viento fuerte
ella no lo hace más caliente. Los vientos, incluso los más fuertes, pueden ser fríos y

43
calientes, porque la temperatura del gas no se determina por la velocidad dirigida del
viento, sino por los movimientos caóticos, que las moléculas realizan al mismo tiempo
que el movimiento dirigido del gas como un todo e independiente de él.

1.12.VELOCIDADES MEDIAS DE LAS MOLECULAS

Utilizando la función de distribución de Maxwell se puede calcular una serie de


magnitudes importantes de la Física Molecular.
Señalemos aquí, en calidad de ejemplos, los cálculos de la velocidad media

aritmética v, la velocidad cuadrática media v 0
= v2 que ya calculamos
anteriormente (véase la pág. 45) y por último, la velocidad más probable vmp.
Empecemos por la velocidad media aritmética de la s moléculas.
La velocidad media aritmética v es por definición igual a la relación entre la suma
de todas las velocidades de toas las moléculas de la unidad de volumen y el número
de moléculas que hay en la unidad de volumen.
El número de moléculas en la unidad de volumen, cuyas velocidades están
comprendidas en el intervalo de v a v+ dv, evidentemente, es igual a n f(v) dv.
La suma de las velocidades de tales moléculas es igual a vn f (v) dv. Para hallar la
suma de las velocidades hay que integrar esta función por todas las velocidades
posibles de cero al infinito. Por consiguiente, la suma de todas las velocidades es igual

∫vnf (v )dv,
0
y la velocidad media aritmética v es igual a
∞ ∞
− 1
v = ∫ vnf ( v ) dv = ∫ vf ( v ) dv.
n0 (14.1)
0
Poniendo aquí la expresión (13.3) obtenida anteriormente para f(v) obtenemos:
3
∞ mv 2
− 4  m  2 −
v= ∫ e
3
  v 2 kT
dv
π  2 kT  0
(14.2)

Para calcular la integral que figura en esta expresión, transformemos la expresión


subintegral:
mv 2 mv 2
− −
v 3e 2 kT
dv = v 2 e 2 kT
vdv
Ya que v dv = 1/2d (v2), entonces
mv 2 mv 2
3
ve

2 kT
dv =
1 2
2
ve

2 kT
d v2( )
y
3
∞ mv 2
4  m  1 2
( )
− 2 −
v=   . ∫v e 2 kT
d v2 .
π  2 kT  20 44
Introduciendo por partes nos da:

∫ dz = 1
−z
ze
0
Por lo tanto, para la integral de la fórmula (14.2) obtenemos la expresión:

∞ mv 2 2
−  kT 
∫ e dv = 2 
3
v 2 kT

0 m
Poniéndola en (14.2) hallamos para v la expresión:
3
2
− 4  m   kT 
2 8kT
v=    
.2 =
(14.3) π  2kT   m  m

De un modo semejante se puede también calcular el valor medio aritmético de la


componente de velocidad sobre cualquier eje coordinado.
Propiamente hablando, el valor medio de cualquier componente de la velocidad es
igual a cero, ya que ella puede ser con la misma probabilidad positiva, o negativa.
Pero esto no se puede decir sobre el valor medio del módulo de tal componente.
Hallemos, por ejemplo, el valor aritmético medio del módulo de la componente x de la
velocidad, es decir, la magnitud |vx|. Para ella se puede escribir la ecuación, análoga a
(14.1):
− ∞
v x = ∫ v x f ( v x ) dv x .
(14.4)
−∞
Aquí f (vx) es la función de distribución de las moléculas según la componente vx,
que hallamos anteriormente:

1
mv 2
1  m  −
f ( vx ) =
2
  e 2 kT

n  2kT 
Poniendo esta expresión en (14.4) obtenemos:

1
∞ mv x2
− 1  m  2 −
vx = 
n 2 kT


∫v e
−∞
x
2 kT
dv x .
45
La integral que figura en esta fórmula se resuelva con la ayuda de la sustitución de
variable mv2x/2kT≡z2. Entonces para |vx| se obtiene la expresión:

(14.5)
− 2kT
vx = .
πm
Esta expresión permite resolver la tarea interesante sobre el número medio de
golpes de las moléculas sobre la unidad de superficie de la pared de la vasija en la
unidad de tiempo.
En el § 2 (pág. 26) vimos que en el número de moléculas que atraviesan la
superficie con un área S en el tiempo ∆t es igual a 1/2nvx S ∆t.
De aquí se deduce que en la unidad de superficie en la unidad de tiempo caen
1/2nvx moléculas. Sustituyendo aquí vx por su valor medio |vx| obtenemos que el
número medio de golpes v de las moléculas contra la unidad de superficie en la unidad
de tiempo es igual a:

− 1 − nv
vx = n vx = .
2 4
Velocidad media cuadrática de las moléculas. Para hallar la velocidad media
−2
cuadrática de las moléculas es necesario calcular la relación entre la suma de los
v
cuadrados de las velocidades de las moléculas de la unidad de volumen y el número
de moléculas en este volumen. Repitiendo los razonamientos anteriores obtenemos:
− ∞
2
v = ∫ v f ( v ) dv.
2

0
Poniendo aquí la expresión (13.3) de f (v) obtenemos:
3
− ∞ mv x2
 m  2 −
v = 4π  ∫v e
2 4
 2 kT
dv.
 2kT  0
Por medio de la integración por partes hallamos la integral que entra aquí y
obtenemos:
5
∞ mv x2
− 3  2kT  2
∫v e dv =  π
4 2 kT

0
8 m  (14.6)

Tal expresión también la obtuvimos anteriormente.

1.13.VELOCIDAD MÁS PROBABLE DE LAS MOLECULAS.


46
Calculemos ahora la velocidad vmp más probable de las moléculas, alrededor de la
cual se agrupan las velocidades del mayor número de moléculas de un gas. Esta
velocidad corresponde al máximo de la curva de distribución de Maxwell (véase la fig.
14). Por eso, para hallar la velocidad vmp , es necesarioigualar a cero la derivada de la
unión de distribución (13.3):

 3
mv 2 
d d  4  m 2 2 −2 kT
f (v ) =   v e 
dv dv  π  2kT  
 
Esta igualdad se cumplirá si

 2 −mv 
2
d v e 2 kT  =0
dv  
 
Realizando la diferenciación obtenemos:
mv 2
−  mv 2 
v e2 2 kT 
1 −2kT 
 =0
 
Esta igualdad se cumple bien para v=0, bien para v=∞, o bien con la condición de
que 1-(mv2mp /2kT)=0. Es claro, que las dos primeras condiciones no corresponden al
máximo de la curva de la distribución. Por consiguiente, el valor v mp se determina de la
condición:

mv 2 mp
1− =0,
2kT
de donde
2kT
vmp =
m
Comparando las expresiones (14.3), (14.6) y (15.1), hallamos la relación entre las
velocidades calculadas:

3π 3
v= v = 1.09v = vmp = 1.22vmp
8 2
Como se ve la diferencia entre estos tres valores no es muy grande: las velocidades
media aritmética y media cuadrática son próximas a la velocidad más probable.

1.14. FOMULAS DE MAXWELL PARA LAS VELOCIDADES RELATIVAS

Para resolver muchas tareas es cómodo utilizar la fórmula de Maxwell en la forma


que se obtiene, si se expresan las velocidades de las moléculas no en las unidades

47
corrientes sino relativas, tomando por unidad de velocidad la velocidad más probable
vmp de las moléculas. La velocidad relativa u, por consiguiente, será igual a

v
u =
vmp
Aquí v es la velocidad dada las moléculas y Vmp es la velocidad más probables
para la temperatura dada. Como acabamos de aclarar.

En la fórmula de Maxwell
3
mv 2
d 4  m  2 −
=   ve
2 2 kT

dnv π  2kT 
figura dos veces la expresión m/2kT. Sustituyendo en ella esta expresión por su igual
1/v2mp y designando v/vmp por la letra u, se le puede dar a la ecuación de Maxwell la
forma siguiente:

d 4 −u2 2
= e u
(16.1) ndu π
Esta ecuación es universal. En esta forma la función de distribución no depende ni
del género de gas ni de la temperatura.
Semejante ecuación también se puede escribir para la función de distribución de las
moléculas según las componentes de velocidad sobre los ejes coordinados. Si se
trata, por ejemplo, de la componente x de la velocidad, entonces, introduciendo
también aquí la velocidad relativa ux = vx / vmp se puede representar la función de
distribución (12.5)en la forma

du 1 − u x2
= e
(16.2) ndu x π
Para resolver distintas tareas ligadas con la distribución de las moléculas según sus
velocidades es cómodo utilizar las fórmulas de distribución, precisamente, en la forma
(16.1) y (16.2). En la fig. 19 está representada la curva de distribución para las
velocidades relativas.
Las funciones

4 2
u 2 e −u
π
Y
1 2
e −u x
π
48
Pueden ser calculadas de antemano para los diferentes valores u y u x y
representadas en forma de gráficos, a partir de los cuales se pueden determinar las
magnitudes buscadas. En la tabla 1 están expuestos los valores de estas funciones,
calculados con una exactitud suficiente para resolver muchas tareas.
Supongamos, por ejemplo, que se exige hallar la parte de moléculas de nitrógeno
cuyas velocidades están comprendidas entre 275 y 276 m/s para la temperatura
ambiente (300k).
Ante todo hallamos la velocidad más probable:

2kT 2 RT 2.8,31.103.3.10 2
vmp = = = ≈ 394m / s
m µ 28
La velocidad relativa u será igual a:

v 275
u= = ≈ 0.70
vmp 394
De la expresión u = v / vmp. En el caso dado, el intervalo de velocidad igual a 1 m/s,
es suficientemente pequeño para considerar que du = ∆ v/ vmp = 0.0025. Según el
gráfico, que puede construir cualquiera con los datos de la tabla 1, hallamos que la
velocidad realtiva u = 0.70 al valor de la función
dn 4 2 −u 2
= u e =0.677.
ndu π
De aquí
dn
= 0,677.0,0025 = 1,7.10 − 3
n
Es decir, sólo 0.17% de todas las moléculas poseen velocidades que descansan
dentro del intervalo de velocidades, indicado en la tarea.

4 1 4 1
u, f (u) = f (ux ) = u, f (u) = f (ux ) =
2 2 2 2
u 2e − u e−u x u 2e − u e−u x
ux π π ux π π
0.1 0.022 0.558 1.2 0.770 0.133

0.2 0.087 0.524 1.3 0.703 0.104

0.3 0.185 0.515 1.4 0.623 0.079

0.4 0.308 0.480 1.5 0.535 0.059

49
0.5 0.439 0.439 1.6 0.477 0.044

0.6 0.567 0.393 1.7 0.362 0.031

0.7 0.677 0.345 1.8 0.286 0.022

0.8 0.761 0.297 2.0 0.165 0.010

0.9 0.813 0.251 2.2 0.086 0.004

1.0 0.830 0.208 2.4 0.041 0.002

1.1 0.814 0.168 3.0 0.003 -

Una de las tareas interesantes, creadas por la distribución de las moléculas según
sus velocidades es la determinación de la parte de moléculas, cuyas velocidades
superan a la dada. Para resolver tales tareas también es cómodo utilizar la fórmula de
Maxwell para las velocidades relativas, es decir, la fórmula

dn 4 2
= u 2 e −u du
es necesario hallarπ
Está claro que si ndu la parte de moléculas, cuyas velocidades
superan a un valor dado determinado v, y por lo tanto determinado u, entonces es
necesario integrar la ecuación entre los límites desde el u dado hasta el infinito, de
modo que ∞
n>u 4
∫z
−z2
= 2
e dz
n π u
Donde n>u es el número de moléculas, cuyas velocidades relativas son mayores que
la u dada. Por consiguiente, la solución de la tarea se reduce al cálculo de la integral
que figura aquí. En la tabla 2 están expuestos sus valores para distintos valores de u.
En la tabla se ve que el número de moléculas, cuyas velocidades superan a la más
probable, es decir, las moléculas con v>vmp alcanzarán el 57.24% de todas las
moléculas del gas, o sea, más de la mitad.
Esto significa que la curva de distribución de Maxwell no es simétrica con relación al
máximo, lo que se ve claramente de los gráicos representados anteriormente (véase
las figs. 14, 18, 19).
∞ ∞ ∞
4 4 4
∫z e ∫z e ∫z e
2 −z2 2 −z2 2 −z2
u dz u dz u dz
π u π u π u

0.1 0.9992 0.8 0.7340 1.5 0.2123

0.2 0.9941 0.9 0.6550 1.6 0.1632

50
0.3 0.9807 1.0 0.5724 1.7 0.1230

0.4 0.9582 1.1 0.4900 1.8 0.0905

0.5 0.9190 1.2 0.4105 1.9 0.0602

0.6 0.8685 1.3 0.3370 2.0 0.0460

0.7 0.8061 1.4 0.2702

2. TEORÍA CINÉTICA DEL CALOR.


LEY DE CONSERVACIÓN DE LA ENERGÍA.

2.1. ENERGÍA INTERNA DEL GAS IDEAL

Se sabe que la energía media de la molécula del gas ideal, si consideramos a sus
partículas como puntos, se determina por la expresión:

mv 2 3
= kT
2 2

Es necesario señalar otra vez, que esta expresión es justa para las moléculas
consideradas como puntos, capaces de realizar solamente movimiento de translación.
Tal representación del gas se puede justa para los gases monoatómicos. Si la
molécula del gas contiene no uno, sino varios átomos, entonces puede realizar
también otras formas de movimiento, giratorio y oscilatorio, con los cuales también
está ligada una determinada energía.

Sin embargo, limitémonos por ahora sólo al caso de los gases monoatómicos y
escribamos la expresión para la energía de todas las moléculas de la masa dada de
gas. Si el gas contiene N moléculas, entonces su energía total U será igual a:

3
U= NkT (20.1)
2

51
Para una mol esta expresión toma la forma:

3 3
U= N 0 kT = RT (20.2)
2 2

Esta energía se llama energía interna del gas ideal. Energía interna de un cuerpo
se llama en general a la energía total que se refiere a las mismas moléculas, es decir,
su energía “invisible”. Aquí entra la energía cinética del movimiento de las mismas
moléculas, la energía cinética del movimiento de los átomos dentro de la molécula (si
la molécula no es monoatómica), la energía potencial de interacción de los átomos
dentro de la molécula e incluso la energía cinética de las partículas que entran en la
composición de los átomos (núcleos y electrones). En ella no se incluye, sin embargo,
la energía cinética que el gas puede poseer, si él se mueve como un cuerpo entero, y
la energía potencial que puede poseer si se encuentra en un campo de fuerzas
cualesquiera.

La energía interna de una masa dada de gas ideal depende, como se ve de las
fórmulas (20.1) y (20.2), solo de la temperatura y no depende ni de la presión, ni del
volumen del gas. (Para los gases reales esto no es cierto).

De las fórmulas expuestas se ve que para cambiar la temperatura de un gas, es


necesario cambiar su energía interna. Como se sabe de la Mecánica, el cambio de
energía está ligado al trabajo: la energía del cuerpo varía si el cuerpo realiza un
trabajo o si se realiza un trabajo sobre él, y este cambio es, precisamente, igual al
trabajo realizado.
De aquí, al parecer, resulta que el cambio de la temperatura del gas, o en general
de cualquier cuerpo se puede conseguir sólo gracias al trabajo mecánico: para
calentar un cuerpo es necesario realizar un trabajo sobre él, y para enfriarlo es
necesario crear tales condiciones, para las cuales él mismo pudiese realizar un
trabajo. La experiencia muestra, en efecto, que se puede cambiar la temperatura de un
cuerpo por medio de un gasto correspondiente de trabajo mecánico. Así por ejemplo,
los cuerpos se calientan con el rozamiento de uno con otro (en esto está basado el
medio antiquísimo de obtener fuego). Como se mostrará más adelante, el gas también
puede calentarse a cuenta del trabajo realizado.

2.2. CANTIDAD DE CALOR

Se sabe, sin embargo, que un gas, como cualquier otro cuerpo, se puede calentar
o enfriar con otro método durante el cual el trabajo no juega ningún papel a primera
vista. Este método consiste en que el cuerpo se pone en contacto con otro cuerpo
que tiene una temperatura diferente a la suya propia. Se puede conseguir el mismo
resultado sin el contacto directo, cuando dos cuerpos con diferentes temperaturas
están separados por cualquier medio o incluso por el vacío. En el primer caso se dice
que el calentamiento o enfriamiento se realiza por medio de la conductibilidad térmica,
en el segundo caso, por medio de la irradiación.

Pero de la fórmula (20.1) se deduce que el cambio de temperatura de un gas


siempre está ligado con el cambio de energía. Cuando el cambio se realiza como
resultado de un gasto de trabajo, la causa del cambio está clara, ya que el trabajo es
un cambio de energía. Es decir, en el método por contacto de una forma determinada
se realiza la entrada ( al calentarse) o a la salida (al enfriarse) de energía.

52
El mecanismo de transmisión de energía en el método por contacto consiste en que
las partículas de los cuerpos en contacto, durante los choques entre sí, se cambia su
energía de modo que las partículas del cuerpo más caliente pierden energía,
entregándola a las partículas del cuerpo menos caliente. Es decir, en este caso, en
lugar de un cambio de energía a cuenta de trabajo gastado, se consigue el mismo
resultado por medio de la transmisión de la energía de las partículas en movimiento
caótico de un cuerpo, a las partículas del otro cuerpo.

Sin embargo, debido a una serie de circunstancias, ligadas a la historia del


desarrollo de la Física, en el caso cuando el cambio de temperatura del cuerpo
(calentamiento o enfriamiento) se realiza por este método (“por contacto” o por
irradiación), dicen que al cuerpo se le entrega o se le extrae una determinada
cantidad de calor.

Es decir, la cantidad de calor representa en sí la energía que se transmite de un


cuerpo a otro durante su contacto (directamente, o a través de un tercer cuerpo) o por
medio de irradiación. En realidad, durante la transmisión de calor también tenemos
relación con el trabajo, pero en este caso el trabajo lo realizan no los cuerpos
macroscópicos en movimiento ordenado, sino las micropartículas en movimiento
desordenado. Como veremos más adelante, esta circunstancia juega un papel muy
importante.

2.3. EQUIVALENTE MECÁNICO DEL CALOR

No existe ninguna otra diferencia entre el calor y el trabajo(energía). Por eso,


deben medirse en unas mismas unidades. En el sistema SI como unidad de cantidad
de calor se toma 1 julio (J). Pero, por causas históricas, hasta el último tiempo, la
cantidad de calor se medía en calorías y kilocalorías. Ya en los tiempos
“antecinéticos”, fue introducida una unidad especial para la cantidad de calor, cuando
consideraban el calor como una sustancia especial, semejante a un líquido
determinado capaz de fluir de un cuerpo a otro. Ahora, cuando ya está clara la
equivalencia de energía y calor, esta unidad ha perdido su sentido físico particular,
pero se conserva todavía en la Física y la Técnica por tradición.

La kilocaloría se determina como la cantidad de calor, cuya entrega (o extracción)


origina el calentamiento (o enfriamiento correspondiente) de un kilogramo de agua en
un grado Kelvin a la presión atmosférica.

La equivalencia entre el calor y la energía fue demostrada de una forma clarividente


ya en el siglo pasado en la década del 50, por J. Joule, mostrando en una serie de
experimentos escrupulosos, que el calentamiento originado por una kilocaloría es el
mismo que el que da siempre un mismo trabajo determinado. Resultó, precisamente,
que
1 kcal = 4186.8 J

También se utiliza la unidad 1000 veces menor que la kilocaloría, o sea, la caloría
– gramo, o simplemente, caloría (cal):

1 cal = 4.1868 J

El número que indica la relación de la unidad mecánica a la unidad de calor, se


llama equivalente mecánico de calor:

53
I = 4186.8 J / kcal = 4.1868 J / cal

La magnitud inversa se llama equivalente térmico del trabajo mecánico:

I’ = 2.39 E 10-4 kcal / J = 0.239 cal / J

En la exposición sucesiva, no utilizaremos estos equivalentes. En los casos, cuando


en una misma ecuación figuren la cantidad de calor y el trabajo o energía,
consideraremos que ellos se miden en unas mismas unidades (en calorías o julios,
indiferentemente).

2.4. PRIMER PRINCIPIO DE LA TERMODINÁMICA

El cambio de estado de cualquier cuerpo o sistema de cuerpos, en general, va


acompañado de un trabajo realizado por este sistema, o por un trabajo realizado sobre
él por las fuerzas externas. Este trabajo puede ser expresado por los parámetros que
determinan el estado del sistema.

Si el estado de un cuerpo se determina, como ya sabemos, por dos de los tres


parámetros p, V y T, entonces, en caso general, el cambio de cualquiera de ellos
deberá acompañarse con un trabajo externo.

Así, por ejemplo, el cambio de temperatura de un gas, es decir, el calentamiento o


enfriamiento, se puede realizar como resultado de un gasto de trabajo mecánico
externo (calentamiento), o a cuenta del trabajo realizado contra las fuerzas externas
(enfriamiento).

Este trabajo mecánico se realiza al comprimir el gas con una fuerza externa cuando
el gas se calienta, o al dilatar el gas cuando el mismo realiza un trabajo, enfriándose
con ello. El cambio de volumen del gas también puede realizarse sin cambiar su
temperatura, entonces se exige correspondientemente un trabajo menor.

Pero como fue indicado, el estado de un gas ( o de otros cuerpos) se puede


cambiar, comunicándole o, al revés, quitándole una cantidad determinada de calor, es
decir, poniéndolo en contacto con un cuerpo más caliente o más frío que él.

¿Qué trabajo se realizará cambiar el estado por este método? La ley de la


conservación de la a energía da contestación a esta pregunta. Si se le comunica a un
gas ( o a otro cuerpo cualquiera) una cantidad determinada de calor dQ se realiza en
general un trabajo dA y se cambia su energía interna en dU .

La ley de conservación de la energía dice así: el trabajo, realizado por el sistema,


es igual a la diferencia entre la cantidad de calor, comunicado al sistema, y el cambio
de su energía interna

dA = dQ − dU
o
dQ = dU + dA (23.1)

54
Esta ecuación expresa la ley más importante de la naturaleza, la ley de
conservación de la energía aplicable a la energía mecánica y térmica. Esta ley recibió
el nombre de primer principio de la Termodinámica.

Trabajo, al cambiar el volumen del gas.

No es difícil calcula el trabajo, ligado a la dilatación o


comprensión de un gas, es decir, al cambio de su volumen.
Supongamos que el gas se encuentra en un cilindro, cerrado
con un émbolo móvil de superficie S (Fig. 31). Supongamos
que el émbolo desciende en un distancia dx , bajo la acción
de una fuerza externa F, comprimiendo el gas. El gas
continuará comprimiéndose hasta que la fuerza F se equilibre
con la fuerza que actúa sobre el émbolo por parte del gas e
igual a pS , donde p es la presión del gas. El trabajo dA , gastado en el
desplazamiento del émbolo en la distancia dx , es, evidente, igual a pS dx . Pero S dx
no es otra cosa, que el cambio de volumen del gas dV durante la compresión, es
decir,

S dx = - dV
de donde
dA = - p dV (23.2)

Por el contrario, durante la dilatación del gas, es decir, al aumentar el volumen del
gas en dV , el mismo gas realiza un trabajo contra las fuerzas externas igual a + p
dV .

El cambio de volumen del gas va acompañado de un trabajo igual al producto de la


presión bajo la cual se encuentra el gas, por su cambio de volumen.
La fórmula (23.2) es cierta no solo para los gases, sino para cualquier cuerpo. Si al
cambiar el estado de un cuerpo se realiza un trabajo sólo a cuenta del cambio de
volumen, entonces se puede escribir el primer principio de la Termodinámica en la
forma siguiente:
dQ = dU + p.dV (23.3)
Son posibles los casos, cuando el cambio de estado de los cuerpos va
acompañado de cambios eléctricos, magnéticos o de otros parámetros, entonces, a la
parte derecha de la ecuación (23.3) se le debe añadir los sumandos correspondientes:
energía eléctrica, magnética u otras formas de energía. Aquí, nos limitamos solo al
examen de los cambios de los parámetros p y V.
También se puede calcular el trabajo exterior en el caso, cuando el cambio de los
parámetros de estado no es infinitamente pequeño.
Si un cuerpo pasa del estado 1 al estado 2, entonces, el trabajo A ligado a esto se
determina por medio de la integración de la ecuación (23.2):
2 2
A = ∫ dA = ∫ p.dV
1 1
Esta integral se puede determinar gráficamente. En efecto, como fue indicado, el
estado de un cuerpo se caracteriza con un punto en la curva I en la Fig. 32, entonces
2

∫ p.dV
1
es igual a la superficie rayada por debajo de la curva.
55
Si el paso desde el estado 1 al estado 2 se realiza de tal modo que el cambio de la
presión con el volumen se representa con la curva II entonces el trabajo ligado a este
paso será otro.

El trabajo exterior, realizado por un cuerpo (o sobre él), al cambiar su volumen


depende de la sucesión de estados, que pasa el cuerpo desde el estado inicial hasta
el final.

En relación a la energía interna U se puede decir que depende sólo del estado del
cuerpo, y su cambio no depende de los estados intermedios, en los que se encontraba
el cuerpo. Por eso la ecuación (23.3) se puede escribir en la forma:
2 2

∫ dQ = U1 − U 2 + ∫ p.dv
1 1
donde U1 y U2 son los valores de la energía interna del cuerpo en los estados
correspondientes 1 y 2.
En caso particular, si el cuerpo, como resultado de todos los cambios de estado,
volvió al estado inicial, es
decir U1 = U2 , en este caso
se dice que el proceso de
cambio de estado es circular
o cíclico. Tal proceso se
representa gráficamente por
una curva cerrada (Fig. 33) y
el trabajo realizado (o
gastado) en este caso se
determina por la superficie
rayada.
Es evidente, que si el trabajo

A = ∫ p.dV ,

de un ciclo es positivo, es decir, si el cuerpo mismo realizó un trabajo contra las


fuerzas externas, esto significa, que el cuerpo recibió del exterior una misma cantidad
de calor Q. Si este trabajo A de un ciclo es negativo, es decir, si fue realizado sobre el
cuerpo un trabajo por la fuerzas exteriores, con esto se desprendió una cantidad de
calor Q igual al trabajo.

De tal modo, durante el proceso cíclico Q = A

No debemos extrañarnos de la forma “no corriente” de la curva p = f (v) en las Figs.


32 y 33 cuando crece la presión en algunos de sus tramos al aumentar el volumen. La
función “corriente” en donde la presión es inversamente proporcional al volumen del
gas, se observa solo para una temperatura constante, es decir, para un proceso
isotérmico. El proceso que hemos examinado del cambio de volumen del gas, se
refiere al caso, cuando el gas se le comunica o se le quita una determinada cantidad
de calor y sobre él se realiza (o el mismo realiza) un trabajo, y durante los diferentes
estadios del cambio de volumen la temperatura del gas es diferente.

No hay nada de extraño en que al mismo tiempo que se dilata (elevación de


émbolo) el gas pueda elevar tanto su temperatura, a cuenta de la fuente de calor, que

56
se eleve su presión a pesar del aumento de volumen (y al contrario, al comprimirse, el
gas puede dar calor a un cuerpo más frío y bajar su presión).

Esto explica la circunstancia de que al pasar de un mismo estado inicial (p1V1) a un


mismo estado final (p2V2), pero por distintos estados intermedios, se obtiene un
trabajo diferente, y por consecuencia, en un proceso circular no será igual a cero.
Sobre esto está basado el trabajo de las máquinas térmicas (de los motores).

Resulta innecesario subrayar que un cuerpo no podrá realizar ni un trabajo positivo,


si durante todo el proceso circular la temperatura del cuerpo es invariable (es decir, si
el proceso es isotérmico). En un gas, evidentemente, es imposible tal circular
isotérmico en general, ya que si el cambio de presión en el volumen se realiza a lo
largo de la isoterma, entonces se puede volver al estado inicial solo a lo largo de esta
misma isoterma, pero tal proceso no se puede llamar circular en el sentido citado
anteriormente.

Procesos cuasiestáticos. Al deducir la ecuación (23.2) para el trabajo de un gas,


ligado al cambio de su volumen, suponíamos, que durante todo el proceso del cambio
de volumen la presión, en cada momento de tiempo, era igual en todos los puntos del
gas. En caso contrario, el valor de la presión p hubiese sido completamente
indeterminado. Entre tanto, asegurar tal constancia de presión en todo el volumen del
gas ( como en cualquier otro cuerpo), durante el proceso de su dilatación o
compresión, no es fácil en general.

Si la dilatación o compresión de un gas se realiza rápidamente, entonces la presión


no tiene tiempo de igualarse en todas su diferente partes. Bajo la acción de la
diferencia de presiones se origina un flujo de gas con diferentes velocidades en
distintos puntos y, en particular, también flujos turbulentos. Para la creación de estos
movimiento se exige un trabajo determinado. Además, en las distintas partes del gas
se pueden tener diferentes temperaturas y densidades.
En una palabra, con el cambio rápido de volumen, el gas no se encuentra en
estado de equilibrio. Para que el gas se encuentre en equilibrio, durante el proceso de
su cambio de volumen (o de otra magnitud que caracterice el estado), es necesario
que el desarrollo de este proceso sea muy lento, en el límite, infinitamente lento. En
este caso, todas las desviaciones del equilibrio tendrían tiempo de desaparecer, y el
gas pasará a través de una serie de estados de equilibrio que se transforman uno en
otro.

Tales procesos se llaman cuasiestáticos porque durante ellos, en cada momento de


tiempo determinado, el estado del gas se diferencia muy poco del estado estático,
durante el cual son iguales los parámetros de estado en todo el volumen. Esta claro,
que solo los procesos cuasiestáticos se pueden representar gráficamente en forma de
curvas semejantes a las expuestas en la Fig. 32. Es imposible representar un proceso
que no sea cuasiestático. La ecuación (23.2) y sus consecuencias se pueden utilizar
solo para los procesos cuasiestáticos.

Si el proceso del cambio de volumen, es decir la compresión o dilatación del gas se


realiza no cuasiestáticamente, entonces el trabajo realizado durante la compresión o
dilatación será menor que durante el proceso cuasiestático. Esto se puede
comprender de las consideraciones siguientes. Imaginémonos que el gas, en el
cilindro con émbolo (Fig. 31), se encuentra al comienzo en equilibrio, esto significa que
la presión p del gas en el interior de la vasija es igual a la presión exterior.
Supongamos que bajo la acción de unas u otras causas empieza a dilatarse el gas( no

57
cuasiestáticamente), es decir, empieza a desplazarse el émbolo hacia arriba. Es
evidente que la presión exterior p1 se ha hecho menor que la presión p de equilibrio y,
por consiguiente, que el trabajo exterior es

p1 dV < p dV

Correspondientemente, durante la compresión no cuasiestática del gas, la presión


exterior p1 es mayor que la de equilibrio y por eso el trabajo (en este caso negativo) es

-p1 dV < -p dV

Y solo durante el proceso cuasiestático la presión exterior se diferencia


infinitamente poco de la de equilibrio y, por consiguiente, en este caso se realiza el
máximo trabajo.

Además, el gas puede dilatarse sin realizar en general ningún trabajo exterior.
Este caso se puede realizar uniendo dos vasijas una con otra, una de las cuales está
llena de gas y la otra vacía. Entonces, el gas fluye desde la primera vasija a la
segunda y ocupa, por consiguiente, mayor volumen. Pero con ello no se realizará
ningún trabajo exterior (ya que no existen ningunas fuerzas externas, contra las
cuales se podría realizar este trabajo). Este proceso se llama proceso de dilatación en
el vacío. Y en efecto, durante todo este proceso el gas no se encuentra en equilibrio
(por muy lento que transcurra).

2.5. CAPACIDAD CALORÍFICA DE LOS GASES IDEALES

Determinemos ahora la cantidad de calor que es necesario comunicar a un gas


ideal para su calentamiento o que hay que quitarle para su enfriamiento.

De lo dicho en el párrafo anterior, está claro, que la cantidad de calor necesaria


para el cambio de la temperatura del gas, depende de si se realiza trabajo con ello, es
decir, si con ello cambia el volumen del gas.

Si el gas que se calienta (o se enfría) está comprendido en un vasija cerrada por


todas partes, cuyo volumen no puede cambiarse (aquí despreciamos la dilatación
térmica del material de la vasija), entonces el calor dQ que se le transmite, se gasta
exclusivamente en el cambio de su energía interna. Durante el calentamiento, la
presión del gas crecerá según la ley que ya conocemos. Si el gas se encuentra en una
vasija, semejante a la representada en la Fig. 31, entonces se dilatará realizando el
trabajo de dilatación del émbolo, conservando con ello la presión constante. En este
caso el calor recibido se determina por la ecuación (23.3):

dQ = dU + p dV

Está claro, que cuando se conserva constante la presión del gas, se exige mayor
cantidad de calor.

La cantidad de calor necesaria para calentar el gas depende de la cantidad de gas


que se caliente y en cuántos grados debe cambiarse su temperatura. Cuanto mayores
son estas magnitudes tanto mayor es la cantidad de calor que se necesita. Por eso,
para la característica de las propiedades térmicas de un gas, como de cualquier otro
cuerpo se utiliza una magnitud especial, la capacidad calorífica.

58
Se llama capacidad calorífica de un cuerpo a la cantidad de calor que es necesario
comunicarle o quitarle para que cambie su temperatura en un grado Kelvin.

La capacidad calorífica referida a la unidad de mas de substancia se llama calor


específico. El caracteriza ya no al cuerpo, sino a la sustancia de que está compuesto
el cuerpo.
La capacidad calorífica referida a un mol de sustancia se llama calor molar. Lo
mismo que el calor específico es una característica de la sustancia.
De la definición de capacidad calorífica, queda claro que la capacidad calorífica de
un cuerpo se expresa en J/K. De acuerdo a esto el calor específico se mide en J/Kg K,
y el molar en J/ mol K.
Si la cantidad de calor se mide en calorías, entonces el calor específico se mide en
cal/g K, y el molar en cal/mol K. Es evidente que

1 cal/g K = 4186.8 J/kg K


1 cal/mol K = 4.1868 J/mol K

Entre el calor específico que designaremos por c, y el molar C existe la relación


evidente

C
c=
µ
Donde µ es el peso molar de la substancia (numéricamente igual a la masa de un
mol).
Si calentamos un mol de sustancia no en 1 grado, sino en dT grado, entonces el
calor, gastado en esto, es igual a
dQ = C dT

de donde
dQ
C= (24.1)
dT
Supongamos que el calentamiento se realiza en condiciones, cuando queda
constante el volumen (V= const.). El calor molar correspondiente se llama calor
específico a volumen constante o calor isocórico (equivolumétrico))1 y se designa por
Cv

 dQ 
Cv =   (24.2)
 dT  v

Ya que el calor se gasta con ello en el cambio de la energía interna dU, entonces
dQ = dU y

 dU 
Cv =   (24.3)
 dT  v

De donde dU = Cv dT. La ecuación de la ley de conservación de la energía (23.3)


ahora se puede escribir en la forma:

1
El término equivolumétrico es equivalente al término isocórico. (N del T)
59
dQ = Cv dT + p dV (24.4)

Por consiguiente, el calor aportado al cuerpo se gasta en el cambio de temperatura


dT (cambio de energía interna) y en el cambio del volumen dV (con esto está ligado el
trabajo mecánico exterior).
Si durante el calentamiento se observa la presión constante, entonces la capacidad
calorífica se llama calor específico a presión constante Cp (también se puede llamar
calor isobárico)

 dQ 
Cp =  
 dT  p
utilizando los resultados de la teoría cinética de los gases, se puede calcular
fácilmente los calores molares del gas ideal.

2.6. CAPACIDAD CALORÍFICA DE LOS GASES Y NÚMERO DE GRAOS DE


LIBERTAD DE LAS MOLÉCULAS

Para la comparación con los resultados de los cálculos teóricos de la capacidad


calorífica, hemos elegido los datos experimentales que se refieren a los gases
monoatómicos, es decir, aquellos gases cuyas moléculas se componen de un solo
átomo. Y esto no es casual. Una de las suposiciones que constituyen la base de la
teoría cinética, de la cual exactamente se deduce la teoría de la capacidad calorífica
expuesta anteriormente, consiste en que podemos considerar las partículas del gas
ideal como puntos o, por lo menos, como pequeñísimas bolitas. Los gases que más
se aproximan a esta representación de los gases son precisamente los gases
monoatómicos.

La energía media de tal partícula se determina totalmente por la energía cinética


mv 2
media de su movimiento de traslación. Esta energía se puede representar como
2
la suma de tres sumandos : de las energías cinéticas del movimiento de la molécula
según tres direcciones perpendiculares entre si:

2
mv 2 mv x2 mv y mv z2
= + +
2 2 2 2

donde vx, vy, vz son las componentes de la velocidad de la molécula según los tres ejes
coordenados. El caos completo de los movimientos moleculares nos permite
considerar que los valores medias de las energías cinéticas, según las tres
direcciones, son iguales unos a otros

2
mv x2 mv y mv z2 1 mv 2 (26.1)
= = =
2 2 2 3 2

Ya que de acuerdo a la ecuación fundamental de la teoría cinética

mv 2 3
= kT
2 2
60
1
entonces cada uno de los tres sumandos de la igualdad (26.1) es igual a kT .
2

La descomposición de la energía cinética de la partícula en tres componentes


independientes, esta ligada a que ella se considera como un punto material libre que
posee tres grados de libertad.

Recordemos que se llama numero de grados de libertad de un sistema mecánico al


numero de coordenadas independientes que determinan su posición y configuración
en el espacio. Es decir, a cada grado de libertad de la molécula monoatómica le
corresponde una energía igual a kT / 2.

Si existiese, por ejemplo, un gas hipotético tal, cuyas moléculas pudiesen moverse
solo a lo largo de una línea determinada (gas de una dimensión), entonces, la energía
cinética media de la molécula de tal gas sería igual a kT / 2. El calor molar a volumen
constante de tal gas, sería igual no a 3/2 R, sino a ½ R. El gas de dos dimensiones es
decir, el gas cuyas moléculas están limitadas en su movimiento por un plano
determinado, poseería un calor específico Cv igual a 2/2 R = R1

2.7. CAMBIO DEL ESTADO AL VARIAR EL VOLUMEN DEL GAS

De la ecuación de la ley de conservación de la energía (24.4)

dQ = CvdT + pdV

se ve que el calor aportado al gas puede originar un cambio de temperatura del mismo
(dT) y un cambio de volumen (dV). En los párrafos anteriores examinamos, desde el
punto de vista energético, el proceso del cambio de temperatura del gas. Ahora
llamamos la atención sobre la cuestión de la dilatación o compresión del gas ideal, es
decir, sobre la cuestión del cambio de su estado al variar el volumen.

Se mostró que la cantidad de calor, necesaria para el cambio de temperatura del


gas, depende de las condiciones, en las cuales se realiza este cambio, de si se
conserva durante el calentamiento invariable su volumen o su presión, es decir se se
considera el cambio de temperatura isocoro o isobérico.

La presión y dilatación del gas también pueden transcurrir en distintas condiciones


y, de las condiciones del experimento depende el resultado enérgico del proceso, es
decir, el trabajo realizado durante este proceso (porque el cambio del volumen del gas
está relacionado precisamente con el trabajo).

La comprensión y dilatación del gas se puede realizar de tal modo que su


temperatura quede constante. Tal proceso se llama isotérmico. El se puede realizar
colocando el gas en una vasija provista de un émbolo, conservando constante la
temperatura de la vasija. Para esto se la coloca en un termostato, aparato dotado de
cualquier fuente de energía (con horno eléctrico, soplete, etc.) Cuando hay un buen
contacto del gas con el medio del termostato, se puede conseguir que cuando el gas
segregue energía, disminuya la cantidad de calor suministrado por la fuente, y al
absorber el gas energía, aumente el calor y con ello se asegure la temperatura
constante. Un dispositivo especial, el termorregulador, mantiene automáticamente la
temperatura constante en el termostato.

61
Si en estas condiciones trasladamos el émbolo hacia abajo con ayuda de una
fuerza exterior (véase fig. 31), el gas se comprimirá, y la fuerza exterior realizará un
trabajo. Por el contrario, durante la dilatación realiza un trabajo positivo la fuerza que
presiona sobre el émbolo.

El cambio de volumen también se puede realizar en condiciones, cuando el gas no


se le transmite ni se le quita calor. Tal proceso se llama adiabático. A diferencia del
proceso isotérmico, que exige un buen contacto con el medio del termostato, en el
proceso adiabático se exige, por el contrario, un aislamiento térmico cuidadoso entre el
gas y el medio ambiente.

2.8. TRABAJO DURANTE EL CAMBIO ISOTÉRMICO DEL VOLUMEN DEL GAS


IDEAL

Para determinar el trabajo durante el cambio isotérmico del volumen del gas, es
necesario calcular la integral de acuerdo con la ecuación (23.2)

∫ dA = ∫ pdV
a lo largo de la isotermia. No podemos sacar p fuera del signo integral, ya que la
presión varía continuamente durante la dilatación. Pero la presión cambia con el
cambio del volumen según la ley de Boyle-Mariotte, es decir, pV = RT = cons tan te ,
RT
donde p = .
V
Poniendo esta expresión de p bajo el signo de integración, obtenemos para el
trabajo A, durante el cambio del volumen de V1 a V2.

V2 V
dV 2
dV V
A = ∫ RT = RT ∫ = RT ln 2 (29.1)
V1 V V1 V V1

Esta es la expresión del trabajo de dilatación isotérmica (o compresión) de 1mol de


gas ideal. Si la masa del gas es igual no a 1mol entonces la fórmula (29.1) toma la
forma:

M V
A= RT ln 2 (29.2)
µ V1

donde M/µ es el número de moles.

De las fórmulas (29.1) y (29.2) se ve que el trabajo de la dilatación isotérmica no


depende de la diferencia de los volúmenes, entre los que se realiza la dilatación, sino
de su relación. Lo mismo se refiere, naturalmente a la compresión.

Ya que según la Ley de Boyle-Mariotte p1V1 = p2V2, entonces

V2 p
= 1
V1 p2

62
Por eso, en las fórmulas (29.1) y (29.2), en lugar de la relación de los volúmenes se
puede poner la relación inversa de las presiones. Entonces,

M p
A= RT ln 1
µ p2
Como ya se indicó anteriormente, durante la dilatación isotérmica el calor
transmitido al gas se gasta sólo en la relación de trabajo exterior. Por el contrario,
durante la compresión isotémica, el trabajo de las fuerzas externas pasa a aumentar la
energía interna (calentamiento) de los cuerpos circundantes. Esto corresponde,
dQ
formalmente, a que la capacidad calorífica del gas es igual a ∞ (ya que dT = 0).
dT

2.9. CAMBIO ADIABÉTICO DEL VOLUMEN DEL GAS IDEAL

Durante el proceso adiabático el gas no entrega calor a los cuerpos


circundantes, lo mismo que tampoco lo recibe del exterior dQ = 0. La ley de
conservación de la energía, en este caso, toma la forma:

− pdV = Cv dT (30.1)

Esto significa, que el trabajo, ligado al cambio de volumen del gas, deberá
acompañarse con el cambio de la energía interna, y por lo tanto, de la temperatura. El
signo menos de la expresión (30.1) significa que el aumento de volumen del gas
(dilatación) va acompañado con la disminución de su temperatura, y con la
compresión, con el aumento de la temperatura. En el primer caso el gas realiza un
trabajo a cuenta de su propia energía interna, por eso desciende su temperatura. En el
segundo caso, la fuerza exterior realiza el trabajo y, a cuenta de este trabajo, crece la
energía interna, y por lo tanto aumenta la temperatura del gas.

Nos podemos representar fácilmente


el cuadro “cinético” de este cambio de
temperatura. Imaginémonos una vasija
en forma de cilindro con gas y con un
émbolo (fig. 37). Supongamos que el
émbolo asciende con una velocidad µ (el
gas se dilata). Examinemos una
molécula determinada, que se mueve
con una velocidad ν en la misma
dirección que el émbolo. Si la velocidad
de esta molécula, que va “alcanzando”
al émbolo en relación a las paredes de
la vasija es igual a ν, entonces, en
relación al émbolo, su velocidad será
igual a ν → u. Después que nuestra
molécula “alcanza” al émbolo y se realiza un choque elástico, su velocidad con
relación al émbolo deberá quedarse como antes ν → u, a pesar de que ya se mueve
no tras el émbolo, sino, al contrario. Esto significa que su velocidad en relación a las
paredes de la vasija deberá ser menor que la anterior en la magnitud ν → 2u. De tal
modo, todas las moléculas que chocan con el émbolo retroceden de él con una
velocidad menor que antes del choque. Esto conduce a la disminución de la velocidad
media de la molécula y, por lo tanto, a la disminución de la temperatura.
63
Ecuación de Poisson. Antes de calcular el trabajo del cambio adiabático del
volumen del gas, es necesario hallar la relación entre el volumen del gas y su presión,
ya que en el proceso adiabático ya no se determina por la ley de Boyle-Mariotte. Para
ello es necesario de la ecuación.

Cv dT + pdV = 0 (30.2)

excluir a T. Esto se puede hacer, utilizando la ecuación de estado

pV = RT ,

cuya diferencia da:

pdV + Vdp
pdV + Vdp = RdT , de donde dT =
R

Poniendo este valor de dT en (30.2) obtenemos:

pdV + Vdp
Cv + pdV = 0 ,
R

O, después de cambiar R por su valor igual C p → Cv = R , tenemos:

CvVdp + C p pdV = 0
Cp
Designemos la relación de los calores específicos por = γ , entonces, la última
Cv
ecuación toma la forma:

dp dV
+γ = 0. (30.3)
p V

Con la suposición de que γ es constante, se puede escribir:

dp dV
∫ p
+γ∫
V
=0

Después de la integración, obtenemos: ln p + γ ln V = cons tan te , o bien

pV γ = cons tan te (30.4)

Esta es la relación buscada entre la presión y el volumen del gas ideal, durante el
proceso adiabático del cambio de volumen.

La ecuación (30.4) se llama Ecuación de Poisson, o ecuación de la adiabata, y la


Cp
magnitud γ = exponente de la adiabata.
Cv
64
Al integrar (30.3) tomamos γ como constante. Rigurosamente hablando, esto no es
completamente justo. El calor específico Cv y, por consiguiente, Cp y γ pueden
cambiarse con el cambio de volumen, de la presión y de la temperatura. Por eso, la
ecuación de Poisson (30.4) es rigurosamente justa, para un intervalo limitado de
valores de presiones y volúmenes. La ecuación diferencial (30.3) es exacta.
De la ecuación de Poisson se ve que a diferencia del proceso isotérmico, durante el
cambio adiabético del volumen del gas, su presión cambia inversamente proporcional,
no a la primera potencia del volumen, sino a Vγ, siendo γ mayor que la unidad, ya que
Cp > Cv. Está claro que el gráfico de la presión en función del volumen ahora ya no
será una hipérbola.
Ya que γ > 1, entonces la curva p = f (V) para el
proceso adiabático, llamada adiabata2, está más inclinada
que la isoterma, como se ve en la fig. 38 en donde está
representada la adiabata y la isoterma del gas ideal para
su comparación. El descenso más rápido de la presión
con aumento de volumen, durante el proceso adiabético,
se explica con que durante el proceso de dilatación
adiabática del gas ideal, disminuye su presión, no solo a
cuenta del aumento de volumen, sino a consecuencia del
descenso de la temperatura que ocurre con ello.
No es difícil hallar la relación entre los otros parámetros
del gas para el proceso adiabético.

Así por ejemplo, excluyendo la presión p de la ecuación, (30.4) y de la ecuación de


estado pV = RT, obtenemos la relación entre la temperatura y el volumen del gas,
durante el cambio adiabético.
RT
Poniendo en la ecuación (30.4) el valor p = , obtenemos:
V

RT γ
V = const
V

TV γ −1 = const , (30.5)

(ya que R es constante).

Del mismo modo, colocando en la ecuación (30.4) el valor V de la ecuación de


RT
estado V = , obtenemos la relación entre la presión y la temperatura, durante el
P
proceso adiabético:

γ
 RT 
p  = const
 p 

2
Adiabata y adiabática son términos equivalentes (N. del T.)
65
T γ p1−γ = const (30.6)

Elevando ambas partes de la igualdad (30.6) a la potencia 1/γ obtenemos:

1− γ

Tp γ
= const (30.7)
Es claro que las objeciones hechas sobre los límites de aplicación de la ecuación
de Poisson también se refieren a las fórmulas (30.5) y (30.7).

2.10. TRABAJO DURANTE EL CAMBIO ADIABÁTICO DEL VOLUMEN DEL


GAS

Aplicando la ecuación de la adiabética que acabamos de obtener, ahora


podemos calcular el trabajo realizado por el gas durante su dilatación adiabática (o el
trabajo realizado por las fuerzas externas al comprimir el gas).

Calculemos el trabajo de dilatación del gas (1 mol) desde un valor inicial del
volumen V1 has V2. Como anteriormente, el trabajo elemental durante el cambio de
volumen en dV será igual a

dA = pdV .

El alcance entre la presión p del gas y su volumen V se determina por la ecuación


de la adiabata (para que el proceso de dilatación esté en equilibrio, es necesario
llevarlo a lo largo de la adiabata)

pV γ = const ,

que también podemos escribirlo en la siguiente forma

pV γ = p1 A1γ

donde p1 es la presión inicial del gas, V1 es su volumen inicial. De donde

p1V1γ
p=

Poniendo el valor de p en la fórmula del trabajo, obtenemos:

p1V1γ
dA = γ dV
V

Para obtener el trabajo de dilatación desde V1 hasta V2, es necesario integrar la


expresión para dA en estos límites:

V2 V
dV 2
dV
A = ∫ pV γ
= p1 1 ∫
V
1 1
γγ
γ
V1 V V2 V

66
Después de la integración obtenemos, para la integral de la parte derecha de la
igualdad, la siguiente expresión:

V2
dV 1  1 1 
∫V V γ − 1  V1 V2γ −1  .
γ
=  γ −1

1

Por eso, la expresión del trabajo A toma la forma:

p1V1γ 1   V1  
γ −1

A= . 1 −   
γ − 1 V1γ −1   V2  
 

RT1
De la educación de estado se deduce que p1 = , de donde obtenemos la
V1
expresión final:

RT1   V1 
γ −1

A= 1 −   . (31.1)
γ − 1   V2  

Si la masa de gas es igual a M, esta fórmula toma la forma:

M RT1   V1  
γ −1

A= 1 −    . (31.2)
µ γ − 1   V2  
 
γ −1
V  T2
Ya que PV1 1
γ −1
=TV
2 2
γ −1
, entonces  1  = . Por eso, la fórmula para el trabajo
 V2  T1
durante el cambio adiabético del volumen se puede representar en la forma

RT1  T2  R
A= 1 −  = ( T1−T2 ) = CV ( T1 − T2 ) ,
γ − 1  T1  γ − 1

R
Ya que = CV
γ −1

La comparación de las expresiones (31.1) y (29.2) muestra que, durante la


dilatación abiabática, se realiza menor trabajo que en la isotérmica (para un mismo
cambio de volumen). Esto está ligado, evidentemente, con la mayor pendiente de la
adiabata en comparación de la isoterma, ya que debido a esto, en cualquier estadio
del proceso de dilatación, en condiciones iniciales iguales, la presión durante el
proceso adiabético, será menor que durante el isotérmico.

67
El trabajo durante la dilatación adiabética del gas, depende fundamentalmente del
Cp
valor del exponente de la adiabata γ = . Se ve fácilmente, que si γ → 1 , el trabajo
Cv
de la dilatación adiabética tenderá al valor del trabajo en el proceso isotérmico.
Podemos convencernos de esto, hallando el valor límite de la parte derecha de la
ecuación (31.1) para γ → 1 (utilizando el Teorema de L´Hopital).

En los gases poliatómicos, para los cuales el valor de γ es el más próximo a la


unidad, existe la mínima diferencia entre los valores de los trabajos en los procesos
isotérmicos y adiabético.

La comparación de los dos procesos examinados es más cómodo realizarla si


recurrimos a la representación gráfica del proceso de cambio de volumen del gas. En
el gráfico de dependencia entre la presión del gas y su volumen (fig. 39), el trabajo
elemental dA del cambio de volumen del gas dV, se representa por la superficie
limitada por el tramo de la curva AB y por el segmento dV sobre el eje de las abscisas
(cuadriculada) El trabajo de cambio de volumen del gas desde el valor V1 hasta el
V2

valor V2, que es igual a ∫ pdV , se representa por toda la superficie rayada, limitada
V1

por los tramos correspondientes de la curva AB y el segmento del eje de las abscisas.

En la fig. 40 están expuestas, para su comparación, las curvas 1 y 2 que


representan la isoterma y la adiabata de un mismo gas y para condiciones iniciales
iguales. El trabajo del cambio isotérmico y del volumen del gas desde V1 hasta V2 es
igual a la superficie ABV2V1 y el trabajo correspondiente a la dilatación adiabética es
igual a la superficie AB1V2V1 que es, evidentemente, menor (véase la fig. 40).

Mientras menor sea la constante γ de la adiabata, tanto más próxima estará la


adiabata de la isoterma y tanto menor será la diferencia entre las superficies por
debajo de ambas curvas. En el lÍmite, cuando γ → 1 , la adiabata se convierte en
isoterma.

68
3. ELEMENTOS DE LA TERMODINÁMICA

3.1. ESTADOS DE EQUILIBRIO

La teoría cinética de los gases explica muchos fenómenos de los gases ideales, en
los cuales los movimientos de las moléculas se pueden considerar libres, debido a la
pequeñez de las fuerzas de interacción entre ellas. En los casos cuando no se pueden
depreciar las fuerzas de interacción, como, por ejemplo, en los gases reales, la teoría
describe con mucha más precisión los procesos que ocurren en ellos. Esto se explica
con el cuadro detallado de los movimientos moleculares no es conocido en la mayoría
de los casos, ya que no se consigue tener en cuenta, lo suficientemente exacto, todas
las fuerzas que actúan sobre las moléculas. Cualquier sistema molecular está
compuesto de un número enorme de partículas que interaccionan entre sí, que se
mueven constantemente y cambian su posición mutua. En tales condiciones es
imposible conocer, exactamente, las fuerzas que actúan sobre la molécula en
cualquier momento de tiempo, y por lo tanto conocer sus movimientos. Por eso, no se
pueden determinar teóricamente el enlace entre los movimientos moleculares y las
propiedades de la substancia.

Sin embargo, puede ser estudiada una serie de propiedades de la substancia,


muchos fenómenos en ella, sin un conocimiento detallado del mecanismo de los
movimientos moleculares, si utilizamos solamente las magnitudes macroscópicas, es
decir, las magnitudes que caracterizan la substancia en total, pero cuya aplicación a
partículas por separado no tiene sentido. A tales magnitudes se refieren, ante todo, la
presión y la temperatura. Como ya vimos anteriormente, estas magnitudes solo tienen
sentido en relación al conjunto de un gran número de partículas. No se puede hablar
de la presión o temperatura de una molécula. Esto se deduce de que ambas
magnitudes se determinan por la energía cinética media de las partículas.

Una situación análoga ya la hemos encontrado en la mecánica. Al resolver una


serie de tareas, relativas al puro movimiento mecánico, frecuentemente, resulta difícil
determinar los parámetros fundamentales que caracterizan este movimiento, es decir
las coordenadas y los impulsos de distintos cuerpos del sistema en cualquier momento
de tiempo. En estos casos se recurre a la ayuda de las leyes generales, que se
refieren a todo el sistema en su conjunto. Tales leyes son las leyes de conservación de

69
la energía y del impulso. Estas se pueden utilizar sin saber con detalle el carácter de la
interacción de los cuerpos y de sus movimientos, porque estas leyes son justas para
cualesquiera movimientos y cualesquiera interacciones.

De la misma manera, al estudiar las propiedades de la substancia, ligadas con los


movimientos térmicos de las partículas, también se utilizan algunas leyes generales,
siempre justas, independientemente del carácter de los movimientos de las moléculas,
de la interacción entre ellas, de la estructura de la substancia. Estas leyes generales
se refieren a la energía, a sus cambios y a las magnitudes ligadas a ella.

La parte de la Física que se ocupa del estudio de las propiedades generales de la


substancia, ligadas con los movimientos térmicos en las condiciones de equilibrio, se
llama Termodinámica. La situación particular de la Termodinámica en la Física, está
ligada a que por causas, sobre las cuales hablaremos más adelante, cualquier forma
de energía, durante sus transformaciones, al fin y al cabo se transforma en energía de
movimientos térmicos. Sí por ejemplo, en el proceso del movimiento mecánico, la
energía del cuerpo o del sistema de cuerpos disminuye, debido a la acción de las
fuerzas de rozamiento, entonces, esto se realiza porque ella se transforma en calor,
los cuerpos que frotan se calientan. Se transforma también en calor la energía de la
corriente eléctrica, la energía de la luz, la energía de las reacciones químicas, etc.
Cualquier forma de energía, en el proceso de transformación puede pasar a través de
muchas formas de energía, pero el resultado final de todas estas transformaciones
inevitablemente es la energía térmica.

Un gran interés práctico tiene la transformación de la energía mecánica en calor y


el proceso inverso de obtención del trabajo mecánico, a base de la energía térmica.
Esta cuestión la examinaremos lo más detalladamente posible.

Pero antes de empezar esta cuestión y de formular las leyes de la Termodinámica;


es necesario dedicar alguna' atención a la cuestión importante sobre el equilibrio,
concepto que se introduce en la Termodinámica de modo semejante a como esto se
hacía en la Mecánica.

En Mecánica se llama equilibrio al estado del cuerpo, durante el cual éste se


encuentra en reposo, (claro está, respecto a un determinado sistema de coordenadas).

En la Termodinámica el concepto de equilibrio es un tanto más amplio.

Un sistema se encuentra en equilibrio termodinámico, si las magnitudes


macroscópicas, que determinan su estado, quedan constantes (y añadimos iguales a
sus valores medios). En primer lugar, esto se refiere a la presión y a la temperatura.
En estado de equilibrio no se puedan realizar tales fenómenos, como la conductibilidad
calorífica, la difusión, las reacciones químicas, las transiciones fásicas.

Pero el equilibrio termodinámico (algunas veces también lo llaman equilibrio


estadístico), se diferencia, esencialmente, del mecánico en que, a pesar de que las
magnitudes macroscópicas que caracterizan el sistema quedan constantes, las
partículas, de que se compone el sistema (átomos, moléculas), no interrumpen sus
movimientos complejos. Y la circunstancia de que esto no dificulta a quedar el sistema
en estado invariable, está condicionada por el gran número de estas partículas.

Así, por ejemplo, si ponemos en contacto dos cuerpos que poseen la misma
temperatura, entonces, como es bien conocido de la experiencia diaria, el calor no

70
pasará de un cuerpo a otro y la temperatura de los cuerpos en contacto queda
invariable, los cuerpos se encontrarán en equilibrio. Mientras tanto, no está excluido
que en algunos, puntos de contacto de estos cuerpos las partículas de uno de ellos
poseen una energía cinética mayor, que las partículas del otro. En estos puntos se
realizará, naturalmente, el paso de calor de un cuerpo a otro. Pero él se compensará,
indudablemente, con el pasó inverso en otros puntos, donde la diferencia de energías
tenga el signo contrario.

En general, la energía térmica no pasa dé un cuerpo a otro en el caso de los


cuerpos con la misma temperatura, y a esto hay que añadir que las partículas de los
cuerpos a lo largo de la superficie de contacto teniendo las energías «individuales»
más diferentes, poseen el mismo valor medio de energía para, ambos cuerpos.

Lo mismo se refiere al hecho muy conocido, de .que el gas en estado de equilibrio


se distribuya uniformemente por todo el volumen de la vasija, de modo que su
densidad, es igual en todas partes de la vasija. Esto está completamente condicionado
con que el número de moléculas de gas es extraordinariamente grande. Si hubiese en
la vasija, por ejemplo, cien moléculas en total, entonces, siendo el movimiento de las
moléculas completamente caótico, no podríamos esperar que en cada una de las dos
mitades de la vasija se contuviesen en cualquier momento exactamente 50 moléculas.
Pero incluso, para un gran número de partículas, pueden tener lugar algunas
desviaciones en su distribución uniforme por el volumen en algunas partes de la vasija.
Es igual y constante sólo ladensidad media del gas en todo el volumen.

Nos encontramos con una posición análoga al establecer el equilibrio entre el


líquido y el vapor en una vasija cerrada. Se forma vapor sobre el líquido como
resultado de la evaporación, proceso que consiste en, que las moléculas de líquido
que poseen gran velocidad, abandonan el líquido en su superficie. Pero parte de las
moléculas que abandonaron el líquido, durante su movimiento caótico puede volver de
nuevo a él y esto se realiza, tanto más frecuentemente, cuanto mayor sea la cantidad
de vapor. El equilibrio entre el líquido y su vapor comienza cuando el número de
moléculas, que abandonaron el líquido en la unidad de tiempo, se hace igual al
número de moléculas que regresan del vapor al líquido. El vapor se satura y después
de esto no se realiza en el sistema ningún cambio macroscópico, la presión y la
temperatura quedan constantes. Sin embargo, la salida de las moléculas del líquido y
su regreso del vapor continúan también después de establecerse el equilibrio. Y no
está excluido en este caso que en algunas partes del volumen, en estado de equilibrio,
la densidad del vapor pueda diferenciarse del valor medio, es decir, de la densidad del
vapor saturado.

Estos ejemplos indican dos particularidades del estado de equilibrio. En primer


lugar, el concepto de equilibrio termodinámico es una determinada idealización,
porque, hablando en rigor, durante el equilibrio los parámetros, de estado no quedan,
constantes, sino que sufren unas pequeñas oscilaciones alrededor de sus valores de
equilibrio (medios). Tales oscilaciones, como se indicó anteriormente, se llaman
fluctuaciones. En segundo lugar, se puede hablar de equilibrio termodinámico sólo en
el caso, cuando es muy grande el número de partículas que componen el sistema.

Observemos que las leyes de la Termodinámica sobre las que hablaremos en este
capítulo, sólo se refieren a los sistemas compuestos de un gran número de partículas.

3.2. PROCESOS REVERSIBLES E IRREVERSIBLES

71
Si por cualquier causa el sistema no se encuentra en equilibrio o ha sido sacado de
él y luego se le deja a su albedrío (esto significa, que no se somete a las acciones
externas), entonces, como demuestra la experiencia, se realiza por sí mismo el paso al
estado de equilibrio. Se puede incluso decir que el estado de equilibrio es aquel
estado, al cual pasa cualquier sistema molecular en ausencia de acciones externas
sobre él. El proceso de paso al equilibrio se llama relajación y el tiempo empleado en
él se llama tiempo de relajación.

Pero cuando ya se ha establecido el equilibrio, el sistema, como muestra la


práctica, no puede volver a su estado de desequilibrio inicial. En otras palabras, el
cambio de estado, que sufrió el sistema, pasando al estado de equilibrio, no puede
realizarse en dirección contraria sin la acción exterior.

Así, por ejemplo, si dos cuerpos que están en contacto, poseían al principio una
diferencia de temperaturas y fueron, puestos a su albedrío, entonces, se iguala, al fin y
al cabo la temperatura de ambos cuerpos. Pero el proceso inverso, el aumento de la
diferencia de temperaturas entre ellos, no se realiza sin la acción exterior.

El gas por si mismo siempre se distribuye uniformemente por todo el volumen de la


vasija, y tal estado corresponde al equilibrio. Pero el gas nunca se acumula en una
parte de la vasija en mayor cantidad (con mayor densidad) que en otra parte, sin la
acción de las fuerzas externas.

Exactamente igual, si introducimos en la vasija dos gases diferentes, ellos mismos


se mezclan a consecuencia de la difusión mutua de modo que la composición de la
mezcla se hace igual en todas partes. En esto consiste el estado de equilibrio. Sin
embargo, para separar de nuevo estos gases, se exige gastar grandes fuerzas del
exterior.

Los ejemplos expuestos indican una particularidad importante de los procesos que
se realizan en los sistemas moleculares, que es su irreversibilidad. En esto,
precisamente, los procesos moleculares se diferencian de los puramente mecánicos,
los cuales se caracterizan por su rigurosa reversibilidad.

Se llama proceso reversible al cambio de estado del sistema (o de un cuerpo por


separado) que, al ser realizado en dirección contraria lo vuelve a su estado inicial, de
modo que el sistema pase a través de los mismos estados intermedios que en el
proceso directo, pero en orden inverso y el estado de los cuerpos exteriores al sistema
queden invariables.

Son reversibles todos los movimientos, examinados en la Mecánica, excepto


aquellos en los que actúa la fuerza de rozamiento (la acción de la fuerza de
rozamiento conduce a la segregación de calor, y el proceso deja de ser puramente
mecánico).

Así, por ejemplo, cuando cae una bola elástica sobre una superficie dura, se realiza
el cambio de la energía potencial de la bola en cinética, ya que en el momento, cuando
la bola se pone en contacto con la tabla en donde cae, su energía cinética es
exactamente igual a la energía potencial inicial, si no existe la fuerza de rozamiento
con el aire, durante el movimiento de la bola hacia abajo. Al chocar, se origina la fuerza
de elasticidad (debido a la deformación de la bola y de la tabla), y si no interrumpimos
el proceso, entonces estas fuerzas obligan a la bola a empezar el movimiento inverso

72
hacia arriba. Con ello de nuevo la energía potencial, esta vez la energía de
deformación, se transformará en la energía cinética del movimiento de la bola y ésta
se elevará a la misma altura, que cuando empezó su caída. Este proceso puede
repetirse muchas veces. Está claro, que el movimiento hacía arriba de la bola es un
proceso inverso a su caída, y no es difícil observar que durante su elevación la bola
pasa por todos los mismos estados intermedios, determinados por sus coordenadas
que tenía durante su caída, pero en orden contrarío. Por consiguiente, este proceso
puramente mecánico es reversible. Es cierto, que el proceso pasará como acabamos
de describir, sólo en el caso si no existen las fuerzas de rozamiento con el aire, si la
hola es completamente elástica, si también la tabla sobre la que ella choca es
completamente elástica. Todos estos «sí» indican que el proceso reversible, incluso en
el ejemplo mecánico examinado, es una determinada idealización, ya que de hecho no
existen cuerpos completamente elásticos, nunca se puede excluir completamente la
fuerza de rozamiento, etc. Pero, por lo menos en su esencia, el movimiento mecánico
es reversible.

Los procesos que no satisfacen la condición de reversibilidad expuesta


anteriormente se llaman irreversibles.

Expongamos aquí un ejemplo que permite precisar el concepto de la reversibilidad


e irreversibilidad de los cambios o procesos,

Supongamos que un muelle, sujeto por uno de sus extremos, se deforma (se estira)
con una fuerza F, aplicada a su otro extremo (fig. 90). El muelle se estira aumentando
su energía potencial a cuenta del trabajo de la fuerza F. Si después de que el muelle
resulta estar estirado en una longitud determinada suspendemos la acción de la
fuerza, entonces, el muelle vuelve a su estado inicial, disminuyendo
correspondientemente su energía potencial.

¿Se puede considerar reversible el proceso descrito de estiramiento del muelle?

Se ve fácilmente, que si estiramos rápidamente el muelle (más adelante se verá lo


que significa «rápidamente»), e inmediatamente suspendemos la acción de la fuerza,
entonces el proceso no será reversible.

En efecto, cuando la fuerza F empieza a estirar el muelle, ante todo se deforma


aquella parte del muelle, a la cual está directamente aplicada la fuerza, es decir, a la
parte colindante con el extremo libre. La deformación se transmite poco a poco a las
restantes partes del muelle y, por último, sufre la deformación aquella parte que
colinda con el extremo fijado.

Después de suspender la acción de la fuerza el muelle empieza a encogerse. Pero


también ahora la deformación, esta vez la deformación por compresión, al principio la
sufre la parte del muelle colindante con el punto de aplicación, ya que ella,

73
evidentemente, es la primera en «sentir» que la fuerza ha dejado de actuar. De esta
parte se transmite poco a poco la deformación a lo largo del muelle, hasta que no se
restablezca el estado inicial.

De tal modo, a pesar de que el proceso de compresión va en sentido contrario, con


ello el muelle no pasa por los estados intermedios en orden contrario: durante el
proceso directo se deformó al principio aquella parte del muelle que colinda con el
extremo libre, y de él se transmitió la deformación a las partes restantes del muelle; del
mismo modo y no en orden contrario se deformó el muelle durante la compresión, por
eso, en el experimento descrito no se puede considerar reversible el proceso de
estiramiento del muelle. La irreversibilidad se manifiesta con que, al suspender
rápidamente la acción de la fuerza, el muelle se pone en movimiento oscilatorio, que
no es reversible: la fuerza de rozamiento conduce al amortiguamiento de las
oscilaciones y su energía se transforma en calor.

Por esta causa, la compresión rápida o la dilatación de un gas isotérmica o


adiabática, no son procesos reversibles. Lo mismo que en el caso del muelle, la
reversibilidad consiste aquí en que la ordenación de los estados intermedios durante
los procesos directo e inverso resultan ser iguales.

Al número de procesos irreversibles se refiere también la dilatación de un gas en el


vacío, no equilibrado por las fuerzas externas. Son irreversibles todos los procesos de
transporte, conductividad calorífica, difusión y de rozamiento interno.

3.3. PROCESOS CUASIESTÁTICOS

En relación al concepto de reversibilidad e irreversibilidad recordaremos lo que


se dijo en el cap. II sobre los procesos cuasiestáticos (véase la pág. 115).
En algunos casos de los procesos que se desarrollan irreversiblemente en
unas condiciones, pueden ser reversibles en otras. Por ejemplo, el proceso de
estiramiento del muelle, descrito anteriormente, puede ser realizado de una forma
reversible. Para esto, es necesario que la fuerza exterior que estira al muelle aumente
constantemente a medida del estiramiento, para que sea en cada momento igual y
contraria a la fuerza de elasticidad del propio muelle. En otras palabras, es necesario
que el muelle se encuentre en cada momento dado en estado de equilibrio. Para ello
es estiramiento deberá realizarse tan lentamente, que la deformación tenga tiempo de
transmitirse en toda la longitud del muelle y siempre sea igual en todos los puntos.
Entonces estará en equilibrio en cualquier momento. Por principio, el proceso se debe
realizar infinitamente lento. El tiempo de estiramiento debe ser prácticamente muy
grande en relación al tiempo de relajación. Si la duración del proceso es menor que el
tiempo de relajación, entonces no tiene tiempo de establecerse el equilibrio, el proceso
resulta ser muy rápido para ser reversible.
Recordemos que los procesos, en la marcha de los cuales el sistema está todo
el tiempo en equilibrio, se llaman cuasiestáticos. Está claro que estos procesos son
reversibles, ya que todos los estados intermedios están en equilibrio.
En los ejemplos, expuestos anteriormente, de comprensión y estiramiento de
un muelle o de un gas, el tiempo de relajación es el tiempo de propagación del sonido,
ya que las ondas acústicas representan en sí la dilatación y compresión propagadas
en el cuerpo.
La dilatación del gas o su compresión, realizada con ayuda de un émbolo, será
cuasiestática, si la velocidad de traslación del émbolo es pequeña en relación con la
velocidad del sonido en el gas, ya que en estas condiciones, la presión tiene tiempo de

74
igualarse en todo en volumen del gas. Como vimos (véase la pág. 116) el trabajo de
dilatación del gas era el máximo en este caso.
Recordemos una vez más que los procesos cuasiestáticos pueden ser
representados como la curva de la presión en función del volumen o de la
temperatura. El proceso irreversible no puede ser representado por esta curva. Si el
proceso no está en equilibrio (no es cuasiestático), entonces, no se puede hablar de
una determinada presión o una determinada temperatura, correspondiente al valor
dado del volumen. Todos los procesos que se desarrollan naturalmente, tales como el
paso del calor del cuerpo más caliente al menos caliente, la igualación de
concentraciones en las mezclas gaseosas, etc., siempre son procesos irreversibles y
naturalmente no cuasiestáticos.

3.4. IRREVERSIBILIDAD Y PROBABILIDAD

De tal modo, vemos que los procesos ligados a los movimientos térmicos de
las moléculas, se diferencian de los movimientos mecánicos en que ellos
frecuentemente suelen ser irreversibles.
Entre tanto, el movimiento de las moléculas de por sí, por lo menos en su
primera aproximación, se someten a las leyes de la Mecánica, y nosotros utilizamos
estas leyes al deducir las ecuaciones fundamentales de la teoría de los gases ideales.
Surge la pregunta natural ¿de qué modo el conjunto de partículas, cada una de las
cuales se somete a las leyes de la Mecánica y cuyos movimientos son, por
consiguiente, reversibles, sólo es capaz de cambios irreversibles (si excluimos los
procesos cuasiestáticos, que no se realizan por sí mismos)?
Como veremos ahora, la causa de esto es la grandiosidad del número de
partículas y el caotismo absoluto de sus movimientos. Para aclarar la causa de esta
diferencia cualitativa, que se origina durante el cambio cuantitativo del número de
partículas, examinemos el siguiente ejemplo.
Sea que la vasija de volumen V esté rellena de aire. Dividamos
imaginariamente el volumen de la vasija, supongamos en cinco partes, cada una de
las cuales con un volumen Vt, e introduzcamos en una de ellas, por ejemplo, en la
inferior, una molécula señalada con un rayado (fig. 91), verbigracia, la molécula de
éter. Tomando parte en los movimientos térmicos desordenados con las partículas de
aire, nuestra molécula abandonará pronto el volumen separado y en el proceso de su
movimiento sucesivo caerá en todas las cinco partes de la vasija, y entre otras, en
aquella parte que acababa de abandonar.
Si planteamos la pregunta de si es un proceso reversible
el paso de la molécula de éter desde el volumen Vt rayado al no
rayado, deberemos responder a ella afirmativamente, ya que sin
ninguna acción externa nuestra molécula se encuentra de nuevo,
rápidamente, en la parte de volumen de la vasija abandonada por
ella. Y si controlamos cada segundo su posición, no existe
ninguna duda de que aproximadamente en una quinta parte de
observaciones la encontraremos en el volumen Vt. Utilizando el
concepto de probabilidad que introducimos anteriormente (pág.
65) se puede decir, que la probabilidad de hallar la molécula en el
volumen Vt es igual a 1/5. Esta probabilidad es bastante grande
para considerar el proceso reversible, capaz de desarrollarse en
ambas direcciones.
Si introducimos ahora no una, sino dos moléculas de éter, entonces la probabilidad
de encontrarse a un mismo tiempo en el volumen Vt, de acuerdo al teorema de la
multiplicación de probabilidades (las moléculas se mueven independientemente una
de otra, por eso aquí se debe emplear precisamente este teorema) será igual a (1/5)2.

75
Esta probabilidad ya es mucho más pequeña, de modo que el proceso del paso de dos
moléculas de V a Vt se puede considerar reversible con menos derecho. Si
introducimos 3, 4, 5… moléculas de éter, entonces la probabilidad de hallarlas de
nuevo en el volumen inicial será correspondientemente igual a
3 4 5
1 1 1
  ;   ;   ;...
5 5 5
Con el crecimiento del número de partículas de éter, introducidas al principio en
el volumen Vt, la probabilidad de hallarlas de nuevo allí se hará cada vez menor. Por
consiguiente, el proceso de la mezcla de las partículas de éter en el aire se hará cada
vez menos reversible.
Esto quedará más claro, si traducimos nuestro raciocinio al lenguaje del tiempo.
Supongamos que la molécula que abandonó a Vt regresa allí después de 2 segundos.
Para esperar el regreso no de una sino de dos moléculas ya se exigen 2 2 s, para 3, 23
s, y así sucesivamente. Pero si hay 100 moléculas de éter, entonces para observar el
regreso a Vt de todas las 100 moléculas, ya sería necesario 2100 s y este número ya
tiene más de treinta cifras, y este tiempo supera en unos millones a la edad de la
Tierra. En la naturaleza, sin embargo, el número de partículas corrientemente alcanza
no 100, ni 1000 sino miles de millones, decenas, centenas y miles de miles de
millones. Está claro, que el proceso de difusión de un gas en otro se puede considerar
completamente irreversible, a pesar de que sea posible por principio el proceso
reversible natural. Pero éste es tan poco probable que se le puede considerar
prácticamente imposible.
Generalizando el ejemplo que acabamos de exponer, podemos decir que si del
1
volumen V separamos el volumen Vt igual a parte de V,
m
V
Vt = ,
m
entonces, la probabilidad W de que se encuentren en la parte separada N
N
1
partículas, será igual a   , y si N es muy grande, entonces, la probabilidad W será
m
muy pequeña. Imaginémonos ahora que en el volumen V de la vasija, privada de gas,
V
separamos el volumen V =
t
que está separado del volumen restante por un
m
tabique. Introduzcamos N moléculas de gas en el volumen Vt y quitemos el tabique.
Está claro que, después de esto, en el gas todas sus partículas ocuparán todo el
volumen V. Si mantenemos la temperatura constante, entonces esto será una
dilatación isotérmica del gas, desde el volumen Vt hasta el volumen V. Tal dilatación
representa en sí un cambio de estado del gas y ahora deberemos hablar sobre la
mayor o menor probabilidad del estado.
En nuestro caso se trata del paso de un estado, durante el cual se encuentra
reunido el gas en el volumen Vt (estado Vt), al estado, cuando él ocupe el volumen V
(estado V). La probabilidad W del primero de ellos es igual, como ya hemos visto, a
V
(1/m) N, o bien, ya que m = , entonces
Vt
N
V t 
W =   .
V 
Con referencia al estado V, ya que el gas no puede encontrarse en ninguna
parte, a excepción del volumen V (Vt es también una parte de V), entonces, la

76
probabilidad de este estado es igual a la unidad. Esto ya se ve de la fórmula (6.1), si
ponemos en ella Vt = V.
La probabilidad W del estado, durante el cual el gas se concentra en una parte
del volumen, en lugar de ocuparlo todo entero, para grandes valores de N (el número
de partículas de la substancia siempre es, prácticamente, muy grande) será
extraordinariamente pequeña, incluso si Vt se diferencia poco de V.
Como ejemplo, calculemos la probabilidad W de que el gas, para la presión
atmosférica y a la temperatura ambiente (T = 300K) rellene uniformemente la vasija de
volumen V = 1 cm3, a excepción de una parte de él igual a una milésima de millón. Es
decir, que
V −V t Vt
= 1− = α = 10 −9 .
V V

El número de molécula es
p
N= ≈ 2,4·10 19 ,
kT

entonces, de acuerdo con (76.1)


N
V t 
W =   =(1 − α ) N . (76.2)
V 
Apliquemos la fórmula conocida para los pequeños valores de (en nuestro
caso = 10-9):
1
lím (1 − α )

α = e = 10 lg e = 10 0.43
α →0
(e es la base de los logaritmos naturales), entonces (76.2) se puede transformar:

N
V t  1 1 1
W =   = (1 − α ) N = 1
≈ 19 −9
≈ .
1010
V (1 − α ) α
0 , 43· 2 , 4·10 ·10
 − Nα 10 10

El número en el denominador de este quebrado es la unidad con diez mil


millones de ceros. Aún más pequeña será la probabilidad de que las moléculas del gas
se reúnan en un volumen que forme una parte pequeña del volumen de la vasija. En
esto se encierra la causa de la irreversibilidad de los procesos que transcurren,
naturalmente, si el gas se distribuye por sí solo en todo el volumen de la vasija, pero
nunca se concentra en una parte de este volumen, esto no significa que este segundo
proceso sea por principio imposible. Al contrario, las leyes de la Mecánica, a las que se
someten las moléculas, permiten las dos direcciones del proceso, pero debido al gran
número de partículas la probabilidad de una de ellas es tan pequeña, que
prácticamente no se puede observar.
Los razonamientos expuestos se referían al caso particular de la distribución de
las partículas en el volumen. Pero está claro que se pueden referir a cualquier otro
proceso, donde toma parte un gran número de partículas. La concentración por sí
misma de las moléculas en una parte pequeña del volumen de la vasija es tan poco
probable, como el paso por si mismo del calor desde el cuerpo frío al caliente o la
separación por si misma de los componentes de una mezcla gaseosa. En todos estos
casos semejantes se realiza por si mismo el paso al estado de equilibrio, cuya
probabilidad prácticamente, no se realiza nunca, porque es muy pequeña la
probabilidad de tal estado.

77
Es decir, la irreversibilidad de los procesos en los sistemas moleculares,
compuestos de partículas, cada una de las cuales se somete a las leyes de la
Mecánica, es decir, se mueve reversiblemente, se explica exclusivamente con que el
número de estas partículas es muy grande. Si éstas fueran muy pocas, el sistema no
conocería ningún proceso irreversible.
Con referencia a los procesos cuasiestáticos, ya que el paso al equilibrio se
realiza en estos casos a través de los estados intermedios, ellos pueden transcurrir
con una probabilidad igual en cualquier dirección.

3.5. TRANSFORMACIONES MUTUAS DE LA ENERGÍA MECÁNICA Y TÉRMICA

Los conceptos de equilibrio, de la reversibilidad e irreversibilidad de los


procesos son generales y se refieren a todos los procesos que se realizan en la
naturaleza.
Uno de los procesos que se realizan frecuentemente en la naturaleza, al pasar
cualquier sistema al equilibrio, es la transformación de la energía mecánica en calor.
Un ejemplo de tal transformación es la segregación de calor durante el rozamiento.
Recordemos que de aquí en adelante llamaremos energía macroscópica a la energía
mecánica, es decir, a la energía cinética del movimiento de los cuerpos a su energía
potencial, condicionada por las fuerzas que actúan sobre estos cuerpos. En
contraposición a esto, la energía cinética de los movimientos térmicos de las
moléculas y la energía potencial de su interacción se llama energía interna. Es decir, la
segregación de calor a cuenta de la energía mecánica es el proceso de transformación
de la energía macroscópica en la energía de los movimientos térmicos microscópicos.
Inversa a este proceso es la transformación de calor en energía mecánica, o lo que es
lo mismo, la obtención de energía mecánica a cuenta del calor. A su tiempo, la
invención de los métodos para obtener trabajo mecánico a cuenta del calor fue el
principio de una nueva época en la historia de la civilización. En nuestros tiempos
comenzó una época no menos importante de la utilización de la energía nuclear para
obtener trabajo. Pero la energía nuclear en la actualidad se transforma en trabajo
mecánico no directamente, sino de nuevo, a través del calor. Con esto se determina la
importancia del estudio de las leyes generales que dirigen los procesos de
transformación mutua de la energía mecánica y térmica.
La Termodinámica nació, históricamente, como un apartado de la Física que
estudiaba la ligazón entre las energías mecánica y térmica. En su desarrollo posterior
la Termodinámica se ha hecho una ciencia, que estudia la ligazón entre la energía
térmica y todas las demás formas de energía: química, eléctrica, energía de
irradiación, etc.
En los siguientes párrafos nos limitaremos al examen de las leyes generales,
que ligan las energías térmica y mecánica.

3.6. PRIMER PRINCIPIO DE LA TERMODINÁMICA

La primera ley que liga la energía mecánica y térmica, es la ley de


conservación de la energía, que ya examinamos detalladamente en su aplicación al
gas ideal (véase la pág. 111). Esta ley se llama primer principio de la Termodinámica.
Recordaremos aquí el contenido de esta ley.
Si el estado de un sistema se cambia a consecuencia de aportarle una
determinada cantidad de calor dQ, y con este cambio el sistema realiza un trabajo dA,
entonces la ley de conservación de la energía dice así: la cantidad de calor aportado
es igual a la suma del trabajo realizado y del cambio de la energía interna del sistema.
La ley de conservación de la energía se expresa matemáticamente en la forma:
dQ = dU + dA. (78.1)
78
Como hemos visto
dA = pdV .
La fórmula (78.1) se puede también escribir así:
dU = dQ − dA.
Si se trata no de un cambio pequeño, sino del cambio macroscópico del
estado, entonces, es necesario sumar todos los dQ y todos los dA y calcular de tal
modo el cambio de energía interna durante el paso del sistema, por ejemplo, del
estado 1 al estado 2:
2 2 2

∫ dU = ∫ dQ − ∫ dA.
1 1 1
Aquí es importante señalar que la cantidad de calor aportado, así como
también el trabajo realizado por el sistema (o sobre él), depende de qué modo
precisamente se realizó el paso del estado 1 al estado 2. El cambio de la energía dU,
evidentemente, no depende del camino del paso, sino sólo de los estados inicial y
final. Por eso, se puede escribir que
2 2 2

∫ dU = U
1
2 − U 1 = ∫ dQ − ∫ dA,
1 1
pero no se puede escribir
2 2

∫ dQ = Q2 − Q1
1
ó ∫ dA =A
1
2 − A1

Esto significa, que el sistema en cada estado posee un determinado valor de la


energía interna U, pero no se puede decir que él posee una determinada cantidad de
valor o de trabajo. Por eso, la energía interna se llama función de estado. Pero ni Q ni
A son funciones de estado, sino del proceso de cambio de estado3.
Tienen una importancia especial los llamados procesos cíclicos (o circulares)
durante los cuales, el sistema, pasando por una serie de estados, retorna a su estado
inicial. En este caso ∫ dU = 0. Pero esto no significa naturalmente que Q y A también
son iguales a cero. En el proceso cíclico el cuerpo puede recibir o entregar una cierta
cantidad de calor, puede realizar un trabajo, o el trabajo puede ser realizado sobre él,
pero el cambio de energía interna será igual a cero.
En este caso, el primer principio de la Termodinámica se escribe así:

∫ dQ = ∫ dA,
donde el signo ∫ significa la integración por el contorno cerrado.
El primer principio de la Termodinámica es igualmente aplicable a los procesos
en equilibrio y no en equilibrio. A pesar de que lo últimos no pueden ser representados
en forma de curva, los estados inicial y final del sistema también están, en este caso,
completamente determinados.
Recordemos aquí las relaciones fundamentales que obtuvimos aplicando el
primer principio de la Termodinámica al gas ideal.
El trabajo realizado por un mol del gas ideal, durante su dilatación isotérmica desde
el volumen V1 hasta el volumen V2 es igual a:

3
Esto significa matemáticamente que, a diferencia de dU, las magnitudes dA y dQ no son
diferenciales totales
79
V2
A = RT ln .
V1

Si la temperatura del gas cae desde T1 hasta T2 durante la dilatación adiabática, el


trabajo (referido a 1 mol) realizado por el gas es igual a:

R (T1 − T2 )
A=
γ −1

Cp
Aquí γ = es la relación entre la capacidad calorífica para una presión
Cv
constante y la capacidad calorífica para un volumen constante. Recordemos que las
fórmulas expuestas se refieren al caso, cuando el cambio de estado del gas se realizó
cuasiestáticamente, es decir, por un camino reversible.
Es importante señalar que el primer principio de la Termodinámica no indica en
qué dirección van los procesos de cambio de estado. Desde el punto de vista del
primer principio, el calor, por ejemplo, puede pasar del cuerpo caliente al frío, y del frío
al caliente. Sólo es necesario que la energía entregada por un cuerpo y la recibida por
el otro sean iguales una a otra. La irreversibilidad de los procesos de la naturaleza no
se deduce, por consiguiente, del primer principio de la Termodinámica.
Las relaciones expuestas anteriormente permiten calcular la cantidad de calor
segregada como resultado de la realización de trabajo mecánico. Como se sabe,
puede considerarse resultado del trabajo mecánico realizado la aparición de una
cantidad de calor igual a él. Esto significa que la energía del movimiento macroscópico
se transforma por completo en energía de los movimientos microscópicos de las
moléculas de substancia.
Examinemos ahora el proceso inverso de la transformación del calor en trabajo
mecánico.

3.7. TRANSFORMACIÓN DEL CALOR EN TRABAJO MECÁNICO

Como sabemos se llama calor a la energía que se transmite del cuerpo con
mayor temperatura al cuerpo con menor temperatura, por ejemplo, durante su
contacto. Por sí misma, esta transmisión de energía no va acompañada con la
realización de trabajo, ya que con ello no hay ningún desplazamiento de los cuerpos.
Ella conduce sólo al aumento de la energía interna del cuerpo, al que se le entrega el
calor y a la igualación de temperaturas, después de lo cual se suspende el mismo
proceso de transmisión térmica. Pero si el calor se transmite al cuerpo que en este
caso se dilata, entonces, él puede realizar un trabajo. De acuerdo a la ley de
conservación de la energía este trabajo será igual a:

dA = dQ − dU ,

donde dU es el cambio de energía interna. Durante el proceso isotérmico se realiza el


máximo trabajo, cuando no cambia la energía interna, de modo que

dA = dQ.

Un trabajo mayor claro está no puede haber. Por consiguiente, para obtener el
trabajo máximo, igual al calor empleado, es necesario transmitir calor al cuerpo que se

80
dilata, de modo que entre él y la fuente de calor no haya diferencias de temperaturas,
porque, repetimos, el proceso irreversible de la conductibilidad calorífica es incapaz de
transformar el calor en trabajo, conduciendo solamente al aumento de la energía
interna en perjuicio del trabajo. Es cierto, que si no hay diferencias de temperaturas
entre la fuente de energía y el cuerpo al que se le transmite el calor, entonces, no se
transmitirá el calor. Pero, para que se transmita el calor, es suficiente que la diferencia
de temperaturas entre ellos sea infinitamente pequeña lo que prácticamente no se
diferencia del isotermismo completo. En tales condiciones el proceso de transmisión
de calor ocurre de un modo infinitamente lento y, por eso, es reversible.
Todo esto se relaciona al acto único de transmisión de calor al cuerpo que
realiza un trabajo. En este caso repetimos, el cuerpo puede realizar un trabajo igual al
calor entregado por la fuente. Por ejemplo, si un mol de un gas ideal, al recibir el calor,
se dilata isotérmicamente desde el volumen V1 hasta el volumen V2, con ello se
realizará un trabajo igual a R ln(V 2 / V1 ) .
Pero para la Técnica tienen importancia no estos procesos unitarios de
transformación de calor en trabajo. Los mecanismos reales existentes para obtener
trabajo a cuenta del calor (máquinas de vapor, motores de combustión interna, y etc.)
actúan, como sabemos, cíclicamente, es decir, en ellos los procesos de transmisión
del calor y de su transformación en trabajo mecánico se repiten periódicamente. Para
eso, es necesario que el cuerpo que realiza el trabajo, al recibir una cierta cantidad de
calor de la fuente y realizar un trabajo determinado, vuelva después de esto al estado
inicial, para empezar de nuevo el mismo proceso. En otras palabras, el cuerpo deberá
realizar procesos circulares.
El conjunto de cambios de estado en resultado de los cuales se restablece él
(el estado) se llama ciclo.
Recordemos, que si caracterizamos el cuerpo con su presión y volumen,
entonces su estado se representa por un punto del diagrama p – V. El cambio de
estado se representa en este diagrama con una línea, por ejemplo, la línea AaB del
diagrama de la fig. 92. El proceso circular (ciclo) se representa por una línea curva
cerrada, por ejemplo, la línea AaBbA. El trabajo realizado en un ciclo es igual a la
superficie abarcada por esta curva cerrada (véase la pág. 114, fig. 33).
Principio de Kelvin. Surge la pregunta importante ¿se puede obtener un trabajo,
durante el proceso cíclico que sea igual al calor transmitido por la fuente? A primera
vista, parece ser que para esto no hay ninguna barrera.
Como resultado del ciclo el cuerpo que realizó el trabajo
retorna a su estado inicial y, por consiguiente, queda
invariable la energía interna y el trabajo deberá ser igual al
calor absorbido. Sin embargo, en realidad, un conjunto de
datos experimentales, obliga a dar una contestación
negativa a la pregunta. Ya en el siglo pasado (año 1854)
fue formulado por V. Thomson (Kelvin) en forma del
siguiente principio:
Es imposible realizar un proceso cíclico, cuyo
único resultado sea la transformación en trabajo del calor quitado de cualquier cuerpo,
sin que haya ocurrido ningún cambio en el otro cuerpo o cuerpos.
De acuerdo a este principio, basado en numerosísimos datos experimentales,
referentes al trabajo de las máquinas térmicas, el calor quitado a la fuente se puede
transformar en trabajo (en el proceso cíclico) con la condición indispensable, de que
además de esta transformación deberá cambiarse el estado de cualquier otro cuerpo
(o cuerpos). Es decir, en el proceso de transformación del calor en trabajo, además de
la fuente de calor, de donde se quita el calor, y del cuerpo que realiza el trabajo, al cual
se le entrega directamente el calor, también deberá participar otro cuerpo (o cuerpos)

81
cualquiera. ¿Qué cuerpo misterioso es ése y cuál es su papel en el proceso de
transformación del calor en trabajo?
Como ya sabemos, para la transformación del calor en trabajo, es necesario
naturalmente <<quitar>> calor de la fuente y transmitírselo a otro cuerpo de menor
temperatura. Pero la simple transmisión no está ligada a ningún trabajo. Por eso, tal
transmisión no se realiza, directamente, sino a través de otro cuerpo, que al dilatarse
realiza <<de paso>> un trabajo mecánico y regresa a su estado inicial. Él se llama
cuerpo de trabajo4, mientras que la fuente se llama calentador y el cuerpo con
temperatura más baja, al cual se le entrega el calor es el refrigerador. Precisamente el
refrigerador es <<aquel cuerpo>> del que se habla en el principio de Kelvin. Él por sí
mismo no realiza ningún trabajo, pero es necesario, por que el cuerpo de trabajo le
debe entregar calor.
La afirmación de que para realizar un trabajo en la máquina cíclica es
necesario la participación de dos cuerpos con diferente temperatura se denomina
Principio de Carnot.
¿Pero por qué no tuvimos necesidad de este cuerpo complementario que
recibe calor, pero no realiza trabajo, cuando hablamos del acto unitario de
transformación del calor en trabajo, y por qué no se puede prescindir de él, cuando se
trata del proceso cíclico?
La cuestión consiste, evidentemente, en que durante el proceso cíclico, circular,
el cuerpo de trabajo, después de que al dilatarse realizó un trabajo a cuenta del calor
recibido del calentador, debe volver al estado inicial. Si, por ejemplo, al dilatarse el
cuerpo de trabajo, realizando un trabajo, pasa a través de una serie de estados a lo
largo de la curva AaB (fig. 92), para que vuelva a su estado inicial es necesario
comprimirlo. Pero para esto es necesario realizar un trabajo sobre el cuerpo de
trabajo. Pero este trabajo deberá ser menor que el trabajo, realizado por el cuerpo de
trabajo durante la dilatación. De otra forma el objetivo del ciclo no será conseguido. Y
para que el trabajo durante la compresión sea menor que el trabajo de dilatación, el
cuerpo de trabajo debe pasar durante la compresión por una serie de estados por la
curva que descansa por debajo de la curva de dilatación, por ejemplo, por la curva
BbA de la fig. 92. Pero la curva más baja del diagrama p – V corresponde a una
temperatura más baja. Esto significa que el cuerpo de trabajo antes de la compresión
debe ser enfriado, de él se debe quitar alguna cantidad de calor y entregárselo al
refrigerador. Por eso, ninguna máquina térmica (cíclica) no puede realizarse,
solamente, con la fuente de calor y el cuerpo de trabajo.
Si fuese posible limitarse sólo con la fuente de calor y el cuerpo de trabajo,
entonces para obtener trabajo podrían utilizarse tales <<fuentes>> de calor, como son
el agua de los mares y océanos, la corteza terrestre, la atmósfera de la Tierra, de las
cuales se podría tomar una cantidad de calor, prácticamente ilimitada. La máquina que
trabajase a base del calor de estas fuentes, que no exige por lo tanto ningún
combustible, tendría tanta importancia como el <<perpetuum mobile>> (tal máquina
imaginaria se llama perpetuum mobile de segundo género). Sin embargo, ella no está
<<prohibida>> por la ley de conservación de la energía, el trabajo se realiza a base del
calor. Pero la experiencia muestra, que tal máquina no puede ser construida. Para que
trabaje la máquina térmica cíclica es necesario el refrigerador, cuerpo con temperatura
más baja que el calentador. Precisamente, la atmósfera, corrientemente, sirve de
refrigerador.
A esta cuestión volveremos más adelante.

3.8. CICLO DE CARNOT

4
También se suele llamar <<portador de calor>> (N. del T.)
82
Examinemos ahora el proceso circular, durante el cual, el calor, quitado de
cualquier cuerpo, se puede transformar en trabajo, precisamente, de la mejor forma,
es decir, de modo que se obtenga el máximo de trabajo.
Para realizar este proceso es necesario tener, como sabemos, tres cuerpos: la
fuente de calor, del cual se extrae el calor (calentador), un cuerpo más frío, al cual se
le entrega el calor (refrigerador), y el cuerpo de trabajo, por medio del cual se realiza la
transmisión y se efectúa el propio trabajo. Supongamos, además, para sencillez del
razonamiento, que el calentador y el refrigerador tienen una capacidad calorífica, tan
grande, que sus temperaturas no cambian porque al primero se le quite y al segundo
se le entregue una determinada cantidad de calor. Examinemos cómo el cuerpo de
trabajo, realmente, realiza un trabajo en estas condiciones, a base del calor entregado
por el calentador.
Empecemos el proceso circular sobre el cuerpo de trabajo partiendo de que él
se encuentra comprimido hasta una presión determinada y está en contacto con el
calentador y tiene, por lo tanto, la misma temperatura qu
él (punto A en la fig. 93). Aquí no se verifica el proceso de
conducción de calor, ya que no hay diferencia de
temperaturas. Por lo tanto, tampoco se realiza la
transmisión de calor sin realizar trabajo. Ya que nuestra
tarea consiste en obtener el máximo de trabajo no
debemos permitir en nuestro ciclo tales procesos. Demos
ahora la posibilidad al cuerpo de trabajo de dilatarse y
desplazarse y desplazarse cualquier cuerpo, por ejemplo,
un émbolo sin interrumpir su contacto con el calentador.
Por lo tanto, la dilatación será isotérmica (curva AB en la
fig. 93). Con ello se realizará un trabajo. Se realiza,
evidentemente, a cuenta del calor quitado del calentador,
que sin embargo, no cambia su temperatura, gracias a su gran capacidad calorífica.
El calor recibido por el cuerpo de trabajo ahora es necesario entregárselo al
refrigerador. Esta transmisión tampoco es conveniente realizarla, por el contacto
directo del cuerpo de trabajo con el refrigerador, ya que la temperatura del cuerpo de
trabajo, que se dilata isotérmicamente, es mayor que la temperatura del refrigerador y
la transmisión de calor durante el contacto no irá acompañada con la realización de
trabajo útil. Por eso es necesario, al principio, enfriar al cuerpo de trabajo hasta la
temperatura del refrigerador y ya después de esto se les pueden poner en contacto.
Para el enfriamiento del cuerpo de trabajo, éste deberá estar aislado del calentador, y
luego es necesario darle la posibilidad de dilatarse adiabáticamente (mirar la curva BC
de la fig. 93), hasta que él no tome la temperatura del refrigerador (durante la
dilatación adiabática los cuerpos se enfrían). El cuerpo, en esta segunda etala,
dilatándose y trasladando el émbolo, por ejemplo, realiza, complementariamente, un
trabajo mecánico. Después de conseguir, de tal modo, el enfriamiento del cuerpo de
trabajo, se le pone en contacto con el refrigerador. Con esto se termina la primera
mitad del ciclo, durante el cual el cuerpo de trabajo realizó un trabajo útil a cuenta del
calor recibido del calentador.
Ahora es necesario volver al cuerpo de trabajo al estado inicial, es decir,
restablecer la presión y temperaturas iniciales. Esto significa, que el cuerpo de trabajo
debe ser comprimido y puesto de nuevo en contacto con el calentador. Este contacto,
como anteriormente, no se debe realizar mientras la temperatura del cuerpo de trabajo
sea más baja que la temperatura del calentador. Por eso, el retorno al estado inicial
también se realiza en dos etapas. Al principio se comprime el cuerpo de trabajo sin
alterar su contacto con el refrigerador, es decir, isotérmicamente (mirar la curva CD en
la fig. 93). Luego, aislando el cuerpo de trabajo del refrigerador, complementariamente,
se le comprime adiabáticamente, para que se caliente hasta la temperatura del

83
calentador (mirar la curva DA en la fig. 93). Durante la compresión adiabática, el
cuerpo se calienta a cuenta del trabajo externo realizado sobre él. Después que en el
proceso de compresión adiabática la temperatura del cuerpo se hace igual a la
temperatura del calentador, se les pone en contacto y con ello se finaliza el ciclo: el
cuerpo de trabajo se encuentra en su estado inicial, y el proceso puede ser empezado
de nuevo.
El proceso circular descrito se compone, de tal modo, de dos dilataciones y dos
compresiones isotérmicas y adiabáticas. Durante las dilataciones, el cuerpo de trabajo
realiza un trabajo útil: las compresiones, por el contrario se realizan a cuenta del
trabajo realizado sobre el cuerpo de trabajo por las fuerzas externas.
En ninguno de todos los estadios del proceso circular examinado no se permite
el contacto de dos cuerpos con distintas temperaturas, y de este modo, se evita el
origen del proceso irreversible de conducción calorífica. Por consiguiente, el ciclo se
verifica de forma reversible (para la completa reversibilidad es necesario realizar las
propias dilataciones y compresiones muy lentamente, por principio, con una lentitud
infinita, de modo que estos procesos sean cuasiestáticos).
El ciclo descrito, realizado por el cuerpo de trabajo, lleva el nombre de ciclo de
Carnot, en nombre del científico francés que lo examinó por primera vez.
Como resultado del proceso circular de Carnot una determinada cantidad de
calor resulta ser transmitida por medio del cuerpo de trabajo desde el calentador al
refrigerador. En la marcha del proceso, el cuerpo de trabajo realiza, además de esto,
un trabajo. A su tiempo las fuerzas externas realizan un trabajo sobre el cuerpo de
trabajo. ¿Se obtiene con esto un trabajo mecánico útil, es decir, se consigue el objetivo
de todo el proceso?
A primera vista parece ser que el trabajo realizado por el cuerpo de trabajo,
durante sus dilataciones en los dos primeros estadios del ciclo, se compensa,
completamente, con el trabajo realizado por las fuerzas externas en los dos estadios
siguientes de modo, que el trabajo útil al fin de cuentas es igual a cero. Sin embargo,
no es difícil de cerciorarse, que en realidad el trabajo positivo realizado por el cuerpo
durante su dilatación es mayor que el trabajo negativo realizado sobre él, durante su
compresión y, por consiguiente, una parte del calor, recibido del calentador, realmente,
se transforma en trabajo mecánico.
Nos podemos convencer de esto, lo más sencillamente, en el caso cuando el
cuerpo de trabajo es un gas ideal, para el cual se puede calcular exactamente el
trabajo de dilatación y compresión. Como vemos, las conclusiones obtenidas con ello,
no dependen de la naturaleza del cuerpo de trabajo, es decir, son justas para cualquier
cuerpo.
Examinemos cuantitativamente todo el ciclo de Carnot, cuando el cuerpo de
trabajo es un gas ideal (mirar la fig. 93).
Supongamos que de cuerpo de trabajo sirve 1 mol de un gas ideal, y que el
estado inicial se caracteriza por la presión p0 y el volumen V0, es decir, por el punto A
P0V0
en la fig. 93. La temperatura del gas T0 = , según nuestras condiciones, es igual
R
a la temperatura del calentador. La temperatura del refrigerador la designamos a
través de T1. Es decir, T0 > T1.
En el estado inicial, el cuerpo de trabajo tiene contacto con el calentador. El
primer estadio del proceso circular que realiza el gas es su dilatación isotérmica (se
conserva el contacto con el calentador) hasta el volumen V1. La presión,
correspondientemente, desciende por la isoterma hasta el valor p1 (punto B en la fig.
93).
El trabajo positivo, realizado por el gas durante la dilatación, es igual a:

84
V1
A1 = RT0 ln = Q0 ,
V0

donde Q0 es la cantidad de calor quitado del calentador por el gas. A cuenta de este
calor fue realizado el trabajo A.
El segundo estadio consiste en que el gas se aísla del calentador y su
dilatación sucesiva se realiza adiabáticamente, a consecuencia de lo cual se enfría el
gas. Esta dilatación adiabática se suspende cuando la temperatura del gas se hace
igual a la temperatura del refrigerador T1. El valor del volumen, hasta el cual debe
dilatarse el gas, se puede determinar teniendo en cuenta que durante la dilatación
adiabática es justa la igualdad

T0V1γ −1 = T1V 2γ −1 (80.2)

Por consiguiente, el volumen V2 se puede hallar de la igualdad

γ −1
 V2  T0
  = (80.3)
 V1  T1

Con esto la presión cambia según la adiabática hasta el valor p2 (punto C en la


fig. 93). El trabajo realizado por el gas en esta segunda etapa del proceso, es igual a
(véase la pág. 138):

RT0   V1 
γ −1
 R( T − T )
A2 = 1 −   = 0 1
(80.4)
γ − 1   V 2   γ − 1

En la tercera etapa del proceso cíclico, el gas se comprime isotérmicamente


por las fuerzas externas a la temperatura T1 del refrigerador, desde el volumen V2
hasta el volumen V3. El trabajo realizado en este caso sobre el gas es igual a

V3 V
A3 = RT1 ln = − RT1 ln 2 = Q1 (80.5)
V2 V3

A cuenta de este trabajo se desprende el calor Q1 que se transmite al refrigerador


con el que tiene contacto el gas.
Por fin, el último cambio que sufre el gas para volver a su estado inicial, es la
compresión adiabática hasta el volumen inicial V0 y la presión p0, para las cuales su
temperatura de nuevo se hace igual a T0. Para esto es necesario que el gas sea
comprimido isotérmicamente en la tercera etapa del ciclo hasta el volumen V3,
determinado por la igualdad

v −1
 V3  T0
  = (80.6)
 V0  T1

γ −1 γ −1
ya que, como anteriormente, T1V3 = T0V0
El trabajo de compresión en el último estadio del ciclo es igual a

85
R( T1 − T0 ) R( T0 − T1 )
A4 = =− (80.7)
γ −1 γ −1

Ahora el gas se encuentra de nuevo en el estado inicial, se realizó el ciclo de


Carnot y el gas <<está preparado>> para empezar otra vez el proceso.
¿Cuál es el resultado del ciclo? ¿En qué medida se consiguió su objetivo, o
sea, la transformación del calor en trabajo mecánico?
El trabajo total A realizado por el gas y sobre el gas, evidentemente es igual a

A = A1 + A2 + A3 + A4

De las igualdades (80.1), (80.4), (80.5) y (80.7) obtenemos:

V1 R ( T0 − T1 ) V R( T0 − T1 ) V V
A = RT0 ln + − RT1 ln 2 − − = RT0 ln 1 − RT1 ln 2
V0 γ −1 V3 γ −1 V0 V3
V 2 V3 V1 V 2
De (80.3) y (80.6) se deduce que = o, = . Designemos esta
V1 V 0 V0 V3
relación por r. Entonces

V1 V
ln = ln 2 = ln r (80.8)
V0 V3
Ya que V1 > V0 y V2 > V3, entonces ln r > 0.
Por consiguiente, el trabajo total es

A = R( T0 − T1 ) ln r (80.9)

y ya que T0 > T1, entonces, A > 0. Es decir, el trabajo, realizado por el gas durante la
dilatación es mayor que el trabajo de las fuerzas externas, gastado en su compresión.
De tal modo, a cuenta del calor recibido del calentador por el cuerpo de trabajo, ha
sido realizado cierto trabajo útil. Sin embargo, este trabajo no es igual a la cantidad Q0
de calor que recibió el cuerpo de trabajo del calentador.
De la cantidad de calor entregada por el calentador

V1
Q0 = RT0 ln
V0

una parte, igual a

V3
Q1 =RT1 ln ,
V2

fue entregada al refrigerador durante la compresión isotérmica del gas, desde el


volumen V2 hasta el volumen V3 (durante este tiempo el gas se encontraba en
contacto con el refrigerador). De tal modo, se consiguió transformar en trabajo útil sólo
una parte del calor recibido igual a:

86
Q0 − Q1 = R( T0 − T1 ) ln r = A (80.10)

El trabajo A se determina gráficamente por la superficie, limitada por la curva


ABCD (véase la fig. 93).
En esto se diferencia el proceso de transformación del calor en trabajo del
proceso inverso de transformación del trabajo en calor. Para determinadas condiciones
se puede transformar por completo el trabajo mecánico en calor. El calor se transforma
en trabajo sólo parcialmente.
Señalemos aquí que de las igualdades (80.1), (80.5) y (80.8) se deduce una
relación muy importante que nos hará falta en lo sucesivo. Las igualdades (80.1) y
(80.5) se pueden escribir en la forma:

Q0 V Q V
= R ln 1 ,− 1 = R ln 2
T0 V0 T1 V3
Q0 Q1
Sumándolas y teniendo en cuenta (80.8), obtenemos: − = 0 , de donde
T0 T1
Q0 Q1
= (80.11)
T0 T1

Rendimiento del ciclo de Carnot. Del análisis expuesto del proceso circular de
Carnot se deduce que por medio de su ayuda no se puede transformar completamente
en energía mecánica el calor tomado del calentador. Parte de este calor
imprescindiblemente deberá entregarse al refrigerador, a un cuerpo que tenga una
temperatura más baja que el calentador.
Si la cantidad de calor recibida del calentador por el cuerpo de trabajo es igual
a Q0, y se ha transformado en trabajo una parte Q0 - Q1 de este calor, entonces, la
relación

Q0 − Q1
η=
Q0
representa en sí el rendimiento del proceso circular (más exactamente, de las
máquinas que trabajan según este proceso). Como se ve en la fórmula (80.11), el
rendimiento η del ciclo de Carnot se determina por la igualdad:

Q0 − Q1 Q T
η= = 1− 1 = 1− 1 (80.12)
Q0 Q0 T0

El rendimiento, por consiguiente, siempre es menor que la unidad y depende


de la relación entre las temperaturas del calentador y del refrigerador.
El ciclo de Carnot, examinado por nosotros, se realizó en cada uno de sus
estadios de forma que no hubo en ningún lugar contacto de cuerpos con diferentes
temperaturas, lo que excluye la posibilidad de los procesos irreversibles de conducción
calorífica. El cambio de volumen del cuerpo de trabajo también se realizó por un
camino reversible, que, como sabemos, asegura con ello el máximo de trabajo
realizado (véase 23). Esto significa que fueron aseguradas las mejores condiciones
para la utilización de la energía térmica. Por eso, no se puede obtener por principio un
rendimiento más elevado que el expresado por la fórmula (80.12)
La máquina térmica, que trabaja para los valores dados de temperaturas del
calentador y refrigerador, no puede tener un rendimiento mayor que la máquina que
87
trabaja según el ciclo reversible de Carnot, para unos mismos valores de temperaturas
del calentador y refrigerador (A esta afirmación algunas veces la llaman primer
teorema de Carnot).
De la fórmula (80.12) se ve que el rendimiento del ciclo de Carnot no depende
del género del cuerpo de trabajo, sino solamente de las temperaturas del calentador y
del refrigerador (esta afirmación compone el contenido del segundo teorema de
Carnot)
Durante el cálculo, tomamos al gas ideal como cuerpo de trabajo solamente
porque para él se conoce exactamente la ecuación de estado, lo que permitió calcular
fácilmente la magnitud del rendimiento.
El hecho de que el rendimiento de la máquina, que trabaja según el ciclo de Carnot,
sea el máximo, está condicionado, como vimos (y como veremos detalladamente más
adelante), por la circunstancia de que este proceso es completamente reversible. Más
adelante serán expuestas las demostraciones generales de ambos teoremas de
Carnot.

3.9. MÁQUINA REFRIGERADORA

El proceso reversible, como ya se indicó, se caracteriza por el hecho de que si se


realiza en dirección contraria, el cuerpo que toma parte en el proceso, pasa por los
mismos estados, pero en orden contrario.
Aplicado al ciclo de Carnot esto significa que, se
transmite el calor no del calentador al refrigerador, sino al
contrario, desde el refrigerador al calentador.
El ciclo inverso de Carnot se empieza con que el cuerpo
de trabajo que se encuentra, por ejemplo, en el estado
correspondiente al punto A (fig. 94) se dilata
adiabáticamente hasta el estado que responde al punto D
(en el ciclo directo, el proceso se empieza con la dilatación
isotérmica). Luego le sigue una dilatación isotérmica hasta
el estado C. En estos dos primeros estadios del ciclo, el
cuerpo de trabajo, dilatándose, realiza un trabajo. En la segunda parte del ciclo, a lo
largo de la adiabática CB y de la isoterma BA, el cuerpo de trabajo se comprime, y el
trabajo de compresión se realiza sobre el cuerpo por la fuente externa de energía.
Como acabamos de indicar, este trabajo supera al trabajo realizado por el mismo
cuerpo en la primera mitad del ciclo. Por eso, el resultado del ciclo inverso de Carnot,
será no el trabajo exterior útil, sino el transporte del calor, desde el refrigerador al
calentador, es decir, desde el cuerpo menos caliente al más caliente.

NO es difícil convencerse de que el cuerpo de trabajo durante el proceso inverso de


Carnot pasa a través de los mismos estados intermedios que durante el directo, pero
en orden contrario.
Si la instalación que trabaja según el ciclo directo de Carnot sirve para la
transformación del calor en trabajo mecánico, es decir, es una máquina térmica, la
máquina que actúa según el ciclo inverpo de Carnot so utiliza para la transmisión del
calor desde el cuerpo menos caliente al más caliente, es decir, es una máquina
refrigeradora. Con su ayuda a cuenta de un trabajo mecánico externo so quita el calor
del cuerpo más frío y se entrega al cuerpo con temperatura más elevada.

3.10. DEMOSTRACIÓN DE LOS TEOREMAS DE CARNOT

Ahora se puede exponer una demostración más rigurosa del primer teorema de
Carnot (véase la página anterior), que se puede formular así: el rendimiento de la

88
máquina térmica que trabaja para los valores dados de temperaturas del calentador y
del refrigerador, no puede ser mayor que el rendimiento de la máquina que trabaja
según el ciclo inverso de Carnot para unos mismos valores de las temperaturas del
calentador y del refrigerador.

Supongamos que tenemos dos máquinas térmicas con un calentador y refrigerador


común para ellas: la máquina I que trabaja según el ciclo inverso de Carnot y la
máquina II que se diferencia de la I bien por la irreversibilidad de los procesos en ella,
o bien por el género de la substancia de trabajo. Supongamos al principio que el
rendimiento η2 de la máquina II es mayor que el rendimiento η1 de la máquina I:
η 2 > η1

Acoplemos estas máquinas (con un eje común, por transmisiones a correa, etc.) para
que una de ellas pueda poner en movimiento a la otra. Supongamos que la máquina II
trabaja según el ciclo directo, es decir, recibe el calor Q del calentador, realiza un
trabajo A2 y entrega al refrigerador una cantidad de calor igual a

Q – A2

Durante esto, ella pone en movimiento a la máquina I, de modo que esta máquina
realiza el ciclo inverso. Por consiguiente, la máquina I, transporta el calor desde el
refrigerador al calentador, a cuenta del trabajo realizado sobre ella por la máquina II.
Supongamos que la máquina I lo transmite al calentador en cada ciclo una cantidad Q
de calor, es decir, el mismo que absorbe la máquina II en un ciclo. Supongamos que el
trabajo necesario para esto sea igual a A1. El calor tomado del refrigerador por la
máquina I es, por lo tanto, igual a

Q – A1

Después de un ciclo obtenemos en nuestra máquina combinada I – II el resultado


siguiente.
1. El calentador no sufrió ningunos cambios, ya que la máquina I le suministró tanto
calor como le quitó la máquina II.
2. El cuerpo de trabajo volvió a su estado inicial en cada una de las máquinas, es
decir, tampoco ha sufrido ningún cambio.
3. El refrigerador ha recibido de la máquina II un calor Q – A 2 y la máquina I le ha
quitado al refrigerador un calor Q – A1 y ya que según nuestra suposición η2 > η1,
entonces, A2 > A1 y

Q – A1 > Q – A2

Esto significa, que el único resultado de todo el ciclo ha sido la extracción de una
cantidad de calor igual a A2 – A1 del refrigerador y de su transformación en trabajo.
Pero esto contradice al principio de Thompson. Por consiguiente, η2 no puede ser
mayor que el rendimiento η1 de la máquina reversible de Carnot.
Demostremos ahora la justeza del segundo teorema de Carnot sobre la
independencia del rendimiento de la máquina reversible de Carnot del género del
cuerpo de trabajo. Tomemos de nuevo a las dos máquinas unidas entre sí I y II con un
calentador y refrigerador común. En este caso ambas máquinas trabajan según el ciclo
reversible de Carnot, diferenciándose una de la otra solamente por la substancia de
trabajo. Demostremos que son iguales los rendimientos η1 y η2, de ambas máquinas.
De nuevo supondremos que la máquina II realiza el ciclo directo y la máquina I el

89
inverso. Al principio supondremos que el rendimiento de ambas máquinas es diferente:
sea, por ejemplo,
η1 < η 2

Al realizar el ciclo directo, la máquina II recibe del calentador una cantidad Q 1 de


calor, entrega al refrigerador un calor Q2 y realiza un trabajo equivalente a Q1 – Q2. La
máquina I realiza el ciclo inverso, coge un calor Q del refrigerador, entrega un calor Q1
al calentador, a cuenta del trabajo mecánico equivalente a Q – Q 2. Si el rendimiento
η1<η2, entonces,

Q > Q2

La diferencia de calores Q – Q2 se transforma en trabajo. Es decir, como resultado


del ciclo, el calentador no sufre ningún cambio, ya que recibe de una máquina tanto
calor como entrega a la otra. Los cuerpos de trabajo, realizando un proceso en grupo,
también resultan estar en el estado inicial. Es decir, el único resultado del ciclo es la
toma de calor (en la cantidad Q – Q2) del refrigerador y su transformación en trabajo, lo
que contradice al principio de Thompon. Es decir, no es cierta la suposición de que η1
> η2. Por lo tanto, sólo queda una posibilidad que

η1 = η 2

Ya que el cuerpo de trabajo de una de las máquinas puede ser un gas ideal, y ya
T1 − T2
mostramos que para este caso η = , donde T2 y T1 son las temperaturas
T
correspondientes del refrigerador y calentador, entonces, de aquí se deduce que el
rendimiento será uno mismo para cualquier máquina reversible de Carnot. Para el ciclo
irreversible el rendimiento es

T1 − T2
η< (82.1)
T

Recordemos que

Q1 − Q2
η= ,
Q1

donde Q1 es la cantidad de calor, entregado (al cuerpo de trabaja) por el calentador, y


Q2 es la cantidad calor recibido (del cuerpo de trabajo) por el refrigerador.
Pero si examinamos nuestro proceso desde el punto de vista de los cambios
ocurridos en el mismo cuerpo de trabajo, entonces, Q1 y Q2 son la cantidad de calor
recibido y entregado, correspondientemente, es necesario escribirlas con signo
contrario.
Consideraremos positiva a la cantidad Q1 de calor recibido por el cuerpo; entonces
Q2 será negativa.
Por consiguiente, la desigualdad (82.1) se escribe en la forma:

Q1 + Q2 T1 − T2
<
Q1 T1

90
O bien,

Q1 Q2
+ <0 (82.2)
T1 T2
Evidentemente, [véase (80.11)] si el cuerpo sufre un proceso circular reversible,
entonces,
Q1 Q2
+ =0 (82.3)
T1 T2

En lo sucesivo estas relaciones (82.2) y (82.3) serán generalizadas.


De lo dicho anteriormente, está claro qué es necesario hacer para conseguir el
rendimiento mayor posible de la máquina térmica.
En primer lugar, es necesario tender en lo posible a que en la máquina no se
realicen los procesos irreversibles, para que el ciclo de la máquina sea lo más próximo
posible al reversible.
En segundo lugar es necesario, en lo posible, elevar la temperatura del calentador y
rebajar la temperatura del refrigerador [véase la fórmula (80.12)]
En lo que se refiere a la elección del cuerpo de trabajo, está dictada por
consideraciones de racionalidad técnicas y económicas. La circunstancia de que en
las máquinas térmicas actuales se emplee fundamentalmente el vapor de agua, está
condicionada a la gran accesibilidad del agua y el manejo sencillo de ella.
El progreso en la técnica de las instalaciones de fuerza a vapor se consigue con la
elevación de la temperatura del calentador (el refrigerador, corrientemente, es el aire
que nos rodea). Sin embargo, con las instalaciones de fuerza a vapor concurren con
éxito los motores de combustión interna, donde como cuerpo de trabajo sirve una
mezcla de aire y el combustible correspondiente. La temperatura, conseguida en este
caso, es mucho mayor y, por eso, el rendimiento de estas máquinas es mayor. Y
además, en estos motores está excluido el proceso irreversible de conducción de calor
desde el hogar, lo que también eleva el rendimiento.
Sin embargo, es necesario tener en cuenta, que el proceso reversible es un
proceso ideal y en la práctica no se puede asegurar la reversibilidad completa. Por
eso, aquel valor del rendimiento de la máquina térmica que da la fórmula (80.12) de
hecho es el limite superior inaccesible, al cual, sin embargo, nos podemos acercar lo
más posible, por principio.

3.11.ENERGÍA LIBRE

En el ciclo de Carnot, el cuerpo de trabajo realiza un trabajo en la primera mitad del


ciclo, en los procesos de dilatación, al principio isotérmico, y luego adiabático.

Durante el proceso adiabático se realiza un trabajo a cuenta de la energía interna, y


este trabajo es igual al decrecimiento de energía interna:
dA = - dU

La cuestión es diferente en el caso del proceso isotérmico. Durante este proceso, la


temperatura del cuerpo queda constante, y, por eso, aquella parte de energía interna
que está ligada a la energía cinética de los movimientos moleculares no puede ser
utilizada para su transformación en energía mecánica. Esta circunstancia nos obliga a
distinguir la energía total que posee el cuerpo o sistema de cuerpos de aquella parte
de energía que para las condiciones dadas se puede utilizar para obtener trabajo.

91
Imaginémonos un determinado cuerpo, por ejemplo, un gas en donde pueden
ocurrir procesos isotérmicos reversibles de dilatación y compresión. Para esto es
necesario colocar el gas en un termostato (véase § 28) o ponerlo en contacto con un
cuerpo do gran capacidad calorífica, cuya temperatura es constante. Al dilatarse, el
gas puede producir un trabajo mecánico, por consiguiente, nuestro sistema,
compuesto del termostato y del gas, posee una energía determinada. Aquella parte de
energía, que para las condiciones dadas puede ser utilizada para su transformación en
trabajo mecánico, so llama energía libre.
Es decir, el sistema no puede realizar un trabajo superior al valor de su energía
libre.
En este sentido, aquí tenemos una situación algo diferente a la del sistema
mecánico. En Mecánica, como se sabe, la energía de un cuerpo, o sistema de
cuerpos, es igual a la suma de las energías potencial y cinética. Ambas formas de
energía de los cuerpos macroscópicos (y sólo estos cuerpos se examinan en la
Mecánica) pueden ser transformadas por completo en trabajo mecánico. La energía
interna de un sistema molecular no puede ser transformada por completo en trabajo,
en el caso que nos interesa.
Por eso, si nos interesamos por la magnitud del trabajo que el sistema puede
realizar en el estado dado durante un proceso isotérmico, entonces, la energía interna
no es la característica apropiada de este estado. La energía interna caracteriza al
sistema si nos interesamos por el trabajo que es capaz de producir este sistema
durante el proceso adiabático. Precisamente, el trabajo producido durante el proceso
adiabático es igual al cambio (disminución) de la energía interna. La energía libre
deberá caracterizar al sistema desde el punto de vista de su «capacidad de trabajo»,
durante su cambio isotérmico de estado (cambio de volumen).
Para que a cada estado se le pueda yuxtaponer un determinado valor numérico de
energía libre, es necesario tomar como origen de medidas un estado determinado, del
mismo modo que se hizo al determinar la energía potencial en la Mecánica. Esta
indeterminación del valor absoluto de la energía libre no crea ninguna dificultad ya que
lo esencial no es el propio valor de la energía libre del sistema sino su cambio, lo que
determina al trabajo. Recordamos, además, que el trabajo de dilatación o compresión
de un cuerpo tiene un valor determinado si este proceso se desarrolla en forma
equilibrada, es decir, cuasiestáticamente.
De tal modo, la energía libre de un sistema se mide por el trabajo que puede
producir el sistema (por ejemplo, un gas ideal), cambiando isotérmica y
reversiblemente su estado desde aquel estado en que se encontraba anteriormente al
estado inicial, en el cual se admite que la energía libre es igual a cero (origen de
medidas).
Si designamos por F la energía libre del sistema, entonces, el trabajo infinitamente
pequeño dA, que realiza el sistema durante el, proceso isotérmico reversible, será

dA = −dF (83.1)

Si, por ejemplo, el cambio de estado del sistema se reduce a la dilatación


isotérmica del gas (aumento de su volumen), durante el cual el trabajo es positivo,
entonces, el signo menos significa que disminuye con esto la energía libre. Al
contrario, durante la compresión del cuerpo (trabajo negativo) la energía libre crece a
cuenta de las fuerzas externas, que comprimen al cuerpo (gas). En particular, para el
gas ideal, durante su dilatación isotérmica desde el volumen V1 hasta el volumen V2 el
trabajo se expresa, como es sabido, por la ecuación (para un mol)

92
V2
A = RTM ln (83.2)
V1
El segundo miembro de la ecuación (83.2) representa en sí el decrecimiento de la
energía libre de 1 mol de gas durante tal dilatación. Esto significa, que a la
temperatura dada, la energía libre de una masa de gas dada, será tanto mayor cuanto
menor sea el volumen ocupado por ella, es decir, mientras más comprimido esté.
Recordemos, que la energía interna del gas ideal no depende del volumen que él
ocupa; un mol de gas, comprimido en un balón, tiene la misma energía interna que el
gas no comprimido para una misma temperatura. Pero el gas comprimido tiene una
gran energía libre porque él durante la dilatación isotérmica puede realizar un trabajo
mayor.
Cuando este gas comprimido realiza en realidad un trabajo al dilatarse
isotérmicamente (elevando, por ejemplo, un émbolo con carga), entonces, este trabajo
se realiza a cuenta del calor, que es necesario comunicar al gas desde el termostato, o
de otro cuerpo de gran capacidad calorífica (si no, el gas se enfría y el proceso no será
isotérmico).
Pero, a pesar de todo, nosotros hablamos sobre la energía libre de un gas con
objeto de subrayar que el gas es, precisamente, el cuerpo, gracias al cual se crea la
posibilidad de realizar un trabajo.
Si el proceso de cambio isotérmico de volumen se desarrolla irreversiblemente,
entonces, ya que el trabajo realizado con esto es menor que durante el proceso
reversible, el cambio de energía libre será mayor que el trabajo realizado, de modo
que la fórmula (83.1) se debe escribir en la forma:

dA ≤ dF

El signo de desigualdad se refiere al proceso irreversible, y el signo de igualdad, al


reversible.
También son posibles los casos cuando el cambio de energía libre, en general, no
va acompañado con realización de trabajo.
En particular, si se dilata el gas ideal en el vacío, con ello no se realiza ningún
trabajo. La temperatura y, por lo tanto, la energía interna del gas también quedan
invariables. Mientras tanto, la energía libre del gas disminuyó, ya que disminuyó el
trabajo que puede realizar el gas. Esto está ligado a que el proceso de dilatación del
gas en el vacío, a pesar de que es isotérmico, es completamente ireversible.
Al principio del apartado subrayábamos que la energía libre caracteriza el estado
del cuerpo. Ahora nos queda por demostrar que ella es realmente una función de
estado, es decir, necesitamos demostrar que durante el paso de un cuerpo, isotérmica
y reversiblemente de un estado a otro, el trabajo realizado, igual a la diferencia de las
energías libres del cuerpo en estos estados, no depende del camino del paso. Esto se
desprende directamente de que durante el proceso isotérmico circular reversible el
trabajo es igual a cero.
En efecto, supongamos que el cuerpo puede pasar del estado 1 al estado 2 por dos
caminos distintos (isotérmicos), realizando en el primer camino un trabajo A1, y en el
segundo, el trabajo A2. Pero en tal caso podemos trasladar nuestro cuerpo del estado
1 al estado 2 por un camino y volverlo de regreso por el otro camino, realizando un
proceso circular. El trabajo total realizado con ello es

A1 − A2 = 0

Y, por consiguiente,

93
A1 = A2

Es decir, el trabajo realizado por el cuerpo solamente depende del estado inicial y
final del mismo. Por consiguiente, la energía libre es una función de estado.
Más adelante será expuesta la fórmula general de la energía libre.

3.12.ENTROPÍA

Volvamos al proceso circular de Garnot examinado, y prestemos una atención más


minuciosa sobre los cambios que sufrió el cuerpo de trabajo en este proceso.
Recordemos que el cuerpo de trabajo, desde el estado inicial A caracterizado por la
presión p0 y la temperatura T0, pasó por medio de la realización sucesiva de
dilataciones isotérmicas y adiabáticas al estado C, cuando tomó la temperatura del
refrigerador. Este cambio de estado se realizó a cuenta del calor Q0 entregado por el
calentador al cuerpo de trabajo. El paso inverso del cuerpo de trabajo desde el estado
C al estado inicial A fue realizado con la ejecución de dos compresiones del cuerpo
sucesivas, isotérmica y adiabática. El calor que se segrega con este retorno al estado
inicial es igual a Q1, siendo como vimos Q1 < Q0. De tal modo, resulta que el paso
reversible de un mismo cuerpo desde el estado A al C y el paso inverso desde C a A
va acompañado de una cantidad de calor absorbido diferente al segregado.
Evidentemente, esto está ligado a que ambos pasos fueron realizados por diferentes
caminos: en un caso (de A a C) el proceso de dilatación se realizó a una presión más
elevada que en el otro proceso de compresión (al pasar de C a A). Está claro, que si
hubiésemos realizado el paso de C a A del mismo modo que el paso directo, es decir,
por la curva CBA y no por la CDA (véase la fig. 93) entonces, la cantidad de calor
gastado durante el paso directo sería exactamente igual a la cantidad de calor que se
segregó durante el paso inverso.
De aquí se deduce la conclusión importante sobre la que ya llamamos la atención
del lector, de que la cantidad do calor, que se le debe entregar o quitar al cuerpo
durante el paso de un estado a otro, no se determina de una sola forma por los
estados inicial y final, sino que depende esencialmente del método de realización del
paso. Hablando de otro modo, la cantidad Q de calor no es función de estado del
cuerpo como, por ejemplo, la energía interna U (o la energía libre F). Esto, entre tanto,
se deduce de la ecuación del primer principio de la Termodinámica

dQ = dU + dA

ya que el trabajo dA, realizado por el cuerpo (o sobre el cuerpo) depende de por
qué camino ha sido realizado, mientras que el cambio de la energía interna dU no
depende en qué forma se realizó el cambio de estado.
Pero si las mismas cantidades de calor Q0, entregado al cuerpo por el calentador a
la temperatura T0 y Q1, entregado por el cuerpo al refrigerador a la temperatura T 1, no
son iguales entre sí, entonces, como vimos [véase la fórmula (80.11)], las relaciones
entre estos calores y las temperaturas, a las cuales fueron absorbidos o entregados,
numéricamente son iguales entre sí (pero tienen signo contrario)

Q0 Q
= 1
T0 T1

94
Q
La relación se llama algunas veces, según Lorentz, calor reducido, de modo que
T
la última ecuación habla sobre la igualdad de los calores reducidos, recibidos o
entregados por el cuerpo de trabajo durante el proceso circular.
Esta particularidad del calor permite introducir una magnitud termodinámica
peculiar, la entropía, que tiene un valor fundamental en la Física. La importancia de
esta magnitud se determina, como ahora será mostrado, con que es una función de
estado y por aquel papel que juega en todos los procesos de la naturaleza y, en parti-
cular en el proceso de transformación del calor en trabajo.
Cualquier cambio de estado del cuerpo o del sistema de cuerpos se puede
representar, en caso general, como resultado de un número infinito de cambios
pequeños. Durante cada uno do los cambios infinitamente pequeños de estado del
sistema o bien se absorbe, o bien se segrega una cantidad infinitamente pequeña de
calor dQ (si el proceso no es adiabático). Pongámonos de acuerdo en considerar dQ
positivo, cuando el sistema absorbe calor, y negativo, cuando lo segrega.
Se puede mostrar que si el sistema a consecuencia de cualquier cambio de estado
pasó reversiblemente del estado A al estado B, entonces, la suma de las cantidades
do calor reducido, es decir, la magnitud
B
dQ

A
T
no depende del camino, por el cual se realizó el paso de A a B. Para esto es suficiente
mostrar que durante el proceso circular, cuando coinciden el estado inicial y final, esta
integral es igual a cero

dQ
∫ T
=0

Demostremos, al principio, que durante cualquier proceso circular

dQ
∫ T
(84.1)

No puede ser una magnitud positiva.


Supongamos que un cuerpo M, determinado como resultado de cualesquiera
cambios, vuelve a su estado inicial, es decir, realiza un proceso circular. Durante el
proceso el cuerpo entregó y absorbió calor. Supongámonos que el calor segregado por
el cuerpo M se transmite a un determinado depósito térmico (cuerpo de gran
capacidad calorífica) cuya temperatura es igual a T0. Esta transmisión se puede
realizar de forma reversible, por ejemplo, con ayuda de un cuerpo intermedio, que
realiza el proceso circular de Carnot, de modo que el cuerpo M servirá de calentador
para el cuerpo intermedio y el depósito servirá de refrigerador.
Como ya se vio al examinar el ciclo de Carnot, la cantidad de calor dQ, quitado del
cuerpo M a la temperatura T y la cantidad dQ' de calor cedido al depósito que se
encuentra a la temperatura T0 no son iguales entre sí, pero sí lo son las relaciones
dQ dQ´
y . De aquí se deduce que
T T
T
dQ´= 0 dQ (84.2)
T
Si T0 < T, el depósito cumplirá el papel de refrigerador y el cuerpo M de calentador.
Si, por el contrario, T0 > T el depósito y el cuerpo M cambian sus papeles.
95
Después de que ha sido realizado el proceso circular por el cuerpo M, la cantidad
total de calor, perdido por el cuerpo, deberá ser igual, como esto se ve de (84.2), a
dQ
∫T 0
T
,
O bien, ya que la capacidad calorífica del depósito es muy grande y por eso su
temperatura queda constante, esta magnitud será igual a:
dQ
T0 ∫
T
El proceso realizado por el cuerpo es circular. Por eso, él al fin y al cabo no sufrió
ningún cambio. El cuerpo intermedio también realizó un proceso circular. Es decir, en
él tampoco ocurrió ningún cambio.
Si resultara ser positiva la integral (84.1), entonces esto significaría que la cantidad
dQ
de calor perdida por el cuerpo igual a T0 ∫ T
, se transformó completamente en
trabajo, mientras que ni el cuerpo M ni el cuerpo intermedio no cambiaron sus estados.
Pero esto, según el principio de Thompson, es imposible. Es decir, la suposición de
dQ
que ∫ T
> 0 no es posible.
Se puede ver fácilmente que la integral (84.1) tampoco puede ser negativa. En
efecto, si realizamos en sentido inverso todos los cambios de estado, entonces, cada
dQ
cantidad de calor cambia su signo y si durante el proceso directo ∫ T
< 0 , durante el
proceso inverso esta integral se hará positiva, lo que es imposible como acabamos de
ver. Es decir, esta integral tampoco puede ser negativa. Pero si ella no puede ser ni
positiva, ni negativa, esto significa, que para los procesos circulares reversibles que
examinamos aquí
dQ
∫ T
=0 (84.3)
[La ecuación (82.3) es un caso particular de esta ecuación].
Esto a su tiempo significa, que durante cualquier proceso reversible no circular el
dQ
valor de ∫ T
no depende del camino por el cual ge realiza el proceso.
Esto nos da derecho a afirmar que existe una determinada magnitud, que
designaremos por S, que es función de estado del sistema, cuyo cambio SB — SA
durante el paso reversible del sistema desde el estado A al estado B es igual a:

B
dQ
SB − SA = ∫ (84.4)
A
T
La igualdad (84.4) permite determinar no el valor absoluto de la función
correspondiente al estado dado, sino solamente su cambio durante el paso de un
estado a otro. Pero, como siempre se hace en estos casos, se puede elegir un estado
determinado, al cual se lo adjudica el valor S igual a cero, y con él se comparan todos
los demás estados. Por eso, en lo sucesivo consideraremos que la función S es
precisamente igual a la integral (84,1):

dQ
S=∫ (84.5)
T
La magnitud S determinada de este modo se llama entropía. En la práctica siempre
es necesario conocer no la propia magnitud S, sino sólo su cambio durante el cambio
96
de estado del sistema. Por eso, es indiferente, a qué estado precisamente se le
adjudica la entropía cero. Está admitido (y para ello existe el fundamento suficiente) en
considerar, que para el cero absoluto de temperatura la entropía es igual a cero.
Esto significa, que para hallar la entropía del sistema en el estado dado, es
necesario trasladarlo (esto se puede hacer mentalmente) desde este estado al estado
cero por cualquier camino reversible (indiferente por cuál, precisamente) y hallar el
dQ
valor de ∫ T
a lo largo de este camino. Por supuesto, la propia entropía del sistema
no depende de si será o no realizado en realidad este proceso reversible.
Lo mismo se refiere al cambio de entropía. De acuerdo a (84.4), para determinar la
diferencia entre los valores de la entropía del sistema en dos de sus estados
(equilibrados) A y B, es necesario llevar el sistema por cualquier proceso reversible
B
dQ
desde el estado A al estado B y calcular el valor de ∫
A
T
para tal proceso.

El cambio de entropía del sistema, al cual se le comunicó una cantidad


infinitamente pequeña de calor dQ evidentemente, se determina por la relación

dQ
dS = (84.6)
T
En sentido matemático esta igualdad es interesante porque la magnitud dQ, que no
es un diferencial total, ya que Q no es función de estado, sin embargo, se hace una
diferencial total después de la división por T. La magnitud 1/T, de tal modo, es el factor
de integración para dQ. La temperatura se puede determinar, desde el punto de vista
formal matemático, como una magnitud cuyo valor inverso es el factor de integración
para dQ.
Utilizando la ecuación (84.6) y recordando que dQ = dU + dA (primer principio de la
Termodinámica) obtenemos:

TdS = dU + dA (84.7)

Esta igualdad lleva el nombre de identidad termodinámica. A esta la llaman


frecuentemente segundo principio de la Termodinámica, para los procesos reversibles.
Propiamente hablando, el segundo principio de la Termodinámica para los procesos
reversibles consiste en que el sistema puede ser caracterizado por la función de
estado, por la entropía, determinada por las ecuaciones (84.6) o (84.7). Más adelante
será aclarado el sentido físico profundo de esta función.
Si el proceso circular sufrido por el sistema es irreversible, entonces,

dQ
∫ T
<0 (84.8)

Esta desigualdad se llama desigualdad de Clausius. Para el caso particular del ciclo
irreversible de Carnot, ya nos cercioramos [véase (82.2)] de que la suma de los
calores reducidos es

Q1 Q2
+ <0
T1 T2

97
La desigualdad (84.8) es una generalización de esto para cualquier sistema. Para
una demostración rigurosa de esta desigualdad invitamos al lector a dirigirse a los
cursos especiales de la Termodinámica.
En la misma medida, la ecuación (84.3) es una generalización de (82.3).

85. ALGUNAS RELACIONES TERMODINÁMICAS

La entropía , siendo una función de estado del cuerpo o del sistema de cuerpos,
puede servir de tal parámetro de estado del cuerpo (por ejemplo, del gas) como las
magnitudes ya conocidas: la temperatura T, la presión p, y el volumen V.
De modo semejante, como cualquiera de estas magnitudes es función de las otras
dos, así la entropía puede ser expresada a través de dos cualesquiera de los
parámetros p, V y T. mostraremos cómo se puede haces esto. Esto es tanto más
importante, ya que la entropía no se puede medir directamente en la experiencia de
modo semejante a al temperatura, el volumen o la presión. Volvamos a escribir la
ecuación (84.7) teniendo en cuenta que dA=p dV, y obtenemos:

dU + pdV
dS =
T
o bien,

dU = TdS − pdV (85.1)

Dos cualesquiera de las cuatro magnitudes T, S, P, V que figuran en esta ecuación,


pueden ser elegidas en calidad de variables independientes, a través de las cuales se
expresan las restantes.
Se sabe del curso de análisis matemático que, si x e y son las variables
independientes de la función U (x, y), y dU su diferencial total, entonces,

∂U ∂U ∂ 2U ∂ 2U
dU = dx + dy y =
∂x ∂y dx∂y dy∂x

Realizando una integración doble de (85.1) obtenenos:

∂T ∂S ∂T ∂S ∂p ∂V ∂p ∂V
− = − (85.2)
∂x ∂y ∂y ∂x ∂x ∂y ∂y ∂x

En lugar de x e y se puede poner en esta igualdad dos cualesquiera de las cuatro


magnitudes T, S, P, V. supongamos, por ejemplo, que el estado del sistema cambia a
causa del cambio de volumen en dV y de la temperatura en dT; calculemos el cambio
de la entropía dS condicionado por este fenómeno.
Esto significa que en la igualdad (85.2) en lugar de x e y debemos poner,
correspondientemente, x = V e y = T, es decir,

∂T ∂S ∂T ∂S ∂p ∂V ∂p ∂V
− = − ,
∂V ∂T ∂T ∂V ∂V ∂T ∂T ∂V
∂T ∂V
Pero si T y V son variables independientes, entonces, = = 0 y, por
∂V ∂T
consiguiente, tenemos

98
 ∂S   ∂p 
  =  (85.3)
 ∂V  T  ∂T V
Además de esto, tendremos en cuenta que dS es una diferencial total:
 ∂S   ∂S 
dS =   dT +   dV (85.4)
 ∂T V  ∂V T
La última igualdad significa que el aumento toral de la entropía se compone del
aumento de entropía, originado separadamente por el aumento de la temperatura y
por el aumento del volumen. De (85.3) y (85.4) se deduce que

 ∂S   ∂p 
dS =   dT +   dV (85.5)
 ∂T V  ∂T V

El primer término del segundo miembro de (85.5) representa en sí el cambio de


entropía (dS)V, originado sólo por el cambio de temperatura para un volumen invariable
(dV = 0). De acuerdo a la definición [véase (84.6)].

( dQ ) V
(dS )V =
T
Donde CV es la capacidad calorífica del cuerpo para volumen constante, por
consiguiente,

 ∂S  C
  dT = V dT ,
 ∂T V T
y finalmente,

CV  ∂p 
dS = dT +   dV (85.6)
T  ∂T V
De tal modo, nosotros expresamos dS a través de las magnitudes que se miden en
la experiencia p, V, T y CV.
Exactamente, del mismo modo, se puede expresar el cambio de la entropía dS a
través del cambio de temperatura dT y de la presión dp, es decir, eligiendo a T y p
como variables independientes. Para ello es necesario poner en la ecuación (85.2) a T
y p en lugar de x e y.
Obtenemos:

∂T ∂S ∂T ∂S ∂p ∂V ∂p ∂V
− = −
∂T ∂p ∂p ∂T ∂T ∂p ∂p ∂T

∂T ∂p
Pero = = 0 , ya que T y p son las variables independientes.
∂p ∂T

Como resultado, se obtiene una ecuación análoga a (85.3)

 ∂S   ∂V 
  = −  , (85.7)
 ∂p T  ∂T  p

99
y, correspondientemente, por analogía con (85.6)
Cp  ∂V 
dS = dT −   dp (85.8)
T  ∂T  p

Integrando (85.6) y (85.8), se puede calcular la entropía S (V, T) de la masa dada


(por ejemplo, de 1 mol) de substancia para los valores dados del volumen V y de
temperatura T, o la entropía S (p, T) para los valores dados de presión p y de
temperatura T si son conocidos los valores de la entropía S(V0, T0) y S(p0,T0) para
cualesquiera otros valores de estos parámetros V0 y T0, o p0 y T0. Es evidente, que

T ,V0
CV dT T ,V  ∂p 
S (V , T ) − S (V0 , T0 ) = ∫
T0 ,V0
T
− ∫ 
T ,V0  ∂T
 dV
V

p0 ,T p ,T
C p dT  ∂V 
S ( p, T ) − S ( p0 , T0 ) = ∫
p0 ,T0 ,
T
− ∫ 
p0 ,T 
 dp
∂T  p
En particular, para 1 mol de un gas ideal

T
CV dT T

T0
T
= CV ln ,
T0

V
 ∂p  V  ∂p  R
∫  ∂T 
V0 V
dV = R ln
V0
, ya que   =
 ∂T V V

Obtenemos:

T V
∆S = S (V , T ) − S (V0,T0 ) = CV ln + R ln
T0 V0

De la última expresión, en particular, se ve que la entropía crece tanto con el


aumento del volumen del gas, como también con el aumento de la temperatura. Así,
pues, si el gas ideal se dilata isotérmicamente, es decir, T = T0, entonces, el cambio de
entropía es

V
∆S = R ln (85.9)
V0

Dependencia de la energía interna del volumen. Ya hemos llamado la atención de


que la energía interna de los gases ideales depende no sólo de la temperatura T, sino
también del volumen V (densidad) del cuerpo:

U = f (T ,V ) ,

También se indicó que el cambio de energía interna originado por el cambio de


volumen a temperatura constante, se determina por la ecuación
100
 ∂U   ∂p 
  = T  −p
 ∂V  T  ∂T V

Utilizando ahora la relación termodinámica obtenida podemos deducir esta


ecuación importante. Para ello utilizamos de nuevo la identidad termodinámica (84.7)
en la forma:

dU + pdV 1 1
dS = = dU + pdV
T T T

Del hecho de que dU es una diferencial total, se deduce que

 ∂U   ∂U 
dU =   dV +   dT ,
 ∂V  T  ∂T V

es decir, el cambio total de la energía interna del sistema se compone de su cambio


U 
 
V
originado separadamente, por el cambio de volumen  T dV y por la variación de la
U 
temperatura   dT . De aquí a su vez se deduce que
 V V

1  ∂U   1  ∂U 
dS =   + p  dV +   dT
T  ∂V  T  T  ∂T V

Comparando con ésta la igualdad obtenida anteriormente, (85.5):

 ∂p   ∂S 
dS =   dV +   dT
 ∂T V  ∂T V
De la comparación de los coeficientes de dV en ambas igualdades se hace evidente
que

1  ∂U    ∂p 
  + p =  
T  ∂V T   ∂T V ,

De donde se obtiene la expresión que nos interesaba:

 ∂U   ∂p 
  = T  −p
 ∂V  T  ∂T V (85.10)
 ∂p  dQ
T 
Es útil observar que la expresión 
∂T V no es otra cosa que dV , es decir, la
cantidad de calor, que corresponde a la unidad del cambio de volumen, que es
necesario al cuerpo para que crezca su volumen, pero con ello quede constante la
temperatura.
Para el gas ideal.
101
 ∂p   ∂U 
T  = p y por eso,   =0
 ∂T V  ∂V T

Empleemos (85.10) para calcular la energía interna del gas, cuyo estado se
describe por la ecuación de Van der Waals

RT a
p= − 2.
V −b V

En este caso, como se ve fácilmente

 ∂p  RT  ∂U  a
T  = y   = 2,
 ∂T V V − b  ∂V  T V

de donde

 ∂U   ∂U  a
dU =   dT +   dV = CV dT + 2 dV
 ∂T V  ∂V T V

y, por consiguiente,

a a
U = ∫ CV dT + ∫ 2
dV =C V T − + B ,
V V

Donde B es la constante de integración. Su valor se puede determinar de la


condición que para V → ∞ , es decir, cuando el gas se enrarece infinitamente, él debe
poseer las propiedades del gas ideal, para el cual

i
U = CV T = RT ,
2
(i es el número de grados de libertad de la molécula del gas). Pero esto significa
que

B=0

y la energía interna del gas de Van der Waals es


a
U = CV T − .
V
De aquí se deduce que la energía interna de tal gas se compone de la energía
cinética de las moléculas (CVT), condicionada por las fuerzas de interacción de las
moléculas. Es claro que la energía potencial disminuye en su valor numérico con el
aumento de la distancia entre las moléculas (porque con ello disminuyen las fuerzas
de interacción), es decir, con el aumento del volumen ocupado por el gas.

3.13. ENTROPIA DURANTE LOS PROCESOS REVERSIBLES EN UN SISTEMA


CERRADO

102
Si en cualquier sistema ocurre un proceso adiabático, esto significa que nuestro
sistema es cerrado. Es cerrado en el sentido de que está aislado de las fuentes
externas de calor, tanto de las que le entregan calor, como de las que absorben calor.
Evidentemente, que si el proceso de cambio de estado es reversible en tal sistema,
entonces el cambio de entropía será igual a cero, ya que en la igualdad

dQ
dS =
T
la magnitud dQ es igual a cero. Durante el cambio adiabático del estado del sistema
cerrado, su entropía queda invariable.
Verdaderamente los cuerpos externos con relación al sistema pueden realizar un
trabajo sobre tal sistema y el propio sistema puede realizar trabajo sobre los cuerpos
externos. En este sentido el sistema no es cerrado. Pero si incluimos estos cuerpos en
nuestro sistema, entonces la variación de entropía en tal sistema ya completamente
cerrado queda igual a cero como antes, por que los cambios de estado de los cuerpos
que realizan trabajo, o de los cuerpos, sobre los cuales son solo partes mecánicas de
nuestro sistema.
Pero se puede demostrar que para cualquier cambio reversible de estado del
sistema cerrado, la entropía no varía.
En efecto, supongamos que un cuerpo cualquiera, capaz de dilatarse o
comprimirse, de intercambiar el calor con las fuentes de calor, recibe calor de unas
fuentes y entrega calor a otras, Supongamos también que sobre el cuerpo se realiza
un trabajo o el propio bajo o sobre los cuales se realiza un trabajo, fuentes de trabajo.
Examinemos el sistema cerrado, incluyendo también los cuerpos y las fuentes de calor
y las fuentes de trabajo.
Supongamos que el estado del cuerpo cambia reversiblemente debido a que él
intercambia calor con la fuente de calor y debido también a que él realiza trabajo o
sobre él se realiza trabajo. La realización de trabajo (de cualquier signo) como
acabamos de ver, no conduce a cualquier cambio de entropía. La entropía sólo cambia
durante el intercambio de calor entre el cuerpo y la s fuentes de calor. Si el cuerpo, por
ejemplo, recibió calor de la fuente, que designamos por dQcuer, entonces su entropía se
dQcuer
cambia en la magnitud , donde T es la temperatura del cuerpo. Pero con esto la
T
fuente perdió la misma cantidad de calor, Si designamos por dQ fuen a la cantidad de
calor perdido, entonces, es evidente que dQcuer = −dQ fuen . Con esto, la entropía de la
dQ fuen
fuente de calor varía en la magnitud − , donde T es la temperatura de la fuente.
T
Ya que el proceso de intercambio de calor es reversible, entonces la temperatura del
cuerpo deberá ser igual a la temperatura de la fuente. De otro modo ocurrirá el
proceso irreversible de conductibilidad científica. Por eso, está claro que
dQcuer dQ fuen
=− ó dS cuer = −dS fuen
T T

La variación total de la entropía dS de todo el sistema cerrado será igual a cero


dS = dS cuer + dS fuen = 0

Por consiguiente, la entropía del sistema cerrado durante cualquier proceso


reversible queda invariable en él.

3.14. SEGUNDO PRINCIPIO DE LA TERMODINÁMICA Y TRANSFORMACIÓN


DEL CALOR EN TRABAJO
103
Cuando la energía mecánica se transforma en calor, este proceso se desarrolla
muy sencillamente: toda la energía mecánica se transforma por completo en calor, y
para saber cuántas caloráis se obtienen durante tal transformación, es suficiente
multiplicar el número de Julios por 0,239 (equivalente térmico del trabajo mecánico).
Entonces, el rendimiento siempre será igual a la unidad.
El proceso inverso de obtención de trabajo mecánico a cuenta del calor, coma
ya vimos en el 80(pag315), es mucho más complicado.
Sobre la máquina térmica descrita en este apartado, que trabaja según el ciclo
de Carnot, se dijo que era la mejor de las máquinas térmicas imaginables, y que
ninguna otra máquina para tales condiciones de temperatura podía dar mayor cantidad
de trabajo. A pesar de ello, incluso en esta mejor máquina, el rendimiento siempre será
menos que la unidad y en muchos casos es sorprendentemente pequeño. Si la
temperatura T0 del calentador, pro ejemplo, es igual a 373 K (temperatura de
ebullición del agua), y la del refrigerador es T1 = 293 K (temperatura ambiente),
entonces, el rendimiento de la máquina ideal de Carnot

T1
η = 1−
T0

es igual en total a 22%. ¡Y este rendimiento es un límite (inaccesible) superior! En


las máquinas reales, como, por ejemplo, en las locomotoras, los rendimientos
establecidos raramente superan el 10%.
De tal modo, la posibilidad de la obtención continua (cíclica) de trabajo a
cuenta del calor está limitada de un modo determinado, en el sentido de que el calor,
tomado de la fuente, no puede ser transformado completamente en trabajo. La
posibilidad de obtener trabajo a cuenta del calor se paga, hablando en general, a un
precio elevado, en forma de calor perdido, inútilmente entregado al refrigerador.
Es fácil cerciorarse de que, precisamente, el segundo principio de la
Termodinámica impone estas limitaciones.
Supongamos que se tiene una vasija con un gas ideal. Admitamos, al principio,
que no actúa el segundo principio de la Termodinámica. Esto significa que las
moléculas del gas pueden distribuirse por todo el volumen de la vasija, pero también
pueden reunirse en cualquier parte pequeña de él (esto no lo impiden ni las leyes de la
Mecánica ni el primer principio de la Termodinámica). Aprovechando el momento
cuando el gas se acumule por sí mismo en una parte del volumen de la vasija, y de tal
modo resulta estar comprimido, lo podemos separa de la parte restante de la vasija
con una pared en forma de émbolo. Luego, dejando dilatarse el gas, lo obligamos a
realizar el trabajo de desplazamiento del émbolo. Para que el gas no se enfríe,
aseguramos el contacto térmico con el medio ambiente, del cual puede extraerse calor
(por consiguiente, será una dilatación isotérmica).
Después de esto, cuando el gas realizó el trabajo por primera vez, se puede
esperar hasta que se reúna de nuevo en aquella parte de la vasija (nuestra espera no
debe ser inútil, si el segundo principio de la Termodinámica no actúa como
suponíamos) y de nuevo le damos la posibilidad de dilatarse y producir trabajo. Tales
ciclos se pueden repetir tantas veces como se quiera.
Esto significa que sobre este principio se pueden construir máquinas de acción
cíclica, cuyo único resultado de su acción es la producción de trabajo y el enfriamiento
del depósito térmico, es decir, en esencia, es un <<perpetuum mobile>>. Pero este
motor no contradice a la ley de conservación de la energía. El trabajo se realiza no de
la <nada> sino a cuenta del calor que el gas toma del medio ambiente. Ya que las
reservas de energía de la atmósfera, de las aguas de los mares y océanos de la

104
corteza terrestre se pueden considerar inagotables, tal máquina, prácticamente, no se
distinguiría del motor eterno.
La máquina térmica hipotética, descrita, cuya acción consiste sólo en que con
ella se realiza el trabajo mecánico a cuenta del calor, se llama, perpetuum mobile de
segundo género, a diferencia del perpetuum mobile de primer género; en el cual, en
contradicción con la ley de conservación de la energía, se crea más trabajo que la
energía gastada. El rendimiento de esta máquina sería igual a la unidad, puesto que
durante el proceso de dilatación isotérmica del gas ideal dA = dQ.
Sin embargo, en realidad, tal máquina no puede actuar, ya que inútilmente
esperaremos que las moléculas de un gas se reúnan por sí mismas en una parte del
volumen de la vasija: un tal auto concentración de las moléculas va acompañada de
una disminución de la entropía y. por eso, es imposible. Observemos que aquí se trata
de la imposibilidad de la máquina cíclica, que repite constantemente el proceso de
transformación del calor en trabajo. Esto es muy importante porque es completamente
posible la transformación unitaria, ella no contradice ni al primero, ni al segundo
principio de la Termodinámica.
Algunas veces también se formula el segundo principio de la Termodinámica en
forma de afirmación sobre la imposibilidad del motor eterno de segundo género,
semejante a como se puede expresar el primer principio en forma de afirmación sobre
la imposibilidad del motor eterno de primer género.
El segundo principio de la Termodinámica también da contestación a al
pregunta sobre qué se necesita para que pueda actuar la máquina térmica cíclica.
Nosotros no podemos quitar sencillamente calor de la fuente (calentador) con
ayuda del cuerpo de trabajo y transformar este calor en trabajo, porque este proceso
va acompañado con una disminución de la entropía del calentador (el cuerpo de
trabajo realiza un proceso circular, y su entropía queda constante). Es decir, es
necesario tener un sistema compuesto no de dos cuerpos, calentador y cuerpo de
trabajo, sino de tres, y precisamente el papel del tercero deberá consistir en aumentar
su entropía, por lo menos en aquella magnitud, en la que disminuye la entropía, por lo
menos en aquella magnitud, en la que disminuye la entropía del calentador como
 dQ 
resultado de haberle quitado calor  dS =  . Para que aumente la entropía del
 T 
tercer cuerpo, hay que entregarle parte del calor tomado del calentador, Este tercer
cuerpo es el refrigerador. Ya que su temperatura es inferior, entonces, hay que
entregarle menos calor que el quitado del calentador, de modo que parte de este calor
se puede transformar en trabajo. En estas condiciones la entropía del sistema
<<calentador cuerpo de trabajo – refrigerador>> queda constante, lo que ya es
permisible por el segundo principio de la Termodinámica, que sólo prohíbe los
procesos con disminución de entropía.
De aquí se deduce que es imposible, por principio, transformar en trabajo todo
el calor recibido del calentador por el cuerpo de trabajo con ayuda de una máquina de
acción cíclica. Parte de calor irremisiblemente se debe entregar al refrigerador. Este es
aquel precio que hay que pagar para que la otra parte de calor se transforme en
trabajo.
Aquí hemos examinado el caso, cuando al refrigerador se le comunica tal
cantidad de calor que aumenta su entropía en tanto, que compensa la disminución de
entropía del calentador. Está claro, que ésta es aquella cantidad mínima de calor
perdido, sin la cual en general, la máquina no puede trabajar. Con ello, la entropía
queda constante y se transforma en trabajo la máxima parte del calor recibido del
calentador, de modo que el rendimiento será el máximo. Ya sabemos, que la
constancia de la entropía corresponde al proceso reversible. He aquí el porqué la
máquina ideal con el máximo rendimiento deberá ser reversible. Precisamente por

105
esto, durante la descripción del ciclo de Carnot dirigimos la atención a las
circunstancia de que durante su realización no se realicen los procesos irreversible de
conducción calorífica, y las dilataciones y compresiones se realicen por n camino
reversible.
En realidad, no es posible asegurar en la máquina real el proceso reversible
completo en todos los estadios del ciclo. Por eso, la entropía no quedará constante
sino crecerá. Esto a su vez significa que en la máquina real hay que entregar al
Q0 Q1
refrigerador más calor que el determinado por la igualdad = .
T0 T1
Por consiguiente, en este caso una parte mayor de calor que en la máquina
reversible recibido del calentador queda inaccesible para su transformación en trabajo,
y el rendimiento de la máquina será menor que el rendimiento calculado para el ciclo
reversible de Carnot.
En general, el aumento de entropía significa que el calor se hace menos
accesible para su transformación en trabajo mecánico. Esto se ve fácilmente en el
siguiente cálculo.
Imaginémonos a una fuente de calor con temperatura T1 , que entrega una
cantidad de calor Q al cuerpo de trabajo. Si la temperatura del refrigerador es T0 ,
Q Q0
entonces, la cantidad de calor Q0 entregado a él se determina de la igualdad: =
T1 T0
de donde
T0
Q0 = Q
T1

La cantidad de calor que con ello se puede transformar en trabajo es igual a:

 T 
Q − Q0 = Q1 − 0  .
 T1 

Si tomamos otro calentador con temperatura T2 y le cogemos la misma cantidad de


calor Q, entonces, hay que entregar al refrigerador (con la temperatura anterior T0 ) una
Q Q´0
cantidad e calor Q0 , determinada por la igualdad = , de donde
T2 T0
 T 
Q − Q´0 = Q1 − 0  ,
 T2 
y en este caso se puede transformar en trabajo una cantidad de calor igual a:

 T 
Q − Q´0 = Q1 − 0 
 T2 

De aquí se deduce, que si la cantidad de calor Q, pasa del cuerpo con temperatura
T1 al cuerpo con temperatura T2 entonces, la <capacidad de trabajo> del calor (es
decir, la magnitud de aquella parte suya que puede ser transformada en trabajo) se
cambia en la magnitud

106
 T   T  1 1
Q1 − 0  − Q1 − 0  = Q − T0
 T2   T1   T1 T2 
(88.1)

1 1
De acuerdo con la fórmula 87.1, la expresión Q T − T  es igual, al aumento de
 1 2 

entropía tomado con signo contrario, durante el paso del calor del cuerpo con
temperatura T1 al cuerpo con temperatura T2 ( T1 > T2 ) . Por consiguiente, el cambio de
la <<capacidad de trabajo>> del calor durante su paso de un cuerpo a otro se
determina por el cambio de entropía durante tal paso. De la fórmula (88.1) se ve que el
crecimiento de entropía conduce a la disminución de la accesibilidad del calor para su
transformación en trabajo. El crecimiento de la entropía nos conduce a la
desvalorización de la energía térmica, a la reducción de la posibilidad de obtener
trabajo a cuenta de él. Desde este punto de vista, se puede considerar al segundo
principio de la Termodinámica como la afirmación de que, en cualquier sistema cerrado
cualquier proceso (irreversible) se desarrolla de tal modo, que la cantidad de energía
capaz de transformarse en trabajo disminuyen tendiendo a cero durante el equilibrio.
Por eso, está claro que a la entropía también va ligada la energía libre que
introducimos anteriormente, que representa en sí aquella parte de energía que,
durante el proceso isotérmico (dT=0); puede ser transformada en trabajo mecánico.
Escribamos la ecuación de la ley de conservación de la energía dQ = dU + dA
dQ
Ya que dS = , entonces, dQ = TdS , y nuestra ecuación toma la forma:
T
dU = T dS – dA
(88.2)

De la ecuación (88.2) se deduce que


-dA = dU – T dS = d (U – TS),

o bien,

dA = - d (U – TS)
(ya que T = const, entonces, S dT = 0)

La última igualdad indica que el trabajo dA, durante el proceso isotérmico, es igual
al cambio de una función determinada U – TS. Ella representa en sí, evidentemente la
energía libre del sistema F:

F = U – TS
La energía libre, es decir, la energía capaz de dar un trabajo mecánico, por
consiguiente, es igual a la energía interna U con descuento de la magnitud TS. Claro
está que TS representa en sí aquella parte de energía que no puede ser transformada
en trabajo, y es algunas veces la llaman por eso energía ligada.
La magnitud situada en la parte derecha de la ecuación (88.1) precisamente
representa Ens. El cambio de la energía ligada T0 ∆S . El es igual al cambio de la
<capacidad de trabajo> de la energía térmica.

3.15. SENTIDO FISICO DE LA ENTROPIA. ENTROPIA Y PROBABILIDAD

El segundo principio de la Termodinámica establece, que los procesos


irreversibles (y tales procesos son, prácticamente, todos los procesos térmicos, y en
107
cualquier caso todos los procesos que se desarrollan naturalmente) marcha de tal
forma, que crece la entropía del sistema de cuerpos participantes en el proceso,
tendiendo a un valor máximo. El valor máximo de la entropía se consigue cuando el
sistema pasa al estado de equilibrio.
Entre tanto, vimos que la misma irreversibilidad de los procesos térmicos está
ligada con que el paso al estado de equilibrio es, extremadamente, más probable en
comparación con todos los demás pasos. Por eso, sólo se observan aquellos cambios
de estado, durante los cuales el sistema pasa de un estado menos probable al más
probable. Salta a la vista la semejanza en la conducta de ambas magnitudes, de la
entropía y la probabilidad: ambas crecen durante el paso al equilibrio. Por eso. Es
natural ligar la entropía del sistema en tal o cual estado con la probabilidad de ese
estado. Esta ligazón fue descubierta por L. Boltzman.
Ante todo, es necesario determinar más exactamente el concepto de
probabilidad del estado. Esto se hace lo más fácilmente, si nos dirigimos de nuevo al
ejemplo de la distribución de las partículas de gas en el volumen de la vasija.
Imaginémonos una vasija dividida en dos partes y supongamos que en esta
vasija se encuentran seis moléculas, por ejemplo, a cada una de las cuales le
adjudicamos un número determinado, por el cual se pueden <distinguir> una de otra.
Es fácil cerciorarse con un cálculo sencillo de que estas seis moléculas pueden
mezclarse en ambas mitades de la vasija de 64 modos distintos. A cada uno de ellos
le corresponde un determinado estado del sistema. Por ejemplo, el estado, durante el
cual se encuentra 1 molécula en la parte izquierda de la vasija y 5 en la parte derecha,
se diferencia del estado, durante el cual en la parte derecha se encontrarán dos
moléculas y en la izquierda 4. Examinemos ¿de cuántos modos de distribución, entre
el número total de ellos, se realiza cada estado de nuestro sistema? No es difícil
calcular, por ejemplo, que sólo una distribución de tal estado, en el cual no hay ni una
molécula en la parte izquierda de la vasija. El estado <a la izquierda 1 a la derecha 5>
se realiza de seis modos, el estado <a la izquierda 2 a la derecha 4 > se realiza de
quince modos. Con el mayor número de modos de distribución se realiza aquel estado,
en el cual, a la derecha y a la izquierda, se encuentran tres moléculas, es decir, con
una distribución uniforme de moléculas en ambas mitades de la vasija.
Se puede mostrar, en general, que si en la vasija se encuentran N moléculas y
están numeradas, entonces, entre las dos mitades de la vasija se les puede distribuir
de 2 N modos. De este número total de distribuciones distintas, el número Z de
distribuciones durante las cuales en una mitad se encuentran n moléculas y en la otra
N - n moléculas, se determina por la igualdad

N!
Z=
n!( N − n)!
(en este caso el número 0! Se considera igual a 1). Nos podemos fácilmente
convencer de que para cualquier número N el valor de Z será el máximo, cuando
N
n= , es decir, la distribución uniforme de las moléculas en el volumen de la vasija
2
se realiza del mayor número de modos. Por supuesto, se obtiene el mismo resultado si
dividimos la vasija no en dos, sino en un número arbitrario de partes.
De aquí se puede pasar fácilmente a la probabilidad de esta o aquella
distribución de las partículas entre ambas mitades de la vasija. Si en el ejemplo
examinado por nosotros con 6 moléculas el número total de modos de distribución de
las moléculas era igual a 64 y 6 de ellas no conducen al estado, en el cual en la parte
izquierda de la vasija se encuentra una molécula, entonces, es evidente que la
probabilidad de este estado es igual a 6/64. La probabilidad de la distribución

108
uniforme será igual a 20/64. En general, la probabilidad de W de que en la parte
izquierda de la vasija se encuentren n de las N partículas será igual a:

N!
W =
n!( N − n)!2 N
N
Está claro que la probabilidad W tiene un máximo para n = .
2
Para un gran número N de partículas, el número de modos, para los cuales se
realiza la distribución uniforme de las partículas en el volumen de la vasija, será la
mayoría aplastante, en comparación con cualquiera de las distribuciones no uniformes,
En la marcha de los movimientos térmicos, ininterrumpidos, caóticos de las
moléculas, el gas se puede hallar en cualquiera de los estados imaginables, pero,
ciertamente, en la mayoría aplastante de los casos, lo hallamos en el estado en que se
realiza por el mayor número de distribuciones, es decir, en el estado de la distribución
uniforme. Este es el estado de equilibrio. Y si el gas por cualquier causa no se
encuentra en equilibrio, entonces, dejándolo a su albedrío, indispensablemente pasará
a este estado.
De tal modo, se puede caracterizar cada estado del sistema no sólo por su
probabilidad matemática W determinada por la igualdad

N
 V `
W =  ,
V 
Que expusimos en el 76, sino también por el número de modos, en los cuales se
realiza este estado. Esta última magnitud se llama probabilidad termodinámica.
Está claro, que ambas probabilidades están ligadas una con otra. Pero a
diferencia de W, que siempre es menor que la unidad, la probabilidad termodinámica
que designaremos por w se expresa por números grandes.
Con la magnitud de probabilidad termodinámica puede estar ligada la entropía,
ya que una y otra tienen el valor máximo en el estado de equilibrio, y el paso de
cualquier sistema al equilibrio va acompañado con el crecimiento y de la entropía y de
la probabilidad termodinámica.
Por causas que aquí no vamos a exponer, Boltzmann ligó la entropía S y la
probabilidad termodinámica W con la relación:
w
S = k ln ,
w0
Donde k es la constante de Boltzmann que ya conocemos.

La fórmula anterior se puede escribir también así:

S = k ln w – K ln w0 = k ln w – S0
La magnitud

S0 = k ln w0
Se puede tomar como origen de medidas de la entropía. Entonces, la entropía
contada desde este origen se expresan por la igualdad
S = k ln w

Algunas veces la probabilidad termodinámica de que un sistema se encuentre en el


estado dado se determina de otro modo, cuya idea se puede aclarar con el siguiente
ejemplo.

109
Vimos que la probabilidad del tal estado, durante el cual el gas, compuesto de
R
N partículas, está concentrado en un una parte del volumen de la vasija V ´= es
m
N N
1 1  V´ 
W =  = N
= 
igual a : m V  V 
 
 V´ 
Introduzcamos su magnitud inversa

N
1 V 
w= =  (89.3)
W  V´ 

Ella muestra en cuántas veces la probabilidad W es menor que la probabilidad


de que el gas ocupe por completo todo el volumen de la vasija (esta probabilidad es
igual a la unidad, ya que V´ compone una parte del volumen V).
Si los valores W de la probabilidad matemática del estado del sistema
molecular (para grandes valores de N) siempre son muy pequeños, los valores w de la
probabilidad termodinámica, por el contrario, son muy grandes. El valor mínimo de w
en nuestro ejemplo es igual a la unidad (cuando V´= V), mientras que para W la unidad
es su valor máximo (también V´=V).
La magnitud w determinada por la igualdad (89.3) se llama probabilidad
termodinámica. Es evidente, que ambas definiciones de la probabilidad termodinámica
expuestas no contradicen una a la otra.
Escribamos la expresión 889.3) para un mol de sustancia

No
V 
w=   ,
 V´ 
R
donde No es el número de Avogadro. Ya que N 0 = , entonces,
k
R
 V k
w= t 
V 
R V
Tomando el logaritmo de esta igualdad, obtenemos: ln w= ln , ó
k V´
V
k ln w = R ln .

La magnitud situada a la izquierda de esta igualdad representa en sí la
entropía, de acuerdo a la fórmula de Boltzmann.

S = k ln w
Supongamos que el mol de gas se dilata isotérmicamente, desde el volumen
V ´= V1 hasta el volumen V ´= V2 . Escribamos la expresión de la entropía antes y
después de la dilatación:
S1 = k ln w1 = R (ln V − ln V1 ),
S 2 = k ln w2 = R (ln V − ln V2 )
Restando una ecuación de la otra, obtenemos la magnitud del cambio de
entropía como resultado de la dilatación:

110
w1 V
∆S = S 2 − S1 = k ln = R ln 2 . (89.4)
w2 V1
Tal fórmula también la obtuvimos anteriormente (85.9).
Se sabe que el trabajo de dilatación durante el proceso isotérmico es igual a:

V2
A = RT ln
V1
Comparando esta expresión con (89.4) hallamos que
A
∆S = .
T
Por otra parte, según la ley de conservación de la energía, en el proceso
isotérmico A= ∆Q , de donde
∆Q
∆S = .
T
De tal modo obtenemos la misma expresión de ∆S que obtuvimos del análisis
del ciclo de Carnot.
La ligazón entre la entropía y la probabilidad permite tratar de otro modo al
segundo principio de la Termodinámica. El ahora significa que cualquier proceso de la
naturaleza se desarrolla de tal modo que el sistema pasa al estado, cuya probabilidad
es mayor. Junto con ello la afirmación contendida en el segundo principio pierde su
carácter categórico. El hecho de que cada proceso que marcha por sí solo conducen
al estado de mayor probabilidad, no significa que es imposible otra dirección del
proceso. Como ya indicamos anteriormente, sólo significa que le paso al equilibrio es
solamente más probable que la libre separación del estado de equilibrio. Por eso, de
hecho el segundo principio es necesario comprenderlo de tal modo, que si el sistema
se encuentra en cualquier estado con una entropía dada, será de esperar, con una
probabilidad aplastante, que el sistema pasará a un estado de mayor entropía, es
decir, que el cambio más probable de la entropía es su crecimiento. Por principio, son
imaginables también los procesos que van acompañados de una disminución de
entropía.
Aquí es necesario recordar que las fluctuaciones, que hemos recordado más
de una vez, representan en sí tales cambio de estado, que van acompañados de una
disminución de entropía 8y, naturalmente, de probabilidad). Pero estas desviaciones
pequeñas del estado de equilibrio no contradicen al segundo principio. Ellas son
consecuencia inevitable, precisamente del carácter probable de la entropía.

3.16. ENTROPIA Y DESORDEN

La energía calorífica del cuerpo es la energía del movimiento caótico


desordenado de sus moléculas. Este caos del movimiento térmico de las moléculas se
diferencia del movimiento mecánico macroscópico del cuerpo, en el cual sus
moléculas componentes se mueven ordenadamente. Por ejemplo, durante el
movimiento de traslación del cuerpo, todas sus moléculas se mueven con una misma
velocidad, que se suma a la velocidad de s su movimiento térmico caótico. La
transformación de la energía térmica en mecánica se reduce, por consiguiente, a la
transformación del movimiento térmico caótico en movimiento ordenado.
Por el contrario, transformar la energía mecánica en térmica, significa
transformar la energía del orden en energía del desorden. No es difícil comprender
que estos procesos, contrarios uno del otro no son equivalentes: es

111
incomparablemente más fácil transformar el movimiento ordenado en caótico, que
producir la transformación contraria.
Esto se aclara con el siguiente ejemplo. Imaginémonos una caja con bolas
negra y blancas, dispuestas de tal modo que en cada mitad de la caja se encuentren
las bolas de un color (fig 97.a). Ahora es suficiente sacudir unas cuantas veces la caja
para que las bolas se mezclen en ella y se dispongan en completo desorden (fig.
97,b). La simple sacudida de la caja transformó el orden en la distribución de las bolas
en desorden.
Sin embargo, con estas sacudidas no se pueden llevar las bolas de nuevo al
estado ordenado, para que en cada mitad de la caja de nuevo se encuentren las bolas
de un color. Hablando en rigor, al repetir muchas veces las sacudidas, por principio,
es posible que cualquier golpe de turno conduzca al establecimiento del orden. Pero
este suceso casual, evidentemente, es extremadamente poco probable. Al desorden
conducen, prácticamente, cada sacudida, al orden sólo una ente muchas.

Esta irreversibilidad peculiar deberá manifestarse aún más fuertemente en


cualquier sistema molecular, donde le número de moléculas es inmensurablemente
mayor que el número de bolas en la caja.
Los choques entre las moléculas <sacuden> al sistema y lo conducen a su
desorden, incluso si en cualquier momento reinaba el orden en el sistema.
Si dos partes de un cuerpo se encuentran, por ejemplo, con distintas
temperaturas, entonces, tal estado es más ordenado, que el estado cuando su
temperatura en todas partes se ha igualado como resultado de la conducción
calorífica.
Del mismo modo si en l vasija dividida por un tabique se encuentran dos gases
distintos, tal estado del sistema es más ordenado que la mezcla de estos dos gases,
etc.
Cada proceso natural siempre se desarrolla de tal modo, que el sistema pasa a
un estado con mayor desorden: las temperaturas de los cuerpos se igualan por sí
mismas, los gases por sí mismos se mezclan, etc.
La identidad ente el grado de desorden del sistema y su entropía es evidente.
Por eso, es natural considerar a la entropía como medida de desorden del
sistema. Teniendo presente la ligazón entre la entropía a la probabilidad del estado, se
puede decir que el estado con mayor desorden se caracteriza por una probabilidad
termodinámica mayor que el estado más ordenado.
Con esto también está ligada la irreversibilidad de los procesos térmicos: ellos
se desarrollan de modo que aumenta el desorden en el sistema.
La irreversibilidad de los procesos térmicos es la irreversibilidad del orden y
desorden.

112
Con ello también está ligado el hecho de que cualquier forma de energía pasa
al fin y al cabo a calor, ya que la energía térmica es la energía de los movimientos
desordenados, mientras que las demás formas de energía están ligadas con un
movimiento más ordenado.
Resumiendo todo lo dicho anteriormente sobre la entropía, formulemos una vez
más sus propiedades fundamentales;
La entropía es una función del estado del sistema.
Para calcular la entropía del sistema en el estado dado con relación a cualquier
dQ
estado tomado como cero, es necesario calcular el valor de ∫ T
para cualquier
proceso reversible de su estado. La entropía crece en un sistema cerrado que cambia
irreversiblemente del sistema. La entropía está ligada, directamente, con la
probabilidad del estado. El crecimiento de la entropía del sistema pasa del estado
menos probable al más probable. La entropía es la medida de desorden del sistema.
El crecimiento de la entropía, durante el proceso irreversible, significa que la
energía que poseía el sistema se hace menos accesible para su transformación en
trabajo mecánico. En el estado de equilibrio, cuando la entropía ha alcanzado su valor
máximo, en general, la energía del sistema no puede ser transformada en trabajo.

3.17. DIABLO DE MAXWELL

A Maxwell le pertenece la idea del siguiente experimento mental que a primera


vista está en contradicción con el segundo principio de la Termodinámica.
Imaginémonos un determinado dispositivo capaz de sentir las moléculas por
separado y lo colocamos en el orificio P de la que divide en dos partes a la vasija con
gas (fig. 98). Supongamos que al comienzo la presión y la temperatura en ambas
partes de la vasija son iguales. A pesar de esto, a consecuencia de sus movimientos
térmicos caóticos, las moléculas pasan
continuamente a través del orificio, tanto desde
la derecha como de la izquierda, a través del
orificio en la unidad de tiempo en ambas
direcciones, no se cambian ni la presión, ni la
temperatura en ambas partes de la vasija.
Supongamos ahora, que el dispositivo
recordado antes, que Maxwell lo llamó
<diablo>, empieza a actuar de modo que deja
pasar a un lado sólo las moléculas rápidas y al otro lado, sólo las lentas, Como
resultado, después de un tiempo determinado en aquella mitad de la vasija donde el
diablo dejaba pasar las partículas rápidas, la velocidad media de las moléculas resulta
ser mayor que en la otra mitad. Esto significa que el gas se encuentra en un mitad de
la vasija a una temperatura más alta.
De tal modo, sin cualquier trabajo exterior se origina una diferencia de
temperaturas, lo que se encuentra en contradicción inadmisible con el segundo
principio de la Termodinámica, que sólo <<permite>> la igualación de la diferencia de
temperaturas existente, pero <<prohíbe>> el origen por sí mismo de tal diferencia.
En realidad, aquí no hay contradicción. El segundo principio de la
Termodinámica sólo es aplicable a los cuerpos macroscópicos que contienen un gran
número de partículas, Esto se ve de la ligazón que existe entre la entropía y la
probabilidad, sobre la que no se puede hablar, si el número de partículas no es
grande, Para el <<diablo>> de Maxwell, el gas no es un cuerpo macroscópico, una vez
que es capaz de elegir las moléculas por separado, y a él no se refiere el segundo
principio.

113
Desde el punto de vista del mecanismo del fenómeno, la paradoja de Maxwell
se resuelve d la forma siguiente. Absteniéndose, por supuesto, de la idea sobre el
<<diablo>> situado en el orificio, con la intención de alterar el segundo principio de la
Termodinámica, deberemos tener presente, precisamente, un dispositivo determinado.
Ya que este dispositivo se pone en acción por los golpes de las moléculas (aunque
sean de las rápidas), entonces, él mismo debe tener medidas moleculares. Por eso,
las piezas de este dispositivo tomarán parte en los movimientos moleculares (del tipo
Browniano). Pero estos movimientos son completamente desordenados, estadísticos.
A consecuencia de ello, el orificio se abrirá según la ley de la casualidad, de modo que
a través de él pasarán no sólo las moléculas rápidas, sino también las lentas y no
ocurrirá la diferencia de temperaturas esperada, en concordancia completa con el
segundo principio de la Termodinámica.

4. FUNDAMENTOS BÁSICOS

4.1. De la necesidad de fundamentos básicos

Los mayores obstáculos que un estudiante promedio encuentra al tratar de entender la


dinámica de Lagrange, usualmente no se deben a las dificultades intrínsecas de la
materia, si no más bien, a ciertas deficiencias en un campo más o menos amplio
correspondiente a los fundamentos básicos. Con la esperanza de remover tales
obstáculos, se han dedicado los dos primeros capítulos al estudio detallado de los pre-
requisitos que con mayor frecuencia no son del dominio de los estudiantes y que no se
encuentran fácilmente en los textos.

4.2. Leyes básicas de la mecánica básica de Newton y varias maneras de


expresarlas

Las tres leyes de Newton (naturalmente incluyendo los conceptos básicos de masa,
longitud, tiempo, fuerza, las leyes de la geometría, el álgebra y el cálculo) junto con el
concepto del trabajo virtual, pueden considerarse como los fundamentos sobre los
cuales se basa toda la mecánica clásica (el campo para el cual se cumplen las
condiciones C,D y E del numeral 1.6). Sin embargo conviene señalar desde el
comienzo que las leyes básicas de la dinámica pueden ser expresadas
(matemáticamente) de varias maneras diferentes a la forma dada por Newton. Las
más importantes de estas formas (que serán tratadas más adelante) son:

(a) el principio de D”Alembert


(b) las ecuaciones de Lagrange
(c) las ecuaciones de Hamilton
(d) el principio de Hamilton

Todas ellas son básicamente equivalentes. Por ejemplo, si se parte de las leyes de
Newton y del principio del trabajo virtual (ver el numeral 2.13 del capítulo 2) se puede
deducir cualquiera de las formas anteriores. Así pues, una cualquiera de las cinco
formulaciones puede tomarse como base de los desarrollos teóricos y de la solución
de los problemas.

4.3. Selección de la formulación

114
La escogencia de una de las cinco formas depende del trabajo que se ha de
realizar. Por ejemplo, las ecuaciones de Newton son adecuadas para la solución de
muchos problemas sencillos, el principio de Hamilton es importante en varias
consideraciones teóricas; y las ecuaciones de Hamilton han sido útiles en ciertas
aplicaciones, asi como en el desarrollo de la mecánica cuántica.

Sin embargo, el método de Lagrange es de manera especial potente y


notablemente sencillo como instrumento de solución de una gama muy amplia de
problemas (tanto teóricos como prácticos) relacionados con sistemas mecánicos,
eléctricos, electromecánicos, etc.

4.4. Origen de las leyes básicas

Las “leyes básicas” de la dinámica son sencillamente expresiones de un gran


conjunto de hechos experimentales: No es posible deducirlas por medio de manejos
lógicos o matemáticos, exclusivamente. En último término, las reglas del juego se
basan en experimentos delicados. Estas reglas deben ser aceptadas bajo la creencia
de que si la naturaleza las ha obedecido en el pasado, continuará haciéndolo en el
futuro. Por ejemplo, no es posible “explicar” porque son válidas la leyes de Newton. Lo
único que es posible afirmar es que ellas representan un enunciado compacto de
experiencia anterior, relacionada con el comportamiento de una gran variedad de
sistemas mecánicos: Las formulaciones de D”Alembert, Lagrange y Hamilton expresan
esto mismo, cada una de cierta manera en particular.

4.5. De los conceptos y magnitudes básicas empleadas.

Las magnitudes de longitud, masa, tiempo, fuerza, etc., se presentan


continuamente en mecánica, su interpretación y uso tiende a hacerse con sensación
de tranquilidad y de comprensión. Sin embargo, en diferentes épocas han surgido
interrogantes con relación a dos conceptos básicos que ellas conllevan y con relación
a la naturaleza fundamental de las magnitudes mismas. Un estudio de estos tópicos
estaría fuera de lugar aquí, pero los estudiantes interesados encontrarán de gran
beneficio los análisis de Bridgman, y otros, sobre estas materias.

4.6. Condiciones de validez de las leyes de Newton

La segunda ley de Newton aplicada a una partícula1 de masa constante, m, puede


escribirse como

dv
F =m (1.1)
dt

en donde la fuerza F y la velocidad v, son magnitudes vectoriales, y la masa m y el


tiempo t, son escalares. Escrito (1.1) en componentes queda

Fx = m x Fx = m y Fx = m z

115
dx d 2x
(En el presente texto se utilizará la conveniente notación: = x, 2 = x , etc) (1.2)
dt dt

Las relaciones (1.2) en la forma sencilla en la que están expresadas, no son


correctas para cualquiera, ni para todas las condiciones. A continuación se analizan las
condiciones con las cuales si son válidas.

Condición A

La ecuación (1.1) implica algún “marco de referencia” con respecto al cual se mide
dv
. Las ecuaciones (1.2) indican que el movimiento se ha referido a un sistema de
dt
ejes rectangulares X, Y, Z.

Es un hecho experimental que la segunda ley de Newton, expresada en la forma


sencilla de (1.2) conduce a resultados que concuerdan con la experiencia cuando los
ejes coordenados están inmóviles con respecto a la posición media de las estrellas
“fijas” o si se mueven con velocidad lineal uniforme, sin rotación, con relación a las
estrellas.

En cualquiera de los dos casos, el marco de referencia (los ejes X, Y, Z) se


denomina MARCO INERCIAL2 y las coordenadas correspondientes, COORDENADAS
INERCIALES. Dicho de otra manera, un marco que posee aceleración lineal, o que
esta girando en cualquier forma, es NO-INERCIAL3.5

La condición enunciada debe considerarse como una de las bases de sustentación


más importantes, sobre las que descansa la superestructura de la dinámica. El
reconocimiento de este hecho debe hacerse automáticamente en todo razonamiento
ya que básicamente, la solución de todo problema comienza con la consideración de
un marco inicial. Se debe la habilidad de reconocer por simple inspección los marcos
inerciales y no-inerciales.

5
El término “partícula”, un concepto imaginario, puede representarse como una pequeña
porción de materia, tan diminuta que su posición en el espacio se determina por las tres
coordenadas de su “centro” . En este caso su energía cinética de rotación con respecto a
cualquier eje que la atraviese, puede depreciarse.
2
El término “marco inercial” puede definirse en abstracto, sencillamente como aquel, con
respecto al cual, las ecuaciones de Newton en su forma sencilla (1.2) son válidas. Pero esta
definición no le indica al ingeniero o científico aplicado, donde hallar tal marco, o si ciertas
coordenadas específicas son inerciales. Por otra parte, la definición de las estrellas fijas, si
suministra esta información. Desde luego, debe observarse que mediciones hechas con gran
precisión podrían demostrar que el marco de las “estrellas fijas” fuera ligeramente no-inercial.
3
Un marco de referencia adherido a la superficie de la Tierra es claramente no-inercial debido
a las rotaciones anuales y diarias, y a los demás movimientos del globo. A pesar de esto, la
aceleración de este marco es tan pequeña que para muchos efectos (pero en ningún caso para
todos los efectos) puede considerarse como inercial. Un marco que no gire (con sus ejes
dirigidos siempre hacia las mismas estrellas fijas) con su origen adherido al centro de la Tierra
es una mejor aproximación de un marco inercial. Un sistema de ejes que no giren, con su
origen en el centro del Sol, constituye un marco inercial excelente (aunque posiblemente no es
aún “perfecto”)
116
Lo anterior no implica, sin embargo, que no se puedan utilizar coordenadas no-
inerciales. Por el contrario, como podrá notarse en forma evidente, los marcos no-
inerciales se emplean quizá con la misma frecuencia que los marcos inerciales. En los
ejemplos que siguen se observará como debe escribirse la segunda ley de Newton en
el caso de coordenadas no-inerciales. En los capítulos 3 y 4 se demuestra que las
ecuaciones de Lagrange (una vez expresada la energía cinética en la forma
apropiada) conducen a las ecuaciones del movimiento correctas en coordenadas
inerciales, no inerciales o mixtas.

Ejemplo 1.1

Como ilustración de la condición A, considérese el comportamiento de los objetos


(a), (b) y (c) de la figura 1-1, dentro de un vagón de ferrocarril que se mueve con
aceleración constante: az , sobre una vía recta y horizontal.

En la figura 1-1, (a) representa una esfera de masa m, bajo la acción de una esfera
exterior F (con componentes Fx y Fy) sometida a la gravedad. Si se supone que el
marco X1, Y1 es inercial, considerando el movimiento solamente en un plano y tomando
la esfera como una partícula, las ecuaciones del movimiento con respecto a la Tierra,
son

(1) m x1 = Fx (2) m y1 = Fy − mg
Por otra parte, las relaciones entre la “coordenadas del vagón” y las “coordenadas
de la Tierra” , para m, serían

117
1 2
(3) x1 = x2 + v1t + azt (4) y1 = y2 + h
2

Al derivar (3) y (4) con respecto al tiempo, y al sustituirlas en (1) y (2),

(5) m x2 = Fx − ma x (6) m y2 = Fy − mg

Que son las ecuaciones del movimiento con relación al vagón.

Es claro que la ordenada y2 es inercial puesto que (2) y (6) tienen la misma forma.
Sin embargo, la abscisa x2 es no-inercial, ya que (1) y (5) son diferentes. La ecuación
(5) es un ejemplo sencillo de la segunda ley de Newton escrita para un marco no-
inercial. (Nótese la magnitud del error que se cometería si se escribiera, en cambio,
m x2 = Fx )

Debe observarse que el efecto de la condición no-inercial, sobre cualquier sistema


mecánico, o sobre una persona en el vagón, es como si g se incrementara a ( a 2 x + g 2 )
, en una dirección que forma un ángulo θ = tan ax / g con la vertical, hacia abajo, y
1/2 −1

que todas las coordenadas fuesen consideradas como inerciales.

Si el hombre lanza una bola (Fig. 1-1 (b)) hacia arriba con una velocidad v 0, su
trayectoria en el vagón sería parabólica y debe calcularse como si la gravedad tuviera
la magnitud y dirección indicadas antes. Si el hombre tiene una masa M, ¿Cuál será su
“peso” en el vagón?

Como una extensión de este ejemplo, supóngase que el coche se hace oscilar
sobre la vía, alrededor de un punto fijo, según δ = δ 0 + Asenωt en donde δ 0 , A y ω
son constantes. La ecuación (6) continua sin modificación, pero al derivar x1=x2+ δ 0
+Asen ω t y al insertarla en (1), se obtiene

m x2 = mAω 2 senωt + Fx

Una vez más, se observa que x2 es no-inercial4

Fácilmente se nota que la bola en (b) en su movimiento con respecto al vagón,


describirá ahora una trayectoria bastante complicada, que esta determinada por la
aceleración hacia abajo g , y por una aclaración horizontal A ω 2sen ω t.

Para el hombre será difícil colocarse sobre una báscula, no importa donde este
ésta, puesto que su “peso” total cambio con el tiempo en magnitud y en dirección.

Ejemplo1.2:

118
Considérese el movimiento de una partícula de masa m (Fig. 1.2) con respecto a
los ejes X2 y Y2 que giran con velocidad angular constante w con relación al marco
inercial de X1 y Y1.

Las ecuaciones de
movimiento en las coordenadas
inerciales, son

m x1 = Fx1 m y1 = Fy1

En donde Fx1 y Fy1 son componentes de la fuerza aplicada en la dirección de los


ejes fijos. Se obtendrán ahora las ecuaciones correspondientes para las coordenadas
rotatorias ( y como se verá, no-inerciales)

Al observar la figura, redemuestra que

x1 = x2 cos ω t − y2 senω t
y1 = x2 senω t + y2 cos ω t

Derivando estas relaciones dos veces y sustituyéndolas en las primeras ecuaciones


del movimiento, se obtiene

[ ]
Fx1 = m x 2 cos ω t − 2 x2ω senω t − 2 y2ϖ cosϖ t − x2ω 2 cos ω t + y2ω 2 senω t − y2 senω t (9)

Fy = m[ x senω t + 2 x cos ω t − 2 y ϖ senϖ t − x ω senω t − y ω cos ω t + y cos ω t ]


1 2 2 2 2
2
2
2
2
(10)

De nuevo, al referirse a la figura, se ve que las componentes de F en la dirección de


X2 y en la de Y2, están dadas por Fx 2 = Fx1 cos ωt + Fy1senωt y por
Fx 2 = Fx1 cos ωt − Fy1senωt . Así, al multiplicar (9) y (10) por cos ωt y senωt ,
respectivamente y al sumar el resultado es
Fx 2 = m x2 − mx2ω 2 − 2mωy2 (11)

En forma semejante, multiplicando (9) y (10) por senωt y por cos ωt


respectivamente y restando, tenemos

Fy 2 = m y2 − my2ω 2 + 2mωx2 (12)

119
Estas son las ecuaciones del movimiento con respecto a los ejes no-inerciales X 2 y
Y2. Nótese que sería un error escribir Fx 2 = m x2 y Fy 2 = m y2 . Este ejemplo pone en
evidencia que cualquier marco giratorio es no-inercial.

Condición B.

Las ecuaciones (1.2) son válidas únicamente cuando m es constante. En caso de


que m sea variable, la ecuación (1.1) debe reemplazarse por

d
F= (mv)
dt

Pueden citarse varios ejemplos en los que la masa de un objeto varía con su
posición (una bola de nieve que rueda por una pendiente cubierta de nieve), que varía
con el tiempo (un carro tanque con un orificio en un extremo por el cual sale un líquido,
o un cohete durante la etapa en que se quema el combustible), o que varía con la
velocidad (un objeto que se mueve con una velocidad cercana a la de la luz). Sin
embargo, en este texto no se considerarán problemas de masa variable.

Condición C.

En general, las masas del sistema deben ser grandes en comparación con las de
los átomos y las de las partículas atómicas. La dinámica de las partículas atómicas
pertenece al campo de la mecánica cuántica. A pesar de esto, hay algunas situaciones
“fronterizas”; por ejemplo, la deflexión de un haz de electrones en un tubo de rayos
catódicos usualmente se calcula con suficiente precisión por medio de la mecánica
clásica.

Condición D.

Sea grande o pequeña la masa, su velocidad debe ser muy inferior a la de la luz.
Como se sabe, por la teoría especial de la relatividad, la masa de cualquier objeta
aumenta con la velocidad. En el caso de velocidades “ordinarias” este cambio de masa
es muy pequeño, pero a medida que la velocidad se aproxima a la de la luz, la
proporción de este aumento se vuelve muy importante. Por consiguiente, la relación
(1.2) no describirá con precisión el movimiento de un electrón, un protón, o una pelota,
si éstos se mueven con una velocidad aproximada de 2 x 1010 cm/seg. (Naturalmente,
esta condición podría incluirse en B)

Condición E.

En el caso de que ciertas masas del sistema sean muy grandes, o si se consideran
intervalos de tiempo muy largos ( un siglo o más), o en problemas que abarquen estas
dos condiciones, la teoría general de la relatividad concuerda mejor con la experiencia
que la dinámica de Newton. Por ejemplo, la dinámica relativística, predice que el
perihelio de la órbita del planeta Mercurio debe avanzar un ángulo de 43” por siglo, lo
cual coincide muy bien con los resultados de mediciones astronómicas.

En conclusión, se observa que al tratar de masas, velocidades o tiempos


“ordinarios”, siempre se cumplen las condiciones C, D y E. Por tanto, en la “dinámica
clásica” el mayor interés tiene que ver con A y con B.
120
De las condiciones anteriores resulta evidente que existen tres campos de
dinámica, más o menos bien definidos: Clásica, cuántica y relativística.
Desafortunadamente hasta ahora no se ha desarrollado una teoría “unificada” que
puedas ser aplicada en cualquiera o en todas las condiciones.

4.7. Dos tipos generales de problemas de dinámica.

Prácticamente cualquier problema de dinámica clásica es un caso especial de uno


de los dos tipos generales siguientes:

(a) Partiendo de unas fuerzas dadas que actúan sobre un sistema de masas, y
conocidas las restricciones, la posición y la velocidad de cada una de las
masas en un instante determinado, se requiere hallar el “movimiento” del
sistema, es decir, la posición, la velocidad y la aclaración de4 cada una de las
masas, en función del tiempo.
(b) Partiendo de unos movimientos dados para un sistema, se requiere hallar un
posible conjunto de fuerzas que produciría tales movimientos. En general,
algunas o todas las fuerzas pueden variar con el tiempo.

Desde luego, consideraciones sobre el trabajo, la energía, la potencia, la


cantidad de movimiento y el momentum angular pueden ser importantes, bien
en el tipo (a) o en el (b).

4.8. Métodos generales para solucionar problemas de dinámica.

La mayor parte de los problemas de la dinámica aplicada son del tipo (a). El
procedimiento general es el mismo en todos aquellos que pertenecen a este tipo. Por
conveniencia el procedimiento puede dividirse en cuatro etapas.

(1) Selección de un sistema de coordenadas apropiada

La facilidad con la que puede resolverse un problema específico depende en una


buena medida de las coordenadas utilizadas. El sistema más ventajoso depende
del problema entre manos; desafortunadamente no es posible dar reglas generales
de selección. Principalmente es un problema de experiencia y criterio.

(2) Planteamiento de las ecuaciones diferenciales del movimiento.

Ya se han dado algunos ejemplos sencillos de ecuaciones de movimiento. No


obstante, para ilustrar aún más el significado del término “ecuaciones del
movimiento” , considérese el problema de una pequeña masa m, suspendida de un
resorte espiral de mas despreciable, como aparece en la figura 1-3. Supóngase
que m puede moverse en un plano vertical bajo la acción de la gravedad y del
resorte. Las ecuaciones del movimiento, expresadas en coordenadas polares son

k
τ − τθ 2 − g cosθ + (τ − τ 0 ) = 0
m
τ θ + 2τθ − gsenθ = 0

121
en donde τ 0 es la longitud del resorte sin estirarse y k es la constante elástica usual
del resorte. La integración de estas ecuaciones diferenciales de segundo orden dan
τ y θ en función del tiempo.

Es importante recalcar dos observaciones: (a)


Estas ecuaciones diferenciales pueden
plantearse de varias maneras (véase el numeral
1.2). Sin embargo, como en la mayoría de los
casos el método de Lagrange es el más
ventajoso. (b) Las ecuaciones anteriores no
representan la única forma de expresar las
ecuaciones del movimiento de este péndulo.
Podrían escribirse en coordenadas
rectangulares, o en cualquier otro sistema de
coordenadas (véanse los capítulos 3 y 4). En
cada uno de estos casos las ecuaciones
tendrán aspectos bien diferentes y algunas serán más complicadas que otras. Las
afirmaciones (a) y (b) son válidas en general para todo sistema dinámico.

(3) Solución de las ecuaciones diferenciales del movimiento

Excepto en la formulación de Hamilton, las ecuaciones del movimiento son de


segundo orden. El grado de complejidad de las ecuaciones depende principalmente
del problema particular entre manos y del tipo de coordenadas que se usen. Con
frecuencia las ecuaciones no son lineales. Únicamente en ciertos casos, relativamente
escasos, en que por ejemplo todos los términos diferenciales tienen coeficientes
constantes, puede darse un método general de solución. Es importante mencionar que
aunque prácticamente para cualquier sistema dinámico pueden escribirse las
ecuaciones diferenciales del movimiento correctamente, en la mayoría de los caos
éstas resultan tan complejas que no es posible integrarlas. Afortunadamente, a pesar
de lo anterior, los varios tipos de computadores vienen a salvar la situación y ahora es
posible obtener soluciones útiles a ecuaciones bastante difíciles, con rapidez y
relativamente con pequeño esfuerzo. Naturalmente, esto quiere decir que ecuaciones
diferenciales que anteriormente se consideraban “sin solución” ocupan la atención
principal de científicos e ingenieros. Además, las técnicas generales más avanzadas
para plantear tales ecuaciones adquieren cada vez más importancia en todos los
campos de la investigación y del desarrollo.

(4) Determinación de las constantes de integración

El método de determinación de las constantes de integración es básicamente


sencillo. Se reduce a la sustitución de los valores conocidos de posición y velocidad en
un instante determinado, en las ecuaciones integradas. Como el método será aclarado
con toda amplitud en los ejemplos específicos de los capítulos siguientes, no se
incluyen aquí detalles adicionales.

4.9. Ejemplo ilustrativo de los numerales 1.7 y 1.8

Con el fin de ilustrar las observaciones de los numerales anteriores y para obtener
una visión general de la dinámica, antes de iniciar el estudio detallado del método de
Lagrange, considérese el ejemplo siguiente.

122
Las masas m1 y m2 están conectadas a los resortes (cuyas constantes elásticas son
k1 y k2 ) y al bloque B, como se muestra en la figura 1-4, abajo. Se hace mover el
bloque según s=A senwt, por medio de la fuerza F. Los puntos fijos p0, p1 y p2 se han
localizado de modo que p0p1 y p1p2 son las longitudes de los resortes, primero y
segundo respectivamente, sin estirar. Todos los movimientos se efectúan sobre una
línea horizontal lisa. Se desprecian las masas de los resortes.

Se describe a continuación el trabajo relacionado con el análisis dinámico del


sistema. El problema es del tipo (a) del numeral 1.7. El método0 de solución es del
numeral 1.8. Un amplio análisis del sistema incluiría la determinación de:

a. La posición de cada una de las masas, en función del tiempo


b. La velocidad de cada una de las masas en cualquier instante
c. La energía (cinética y potencial) del sistema, en función del tiempo
d. La aceleración y la fuerza que actúa sobre cada una de las masas en
función del tiempo.
e. Las frecuencias del movimiento de cada una de las masas.
f. La fuerza que debe aplicarse a B
g. La potencia entregada por B al sistema, en cualquier instante.

Debe entenderse que las soluciones que se dan a continuación no tienen por objeto
mostrar los detalles en su totalidad, sino que tratan solamente de ilustrar las etapas
fundamentales. Por esto, los manejos matemáticos que no parecen esenciales en una
visión general, se omiten. Se determina primero (a) y de aquí se siguen sin dificultad
(b), (c),… y (g).

Siguiendo las etapas descritas en el numeral 1.8, primero se soluciona un sistema


de coordenadas apropiado. Como el movimiento está restringido a una recta
horizontal, resulta evidente que solo dos coordenadas se requieren; una para
determinar la posición de cada una de las masas. De las distancias indicadas en la
figura 1-4, cualquiera de los pares (x1,x2),(x3,x5),(x3,x4),(x4,x5), etc. , puede utilizarse. Por
conveniencia se escoge (x1,x2)

Las ecuaciones del movimiento, obtenidas por aplicación directa de las leyes de
Newton o e las ecuaciones de Lagrange, son

m x1 + (k1 + k 2 ) x1 − k 2 x2 = k1 Asenϖt (1)

m x1 + k2 x2 − k 2 x1 = 0 (2)

Con el fin de hacer el problema más específico, se fijan las siguientes cantidades:

123
m1= 400g., m2=300g. A=5cm
k1=6 x 104 dinas/cm, k2=5 x 104 dinas/cm, ω =12 rad/seg

Por medio de métodos conocidos de integración se encuentran las soluciones


aproximadas de (1) y (2)

X1= 6.25A1sen(19.37t+ τ1 )-3A2sen(8.16t+ τ 2 )-0.95sen 12t (3)


X2= -5A1sen(19.37t+ τ 1 )-5A2sen(8.16t+ τ 2 )-7sen 12t (4)

Con lo cual se han completado las tres primeras etapas del numeral 1.8

Las constantes arbitrarias de de integración A1, A2, τ1 y τ 2 pueden determinarse


mediante la asignación de condiciones iniciales específicas. Se puede suponer, por
ejemplo, una forma de iniciar el movimiento; cuando t=o se tiene

X1= 3 cm, X2=4 cm (5)


X1= 0, X2 = 0 (6)
Al reemplazar en (3) y (4) los valores de (5), y en las derivadas con respecto al
tiempo de (3) y (4), los valores de (6), resultan cuatro ecuaciones algebraicas de las
cuales pueden obtenerse los valores específicos de las constantes, en forma
inmediata. Así se obtienen los desplazamientos x1 y x2 como funciones específicas del
tiempo.

Por simple inspección se nota que cada una de las soluciones a las partes (b),
(c),…y (g) pueden determinarse directamente partiendo de las formas finales de (3) y
(4). Así pues, todos los detalles adicionales se le dejan al lector.

El sencillo ejemplo anterior presenta una visión bastante completa del


procedimiento general que se sigue en la solución de la basta clase de problemas
mencionados en el numeral 1.7 (a). Una advertencia: Las ecuaciones del movimiento
(1) y (2) son bien sencillas y por tanto todas las etapas pudieron realizarse sin
dificultad. Desafortunadamente este no es el caso general (véase el numeral 1.8, (3)).
Por otra parte, sucede con frecuencia que muchos de los detalles que se ennumeraron
en la lista del numeral 1.9, no se necesitan.

El segundo tipo general de problemas mencionado en 1.7 (b) será estudiado en el


capítulo 13.

4.10.Resumen y observaciones

1. La “dinámica clásica” es la rama de la dinámica para la cual se cumple


las leyes de Newton, bajo las restricciones C, D y E del numeral 1.6

2. Las “leyes básicas” de la dinámica son sencillamente expresiones


compactas de resultados experimentales. Pueden expresarse
matemáticamente de varias maneras diferentes, pero todas ellas son
básicamente equivalentes. Cualquiera de las formas puede ser
deducida a partir de cualquier otra.

3. Es de gran importancia conocer y entender las condiciones de validez


de las leyes de la dinámica clásica. Resulta imprescindible, en la

124
solución de todo problema de dinámica, la definición de un “marco
inercial” y la verificación del papel que desempeña éste.

4. Hay dos tipos principales de problemas en la dinámica clásica (como se


vio en el numeral 1.7) de los cuales 1.7 (a) es el más común. Es
importante el reconocimiento de este hecho, así como del orden general
de la solución.

5. Actualmente existen tres campos distintos de la dinámica (desde el


punto de vista de la solución) bastante bien definidos (físicamente):
Clásica, cuántica y relativística. Hasta ahora no se ha desarrollado un
conjunto unificado de leyes que sea aplicable a cualquier problema o a
todos ellos.

4.11.Problemas y preguntas de repaso

1.1 Expresar el significado del término “dinámica clásica”. Mencionar ejemplos


específicos que ilustren los otros dos campos.

1.2 ¿Qué puede decirse con respecto al “origen” y a las maneras de expresar las
leyes de la dinámica?

1.3 Indicar con claridad el significado del término “marco inercial de referencia”

1.4 Demostrar que cualquier marco de referencia que se mueve con velocidad lineal
constante (sin rotación) con respecto a un marco inercial, es así mismo inercial.

1.5 ¿Es posible reconocer por simple inspección, si un sistema de coordenadas es


inercial, o no inercial? ¿Es admisible, en la solución de algunos problemas; utilizar
una combinación de coordenadas inerciales con no-inerciales? (Estas son
consideraciones de importancia)

1.6 El cable que sostiene un ascensor se rompe haciendo que éste caiga libremente
(despréciese la resistencia del aire). Demostrar que para cualquier sistema
mecánico cuyos movimientos se refieran al ascensor, el campo gravitatorio de la
Tierra, se anula efectivamente.

1.7 Un sistema de coordenadas esta adherido al interior de un automóvil que se


mueve de la manera usual, por una avenida con curvas, baches, semáforos y
policías de tráfico. ¿Será inercial tal marco? ¿Los ocupantes del vehículo
experimentan alguna fuerza diferente de la gravitacional? Explicar.

1.8 Si el coche de la figura 1-1 se mueve con velocidad constante sobre una vía
circular horizontal, ¿cuáles de las coordenadas x2, y2 o z2 de m1 (o de cualquier
otro punto referido al marco X2, Y2 y Z2) serán no inerciales? Explicar. (Supóngase
que Z1 tiene la dirección del radio de curvatura de la vía)

1.9 Supóngase que el marco X2, Y2 de la figura 1-2 tiene un tipo definido de rotación
(como θ = constante, θ = constante o θ = θ 0 senωt ). Demostrar que las
coordenadas x2, y2 son no-inerciales. Véase el ejemplo 1-2.

1.10 Supóngase que el dispositivo de la figura 1-4 se coloca en vagón de ferrocarril de


la figura 1-1, paralelo al eje x2, y que el vagón se mueve con aceleración
125
constante ax . Demostrar que las ecuaciones del movimiento (1) y (2) del numeral
1.9, deben reemplazarse por
m1 x1 + (k1 + k2 ) x1 − k2 x2 = k1 Asenϖt − m1a x
m2 x2 + k2 x2 − k2 x1 = −m2 a x

1.11 Supóngase que el origen del sistema X2, Y2 de la figura 1-2 tiene una aceleración
constante ax, en la dirección del eje X1, y que simultáneamente x2, y2 giran con
velocidad angular constante ω . Demostrar que las ecuaciones (11) y (12) del
ejemplo 1.2, deben reemplazarse por.
Fx 2 = m x2 − mx2ω 2 − 2mωy2 + max cos ωt
Fy 2 = m y2 − my2ω 2 + 2mωx2 − max senωt

1.12 Supóngase que el marco X, Y al cual está sujeto el péndulo de la figura 1-5; se
mueve con velocidad constante vx en la dirección X y vy en la dirección Y (sin
rotación del marco). Demostrar que la ecuación del movimiento del péndulo, en el
sentido de θ , es rθ = − gsenθ ¿El periodo de oscilación se altera por el
movimiento del marco del cual pende?

1.13 Si el marco X, Y de la figura 1-5, tiene una aceleración constante a x, en la


dirección de X, y una velocidad constante, vy en la dirección Y, demostrar que

rθ = − ax cosθ − gsenθ

y por tanto, que θ no es inercial. ¿El péndulo tiene ahora un periodo igual al del
problema 1.12?

1.14 Enunciar y dar ejemplos de las dos principales clases de problemas que se
encuentran en la dinámica clásica. Describir el procedimiento general que se siguen
en la solución de los problemas del primer tipo.

126
5. FUNDAMENTOS BÁSICOS II

Sistemas de coordenadas, ecuaciones de transformación, coordenadas


generalizadas. Grados de libertad, grados de restricción, ecuaciones de restricción,
Velocidad, energía cinética y aceleración de coordenadas generalizadas.
Desplazamientos virtuales y trabajo virtual.

5.1. Observaciones introductorias

Los desarrollos teóricos, así como la solución de los problemas de aplicación


en el campo de la dinámica analítica incluyen, además de los importantes tópicos
estudiados en el capítulo primero, una consideración inmediata de las coordenadas
generalizadas, ecuaciones de transformación, grados de libertad, grados de
restricción, ecuaciones de restricción, velocidad y energía cinética expresadas en
coordenadas generalizadas, expresiones generales de la aceleración y el significado y
uso de los desplazamientos virtuales y del trabajo virtual. Ningún estudiante está en
capacidad de comprender el desarrollo de la materia sin haber entendido claramente
cada uno de estos tópicos.

5.2. Sistemas de coordenadas y ecuaciones de transformación.

Los diferentes tópicos bajo este capítulo se estudiarán, principalmente, por medio
de ejemplos específicos.

(1) Sistemas rectangulares.

Considérense primero los sistemas rectangulares en dos dimensiones de la figura


2.1. Las distancias x1, y1 localizan el punto p con respecto al marco de referencia X1,
Y1. En forma similar, x1, y1 localizan el mismo punto con respecto a X2, Y2. Por
observación se ve que las coordenadas x1, y1 de cualquier punto en el plano, se
relacionan con las coordenadas x2, y2 del mismo punto por medio de las siguientes
“ecuaciones de transformación”:

127
Fig. 2-1

x1 = x0 + x2 cos θ − y2 senθ (2.1)


y1 = y 0 + x 2 cos θ + y 2 senθ

Nótese que tanto x1 como y1 son ambas funciones de x2 y y2 simultáneamente.

Puede verse que las relaciones (2.1) pueden escribirse en una forma más
conveniente, como sigue

x1 = x0 + l1 x 2 − l 2 y 2 (2.2)
y1 = y 0 + m1 x 2 + m2 y 2

En donde l1, m1 y l2 son los cosenos directores de los ejes X2, Y2 respectivamente,
con relación al marco X1, Y1.
Extendiendo el razonamiento, supóngase que el origen de X2, Y2 se mueve con
una velocidad que puede ser constante (con componentes vz y vy) con respecto al
marco X1, Y1; y simultáneamente, que los ejes X2, Y2 giran con gran velocidad angular
constante w, de tal manera que θ = wt . Las ecuaciones (2.1) y (2.2) pueden
escribirse:

x1 = v z t + x 2 cos w t − y 2 sen w t
y1 = v y t + x 2 sen w t + y 2 cos w t

Nótese que son ahora funciones tanto de como del tiempo. Naturalmente,
pueden escribirse ecuaciones adecuadas para cualquier tipo de movimiento que se
suponga.
Frecuentemente se encuentran ecuaciones de transformación semejantes a las
anteriores, las cuales se designan simbólicamente por
x1 = x1 ( x 2 , y 2 , t ). y1 = y1 ( x 2 , y 2 , t ).

Puede demostrarse que si se consideran dos sistemas rectangulares


tridimensionales, como en la figura 2-2, las ecuaciones de transformación que
relacionan las coordenadas x1, y1 y z1 de un punto, con las designadas por x2, y2 y z2
para el mismo punto, serán

128
Fig. 2-2

x1 = x 0 + l1 x 2 + l 2 y 2 + l3 z 2
y1 = y 0 + m1 x 2 + m2 y 2 + m3 z 2 (2.4)
z1 = z 0 + n1 x 2 + n2 y 2 + n3 z 2
En donde l1, m1 y n1, son los cosenos directores del eje X2, etc.
Desde luego, el marco X2, Y2, Z2 podría estarse moviendo, en cuyo cado
(conocido el movimiento) x0, y0, z0 y los cosenos directores podrían expresarse en
función del tiempo, o sea x1 = x1(x2, y2, z2, t), etc.

(2) Sistema cilíndrico.

Este sistema, bastante conocido, se muestra en la figura 2-3. Se observa que las
ecuaciones que relacionan las coordenadas (x, y, z) con ( r , θ , z ) son

x = ρ cos φ y = ρsenφ z=z (2.5)

Fig. 2-3 Fig. 2-4

(3) Sistema esférico.

129
Las coordenadas esféricas, consistentes en dos ángulos, φ y θ , y una distancia r ,
usualmente se designan como en la figura 2-4. Observando la figura se demuestra que

x = rsenθ cos φ , y = rsenθsenφ , z = r cos θ (2.6)

Nótese que x y y son ambas, funciones de r , φ y θ . Sin embargo z es función


únicamente de r y de θ .

(4) Otros sistemas de coordenadas.

Considérense los dos conjuntos de ejes, X, Y y Q1, Q2 de la figura 2-5 en donde se


suponen conocidos α y β . Por inspección se nota que el punto p puede localizarse
por medio de varios pares de distancias diferentes, tales como, (x, y), (q1, q2), (q´1, q´2),
(s1, s2), (s1, x), etc. Las ecuaciones de transformación que relacionan algunos de estos
pares son

Fig. 2-5

x = q1 cos α + q2 cos β
y = q1 senα + q2 senβ (2.7)
q ,1 = q1 + q2 cos( β − α )
q , 2 = q2 + q1 cos( β − α ) (2.8)
s2 = xsenβ − y cos β
s1 = y cos α − xsenα (2.9)

En la figura 2-6 se muestran otras posibilidades interesantes, Las distancias r1


y r2 medidas desde los puntos fijos a y b determinan la posición de p en cualquier lugar
encima del eje X (no son únicas para todo plano XY). Asimismo, ( θ , α ) o (r1, sen θ ),
son coordenadas apropiadas.
Si se escribe x = r1cos θ y y = r1sen θ y se designa q = sen θ , se concluye que

1
x = r1 (1 − q 2 ) 2 , y = r1q (2.10)

Lo cual relaciona las coordenadas (x, y) con (r1, q).

130
Fig. 2-6

Es interesante notar que el área sombreada A, y sen θ , constituyen


coordenadas perfectamente aceptables. Dos relaciones entre ellas x y y son

q
xy = 2 A y=( )x (2.11)
1 − q2

Fig. 2-7
En la figura 2-7 se muestran las gráficas de las coordenadas A y q. Las “curvas
de q” se obtienen dejando A constante y haciendo gráficas de la primera relación de
(2.11). En la misma forma, las “curvas de A” resultan de la segunda relación, con q
constante.
Es evidente, por los ejemplos mencionados, que puede emplearse una gran
variedad de coordenadas (longitudes, ángulos, funciones trigonométricas, áreas, etc.).

(5) Coordenadas para el sistema mecánico de la figura 2-8.

Supóngase que las masas m1 y m2 están conectadas por medio de un resorte y


pueden moverse únicamente a lo largo de la vertical. Como el movimiento está así
limitado, la posición de las masas se determina mediante la especificación de sólo dos
coordenadas, como y1 y y2. Asimismo, (y1, y3), (y2, y3), (q1, y1), (q2, y1), (q1, y2), etc., son
adecuadas. Se dice que se ha determinado la configuración del sistema cuando se
conoce uno cualquiera de estos conjuntos. Entre estos conjuntos de coordenadas
existen relaciones obvias (ecuaciones de transformación). Nótese que como
m1q1=m2q2, q1 y q2, r1 no son independientes. ¿Serán entonces independientes q1 y y3?

131
Fig. 2-8 Fig. 2-9

(6) Coordenadas para un sistema de masas pendientes de poleas.

Si se supone que las cuatro masas de la figura 2-9, se mueven verticalmente,


se ve que cuando se especifica la posición de m1, por y1 o por s1, la posición de m3
queda determinada. Asimismo, al especificar la posición de m2 mediante y2 o s2, se
conocerá la de m4. (Estas afirmaciones suponen, naturalmente, que todas las
dimensiones fijas de los cables y las poleas se conocen.) Así pues, solamente se
necesitan dos coordenadas para determinar la configuración de las cuatro masas. Al
principio es posible inclinarse por decir que se necesitan cuatro coordenadas, tales
como y1, y2, y3 y y4. Pero en la figura puede observarse que y1 + y3=C1 y que y2 + y4 -
2y3 = C2 en donde C1 y C2 son constantes. Pero tanto si se conocen los valores de las
coordenadas de cualquiera de los pares (y1, y2), (y1, y4), (y2, y3), los valores de las otras
dos pueden obtenerse por medio de las ecuaciones mencionadas.
Para ser usadas más tarde, el lector podría demostrar las siguientes igualdades

y1 = h + s4 + q1 − l1 − l 2 − 2C , y 3 = h − s4 − q1 + l1
y 2 = h − s4 − 2q1 + l1 , y 4 = h − s4 (2.12)

en donde l1y l2 son las longitudes de los cables. Nótese que las posiciones verticales
de todas las cuatro masas con conocidas, si se han dado los valores de dos
coordenadas únicamente (s4, q1).

(7) Coordenadas posibles para un péndulo doble.

Las dos masas, m1 y m2, de la figura 2-10, están suspendidas de un soporte rígido
y pueden moverse libremente en el plano X, Y.

(a) Suponiendo que r1 y r2 son hilos de longitud fija, se requieren dos coordenadas
tales como ( θ , φ ), (x1, x2), (y1, y2), etc.

132
Fig. 2-10

(b) Suponiendo que las masas se hallan suspendidas de bandas de caucho, o de


soportes espirales, se necesitan cuatro coordenadas, tales como q1, q2 (x1, y1, x2, y2),
etc. Las ecuaciones de transformación que relacionan los anteriores conjuntos de
coordenadas son
x1 = x0 + r1 senθ
y1 = y 0 − r1 cos θ
x 2 = x0 + r1 senθ + r2 senφ (2.13)
y 2 = y 0 − r1 cos θ − r2 cos φ

(8) Marcos de referencias móviles y “coordenadas móviles”.

En la práctica se encuentran muchos problemas para los que es conveniente utilizar


marcos de referencia móviles. (Por conveniencia, en ocasiones, las coordenadas
medidas con respecto a tales marcos pueden denominarse “coordenadas móviles”.)
Algunos ejemplos generales son: Un marco de referencia sujeto a un ascensor, a un
tren en movimiento o a una plataforma que gira; ejes de referencia adheridos a la
Tierra con el fin de determinar movimientos de relación a ésta; un marco fijo al interior
de un satélite artificial; etc.
Se ha mencionado ya un ejemplo específico (véase la ecuación (2.3)), pero
quizá puede ser útil citar los siguientes

(a) Supóngase que en la figura 2-1, el origen O posee una velocidad inicial (vx, vy)
y una aceleración constante (ax, ay), mientras los ejes giran con velocidad
angular constante w. Lógicamente las ecuaciones (2.2) toman la forma
x1 = v x t + 12 a x t 2 + x2 cosω t − y 2 senω t (2.14)
y1 = v y t + 12 a y t 2 + x 2 senω t − y 2 cosω t
Una vez más se ve que x1 = x1(x2, y2, t), etc.

(b) Si se hace oscilar a lo largo de una recta inclinada, al soporte de la figura 2-10,
según x0 = A0 + Asenω t y y 0 = B0 + Bsenω t , las relaciones (2.13) tendrán la
forma
x 2 = A0 + Asenω t + r1 senθ + r2 senφ (2.15)
y 2 = B0 + Bsenω t − r1 cos θ − r2 cos φ
etc., lo cual puede indicarse como x2 = x2(r1, r2, θ , φ , t), etc. Es importante entender y
desarrollar un sentido del significado físico y geométrico asociado con relaciones
simbólicas de este tipo.

133
(c) Si en la figura 2-9 se le da al soporte una aceleración vertical constante con
velocidad inicial v1, entonces h = v1t + 12 at y las relaciones (2.12) deben
2

escribirse y1 = v1t + 12 at + s 4 + q1 + constante, etc.


2

(d) Supóngase que los ejes Q1 y Q2 de la figura 2-5 giran alrededor del origen con
velocidades angulares constantes, w1 y w2, de modo que α = ω1t y β = ω 2 t .

Aún así es posible usarlos como “marco de referencia” (aunque para la mayoría de
los problemas no resulta muy deseable). Las relaciones (2.7) se convierten en
x = q1 cos ω1t + q2 cos ω 2 t (2.16)
y = q1 senω1t + q2 senω 2 t
o bien, x = x(qi , q2, t), etc.

Es importante observar que los marcos de referencia de los ejemplos anteriores


son no-inerciales.
Finalmente, con respecto a las ecuaciones de transformación, en general se tiene
(i) Como regla general, todas las coordenadas de un sistema son funciones
de todas las demás y del tiempo (si los marcos son móviles), como puede
verse en las ecuaciones (2.14), (2.15) y (2.16).
(ii) En los ejemplos anteriores, la mayoría de las ecuaciones de transformación
relacionan las coordenadas rectangulares con algunas otras. Pero si se
desea, normalmente pueden escribirse ecuaciones que relacionen varios
tipos de coordenadas.

5.3. Coordenadas generalizadas. Grados de libertad.

(1) Coordenadas generalizadas.

Como se ha visto en los ejemplos precedentes, puede emplearse una gran


variedad de coordenadas. Así, por conveniencia, se usa la letra q como símbolo
general para representar coordenadas, no importa cuál sea su naturaleza. Por tanto, q
se denomina coordenada generalizada.
Por ejemplo las ecuaciones (2.15) pueden escribirse como
x 2 = A0 + Asenϖt + q1 + q2 + q3 q4 y y 2 = B0 + Bsenϖt − q1 1 − q22 − q3 1 − q42 , en
donde r1 se ha remplazado por q1, sen θ por q2 , etc.

Según el uso común, frecuentemente indicaremos las n coordenadas que se


requieren para especificar la configuración de un sistema, como q1, q2, ….,qn.
(2) Grados de liberad, definición e ilustración.

Una de las primeras consideraciones en la solución de un problema es la


determinación del número de “grados de libertad” del sistema. Estos se definen como:
El número de coordenadas independientes (sin incluir el tiempo) que se requieren
para especificar completamente la posición de todas y cada una de las partículas o
partes componentes del sistema.
El término “parte componente” se refiere aquí a cualquier parte de un sistema, tal
como una palanca, un disco, un piñón, una plataforma, etc., que debe ser tratado
como un cuerpo rígido y no como una partícula.

134
A continuación se incluyen ejemplos que tienen desde uno, hasta muchos grados de
libertad.

(a) Sistemas con un grado de libertad.

Una partícula restringida a moverse en una línea recta (una cuenta ensartada en un
hilo rígido) cuya ecuación es y = a + bx. Si se conoce x o y, la otra queda determinada.
Una cuenta con posibilidad de moverse libremente en un hilo rígido de cualquier forma
conocida: Parabólica, helicoidal, etc.
En péndulo simple con su movimiento confinado a un plano. O un hilo cuyo hilo se tira
hacia arriba por un pequeño orificio en un tablero fijo, a una rata constante. (La
longitud del péndulo es una función conocida del tiempo.) Nótese que el tiempo nunca
se incluye como un grado de libertad.
La cuenta que se muestra en la figura 2-11, que puede deslizarse libremente a lo
largo de la varilla que gira alrededor de p, de alguna manera determinada.

Fig. 2-11
Fig. 2-12

(b) Dos grados de libertad.

Una partícula con libertad para moverse en contacto con un plano o con una
superficie conocida cualquiera: Esférica, cilíndrica, etc.
La palanqueta de la figura 2-12, que puede deslizarse libremente a lo largo del eje Y y
al mismo tiempo girar alrededor del mismo eje.
El sistema de masas y poleas de la figura 2-9. En la ecuación (2.12) se observa queso
se han dado los valores de s4 y q1, se conoce la configuración completa. Si el soporte
AB se está moviendo, se requieren dos coordenadas y t; sin embargo, aún así se
considera que existen dos grados de libertad.
El péndulo doble de la figura 2-10, siendo r1 y r2 los hilos de longitud constante.

Fig. 2-13

(c) Tres grados de libertad.

135
Una partícula libre de moverse en el espacio. Coordenadas posibles: (x, y, z), (r , φ ,
θ ), etc.
Un tablero o una lámina que puede deslizarse libremente sobre un plano. Se requieren
dos coordenadas para traslación y una para rotación.
El péndulo doble de la figura 2-10, si se supone que r 1 es una banda de caucho y r 2
tiene longitud fija.
Un cuerpo rígido que puede girar libremente alrededor de cualquier punto fijo. O, como
se muestra en la figura 2-13. La orientación queda completamente determinada por
θ , φ , α . (m es una partícula cualquiera del cuerpo.)
El sistema de la figura 2-8 con un resorte adicional y una masa conectado a m2.

Fig. 2-14 Fig. 2-15

(d) Cuatro grados de libertad.

El péndulo doble de la figura 2-10 con longitudes variables de y (bandas de caucho


o resortes en espiral).
La disposición de la figura 2-14, en donde puede moverse únicamente en sentido
vertical. La partícula puede moverse libremente en cualquier forma bajo la acción de la
gravedad, sostenida por una banda de caucho.
El sistema de poleas de la figura 2-15, suponiendo únicamente movimiento vertical.
El cuerpo rígido que se muestra en la figura 2-13, con la posibilidad de que la unión
esférica se deslice sobre el eje X.

(e) Cinco grados de libertad.

El cuerpo rígido de la figura 2-13 con la posibilidad que la unión esférica se mueva
siempre en contacto con el plano XY. Un sistema de cinco poleas montadas como se
indica en la figura 2-16.

Fig. 2-16

El sistema de poleas de la figura 2-15 con un resorte intercalado en el cable que


conecta con .
Cinco partículas unidas linealmente con resortes como se muestra en la figura 2-18,
con movimiento horizontal únicamente (o sólo vertical). ¿Se tendría un número igual

136
de grados de libertad si no existieran los resortes, es decir, sin ninguna conexión entre
las masas?

(f) Seis grados de libertad.

El péndulo doble de la figura 2-10, con las partículas y suspendidas por bandas de
caucho y con posibilidad de moverse libremente en el espacio.
Un cuerpo rígido que puede moverse libremente en el espacio, aunque se
encuentre sujeto a resortes de cualquier forma.
El cuerpo rígido de la figura 2-13 con otro cuerpo rígido ligado a él por medio de
una unión esférica, por ejemplo en P.
El sistema de poleas de la figura 2-15 con resortes intercalados de cada uno de los
cables que sostienen a y a .
(g) Muchos grados de libertad.

Dos tableros articulados entre sí, de modo que el ángulo entre ellos puede variar y
además pudiendo moverse el conjunto de cualquier manera aparte de la restricción de
la articulación. Tal sistema tiene siete grados de libertad.
Una sucesión de siete poleas como las de la figura 2-16 tiene siete grados de
libertad. Un sistema consistente en tres partículas suspendidas una de la otra, como
formando un péndulo triple posee ocho grados de libertad siempre y cuando dos de los
hilos sean elásticos y el movimiento no esté restringido a un plano. Si las tres cuerdas
son elásticas el sistema tiene nueve grados de libertad.
Dos cuerpos rígidos ligados por medio de una unión esférica y con posibilidad de
moverse en el espacio con libertad, tiene nueve grados de libertad.
Dos cuerpos rígidos ligados por medio de una unión esférica y con posibilidad de
moverse en el espacio con libertad, tienen nueve grados de libertad.

Fig. 2-17

El sistema que se muestra en la figura 2-17 posee diez grados de libertad. Se


necesitan tres coordenadas para localizar el punto p, dos más para determinar la
configuración de la barra (suponiendo que la barra no gira sobre su propio eje), tres
más para fijar la posición de , y finalmente, dos más para localizar a (suponiendo que
el hilo que la sujeta tiene una longitud fija).
La disposición de resortes y “partículas” de la figura 2-18 puede tener diferentes
números de grados de libertad según como se les permita moverse. Si el movimiento
se limita al eje Y, El sistema tiene cuatro grados de libertad; Si se restringe al plano XY,
habrá ocho grados de libertad. Si y pueden moverse sobre el eje Y únicamente,
mientras que pueden moverse en el plano XY, el conjunto poseerá seis grados de
libertad; y si todas las masas se consideran como cuerpos rígidos, serán veinticuatro.

137
Fig. 2-18

Se ve entonces, que los sistemas mecánicos pueden tener cualquier número finito
de grados de libertad. El número depende en cada caso del número de masas que se
consideren y de las restricciones geométricas que se impongan a sus movimientos
Inclusive, muchos sistemas pueden considerarse como un número ilimitado de grados
de libertad. Un resorte espiral, una cuerda en vibración, la cara de un tambor, etc., son
ejemplos de este caso, si se supone que están compuestos de un número ilimitado de
partículas. En muchos problemas, aunque no en todos ellos, las masas de los
resortes, de los hilos, etc., pueden despreciarse. Así se hará en este texto.
Los sistemas que poseen un “número infinito de grados de libertad” se tratan por
otros métodos bien distintos.

(3) Selección de coordenadas independientes.

En el procedimiento matemático de la solución de un sistema, usualmente existes


muy amplias posibilidades para seleccionar las coordenadas que han de considerarse
como independientes.
En el caso de un péndulo simple, usualmente se toma el desplazamiento angular,
del hilo. Sin embargo podrían emplearse las coordenadas x y y de la pesa, o muchas
otras.
En la figura 2-9 se observa que al conocerse las coordenadas de cualquiera de los
pares, (y1, y2), (s3, q2), (y2, y4), (s1, q1), (s4, q1), etc., se habrán determinado las
posiciones de todas las masas. Por tanto, cualquiera de tales pares puede tomarse
como el sistema de coordenadas independientes, para la solución correspondiente.
Es bien sabido que ciertas coordenadas pueden ser más convenientes que otras.
De tal manera que las coordenadas escogidas en cada caso particular, deben ser las
que parezcan más convenientes para el problema entre manos. La selección final
dependerá, en buena parte, de la comprensión y de la experiencia.

5.4. Grados de restricción, ecuaciones de restricción. Coordenadas


superfluas.

Por lo visto en el numeral anterior, es evidente que el número de grados de libertad


depende no solamente del número de masas consideradas, sino también de cómo se
halle restringido físicamente el movimiento de cada una de ellas. Una partícula que
puede ocupar cualquier posición en el espacio, tiene tres grados de libertad. Para
determinar su posición se requerirán tres coordenadas independientes como, (x, y, z),
( r,φ ,θ ) , etc. Pero si el movimiento se restringe a una línea (una cuenta ensartada en
un alambre rígido), con una sola coordenada será suficiente. Se dice entonces, que la
cuenta tiene dos grados de restricción y dos de las tres coordenadas que se necesitan
para una partícula libre, son ahora “superfluas”.
Es entonces evidente que un sistema de p partículas puede tener un máximo de 3p
grados de libertad, y el número n, estará dado finalmente por
n = 3p – (grados de restricción).

Las restricciones de un sistema pueden representarse por ecuaciones de


restricción. Si la cuenta está restringida a moverse a lo largo de una recta en el plano
XY, la ecuación de tal recta, y = a + bx, junto con z = 0, son las ecuaciones de

138
restricción. Si el alambre está en forma parabólica, y = bx2 y z = 0 son las ecuaciones
de restricción.

Considere una vez más la figura 2-19. Se ve que para movimiento vertical
únicamente

x1 = C1, z1 =b1 ; x2 = C2, z2 =b2 ; etc.


1
y1 +y3 = constante; ( y 2 + y 4 ) − y 3 = cons tan te (2.18)
2

en donde x1 y z1 son las coordenadas de m1 ; c1 y b1 son constantes, etc. Así, en


definitiva, hay diez ecuaciones de restricción y los grados de libertad se han reducido
de un máximo de doce, a dos. Puede decirse entonces, que diez coordenadas son
superfluas.
5.5. Restricciones móviles.

Con frecuencia se da el caso de que algunas, o todas las restricciones de un


sistema estén en movimiento.

Un ejemplo sencillo se muestra en la figura 2 -11 en donde la barra está


girando en el plano XY alrededor del eje indicado, con velocidad angular constante, ω1.
La cuenta m puede deslizarse libremente a lo largo de la barra y como α = ω1 t, la
ecuación de restricción puede escribirse entonces, y = s + (tan ω1 t) x. Nótese que t
aparece explícitamente en esta relación.

Como extensión de este ejemplo, supóngase que los ejes X y Y del ejemplo en
consideración son los mismos X2 y Y2 que se trasladan y giran en la figura 2-1;
entonces, y2 = s + (tan ω1 t) x2. Por consiguiente, las ecuaciones de trasformación
(2.14), en función de x2 y t (igualmente podrían haberse expresado en función de y2 y
t) tienen la forma

1
x1 = v x t + a z t 2 + x 2 cosϖt − ( s + x 2 tanϖ 1t ) senϖt
2

(2.19)
1
y1 = v y t + a y t 2 + x 2 senϖt + ( s + x 2 tanϖ 1t ) cosϖt
2
en donde, tanto x1 como y1 son ahora funciones de x2 y t solamente.

Observación general: Desde un punto de vista puramente matemático, las


ecuaciones de restricción son sencillamente relaciones existentes entre las 3p posibles
coordenadas que salvo por esto, son independientes. De una manera general,
pueden indicarse como

φ1 ( q1 , q2 ,..., q3 p , t ) = 0 , en donde i = 1,2,…,3p-n


(2.20)

5.6. Ecuaciones de transformación “reducidas”.

Si se supone que no existen restricciones, sino posiblemente marcos de referencia


móviles, las ecuaciones de trasformación que relacionan las coordenadas
139
rectangulares de las p partículas con las 3p coordenadas generalizadas, pueden
indicarse como xi = ( q1 , q2 ,..., q3 p , t ) , etc. Sin embargo, si hay restricciones fijas o
móviles, las coordenadas superfluas pueden eliminarse de las relaciones anteriores
mediante el uso de las ecuaciones de restricción, quedando

xi = xi ( q1 , q2 ,..., qn , t ) ; yi = yi ( q1 , q2 ,..., qn , t ) ; zi = zi ( q1 , q2 ,..., qn , t ) ;


(2.21)
las cuales contienen ahora únicamente las coordenadas que son independientes, en
un número igual al de los grados de libertad del sistema. Nos referimos a estas
ecuaciones llamándolas ecuaciones de trasformación “reducidas”. Debe aclararse que
en (2.21) puede aparecer t explícitamente como resultado de tener coordenadas
móviles, restricciones móviles, o ambos.

Ejemplos sencillos de (2.21) lo constituyen las ecuaciones (2.12) en las que no


aparece t, o también (2.19) en las que si aparece t, explícitamente.

En breve se verá claramente la gran importancia que tienen relaciones como (2.21)
para obtener expresiones de velocidad, energía cinética, energía potencial, etc., en
función únicamente de las coordenadas independientes.

Notas. (a) En algunos casos, el álgebra que se utilizaría para eliminar las
coordenadas superfluas puede resultar complicada. (b) Los casos, relativamente
escasos, de sistemas “noholonómicos”, permiten solamente que sus ecuaciones de
restricción se escriban en forma diferencial, no integrable. Véase el numeral 9.12.

5.7. Velocidad expresada en coordenadas generalizadas.

Las expresiones para la velocidad de un punto o de una partícula pueden obtenerse


por cualquiera de los dos procedimientos siguientes. El primero pone de relieve la
definición fundamental de velocidad y las ideas básicas físicas y geométricas
pertinentes. El segundo procedimiento es más conveniente.

(1) La velocidad para un elemento de trayectoria. ∆s. (∆s considerado como vector.)

Supóngase que el punto p de la figura 2-19 se mueve una distancia ∆s desde a


hasta b,
en un tiempo ∆t. La velocidad promedio en el intervalo será ∆s/∆t.

Cuando ∆t se aproxima a cero, se escribe


∆s .
Velocidad = lim =s (2.22)
∆t →0 ∆t

. ds
en donde s es una cantidad vectorial de magnitud, , dirigida según la tangente a la
dt
trayectoria en a. Para apreciar mejor las ideas físicas y geométricas implicadas, puede
pensarse que la partícula tiene una velocidad “en la dirección de la trayectoria” en
todos los puntos de su recorrido.

La anterior definición de velocidad no hace referencia a ningún sistema de


coordenadas en particular. Pero naturalmente ∆s puede expresarse en cualquier

140
.
sistema que se desee de tal manera que al pasar al límite ∆t → 0, s queda expresada
en ese mismo sistema. Ejemplos:
En coordenadas rectangulares, ( ∆s ) 2 = ( ∆x ) 2 + ( ∆y ) 2 + ( ∆z ) 2 . Dividido por ( ∆t ) 2 y
pasando al límite, puede escribirse
s 2 = x 2 + y 2 + z 2
(2.23)

Fig. 2-19

Fig. 2-20
En las coordenadas esféricas (véase la figura 2-20),
( ∆s ) 2 = ( ∆r ) 2 + r 2 ( ∆θ ) 2 + r 2 sen 2θ ( ∆φ ) 2
Por tanto s 2 = r 2 + r 2θ 2 + r 2 senθφ 2 (2.24)

En el sistema oblicuo bidimensional de la figura 2-5, supóngase que p representa


una pequeña distancia cualquiera ∆s. Se observa que
( ∆s ) = ( ∆q1 ) + 2( ∆q1 )( ∆q2 ) cos( β − α ) ;
2 2
y por tanto
s 2 =q
 14 +q
 22 +2q  2 cos( β −α)
 1q (2.25)

2 2
s12 = r 1
+ r 1θ 2

s 22 = r
2
1
2
( )
+ r 1θ 2 + 2 r1r2 + r1r2θφ cos(φ − θ ) (2.26)

φ 2 + 2( r1r2θ − r2 r1φ )sen(φ − θ )


2 2
+ r 2
+ r 2

Debe notarse que aunque la expresión de s 2 resulta complicada, básicamente no

es más que un elemento de longitud ∆s 2 , dividido por el correspondiente elemento


de tiempo ∆t . Nótese también que tal como se ha expresado arriba, 2 es función
s
de todas las coordenadas, así como de sus derivadas con respecto al tiempo, es decir,

(2) la velocidad, usando las ecuaciones de transformación.

Si se tiene una expresión para en cierto sistema de coordenadas, podemos


expresarla en otro sistema por medio del uso de ecuaciones de transformación (o de
ecuaciones de transformación reducidas) que los relacionen entre si. Ejemplos:
Derivando con respecto al tiempo las ecuaciones (2.6), y sustituyéndolas en (2.23), se
obtiene (2.24).

Derivando las relaciones (2.13) e insertándolas en (2.23) se obtienen, con poco


trabajo, las ecuaciones (2.26).
141
De las relaciones (2.12) se concluye en forma inmediata, que las velocidades de las
masa individuales vienen dadas por
y 1 = s 4 + q 1 , y 2 = − s 4 − 2q 1 , y 3 = − s 4 − q 1 , y 4 = − s 4
(2.27)

Naturalmente, esto supone que h sea constante. Nótese que todas las velocidades

se expresan en función de
s 4 y q 1 , únicamente.
Para utilizar en un ejemplo posterior, considérense las velocidades verticales, y
1 y

y
 2 de m1 y m 2 , de la figura 2-8, con respecto al eje X, inmóvil. Se trata de
expresarlas en términos de y 1 y q 1 . Como puede verse en el diagrama,
y1 = y + q1 , y 2 = y − q2 y m1 q1 =m 2 q 2 (relación del centro de masa). Por
tanto,
m1
1 = y
y  +q
1 , 2 =y
y  − q
1 (2.28)
m2
(3) La velocidad expresada
en función de las coordenadas móviles.

Debe entenderse que en el método de Lagrange para solución de problemas, una


de las primeras consideraciones consiste en determinar la velocidad de todas las
partículas, con respecto a un marco inercial. Se utiliza un marco de referencia en el
que algunas o todas las coordenadas seleccionadas sean no-inerciales, (lo cual
implica que eventualmente se trate de hallar el movimiento del sistema con relación al
marco móvil) la velocidad que se requiere no es la relativa al marco móvil, sino la
relativa a los ejes inerciales, aunqu4e exp4esada en función de las coordenadas
móviles. (La razón de lo anterior se vera con claridad en el capítulo 3.) Algunos
ejemplos aclararán esto y mostrarán como obtener los resultados deseados.

Como un caso sencillo, supóngase que los ejes X2, Y2 y Z2 de la figura 2-2 se
mueven paralelamente al marco fijo X1, Y1, Z1 con aceleración constante (ax, ay, az).
Las ecuaciones de transformación serán, x1 = v x t + 12 a x t + x 2 , etc.
2

Las componentes de la velocidad de p con relación a los ejes fijos x 1 , y 1 , z 1 , y con


respecto a los ejes móviles x 2 , y 2 , z 2 . Utilizando las ecuaciones de transformación,
x 1 = v x + a x t + x 2 , etc. (2.29)

Lo cuál expresa la velocidad de p con relación a los ejes estacionarios pero en


relación a las velocidades relativas de los ejes móviles, y del tiempo.

Si se considera que el marco X2, Y2 y Z2 se mueve de cualquier manera, (con


rotación y traslación) las ecuaciones correspondientes serían.
x 1 = x 0 + l1 x 2 + l 2 y 2 + l 3 z 2 + l1 x 2 + l2 y 2 + l3 z 2 , etc. (2.30)
En este caso x0, y0, z0 y todos los cosenos directores estarán cambiando con el
tiempo. Las ecuaciones (2.30) desempeñan un papel muy importante en el estudio de
la dinámica de los cuerpos rígidos, capítulo 9.
Como último ejemplo, considérese el siguiente. D1 y D2 de la figura 2-21, son dos
plataformas giratorias. D1 se mueve impulsada por un motor con una velocidad angular
θ1 con respecto a la Tierra. D2 que está montada sobre D1 es movida por un segundo
motor por una velocidad angular θ 2 con relación a D1. Los ejes X1 y Y1 están fijos con

142
respecto a la Tierra. La línea ab está adherida a la superficie de D1. Los ejes X2 y Y2
están fijos a la superficie de D2. Una partícula de masa m puede moverse libremente,
pero en contacto con D2. Se trata de hallar una expresión

para su
velocidad con respecto a la Tierra, pero en función de las coordenadas polares
móviles, r,α, y otras magnitudes.
Puede observarse finalmente que
x1 = s cosθ1 + r cos β , y1 = ssenθ1 + rsenβ
en donde β = θ1 + θ 2 + α . Derivando y sustituyéndola en v 2 = x 12 + y 12 , se obtiene,

v 2 = s 2θ12 + 2 sθ1 r sen(θ 2 + α ) + r 2 β 2 + r 2 + 2 sθ1 βr cos(θ 2 + α )


(2.31)
lo cual es correcto, sin importar en que forma los motores hagan variar con el tiempo a
θ1 o θ2 .Si, como un caso especial, se supone que θ1 = ω1 = constante y que
θ2 = c = cons tan te, entonces v será una función de r, α, r , α y t únicamente.
Si se desea, b puede expresarse fácilmente en términos de las coordenadas
rectangulares x2 y y2, derivando
x1 = s cosθ1 + x 2 cos(θ1 + θ 2 ) − y 2 sen(θ1 + θ 2 )

x1 = ssenθ1 + x 2 sen(θ1 + θ 2 ) + y 2 cos(θ1 + θ 2 ) (2.31)


y sustituyéndolas en. v 2 = x 12 + y 12 .

5.8. Trabajo y energía cinética.

(1) Proyección de un vector sobre una recta.

A manera de repaso, considérese la forma siguiente de expresar la proyección


de f de un vector cualquiera F, sobre la recta ob con cosenos directores l y m, como se
muestra en la figura 2-22. Resulta claro que

f = F cosθ = F cos(α − β )
= F cos α cos β + Fsenαsenβ )

143
Fig. 2-22

Pero como Fcos α = Fx y cosβ =1, etc., se tiene que f = Fxl + Fym . Extendiendo
esto a las tres dimensiones
f = Fxl + Fym + Fzn (2.33)

En la figura 2-23, es un elemento ab de la linea AB r es la tangente en a cuyos


cosenos directores son dx/ds, dy/ds y dz/ds. Por tanto, la proyección f de un vector
cualquira F sobre r estará dada por.
dx dy dz
f = F cos θ = Fx + Fy + Fz
ds ds ds
(2.34)

Fig. 2-23

(2) Definición de trabajo

Supóngase que F es una fuerza que actúa sobre un cuerpo en el punto a, y que
este punto de aplicación se mueve sobre la trayectoria de a hasta b. Entonces (aunque
el desplazamiento no se deba por compleo a F , sino también a otras fuerzas que
estén actuando sobre el cuerpo) el elemento de trabajo dW hecho por F estará dado
por dW= F ds cos θ, una cantidad escalar. Teniendo en cuenta (2.34) esto puede
escribirse,

dW= Fx dx+ Fy dy+ Fz dz (2.35)

Así, el trabajo hecho a lo largo de una trayectoria A a B, será


B
W = ∫ ( Fx dx + Fy dy + Fz dz ) (2.36)
A

144
Esta expresión general es correcta, inclusive en el caso en que F varíe en magnitud
y en dirección a medida que cambia de posición (puede ser una función de x, y y z)

(3) Definición de energía cinética

Supóngase que ahora F es la fuerza neta que acelera la partícula m mientras esta
se mueve sobre la trayectoria AB. El trabajo realizado sobre la partícula está dado por
(2.36) y si X, Y, Z son ejes inerciales, f x = mx , etc. Si se escribe, xdx = x dx , la
ecuación (2.36) queda,
B
W = ∫ m( x dx + y dy + z dz ) = m2 ( x 2 + y 2 + z 2 ) A = m2 (v B2 − v A2 )
B

lo cual es una expresión del trabajo necesario para cambiar la velocidad de la partícula
desde v A hasta v B , una magnitud escalar que depende únicamente de m y de los
valores de v A y v B .
Si la velocidad inicial v A =0, se tiene que W = 12 mv B lo cual conduce a la siguiente
2

definición de energía cinética.


La energía cinética de una partícula es el trabajo requerido para incrementar su
velocidad desde el reposo hasta un cierto valor v, con respecto a un marco de
referencia inercial.
2
Como se ha demostrado, esto es igual a 12 mv ; y como es una magnitud escalar, la
energía cinética T, de un sistema de p partículas, será
p
T= 1
2 ∑m v
t =1
t
2
t (2.37)

En donde naturalmente, las velocidades v t , pueden expresarse en cualquier


sistema inercial de coordenadas y sus derivadas con respecto al tiempo, o en función
de estas cantidades expresadas en coordenadas no –inerciales.
Se la ecuación (2.37), se sigue la expresión para la energía cinética de un cuerpo
rígido que gira con velocidad angular θ . La velocidad de una cualquiera de las
partículas rθ es en donde r es la distancia normal que va desde el eje hasta la
partícula.
Si se considera que la masa de la partícula es dm y se reemplaza la suma por un
integral la ecuación (2.37) podrá escribirse
θ 2 Iθ 2
T= ( ∫ r 2 dm) = (2.38)
2 2
En donde se ha definido el “momento de inercia” I por medio de la integral.
Suponemos que el estudiante está familiarizado con el uso de la relación anterior en
problemas sencillos y por tanto el estudio general de los momentos de inercia y la
energía cinética de los cuerpos rígidos se aplaza para los capítulos 7 y 8.

5.9. Ejemplos ilustrativos de la energía cinética

(1) Energía cinética de una partícula

m .2 . 2 .2
T= (x + y + z ) véase la ecuación (2.23)
2

145
m .2 2 . 2 2 .
T= (r + r θ + r sen 2θ φ 2 ) véase la ecuación (2.24)
2
(2.39)

m .2 .2 . .
T= [ q1 + q2 + 2 q1 q 2 cos(β − α ) ] véase la ecuación (2.25)
2
.
Utilizando las ecuaciones (2.11) y la primera de las anteriores (con z = 0) puede
expresarse T en función de las coordenadas Ay q, y sus derivadas con respecto al
tiempo.

(2) Energía cinética del péndulo doble (fig 2.10). En coordenadas rectangulares

m1 .2 . 2 m . .
T= ( x1 + y1 ) + 2 ( x 22 + y 22 ) (2.40)
2 2

Si las masas se hallan suspendidas por resortes o bandas de caucho, el sistema


tiene cuatro grados de libertad y en la ecuación (2.40) no habrá coordenadas
superfluas.
Si en cambio, se supone que r1 es un hilo de longitud constante, se tendrá que
x1 = y12 = r12 = cons tan te . (una ecuación de restricción). Con esto puede eliminarse
2

.
y de (2.40), quedando

.
m1 x12 r12 m2 .2 . 2 (2.41)
T= ( 2 ) + ( x2 + y2 )
2 r1 − x12 2

En función de las coordenadas r1, r2, θ y φ (suponiendo que todas son variables, y
con referencia a las ecuaciones (2.26)).
.
.
m . .
m . . . . . .
T = 1 (r12 + r12 θ 2 ) + 2 (r12 + r12 θ 2 + r22 + r22 φ 2 + 2(r12 r22 + r1r2 )
2 2

(3) Energía cinética del sistema de la figura 2-9. Despreciando las masas de las
poleas y suponiendo únicamente movimiento vertical

m1 . 2 m2 . 2 m3 . 2 m4 . 2
T= y1 + y2 + y3 + y4
2 2 2 2

Aunque esta expresión es correcta, contiene dos coordenadas superfluas ya que el


sistema tiene sólo dos grados de libertad. Por medio de las ecuaciones de restricción,
. .
y1 + y3 = C1 y (y3 – y4) + (y3 – y2) = C2 pueden eliminarse las velocidades y3 y y ,
4
quedando entonces

. 2 . 2
1 1 . .
T = (m1 + m3 + m4 ) y1 + (m2 + m4 ) y 2 + 2m4 y1 y 2 (2.43)
2 2
146
Aplicando acá las relaciones (2.27), en forma inmediata puede expresarse T en
. .
función de s y de q , si se desea.
4 1
Como se ha observado, las coordenadas superfluas pueden ser eliminadas de T por
medio de las ecuaciones de restricción. Esta posibilidad reviste importancia en
desarrollos posteriores.

(3) Energía cinética expresada en coordenadas no-inerciales

Básicamente, la energía cinética se toma siempre con respecto a un marco inercial


puesto que las velocidades v4 en la ecuación (2.37) deben ser medidas en
coordenadas inerciales. Sin embargo, como ya se explicó, las expresiones de v1 en
coordenadas inerciales pueden escribirse en función de coordenadas no-inerciales por
medio de las ecuaciones de transformación adecuadas.

(a) Considérese el sistema de la figura 2-8. Para movimiento vertical únicamente


. 2 . 2
1 1
T = m1 y1 + m2 y 2 puesto que y1 y y2 son inerciales. Nótese que T no es
2 2
. 2 . 2
1 1
igual a m1 y1 + m2 y 3 , ya que y3 es no-inercial. Sin embargo, T puede
2 2
. . . . .
expresarse en función de y y y3 , como sigue. Como y3 = y1 – y2, y3 = y - y ,
1 1 2
entonces,

. 2
1 1 . .
T= m1 y1 + m2 ( y1 − y 3 ) 2
2 2
. .
Si, por otra parte, se eliminan y y y de la expresión original, T, en función de
1 2
. .
y y q1 (y es inercial pero q1 es no-inercial) queda,

m1 + m2 . 2 m1 m1 + m2 .
T =( )y + ( ) q1 (2.44)
2 2 m2
. m1 + m2 . 2 1 m1m2 . 2
.
Y en función de y y y , T = ( )y + ( ) y3
3 2 2 m1 + m2

(b) Considérese el primero de los ejemplos estudiados en el numeral 2.7(3).


Aplicando las ecuaciones (2.29) vemos que si p representa una partícula, su
energía cinética es
1  . 2
2 2
.
  .
  
T = m  vx + α xt + x2  +  v y + α yt + y2  +  vz + α z t + z2   (2.45)
2       

en donde vx, αx, etc… son constantes. Nótese que la expresión incluye
explícitamente el tiempo.

(c) Si el origen 0, de la figura 2.1, posee una velocidad inicial (vx, vy) y una
aceleración constante (αx, αy) al mismo tiempo que los ejes giran con una
velocidad angular constante w, de las ecuaciones (2.14) tenemos
147
. . .
x1 = vx + α xt + x2 cos wt − x2 wsenwt − y2 senwt − y2 w cos wt
.
Al tomar esta ecuación junto con la expresión de y y remplazarlas en
1

1  .2 . 2 .
T= m x1 + y1  tendremos a T en función de x2, y2 , x. 2 , y , t.
2   2

(d) Con referencia a la figura 2-21 y a al ecuación (2.31) reobserva que la energía
cinética de la partícula que puede deslizarse libremente en contacto con la
segunda superficie giratoria, está dada por

1  2 . 2 
.
. . . . .
T = m s θ 1 + 2s θ1 r sen(θ 2 + α ) + r 2 β 2 + r2 + 2 s θ 1 β r cos(θ 2 + α )  (2.46)
2  
 

Debe notarse que (2.46) es correcta, no importa la suposición que se haga respecto
de las variaciones con el tiempo de θ1 y de θ2. En el caso de velocidades angulares
. .
constantes, sencillamente se remplazan θ y θ por las constantes w1 y w2. Pero si se
1 2
supone que D1 y D2 oscilan según θ1 = A senαt y θ2 = Bsenbt, entonces se deben
. .
remplazar θ y θ por Aacosαt y Bbcosbt, respectivamente. En tal caso T incluirá a t,
1 2
explícitamente. En tal caso T incluirá a t, explícitamente.

5.10.Teorema de “centro de masa” para la energía cinética

Considérese un sistema de p partículas que se mueven con respecto a un marco


inercial X, Y, Z. Supóngase un segundo marco X´, Y´, Z´ cuyo origen está situado en el
centro de masa de partículas y se mueve sólidamente con este, al mismo tiempo que
sus ejes X´, Y´ Z´ se conservan paralelos a X, Y, Z respectivamente. Las ecuaciones
de transformación que relacionan las coordenadas de una partícula de un sistema con
. . . . . .
las del otro, serán x = x +x´, y = y +y´ y z = z +z´ en donde x , y y z son
coordenadas del origen del marco móvil.

Así pues

1 p  2. 2. .2  1 p  . . ´   . . ´   . . ´  
2 2 2

T = ∑ mi  xi + yi + zi  = ∑ mi  x + xi  +  y + yi  +  z + zi  
2 i =1   2 i =1       
Al hacer la expansión escribiendo M = ∑m, y teniendo en cuenta que por la
.
definición del centro de masa, ∑m1x1 = 0, que ∑m1 x 1 = 0, etc…, la expresión anterior
se reduce a

1 p  . ´   . ´   .´  
2 2 2
M  2. . .
2
T=  xi + yi + zi  + ∑ mi  xi  +  yi  +  zi  
2
(2.47)
2   2 i =1       

Con relación a (2.47) deben hacerse cuatro observaciones importantes:

148
(a) Tal expresión demuestra que la energía cinética de un sistema de partículas es
igual a la de una “partícula” única de masa M = ∑m, (masa total del sistema)
localizada en el centro de masa y moviéndose solidariamente con él, sumada a las
energías cinéticas de todas las partícula calculadas con respecto al marco X´, Y´, Z
´, como si éste último fuera inercial.
(b) Lo anterior es igualmente cierto, sin importar si las partículas son libres o si tienen
cualquier tipo de restricción. En realidad esto puede aplicarse inclusive a los
cuerpos rígidos, en cuyo caso el movimiento con relación al marco móvil sólo
puede tomar la forma de una rotación.
(c) Si el sistema se supone dividido en dos o más grupos de partículas, es evidente
que el teorema puede aplicarse a cada uno de estos grupos en forma individual.
(d) A pesar de que (2.47) se ha escrito en coordenadas rectangulares, es lógico
pensar que esta forma de T puede expresarse en cualquier otro sistema
conveniente de coordenadas por medio de las ecuaciones de transformación
adecuadas.

5.11. Una expresión general para la energía cinética de p partículas

A continuación se obtendrá una expresión muy general para la energía cinética de


un sistema de p partículas que poseen n grados de libertad y 3p-n grados de
restricción. Se supone que algunas o todas las restricciones pueden moverse y que
algunas o todas las coordenadas generalizadas son no-inerciales. Esta expresión será
muy útil en los capítulos siguientes.

(1) Como etapa introductoria considérese la energía cinética de una partícula única
que tenga tres grados de libertad (sin restricciones). Suponiendo que alguna o todas
las coordenadas generalizadas se mueven (q1, q2 ,q3 ), las ecuaciones de
transformación pueden indicarse como
x = x( q1 , q2 , q3 , t ); y = y ( q1 , q2 , q3 , t ) ; z = z ( q1 , q2 , q3 , t )
Derivando
. ∂x . ∂x . ∂x . ∂x
x= q1 + q2 + q3 + , etc
∂q1 ∂q2 ∂q3 ∂t
Por conveniencia escribimos
. . . .
x = a1 q1 + a2 q 2 + a3 q 3 + α
. . . . . . . .
Y similarmente, y = b1 q + b2 q + b3 q + β , z = c1 q + c2 q + c3 q + λ
1 2 3 1 2 3

∂y
En donde, por ejemplo, b3 = , etc
∂q3
. . .
Elevando al cuadrado estas expresiones y remplazando x 2 , y y z 2 en
2

m .2 . 2 .2
T = ( x + y + z ) , se obtiene finalmente,
2
 2 .2 . 2 .2 . . 
 1a (
+ b1
2
+ c1
2
q1 + a )
2
2 + b 2
2 (
+ c2
2
q 2 + a 2
3 + b3)
2
+ c3(
2
q 3 + 2 ( a a
1 2 )
+ b b
1 2 + c c
1 2 ) q 1 q2 

1  . . . . . 
T = m + 2( a1a3 + b1b3 + c1c3 ) q1 q 3 + 2( a2 a3 + b2b3 + c2c3 ) q 2 q 3 + 2( a1α + b1β + c1γ ) q1 + 
2  . . 
2( a2α + b2 β + c2γ ) q 2 + 2( a3α + b3 β + c3γ ) q 3 + α 2 + β 2 + γ 2 
 
(2.48)
149
.2
Nótese que T contiene cuatro clases de términos: los que contienen q , los que
r
. . .
tienen q q , los que llevan q únicamente y por último, los que no incluyen ninguna
r s r
velocidad de las coordenadas. Sin embargo todos los términos son dimensionalmente
2
equivalentes a Mv
El ejemplo que se da a continuación aportará un mayor sentido a la expresión
siguiente. Haciendo referencia a la figura 2-5 y suponiendo que el origen de los ejes
Q1 y Q2 tiene una aceleración lineal constante α (sin rotación), se ve que
1
x = x0 + vz t + α xt 2 + q1 cosα + q2 cos β (2.49)
2
1
y = y0 + v y t + α yt 2 + q1senα + q2 senβ
2
.2 . 2 1  .2 . 2
Derivando y remplazando x y y en m x + y  , tenemos
2  
 
[ ]
2 2
( )
. . . . .
 1q + q 2 + 2 q q
1 2 cos ( β − α ) + 2 ( v x + a x t ) cos α + v y + a y t senα q 1+ 

1  
[ ] ( )
T = m 2 ( vx + axt ) cos β + ( v y + a y t ) senβ q 2 + 2( vx ax + v y a y )t + ax2 + a y2 t 2 + 
.
(2.50)
2  
v x + v y
2 2

 
Por simple inspección puede concluirse que (2.50) tiene exactamente la forma de
(2.48).
En efecto, cada uno de los términos de (2.50) puede ser obtenido del
correspondiente de (2.48) al evaluar los factores a, b, c, etc., por medio de las
relaciones (2.49).

La relación (2.50) presenta una buena oportunidad para destacar un punto básico.
A pesar de su complejidad, el miembro derecho de la ecuación es sencillamente
2
m  ∆s 
  , en donde ∆s es un desplazamiento de p con relación al marco inercial X, Y.
2  ∆t 
(2)

Para considerar ahora el caso más general mencionado al principio de este


numeral, las ecuaciones de transformación pueden escribirse como
x1 = x1 (q1 , q2 ,..., qn , t ), etc (2.51)
En donde i va desde 1 hasta p y además se ha supuesto que las coordenadas
superfluas se han eliminado por medio de las ecuaciones de restricción. Derivando
estas relaciones, tenemos

. n . . n . . n .
x i = ∑ aik q k + α i y i = ∑ bik q k + β i z i = ∑ cik q k + γ i (2.52)
k =1 k =1 k =1

∂x ∂x
Aquí, por ejemplo, aik = ,α i = , etc. Nótese que aik ≠ aki, etc.
∂qk ∂t
Por un proceso directo de elevación al cuadrado, puede demostrarse que

150
.2 n n . . n .
x i = ∑∑ aik ail q k q t + 2α i ∑ aik q k + α i2 (2.53)
k =1 i =1 k =1

. 2 .2 .2 . 2 .2
Ecuaciones semejantes se pueden obtener para y y z . Eliminando x i , y y z i de
i i i

1 p  .2 . 2 .2
T= ∑ mi  xi + y i + z i 
2 i =1  
Y agrupando los términos,

n n
1 p . .  n
 p .
T = ∑∑  ∑ mi ( aik ail + bik bil + cik cil ) q k q l  + ∑ ∑ mi ( α i aik + β i bik + γ i cik )  q k +
k =1 i =1  2 i =1  k =1  i =1 
(2.54)
( )
p
1
∑ mi α i + βi + γ i
2 i =1
2 2 2

Lo anterior puede escribirse en forma más breve, así:


n . . n .
T = ∑ Akl q k q t + ∑ Bk q k +c (2.55)
k =1 k =1
En donde el significado de Akl, de Bk y de C resulta evidente. Nótese que si t no
aparece explícitamente en las ecuaciones (2.51) (si no hay restricciones o marcos de
referencia móviles), αi = βi = γi = 0. Por tanto (2.55) se reduce a
n . .
T = ∑ Akl q k q t (2.56)
k =1

Debe entenderse que (2.51), (2.55) y (2.56) no son simplemente relaciones


académicas que habrán de permanecer siempre en forma simbólica. Como se
demostró en el ejemplo anterior, las relaciones (2.51) (relaciones de transformación
con las coordenadas superfluas eliminadas) pueden escribirse normalmente en forma
explícita para cualquier problema en particular. Para esto pueden obtenerse en forma
inmediata por medio dediferenciación parcial, valores para Akl Bk y C y finalmente para
T. Debe observarse que Akl Bk y C, en general no son constantes, sino funciones de q1,
q2, …, qn y t pero no de las q.
Nótese además que Akl = Alk
En el capítulo 8 se deduce una expresión para la energía cinética de un cuerpo rígido,
más útil que (2.55).Véase la ecuación (8.10).

5.12.Definición de aceleración y ejemplos

Las ecuaciones de Lagrange tienen en cuenta automáticamente todas las


aceleraciones sin necesidad de darle a esto ninguna consideración especial.
Sin embargo, teniendo en cuenta la importancia de esta magnitud en los principios
básicos y en el desarrollo de la dinámica, se incluye aquí un breve repaso de la
definición y de los procedimientos para plantear las expresiones generales.

(1) Consideraciones generales


Imagínese un punto (o una partícula) que se mueve en el espacio según la
trayectoria AB, como se muestra en la figura 2-24. en el punto p1 su velocidad es v1 y
luego de un lapso ∆t, en el punto p2 su velocidad será v2. En general v2 no tiene ni la
misma dirección ni la misma magnitud de v1. Así pues, el cambio ∆v representa un

151
cambio no solamente en magnitud, sino también en dirección. Teniendo esto en
cuenta, se define la aceleración del punto móvil en p1, como
∆v1 dv
a= para ∆t→0, o sea, a = (2.57)
∆t dt

Fig 2-24

Es claro que a es un magnitud vectorial que tiene la dirección de ∆v1 cuando ∆t→0.
Esta definición trae consigo el hecho importante de que el vector aceleración, en
general no lleva la dirección del movimiento. (Nótese que el vector velocidad v = ds/dt,
definido en el numeral 2.7 lleva siempre la “dirección de la trayectoria”.)

La definición de aceleración de (2.57) no incluye referencia a ningún sistema de


coordenadas en particular. Pero como las componentes rectangulares de ∆v son
. . . . . .
∆ x, ∆ y y∆ z su magnitud está dada por (∆v ) 2 = (∆ x ) 2 + (∆ y ) 2 + (∆ z ) 2 dividiendo por
(∆t)2 y pasando al límite, la magnitud de a estará dada por

.. 2 .. 2 .. 2
a2 = x + y + z
(2.58)
Naturalmente su dirección está determinada por los cosenos directores
.. .. ..
x/ a, y/ a, z/ a

(2) La aceleración expresada en coordenadas generalizadas


La magnitud de a, dada por (2.58) así como sus cosenos directores, pueden
expresarse en cualquier otro sistema de coordenadas por medio de las ecuaciones de
transformación adecuadas. Ejemplos:
.. .. ..
(a) Aplicando las ecuaciones (2.6) x, y, z y luego (2.58), pueden expresarse en
coordenadas esféricas.
(b) Usando las dos últimas ecuaciones de (2.13) y (2.58) puede expresarse la
aceleración de m2 en función de r1, r2, θ y φ y de sus derivadas con respecto
al tiempo.
(c) Por medio de (2.32) y (2.58) puede obtenerse fácilmente una relación para la
aceleración de la partícla que se muestra en la figura 2-21, con respecto a los
ejes estacionarios X1 y Y1 pero expresada en función de las coordenadas
móviles x2 y y2, sus derivadas con respecto al tiempo, y el tiempo mismo. (el
tiempo aparece explícitamente cuando se supone que θ1 y θ2 varían de alguna
manera en particular con respecto al tiempo.)

(3) Componentes de la aceleración total según una dirección cualquiera

La componente a´ de la aceleración a lo largo de una recta con cosenos directores


l, m y n está dada por (véase la ecuación 2.33)
152
.. .. ..
a´= l x + m y + n z
(2.59)
Lo cual puede, naturalmente, expresarse en otras coordenadas.

(a) Considérese las expresiones de las componentes de a a lo largo de las


coordenadas en el sistema esférico (ar, aθ y aφ); es decir, en las direcciones
de los elementos de restas indicados por ∆r, r∆θ y rsenθ∆θ y de la fig 2-20.
Examinaremos a aφ en detalle. Los cosenos de los ángulos que rsenθ∆θ forma
con los ejes X, Y y Z son: - senφ, cosφ y 0, respectivamente. Por tanto, a φ = -
.. .. .. ..
x senφ + y cos φ . Eliminando x y y por medio de (2.6) después de una cantidad
considerables de operaciones monótonas, finalmente se obtiene la siguiente
expresión.
.. .. . 2
aφ = r θ + 2r θ − r φ senθ cosθ (2.60)
(b) Haciendo referencia a la fig 2-21, se trata de determinar la componente en la
.. ..
dirección del radio r, de la aceleración de m. Se tiene que ar = l x1 + m y en
1
donde l y m son los cosenos directores de r con relación a los ejes
estacionarios; es decir, l=cosβ y m = senβ.
Aplicando
x1 = s cosθ1 + r cos β1, y1 = ssenθ1 + rsenβ1,
Se obtiene
.. . . .. ..
ar = r − r (θ 1 + θ 2 + α ) 2 + s θ1 sen(θ 2 + α ) − s θ12 cos(θ 2 + α ) (2.61)
Cuando se especifica la manera comos e hacer girarlas plataformas, ar contiene
a t explícitamente.

Como se demuestra en el numeral 3.9 del cap , éstas y otras expresiones para
la aceleración pueden determinarse fácil y rápidamente a partir de las
ecuaciones e Lagrange.

5.13.“Desplazamientos reales y virtuales; trabajo virtual.


Los desplazamientos virtuales y el trabajo virtual desempeñan un papel muy
importante, como los medios para llegar a un fin, en los desarrollos básicos de al
dinámica analítica. Pero una vez que has servido se útil objetivo, desaparecen del
cuadro.

1) Desplazamientos reales y virtuales; trabajo virtual


Para simplificar , considérese una partícula de masa m que se restringe a moverse en
contacto con una superficie rugosa, la cual a su vez está en movimiento. Al sufrir la
acción de una fuerza F, m se mueve según una tryectoria determinada (dad por las
leyes de Nexton) en el espacio y al mismo traza una curva sobre la superficie. Durante
un intervalo de tiempo dt, m experiementa un desplazamiento específico ds (dx, dy, dz)
medido conrespecto a unos ejes estacionarios, por ejemplo. Al referirse a ds aquí se
llama desplazamiento “real” o “verdadero”.

Considérese ahora un desplazamiento arbitrario infinitesimal cualquiera δ s (δ x, δ y, δ


z) o necesariamente según la trayectoria mencionada. En este caso δ s es llamado
desplazamiento virtual. Por conveniencia, a continuación se mencionan tres clases de
tales desplazamientos: a) δs en cualquier dirección en el espacio, ignorando por

153
completo la superficie; b) δs en cualquier dirección sobre la superficie móvil, y c) en
cualquier dirección sobre la superficie, considerada ahora como estacionaria.

p
δW = ∑ ( Fxiδxi + Fyiδyi + Fziδzi ) (2.62)
i =1

(2) Forma en que las expresiones de δW se hacen útiles

La sorprendente importancia de (2.62) radica eventualmente en las siguientes


consideraciones.
(a) Utilizando xi = xi (q1, q2, …, q3, t), etc (en donde aparece un máximo de 3p
∂xi ∂x ∂x ∂x
coordenadas) se tiene δxi = δq1 + i δq2 + ... + i δq3 p + i δt , etc para δy y
∂qi ∂q2 ∂q3 p ∂t
δz. Para estos desplazamientos, que no tinene en cuenta necesariamente las
restricciones, es claro que δW contiene el trabajo hecho por las fuerzas de
restricción.
(b) Empleando las relaciones (2.21) véase 2.6

∂xi ∂x ∂x ∂x
δxi = δq1 + i δq2 + ... + i δqn + i δt , etc
∂qi ∂q2 ∂qn ∂t
Estos desplazamiento no violan las restricciones, pero durante el tiempo
trascurrido δt los marcos móviles y las restricciones móviles habrán cambiado de
posición ligeramente. Entonces, como se demostrará en los ejemplos, δW todavía
contiene el trabajo hecho por las fuerzas de restricción.
(c) Determinando los desplazamientos por medio de (2.21) pero conservando el
tiempo
constante ,

∂xi ∂x ∂x
δxi = δq1 + i δq2 + ... + i δqn , etc (2.63)
∂qi ∂q2 ∂qn

Estos desplazamientos tiene en cuenta las restricciones y por consiguiente, el trabajo


hecho por las fuerzas de restricción suma cero. En efecto, las fuerzas de restricción se
han eliminado de (2.62)
En tanto que la velocidad de esta afirmación puede ser comprobada con ejemplos
sencillos, usualmente no se intenta una demostración general sino que puede
considerarse como un postulado básico.

Este sistema para eliminar las fuerzas de restricción es una de las grandes
realizaciones del método de Lagrange
Las consideraciones anteriores son de vital importancia en el principiop de D´Alembert.
En los cap 3 y 4 se verá con claridad su trascendencia en un método concreto de
planteamiento de las ecuaciones del movimiento, prácticamente todo sistema
dinámico.

5.14.RESUMEN Y OBSERVACIONES

1. Sistemas de coordenadas y ecuaciones de transformación (numeral 2.2)

154
Una de las primeras etapas en la solución de cualquier problema es la selección de las
coordenadas adecuadas. Las ecuaciones de transformación desempeñan un papel
muy importante al expresar la energía cinética, la aceleración y muchas otras
magnitudes importantes, en unción de las coordenadas seleccionadas. Varios
desarrollos teóricos dependen del uso de las ecuaciones de transformación.

2. Coordenadas generalizadas y grados de libertad (2.3)


“Coordenada generalizada” es un término conveniente para una coordenada
cualquiera. La utilización de q1, q2, …,qn para designar las coordenadas
generalizadas es prácticamente universal y tiene ventajas definitivas.
Antes de poder comenzar a trabajar en un problema, debe conocerse el numero de
grados de libertas del sistema, lo cual puede determinarse por simple inspección.

3. Grados de restricción, ecuaciones de restricción y coordenadas superfluas (2.4,2.5 y


2.6)
Es indispensable un entendimiento del sentido físico y geométrico de las restricciones
y de la manera como cada uno de los grados de restricción puede expresarse por
medio de una “ecuación de restricción” correspondiente.

Utilizando estas ecuaciones, las coordenadas superfluas pueden ser eliminadas de las
ecuaciones de transformación, de la energía cinética, de la energía potencial y demás
magnitudes.
4. Velocidad en coordenadas generalizadas (2.7)
La velocidad de una partícula puede expresarse en términos de cualquier sistema de
coordenadas generalizadas y de sus derivadas con respecto al tiempo. Con frecuencia
aparece t. las etapas posteriores no pueden emprenderse sin un conocimiento de
cómo se hace esto. De aquí la importancia del numeral2.7.

5. Trabajo y energía cinética (2.8, 2.9, 2.10 y 2.11)


Es imprescindible un entendimiento de las definiciones correctas de trabajo y energía
cinética.
Es de una importancia extrema el tener en cuenta que la energía cinética debe
considerarse con respecto al espacio inercial. Siempre se empieza escribiendo T en
coordenadas inerciales. Puede entonces, si se desea, expresarse en función de otras
coordenadas (inerciale, no-inerciales o mixtas) por medio de las ecuaciones de
transformación apropiadas.

6. Aceleración (2.12)
El análisis hecho por objeto aclarar la definición básica de aceleración y demostrar que
sus componentes en cualquier dirección pueden expresarse en coordenadas
generalizadas. Sin embargo, a pesar de que la aceleración desempeña un papel
básico en todas alas ecuaciones del movimiento, la técnica anterior no tiene una
importancia vital ya que, como se demuestra en el numeral 3,10 las ecuaciones de
Lagrange tiene en cuenta automáticamente las componentes de la aceleración.

7. Desplazamientos virtuales y trabajo virtual (2.13 y 2.14)


Los métodos generales empleados en este libro dependen de los conceptos de los
desplazamientos virtuales, del trabajo virtual y de su utilización. Muchos de los
desarrollos posteriores emplean el estudio hecho.

Una última palabra: como se verá en los capítulos 3 y 4 los puntos 1 a 7 anteriores
(exceptuando el 6) constituyen la materia básica fundamental para poder entender las

155
ecuaciones de Lagrange y son, en realidad, las etapas preliminares que deben
seguirse al aplicar estas ecuaciones.

6. ECUACIONES DEL MOVIMIENTO DE LAGRANGE PARA UNA PARTICULA

6.1. Consideraciones preliminares.

Cualquiera de las varias maneras de formular leyes fundamentales de la dinámica


puede tomarse como base para la deducción de las ecuaciones de Lagrange. En el
presente texto se parte de las leyes del movimiento de Newton, se establece la
ecuación de D´Alembert y de aquí, finalmente, se deducen las relaciones de Lagrange.
Se sigue este proceso porque partiendo de territorio conocido conduce a campos
desconocidos por un camino, en el cual, es fácil entender el significado físico y
matemático de cada paso.
Con el fin de eliminar algunos detalles que distraen nos limitaremos a la deducción y
análisis de las ecuaciones de Lagrange para una partícula. El tratamiento más general
aplicable a un sistema de muchas partículas, se deja para el capítulo 4.

6.2. Deducción de las ecuaciones de Lagrange para una partícula, sin


coordenadas ni restricciones móviles.

En aras de una mayor claridad se tendrá en cuenta una situación específica


suponiendo que el movimiento de la partícula en consideración está reducido a una
superficie lisa, tal como un plano o una esfera. En tal caso habrá dos grados de
libertad, una ecuación de restricción, y no habrá fuerzas de fricción.
Sea F, con componentes Fx, Fy y Fz, la suma vectorial de todas las fuerzas (aplicadas
externamente, debidas a resortes, gravedad, restricción, etc.) que pueden estar
actuando sobre la partícula. Entonces, suponiendo que la masa m es constante y que
las coordenadas x, y y z son inerciales, las ecuaciones del movimiento de Newton
para una “partícula libre” se escriben
´´ ´´ ´´
Fx = m x, Fy = m y, Fz = m z ,
(3.1)
Estas ecuaciones son correctas
aunque el movimiento esté restringido, porque se supone que Fx, Fy y Fz incluyen
cualquier fuerza de restricción que pueda estar actuando. Considérese ahora el trabajo
δ W hecho por F al suponer que la partícula sufre un desplazamiento δs,
completamente arbitrario e infinitesimal, con componentes δx, δy y δz (posiblemente
bajo la acción de otra fuerza no incluidas en F). (Este se llama “trabajo virtual” de
acuerdo con el numeral 2.13 del capítulo 2). Así pues,

δW = Fδs cos( F , δs ) = Fx δx + Fδy + Fδz

Nótese que como F incluye la fuerza de restricción, (.2) es correcto aunque δs


puede no estar de acuerdo con las restricciones. (Es decir que δs puede tener una
dirección tal, que la superficie sobre la cual se mueve m, se “distorsione” ligeramente.)
Debe recordarse también, que el lado derecho de (3.2), como se demuestre en el
numeral 2.8, tiene en cuenta el posible hecho que F y δs no tengan la misma
dirección.

Multiplicando ahora las ecuaciones (3.1) por δx, δy y δz respectivamente y


sumando* se obtiene
¨ ¨ ¨
(3.3)
m( x δx + y δy + z δz ) = Fxδx + Fyδy + Fzδz
156
El miembro derecho de esta expresión es igual al trabajo δW hecho por F y el
miembro izquierdo puede interpretarse como el pequeño cambio correspondiente en la
energía cinética de m. (Véase de nuevo el numeral 2.8) Esta ecuación será llamada
“ecuación de D´Alembert “.
Al introducir las coordenadas generalizadas en (3.3) y al realizar algunos manejos
matemáticos, se obtiene las ecuaciones de Lagrange (3.15) y (3.16). Como se ha
supuesto que el movimiento se halla restringido a una superficie, se requiere dos
coordenadas generalizadas q1 y q2. Entonces, utilizando las ecuaciones de
transformación apropiadas y una ecuación de restricción, es posible expresar las
coordenadas de m: x, y y z en función de q1 y q2, lo cual se indica como sigue (véase
el numeral 2.6)

x = x (q1 , q2 ), y = y (q1 , q 2 ), z = z (q1 , q 2 ), (3.4)

_____________________________________________________________________
*Nota sobre la ecuación (3.3). Multiplicando las relaciones (3.1) por a, b y c
respectivamente y sumando se obtiene
M (xa + yb + zc) = Fxa+Fyb+Fzc
Lo cual es una relación verdadera, independiente de la naturaleza de a, b y c. Pueden
representarse constantes de cualquier valor, desplazamientos, velocidades o aún funciones
de variables. Así, en cuanto concierne a (3.3) δx, δy, δz son magnitudes completamente
arbitrarias. Sin embargo, para nuestro objetivo, las consideraremos como componentes de
δs, el desplazamiento virtual infinitesimal de m. Además, en lo que sigue, se supondrán de
acuerdo con la restricción. Al considerarlo así 3.3 se denomina con frecuencia “principio de
D´Alembert”).
Ejemplo específico para demostrar el significado de (3.4):

x = Csenθ cos φ ,
Supóngase que la superficie restrictiva es una esfera de radio constante, r = C. En
coordenadas esféricas, las relaciones específicas correspondientes a (3.4) serán
entonces,
x = Csenθ cos φ , y = Csenθsenφ , z = C cos φ (3.5)

El tiempo no aparece en (3.4) puesto que se han tomado los ejes X, Y y Z,


estacionarios, y una restricción fija.
Los desplazamientos virtuales δx, δy y δz, por razones que se darán más adelante, se
determinan a partir de (3.4). Es decir,

δx δx δy δy δz δz
δx = δq1 + δq 2 , δy = δq1 + δq 2 , δz = δq1 + δq 2 , (3.6)
δq1 δq 2 δq1 δq 2 δq1 δq 2

157
Sustituyendo (3.6) en la ecuación de D´Alembert, (3.3), y agrupando términos.

(3.7)

 ¨ δx ¨ δy ¨ δz   ¨ δx ¨ δy ¨ δz 
δW = m x δq1 + y δq1 + z δq1 δq1 + m x δq 2 + y δq 2 + z δq 2 δq 2
 δq1 δq1 δq1   δq 2 δq 2 δq 2 

 δx δy δz   δx δy δz 
δW =  F x + Fy +Fz δq1 +  F x δq 2 + Fy + Fz δq 2
 δq1 δq1 δq1   δq 2 δq 2 δq 2 

En este punto el estudiante debe tener plena conciencia de ciertos hechos básicos.
a. Como (3.4) representa las ecuaciones de la superficie restrictiva (3.6)
representa un desplazamiento de acuerdo con la restricción. Por tanto δW de
(3.7) corresponde a un desplazamiento de conformidad con la restricción
(sobre la superficie). Considerando una vez más la esfera como caso especial
δx, δy, δz determinados a partir de (3.5) son δx = C cos θ cos φδθ – senθδφ,
etc. Lo cual representa claramente, un desplazamiento sobre la esfera.
b. Las coordenadas q1 y q2 (θ y φ en (3.5)) son variables independientes; es decir,
pueden dársele a ambas pequeños valores arbitrarios sin violar la restricción.

Como resultado de a y b la suposición que la restricción es lisa, el trabajo ejecutado


por la fuerza de restricción cuando una cualquiera de las coordenadas varía, o varían
ambas simultáneamente, es igual a cero. (Véase el numeral 2.13). Por esta razón, en
adelante no se necesita considerar la fuerza de restricción como parte de F x, Fy, Fz. En
otras palabras, se ha eliminado del cuadro la fuerza de restricción. Este un punto muy
importante.
Como q1 y q2 son variables independientes, fijaremos la atención en Wq1, es el
trabajo hecho cuando solamente q1 puede variar (δq2 = 0). La ecuación 3.7 se reduce
entonces a

 ¨ δx ¨ δy ¨ δz   ¨ δx ¨ δy ¨ δz 
(3.8)
δWq1 = m x +y +z δq1 =  Fx + Fy + Fz δq1
 δq1 δq1 δq1   δq1 δq1 δq1 

Se utilizarán ahora las relaciones siguientes cuyas pruebas se incluyen abajo*, el


momento el lector no necesita ocuparse de tales demostraciones.

.
¨ δx d  . δx  d  δx 
x =  x  − x  
δq1 dt  δq1  dt  δq1  (3.9)

.
(3.10)
δx d x
=
δq1 dq1
.
d  δx  δ x (3.11)
 =
dt  δq1  δq1

158
Remplazando 3.10 en 3.9 se tiene
.

¨ δx  .
 .
d . δx . dx
x = x −x (3.12)
δq1 dt  δ q.1  dt
 

con un pequeño análisis se demuestra que esto puede escribirse como

  .2   .2  (3.13)
δx   δx 2 
d     
¨ δx
2
x = −  
δq1 dt  δ q.1 
  δ q1
 
 
Sustituyendo 3.13 y las relaciones semejantes para y y z en 3.8, se concluye que

   . . .
  . . .

  m x 2 + y 2 + z 2   m x 2 + y 2 + z 2  
d  δ − δ
δWq1 =   .  
  δq1
 dt 2 .
2 
  δ q1  δ q1
 
(3.14)
   
 
 δx δy δz
= F x

+F y +Fz δq1 Pero 1/2m (x2 + y2 + z2 ) es la energía
 δ q1 δ q1 δ q1  cinética T de la partícula por tanto,
finalmente se escribe

 
d  δT  δT δx δy δz (3.15)
 . 
−y = Fx + Fy + Fz
dt  δ q1  δq1 δq1 δq1 δq1
 

*Para probar las relaciones (3.9), (3.10) y (3.11), se procede de la siguiente manera.
Considérese la identidad
¨
δx  . δx  δx . d  δx 
 x  = x +x  
δq1  δq1  δq1 dt  δq1 

Que es iguala 3.9. Para obtener 3.10 se observa que la derivada de la primera ecuación en 3.4,
con respecto al tiempo es

. dx . δx
x= q+ q2
dq1 δq 2
159
Derivando ahora ésta, parcialmente con respecto a q1, se nota que

.
dx δx
=
.
d q1 δq1

Para probar 3.11 se ve primero que como x = x(q1,q2), la derivada parcial, dx/dq1 es, en general,
función de q1 y de q2, es decir dx/dq1 =φ(q1,q2). Derivando esto con respecto al tiempo, se
obtiene
¨
d  δx  δ  δx  . d  δx  .
  =   q1+   q2
dt  δq1  δq1  δq1  dq 2  δq1 
Pero por la expresión de x, se sigue que

dx δ  δx  . d  δx  .
=   q1+   q2
dq1 δq1  δq1  dq1  δq 2 

Comparando las dos últimas ecuaciones se ve que 3.11 es correcta.

Partiendo de 3.7 y considerando el trabajo δWq2 asociado con una variación de q2


únicamente, de una manera idéntica a la anterior, se llega a

 
d  δT  δT δx δy δz (3.16)
dt  δ q.  − δq = Fx δq + Fy δq + Fz δq
 2  2 2 2 2

Las expresiones 3.15 y 3.16 son las ecuaciones de Lagrange que se trataban de
deducir.
Por conveniencia se escribe,
δx δy δz
Fx + Fy + Fz = Fqr
δq r δq r δq r (3.17)

En donde qr es una cualquiera de las coordenadas que aparecen en T r y Fr se


denomina “fuerza generalizada”. De tal manera, las ecuaciones de Lagrange toman la
forma compacta

 
d  δT  δT
dt  δ q.  − . = Fqr (3.18)
 r  δ qr
Como se verá en el capítulo siguiente, las ecuaciones de Lagrange tienen
exactamente la misma forma para un sistema de muchas partículas.
160
Para el caso que se acaba de considerar (una partícula con dos grados de libertad),
existen dos ecuaciones de Lagrange. Si se supusieran tres grados de libertad (una
partícula sin restricciones), las relaciones (3.4) contendrían todas a q1, q2 y q3, y
finalmente se obtendrían tres ecuaciones de Lagrange. En general, hay tantas
ecuaciones del movimiento de Lagrange, cuantos grados de libertad se tengan.
Sin embargo (y esto es importante tanto desde el punto de vista de las ideas
básicas, como para ciertas aplicaciones) aunque en realidad la partícula tenga
únicamente dos grados de libertad, todavía es posible escribir tres ecuaciones de
Lagrange. Ignorando la restricción, se escribe x = x(q1,q2, q3), etc. Suponiendo que q1,q2
y q3 son variables independientes y siguiendo exactamente el procedimiento anterior,
se obtiene una ecuación de Lagrange correspondiente a cada una de las tres
coordenadas. Existe, sin embargo, la siguiente consideración importante: El
desplazamiento δs, correspondiente a δq1, δq2 y δq3, obviamente no está de acuerdo
con la restricción. (En el ejemplo especial en consideración,
δx = δrsenθ cos φ + rδθ cos θ cos φ − rδφsenθsenφ ,

La cual no esta sobre la superficie de la esfera ya que δr n se ha igual a cero.) Por


tanto δW incluye el trabajo hecho por la fuerza de restricción(reacción entre la
partícula y la superficie) y las componentes de esta fuerza deben incluirse en Fx, Fy
Fz. No se ha eliminado la fuerza de restricción. Con esto en mente, las tres
ecuaciones son absolutamente correctas.
Por razones obvias, entonces, todas las coordenadas superfluas son normalmente
eliminadas de las ecuaciones de transformación y de T. Sin embargo, el procedimiento
anterior de introducir deliberadamente coordenadas superfluas puede ser la base de
un poderoso método para hallar las fuerzas de restricción. Véase el capítulo 12.

6.3. Compendio de detalles importantes relacionados con las ecuaciones de


Lagrange.

a.) Ecuaciones diferenciales del movimiento

Las ecuaciones diferenciales del movimiento para cualquier problema específico se


obtienen, naturalmente, por medio de las operaciones indicadas en 3.18. Para
sistemas de n grados de libertad, solamente n coordenada (y sus derivadas con
respecto al tiempo) deben aparecer en T]. Las coordenadas superfluas deben ser
eliminadas como en el numeral 2.6.

b) Significado de las fuerzas generalizadas.

No sobra insistir sobre la importancia de obtener un claro entendimiento del simple


significado físico de las fuerzas generalizadas (relación (3.17)) tanto para fines de las
ideas básicas, como para sus aplicaciones.
La expresión
δW = F δx + Fδy + Fδz
x es una ecuación general que determina el
elemento de trabajo hecho por una fuerza (de componentes Fx, Fy y Fz) en un
desplazamiento general δs (de componentes δx, δy y δz). Considérese ahora δW
cuando δs está de acuerdo con la restricción y sólo q, varia (δq2 = 0). Tal
desplazamiento se obtiene si las componentes δx, δy y δz provienen de (3.4), hacien-
do q2 constante; es decir

δx δy δz
δx = δq1 δy = δq1 δz = δq1
δq1 δq1 δq1 161
Sustituyendo en la ecuación anterior para δW, se tiene

 δx δy δz 
δWq1 =  Fx + Fy + Fz δq1
 δq1 δq1 δq1 

Que es, claramente, Fq1δq1. Entonces una fuerza generalizada es una magnitud de
tal naturaleza que el producto Fqrδqr es el trabajo hecho por fuerzas impulsoras (sin
incluir fuerzas "inerciales", ni de restricción) cuando q1 sólo varía en una cantidad igual
a + δqr.

Las fuerzas generalizadas no son siempre fuerzas en el sentido corriente de la


palabra. Por ejemplo, si qr es un ángulo θ, Fo debe ser un momento (o torque) a fin de
que Foδ θ sea un trabajo. Si qr es el área A. de la figura 2-6, FA δA=δW y naturalmente,
FA debe tener las dimensiones de una fuerza dividida por una longitud.

(e) Técnica para obtener expresiones

Puede seguirse uno de los tres métodos siguientes.


Sustituyendo expresiones conocidas de Fx, Fy, Fz junto con
(Obtenidas tomando derivadas de (3.4) en (3.17) se obtienen Fqr .
δx δy δz Usualmente Fx, Fy, Fz no son constantes sino funciones de las
+ +
δqr δqr δqr coordenadas, del tiempo, de la velocidad, etc. En cualquier caso,
las expresiones de estas fuerzas deben conocerse por la
naturaleza del problema en consideración. Este método es directo pero puede resultar
largo y monótono.
Un segundo método, que en muchos casos es más fácil y más atractivo desde el
punto de vista de lo que sucede físicamente, es el siguiente: Imagínese una de las
coordenadas que aparecen en T, mantenidas constantes. Determínese ahora, por
cualquier sistema adecuado, el trabajo δWqr hecho por todas las fuerzas impulsoras
(sin incluir las de restricción). Acontinuación se resuelve la ecuación

δWqr = Fqrδqr (3.19)

Para obtener Fqr. Al determinar δWq r , el trabajo se toma como positivo o como
negativo según si la fuerza o fuerzas tienden a hacer aumentar o disminuir la
coordenada qr.
Si la partícula tiene dos o tres grados de libertad, en ocasiones es más
convenientes suponer desplazamientos simultáneos δq1, δq2 y δq3 y escribir el trabajo
total correspondiente δW total, el cual tomará la forma

δWtotal = [….]δq1+[….]δq2+[….]δq3 (3.20)

En donde los paréntesis cuadrados aparecen en el lugar correspondiente a Fq.


Los ejemplos siguientes aclaran esta técnica.

c. De las fuerzas inerciales en las ecuaciones de Lagrange

La expresión “fuerza inercial” como se utiliza aquí, se refiere a (masa) x


(aceleración). Términos como

162
Sirven como ejemplos. Una mirada al miembro izquierdo de 3.3 y a las ecuaciones
siguientes hasta 3.18 muestra que las fuerzas inerciales aparecen exclusivamente

 
d  δT  δT
dt  δ q.  − δq
 r  r

Así mismo, es claro que en Fqr aparecen únicamente fuerzas aplicadas. En otras
palabras, al escribir las ecuaciones de movimiento de Lagrange, para cualquier
sistema, debe recordarse que el miembro izquierdo de 3.18 automáticamente tiene en
cuenta todas las fuerzas inerciales y que al tratar de hallar expresiones para F qr,
solamente deben considerarse fuerzas impulsoras. (Nunca se incluyen en Fqr fuerzas
tales como la centrífuga, la de Coriolis, etc.)

6.4. Integración de las ecuaciones diferenciales del movimiento.

Un hecho desafortunado que todo científico aplicado debe afrontar, es que en la


gran mayoría de los problemas las ecuaciones del movimiento son tan complicadas
que no se encuentran métodos disponibles para su integración. En ciertos casos
puede hacerse aproximaciones justificables o suposiciones que tiendan a simplificar
las ecuaciones y a reducirlas a formas integrables.
Afortunadamente, sin embargo, aparecen como salvación los computadores, los
cuales permiten obtener ahora soluciones gráficas o numéricas para ecuaciones que
por otra parte resultaban “insolubles”. En este texto se presentan parcial o totalmente
las integraciones cuando esto es posible y conveniente. Pero primordialmente la
atención se concentra en plantear correctamente las ecuaciones del movimiento.

6.5. Ejemplos ilustrativos

El valor pedagógico de unos pocos ejemplos es muy superior al de varias páginas


de observaciones. Este es el mejor método para “explicar las explicaciones”.

Ejemplo 3.1:
Considérese el movimiento de un proyectil con respecto a un sistema de ejes
rectangulares adherido a la Tierra. Considerando estos ejes como inerciales y tratando
el proyectil como una partícula de masa m, se escribe,

m . 2 . 2 .2
T=  x + y + z  De donde
2  

¨
dT d  δT 
. δT
= m x , = m x, =0
.
dt  .  δx
dx δ x 

163
Para tanto mx = Fx. En forma similar my = Fy y mz = Fz . Despreciando la resistencia
del aire, la única fuerza es la atracción de la gravedad en la dirección negativa de z.
Así pues δWt = -mgδz y Fz = -mg. Obviamente, Fx = Fy = 0. Entonces, finalmente,

¨ ¨ ¨
m x = 0, m y = 0, m z = −mg.

Este ejemplo no demuestra el potencial del método de Lagrange, pero sí muestra


que para el caso de una partícula tratada en función de coordenadas rectangulares,
las ecuaciones de Lagrange se reducen a la misma forma que las de Newton.

Ejemplo 3.2: Movimiento de una cuenta ensartada en un alambre rígido.

Una cuenta de masa m puede deslizarse libremente a lo largo de un alambre


parabólico cuya forma esta dada por y = bx2. Como el movimiento está confinado a
una línea, la cuenta tiene solamente un grado de libertad. Las dos ecuaciones de
restricción serán:
y = bx2 y z = C. De la expresión

1  .2 . 2 .2
T= m x + y + z 
2  

Puede eliminarse la velocidad z y bien y o x. Eliminando

T=
1 ¨
2
(
m x 1 + 4b 2 x 2 ) Aplicando la ecuación de Lagrange,

δT d  δT  . 2
2 δT
. 2
= m x (1 + 4b 2 x 2 ), ( )
. ¨
= m x 1 + 4b 2 2
x + 8 m x xb , = 4 m x xb 2
.

dt δ x .
 δx
δx  
Finalmente,

. 2
m x(1 + 4b x ) + 4m x xb 2 = Fz
¨
2 2

Para hallar Fz se aplica 3.19 y como se observará, no resulta sencillamente igual a


la componente x de una fuerza. Se puede suponer que el eje Y es vertical y que la
única fuerza que actúa es la atracción de la gravedad (no es necesario considerar la
fuerza de restricción). Si a la cuenta se le da un desplazamiento + δx, necesariamente
se moverá una distancia correspondiente sobre el alambre + δy, y el trabajo hecho
entonces por la gravedad será δW=-mgδy. Pero según la ecuación de la restricción, δy
= 2bxδx. Por tanto δW = -2mgbxδx = Fxδx, Fx = -2mgbx, y la ecuación del movimiento,
completa, queda

. 2
( )
¨
m x 1 + 4b 2 x 2 + 4m x xb 2 = −2mgbx

A manera de extensión de lo anterior, imagínese que por medio de un hilo sujeto a


la cuenta, se tira de ella con una fuerza f. Supóngase que el hilo está en el plano de la

164
parábola y que su dirección, dada por los cosenos directores alfa y beta, se mantiene
constante. Se tiene que para un pequeño desplazamiento,
δW = mgδy + αfδx + βfδy Véase la ecuación 2.35
El miembro izquierdo de la ecuación del movimiento continúa inmodificado. Nótese
que todos los resultados anteriores pueden igualmente expresarse en función de y y y
´, en cambio de x y x´, eliminando desde el principio x´de T, etc.

Ejemplo 3.3: Movimiento de una partícula sobre un tablero horizontal liso, bajo la
acción de un resorte.

Un hilo sujeto a la partícula pasa por un orificio en una mesa horizontal lisa y está
atado a un resorte débil, como se muestra en la figura 3-1. El extremo inferior del
resorte está rígidamente unido a un punto tal que cuando m esta en el orificio, el
resorte no está estirado. El sistema tiene dos grados de libertad y usando
coordenadas polares, T = ½ m (r´ 2 + r2 θ´2). La única fuerza que actúa sobre la masa
es la del resorte. Así, para un desplazamiento arbitrario de la partícula, δW = -krδr en
donde k es la constante usual de la ley de Hooke, del resorte. No existe ninguna
fuerza actuando perpendicularmente a r. Por tanto, las ecuaciones de Lagrange
conducen a
¨
. 2 d 2 .
(1)m r − mr θ = −kr , (2)  mr θ  = 0
dt  

Utilizando 2 se observa que mr2 θ´=Po= momentum angular = constante. Eliminando


θ¨de 1, resulta una ecuación que incluye a r¨ y r únicamente y que puede ser integrado
por los métodos corrientes.
La solución de este problema en coordenadas rectangulares demuestra cómo en
ocasiones, las ecuaciones del movimiento pueden ser considerablemente
simplificadas, al hacer una adecuada selección de coordenadas. Escribiendo

1 .2 .2
T= m x + y , δW = −krδr = −k ( xδx + yδy )
2  

Se concluye que mx¨=-kx y my¨=-ky. O sea que el movimiento está compuesto de


dos movimientos armónicos simples que forman ángulo recto y ambos poseen el
mismo período. Por tanto, la trayectoria, en general será la de una elipse con el origen
en su centro.

Ejemplo 3.4: Un péndulo sostenido por una banda de caucho, (fig.3-2)

Si el movimiento es en un plano, la pesa del péndulo, considerada como una


partícula, tiene dos grados de libertad. Usando r y θ como coordenadas,

165
1 ¨ 2
T = m( r + r θ )
2 2

2
de donde se sigue que mr-mrθ2=Fr y mr2θ+2mrr´θ=Fθ. A continuación se ilustran dos
métodos para obtener las fuerzas generalizadas. Imagínese que se le da a la pesa un
desplazamiento δs arbitrario, en el que tanto θ como r sufren cambios positivos. El
trabajo hecho por la gravedad y la banda de caucho está dado por

δWtotal = −mgδh − k (r − rθ )δr


en donde ro y k se refieren a la longitud, sin extenderse, de la banda de caucho y a su
constante de la ley de Hooke, respectivamente. Los dos términos de la derecha se han
escrito con signo negativo, porque el trabajo debe ser hecho contra la gravedad y
contra la banda, a fin de obtener desplazamientos positivos de r y θ. Pero como puede
verse en la figura δh=r δ θsen θ- δr cos θ y por consiguiente,
δWtotal = −mgδθsenθ − (k (r − rθ ) − mg cos θ )δr

Así el trabajo correspondiente a un cambio de r únicamente, es


δW= -[k(r-ro) – mg cos θ] δr =F, δr de donde

Fr = −k (r − rθ ) + mg cos θ

En forma similar, Fo = -mgr sen θ


Ahora se hallaran Fo y F por aplicación directa de

δx δy δz
Fqr = Fx + Fy + Fz
δqr δqr δqr
Teniendo en cuenta la gravedad y la tensión de la banda, se observa que las
componentes x y y de la fuerza sobre la pesa, son
Fx = −k (r − rθ ) senθ , Fy = mg − k (r − ro) cos θ

Por las relaciones x = r sen θ y y = r cos θ, se obtienen dx/dr =senθ y dy/dr=cosθ.


Por tanto,

δx δy
Fr = Fx + Fy = −k (r − ro) sen 2θ + [ mg − k (r − ro ) cos θ ] cosθ = −k (r − ro) + mg cosθ
δqr δqr
que es idéntica a la expresión obtenida anteriormente. En la misma forma puede
obtenerse Fθ.

6.6. Ecuaciones de Lagrange para una partícula, suponiendo u marco de


referencia móvil, restricciones móviles, o ambas condiciones
simultáneamente.

Hasta ahora se ha evitado nel estudio de sistemas que impliquen marcos de


referencia móviles, restricciones móviles o una combinación de ambas condiciones
simultáneamente. Sin embargo, como en la práctica se presentan numerosos
166
problemas de este tipo, es importante considerar cuidadosamente la deducción y
aplicación de las ecuaciones de Lagrange a tales sistemas.
Supóngase una vez más, que se trata de una partícula que puede moverse libremente
sobre una superficie lisa. Además, se presume que la superficie, el marco de
referencia que sirve para medir las coordenadas generalizadas q1 y q2, o ambos, se
mueven de alguna manera determinada. Siguiendo exactamente el mismo
procedimiento del numeral 3.2 escribimos nuevamente,

^ ^ ^ 
m x δx + yδy + zδz  = Fxδx + Fy δy + Fz δz
 

En donde δx. Δy y δz representan un desplazamiento completamente arbitrario y


Fx, Fy, Fz son las componentes de la fuerza total que actúa sobre la partícula,
incluyendo la fuerza de restricción. (El marco XYZ se supone inercia.)
Se indican las ecuaciones de transformación que relacionan a x, y y z con q1, q2 y
t, de la siguiente manera

x = f1(q1,q2,t), y = f2(q1,q2,t), z = f3(q1,q2,t) (3.21)

En estas ecuaciones aparecen sólo dos coordenadas generalizadas, y el tiempo


entra explícitamente debido a los movimientos asumidos. De aquí en adelante, las
ecuaciones 3.21 consideran en forma completa la restricción y el movimiento
supuesto.

Como δx, δy y δz son todos arbitrarios, se puede, si se desea, determinarlos a partir


de las ecuaciones 3.21 dejando que tanto t como q1 y q2 varíen. En esta forma,

δx δx δx
δx = δq1 + δq 2 + δqt
δq1 δq 2 δqt

Sustituyendo en la primera ecuación de este numeral, y agrupando términos, se


tiene
(3.22)
¨ ¨
¨ δz  ¨ ¨
¨ δz  ¨ ¨
¨ δz 
 δx ¨ δy
  δx ¨ δy
  δx ¨ δy

m x +y +z δq1 + m x + y + z δq 2 + m x + y + z δqt =
 δq1 δq1 δq1   δq 2 δq 2 δq 2   δqt δqt δqt 
     
 ¨
  ¨
  ¨

 δx δy δz   δx δy δz   δx δy δz 
 Fx δq1 + Fy δq1 + Fz δq1 δq1 +  Fx δq 2 + Fy δq 2 + Fz δq 2 δq 2 +  Fx δqt + Fy δqt + Fz δqt δqt
     

Y teniendo en cuenta que δq1 y δq2 y δt son arbitrarios, puede hacerse δq2=0 y δt=0.
Entonces 3.22 se reduce a

¨ ¨
  ¨

 δx ¨ δy ¨ δz   δx δy δz 
m x +y +z δq1 = Fx
 δq1 + Fy + Fz δq1
 δq1 δq1 δq1  δq1 δq1 
   

167
Finalmente, aplicando las relaciones 3.9, 3.10 y 3.11 como en el numeral 3.2 (que
son válidas aunque 3.21 contenga explícitamente el tiempo), se obtiene una ecuación
de Lagrange que tiene exactamente la misma forma de 3.15 . De la misma manera,
haciendo δq1 y δt=0 se llega a 3.16. Por consiguiente, los marcos de referencia
móviles, las restricciones móviles, o la combinación de ambas condiciones, no
producen ningún cambio en las ecuaciones de Lagrange; (3.18) continúa siendo la
forma general.

6.7. De la energía cinética, las fuerzas generalizadas y otros tópicos, cuando


el marco de regencia, las restricciones, o ambos se mueven.

a. Básicamente, la energía cinética, como se ha dicho con insistencia


anteriormente, debe referirse a un marco inercial (véanse los numerales 2.8 y
2.9). Sin embargo, siguiendo el procedimiento descrito e ilustrado en esta
referencia, es posible expresar a T en función de las coordenadas móviles,
cuando éstas han de usarse. Por otra parte, deben eliminarse las coordenadas
superfluas.
b. La observación siguiente sobre las fuerzas generalizadas es muy importante.
Nótese que en la relación

 ¨

 δx δy δz 
 Fx δqr + Fy δqr + Fz δqr δqr = Fqrδqr = δWqr
  Las derivadas de x, y y z se
toman con respecto a qr únicamente dejando fijo t y todas las demás coordenadas.
Así, es muy claro que δWqr es el trabajo ejecutado por la fuerza actuante, cuando, con
las condiciones mencionadas se determinan suponiendo el marco de referencia y las
restricciones en reposo y luego procediendo exactamente como se explicó en el
numeral 3.3(b) y (c); y como se ilustró en el numeral 3.5. Si sucede que algunas, o
todas las fuerzas, son funciones del tiempo, como ocurre con frecuencia, debe
seguirse aún el procedimiento anterior. Como todo desplazamiento, determinado por
las ecuaciones 3.21 con t constate, está de acuerdo con las restricciones, el trabajo
hecho por la fuerza de restricción es igual a cero. Por tanto, como es usual, esta
fuerza debe ser ignorada.
c. Se observará que considerando δq1=0, δq2=0 y δt no es igual 0, obtenemos, a
partir de 3.22, la relación

¨ ¨
¨ δz   ¨
 (3.23)
δx ¨ δy
 δx δy δz 
m x + y + z δt =  Fx + Fy + Fz δt
 δt δt δt   δt δt δt 
   
Como el lector puede demostrar fácilmente, el lado derecho de 3.23 es,
sencillamente el trabajo hecho sobre la partícula por la fuerza total (incluyendo la
fuerza de restricción) cuando el marco d referencia, las restricciones o ambos,
desplazaran su posición ligeramente en el tiempo δt. Sin embargo, como 3.23 es
redundante en cuanto se refiere al planteamiento de las ecuaciones del movimiento,
no recibirá por ahora ninguna consideración adicional.

3.8 Ejemplos ilustrativos

168
El siguiente ejemplo sencillo debe servir para clarificar algunas ideas básicas. Una
varilla rígida lisa, como se muestra en la figura 3.3, se hace girar con velocidad angular
constante, en un plano alrededor del origen de los ejes X y Y. Una cuenta de masa m
puede deslizarse libremente sobre la varilla, bajo la acción de una fuerza F, que
incluye la fuerza de restricción. Por medio de la aplicación directa de la ecuación de D
´Alembert 3.3 se plantea la ecuación del movimiento, que para este caso, es
sencillamente,

m(x¨δx+y¨δy)=Fxδx+Fyδy (1)

La cuenta tiene solo un grado de libertad. Tomando a r como coordenada, se puede


escribir
x = r cos wt, y = r sen wt (2)

δx = δr cos wt – re sen wt, δy = δr sen wt + rw δt cos wt (3)

En donde tanto r como t pueden variar. Igualmente pueden hallarse en forma


inmediata las expresiones para x¨y y¨a partir de 2. Eliminando δx, δy, x¨ y y¨ de 1 se
tiene
(4)
¨
¨
m(r − rw )δr + 2mr r w δt = ( Fx cos wt + Fysenwt )δr +( Fx cos wt + Fysenwt
2
¨
2
¨
)rwδt
¨ ¨
m(r − rw 2 )δr = ( Fx cos wt + Fysenwt )δr (2mr r w 2 )δt = ( Fx cos wt + Fxsenwt )rwδr

Pero como δr y δt son arbitrarios, resulta claro que


(5)

Al examinar la figura se observa que el miembro derecho de 5 es justamente el


trabajo hecho por la fuerza total a lo largo de un desplazamiento δr sobre la varilla (no
un desplazamiento δs). Pero como el desplazamiento tiene en cuanta la restricción, el
trabajo hecho por la fuerza de reacción de la varilla sobre la cuenta es igual a cero.
La ecuación 5 es la ecuación del movimiento y es exactamente igual a la que se
obtiene al aplicar adecuadamente la ecuación de Lagrange.
La ecuación 6 corresponde a 3.23. Por inspección en la figura 3.3 se demuestra
que el lado derecho de 6 es el trabajo hecho por F (incluyendo la fuerza de restricción)
para un desplazamiento rwδt.

Ejemplo 3.6:

169
Con referencia a la figura 3-4, la plataforma giratoria D tiene una velocidad angular
determinada por el motor M1. Adherido a la plataforma se encuentra el mecanismo
impulsor M2 que hace girar la varilla lisa pa, alrededor del eje horizontal en p, de
alguna manera en particular. La varilla pa y las verticales pb y oc se encuentran todas
en el mismo plano. Una cuenta de masa m puede deslizarse libremente a lo largo de la
varilla, bajo la acción de la gravedad.
Suponiendo que alfa y teta son funciones conocidas del tiempo, el sistema tiene un
grado de libertad. Tomando r como coordenada, se plantea la ecuación del
movimiento, y se encuentra Fr.
Se concluye fácilmente que
 
1  . 2 2 .2 . 2 2
T = m r + r θ + α ( s + rsenθ )
2  
(1)
 
Esta expresión es válida independientemente de la forma como varíen con el
tiempo alfa y teta. Supongase que α=W1=constante, y que la varilla se hace oscilar,
por medio del mecanismo M2, alrededor de la vertical pb, según θ= θosen w2t. Por
consiguiente,
 
1 . 2 2 2 2 . 2 .
2
T = m r + r θ o w2 cos w2 t + w1 (δ + rsen(θ o senw2 t ))
2
(2)
2  
 
Que incluye únicamente a r,r´y t. Aplicando la ecuación de Lagrange, se lega a

{ }
¨
m r − m rθ o2 w22 cos 2 w2 t + w12 [ s + rsen(θ o senw2 t )] sen(θ o senw2 t ) = F (3)

Con el fin de hallar una expresión para Fr, se ignoran por completo los movimientos
de la plataforma y de la varilla; es decir que durante el desplazamiento +δr, t
permanece constante (θ y α permanecen constantes). Por tanto

δWr = −mg cos θδr = −mg cos(θosenw2 t )δr

O sea Fr=-mgcos(θosenw2t)

Debe notarse que si la varilla no tiene un movimiento obligado sino que puede girar
libremente alrededor de p, el sistema tiene entonces dos grados de libertad. En este
caso, despreciando la masa de la varilla, 1 continua siendo la expresión correcta para
T. Las ecuaciones del movimiento correspondientes a r y θ, pueden escribirse en
forma inmediata y se ve que

Fr = −mg cosθ , Fo = mgrsenθ


170
6.8. Determinación de la aceleración por medio de las ecuaciones de
Lagrange.

Como se demostró anteriormente (numeral 2.12), la componente a´del vector


aceleración alfa, sobre una línea cuyos cosenos directores son l, m y n, esta dada por
¨
¨ ¨ (1)
a = xl + y m + zn
´

Si debe hallarse a´en la dirección de la tangente a una curva en el espacio en un


punto p determinado,
dx dy dz
l= ,m = ,n = (2)
ds ds ds
En donde ds es el elemento de longitud de la curva en p, dado por

(3)
ds 2 = dx 2 + dy 2 + dz 2

Entonces, partiendo de las ecuaciones de la curva en el espacio pueden hallarse l,


m y n supóngase que se desea determinar una expresión general para la componente
de aceleración en la dirección de la tangente a la coordinado q1 teniendo en cuenta
que las coordenadas generalizadas q1, q2 y q3 se relacionan con las rectangulares
por medio

x = x (q1, q 2, q3, t ), y = y (q1, q 2, q3, t ), z = z (q1, q 2, q3, t ) (4)


La línea coordenada de q1 se determina haciendo que permanezca constantes q2,
q3 y t en 4 y dibujando la gráfica por puntos x, y y z para valores variables de q1 en
forma semejante se tiene las líneas coordenadas de q1 y q3 tomando las derivadas de
4 mientras q2, q3 y t permanecen constantes, se obtienen

dx
dx = dq1, Etc. Entonces 3 se convierte en
dq1
 δx  2  δy  2  δz  2  2
ds = 
2
 +   +    dq1
 δq1   δq1   δq1   (5)

En donde ds es un elemento de longitud medido sobre la curva de q1.

Según (2)

dx 1 δx
l1 = =
1
h1 δq1 (6)
  δx  
2
 δy  
2
 δz  
2
 2
dq1    +   +  
δq1  δq1  δq1 
  

En donde el significado de h1 es bien claro, y donde se ha escrito dx/dq1 como


dx/dq1, puesto que q2, q3 y t se consideran todavía constantes. En forma semejante,

171
1 dy 1 dz .
m1 = n1 =
h1 dq1 h1 dq1

Igualmente, los cosenos directorios de la tangente a la curva coordenada de q2,


son

1 dx 1 dy 1 dz (7)
l2 = , m2 = , n2 =
h 2 dq 2, h 2 dq 2 h 2 dq 2

Designado a´como aq1 la ecuación (1) se convierte en

1  ¨ dx ¨ dy ¨ dz  (8)
a q1 = x +y +z 
h1  dq1 dq1 dq1 
Teniendo en cuenta las etapas que condujeron al miembro izquierdo de 3.15,
evidentemente puede escribirse 8 en la siguiente forma

1  d dT ´ ¨ dT ´ 
a q1 =  −y  (9)
h1  dt dq1 dq1 
En donde T´=1/2(x´2+y´2+z´2 ), expresada en coordenadas generalizadas. En
general,

1  d dT ´ ¨ dT ´ 
a q1 =  −y 
h1  dt dqr dqr 
(3.24)

Es esta una manera sencilla y fácil de obtener las expresiones generales de las
componentes de la aceleración en la dirección de las coordenadas. Véase el siguiente
ejemplo.

Ejemplo 3.7
Considerando el sistema de coordenadas esféricas , se trata de obtener la conocida
expresión de ao, la componente de la aceleración según la dirección de la tangente a
una de las curvas coordenadas de θ, por medio de la utilización de 3.24.
Para estas coordenadas.
1 ¨2 ¨2 2 ¨2
T´ = (r + r θ + r sen 2θφ 2
2

De donde

d  dT  δT ´ ¨ ´ ´
− = r 2
θ + 2 r r θ − r 2φ 2 senθ cos θ
 ´´ 
dt  d θ  δθ

172
1
 δx   δy   δz  
[ ]
2 2 2 2 1
hθ =   +   +    = ( r cosθ cos φ ) + ( r cosθsenφ ) + r 2 sen 2θ
2 2 2 =r
δθ δθ
       δθ

Por tanto
¨
´ ´ ´ 2
a o = r θ + 2 r θ − r φ senθ cos θ
En forma similar pueden obtenerse inmediatamente ar y ao. Si el movimiento de un
punto o una partícula está restringido a una superficie móvil después de eliminar una
coordenada superflua, las ecuaciones 4 serán
(10)
x = x(q1, q 2, t ), y = y (q1, q 2, t ), z = z (q1, q 2, t )

Que en realidad son las ecuaciones de la superficie en cualquier instante.


Y si ahora se hace que q2 y t permanezcan constantes , las ecuaciones 10
representan una curva q1 sobre la superficie. Por otra parte , es claro que dx/ds, por
ejemplo , es la expresión de uno de los cosenos directores de la tangente a esta curva,
en un punto cualquiera. Por consiguiente, si se escribe T¨ en función de q1,q2, q1´,q2
´y t, la ecuación 3.24 da las componentes del vector aceleración según la dirección de
las tangentes a q1,q2 sobre la superficie , en un instante determinado.
Una vez más , es importante recordar que, básicamente, las aceleraciones halladas
de esta manera, son relativas al marco X, Y, Z.

6.9. Una consideración adicional sobre las ecuaciones de Lagrange

Con el objeto de clarificar aún más el sentido físico de las ecuaciones de Lagrange,
considérese lo siguiente:
Escribiendo T=1/2m(r´2+ r´2θ2+ r´2φ2 sen2 θ), según el numeral 3.9, se sigue que

1  d dT ¨ dT 
 +y  = maθ
h1  dt dθ dθ  Asimismo, el lector puede demostrar fácilmente que

1  dx dy ¨ dz
 1 3.25
 Fx + Fy + Fx = Fθ = f θ
hθ  dθ dθ dθ  hθ

En donde si f es la fuerza que actúa sobre m, f, es la componente de f en la


dirección en que θ aumenta. (Nótese que f θ es una fuerza verdadera y no un
momento; además, a θ es una aceleración lineal). Por tanto resulta claro que la
ecuación de Lagrange conduce sencillamente a ma θ=f θ, en coordenadas esféricas
en la misma forma como pueden escribirse las ecuaciones correspondientes a radio y
φ, como mar=fr y ma φ= f φ, y lo mismo para cualquier otro sistema de coordenadas
que pueda usarse.
Si existe alguna restricción sobre la partícula, sobre las ecuaciones de
transformación toma la forma de las ecuaciones 10 siguiendo el razonamiento dado al
final del ejemplo 3.7 se concluye que las ecuaciones de Lagrange correspondientes a
q1 y q2 pueden escribirse como maq1=fq1 y maq2=fq2.

173
Así pues la interpretación física de las ecuaciones de Lagrange para un sistema de
una partícula es muy sencilla y además observa en cada una de las ecuaciones se
tienen en cuenta automáticamente las componentes de la aceleración.
Lo anterior es válido para cualquier sistema de coordenadas y cualquier tipo de
restricciones.
Considérese, por ejemplo, una partícula sobre una plataforma giratoria montada en
un ascensor
acelerado. Supóngase que se desean obtener las componentes de la aceleración
de la partícula,
expresadas en función de ciertas coordenadas cuyo marco se encuentra adherido a
la plataforma,
y que se requiere tener en cuenta los movimientos de la Tierra, del ascensor y de la
plataforma.
Aun en este caso tan complicado, es fácil escribir T para la partícula y (.1.24) da los
resultados
buscados, en forma inmediata. El estudiante debe comparar este método con el
sistema vectorial
normal. Véase el problema 3.34.

6.10.Experimento sugeridos:

Como se mencionó anteriormente, al final de varios de los capítulos, se enumeran


unos pocos experimentos que han sido hallados dignos de la atención, del tiempo y de
los esfuerzos de los estudiantes. Estos experimentos contribuirán a inculcar una
apreciación tangible de la dinámica que el papel y el lápiz no podrían lograr por sí
solos jamás

Experimento 3.1
Determínese el período de un pedúnculo que se muestra en la figura 3-6 (véase en
el problema 3.7). El punto p soporta por medio de un hilo largo y ligero colgado de su
extremo superior de un cielo raso suficientemente alto. Al moverse el péndulo. p
describe el arco de un gran círculo pero para movimientos pequeños este puede
considerarse como una línea recta horizontal. Si se determinan con cuidado los
valores de k y m. los resultados experimentales y los calculados concuerdan con una
buena precisión.

Puede repetirse el experimento ajustando la cuerda vertical de modo que p quede


algunos centímetros por encima de la horizontal AB quedando entonces los resortes
en forma de V invertida. Naturalmente debe hacerse una aproximación para calcular la
tuerza ejercida por los resortes suponiendo pequeños movimientos. (Véase el
desarrollo de Taylor).

6.11.Resumen y observaciones

1. Deducción de las ecuaciones de Lagrange: Una partícula sin coordenadas


móviles, ni restricciones móviles (numeral 3.2)
a. Se ha desarrollado la ecuación de D´Alembert a partir de la segunda ley de Newton
y del concepto del trabajo virtual. (Se ha observado que el trabajo virtual es un
instrumento simple pero poderoso que se utiliza como medio para llegar a un fin).
b. La ecuación de D´Alembert, expresada en coordenadas generalizadas, conduce
directamente (con la ayuda de ciertas operaciones matemáticas sencillas) a las
ecuaciones de Lagrange.

174
2. Detalles importantes relacionados con estas ecuaciones (numeral 3.3.b y c
a. La energía cinética T debe expresarse en función de las coordenadas generalizadas
que se hayan escogido, y de sus derivadas con respecto al tiempo. Deben eliminarse
de T todas las coordenadas superfluas.
b. Es importante entender con claridad el sentido físico de las fuerzas generalizadas
no solamente para facilitar el uso de las ecuaciones de Lagrange, sino también para
lograr una apreciación de lo que ocurre.

3. Deducción de las ecuaciones de Lagrange: Coordenadas móviles,


restricciones móviles, o ambas (numeral 3.6)
a. La deducción se basa de nuevo en la ecuación de DÁlembert y en el carácter
arbitrario de los desplazamientos virtuales δxt, δyt, δzt. Las ecuaciones resultan con la
misma forma anterior.
b. T es ahora función de las qr, q´r y t.
c. Como anteriormente, se halla Fqr, dejando el tiempo constante. El sentido físico de
esto (numeral 3.7) debe ser entendido por las mismas razones mencionadas en 2b.

4. La aceleración determinada por medio de las ecuaciones de Lagrange


(numeral 3.9)
Como se muestra en el numeral 3.9, la componente de la aceleración de un punto o
partícula, en la dirección de una tangente a una cuerva q, en cualquier punto, puede
obtenerse, en forma inmediata, partiendo de la ecuación 3.24.

5. Interpretación física de las ecuaciones de Lagrange (numeral 3.10)


Para un sistema de una partícula, las ecuaciones del movimiento de Lagrange pueden
reducirse a mar = fr, en donde ar es la componente de la aceleración lineal de m, en la
dirección de la tangente a la curva de qr; y fr es la componente de la fuerza total sobre
m (sin incluir la fuerza de la restricción) que actúa según la dirección de la misma
tangente. Por consiguiente, las ecuaciones anteriores se reducen a la simpleza de las
ecuaciones en la segunda ley de Newton, independientemente del sistema de
coordenadas usado.

7. ECUACIONES DE LAGRANGE PARA UN SISTEMA DE PARTÍCULAS.

7.1. Observaciones introductorias.

Por razones pedagógicas, el análisis de las ecuaciones de Lagrange del capitulo 3,


se restringido a sistemas que contengan solamente una partícula. Ahora se deducirán
estas ecuaciones (y al final adquirirán la misma formada la ecuación (3.18)) para el
caso general de un sistema que consiste en muchas partículas con un número finito
cualquiera de grados de libertad y en el cual pueden existir restricciones móviles o
marcos de referencia móviles o ambos. A continuación, el resto del capítulo se dedica
a las técnicas de aplicación de las ecuaciones de Lagrange a varios tipos de sistemas
diferentes y al importante aspecto de Lograr un entendimiento del significado físico de
las relaciones matemáticas empleadas.

7.2. Deducción de las ecuaciones de Lagrange para un sistema de partículas.

En primer lugar se establecerá la forma general de la ecuación de D’Alembert.

175
Considérese un sistema de p partículas cuyas masas m1, m2,…, mp sufren la acción de
las fuerzas F1, F2,…, Fp, respectivamente. Debe entenderse que F1, por ejemplo, repre-
senta la suma vectorial de todas las fuerzas de cualquier origen (incluyendo las
fuerzas de restricción) que actúan sobre m1, etc. Así, suponiendo masas constantes y
un marco de referencia inercial, las ecuaciones de “partícula libre”, para cada una de
ellas, serán:
Fx1 = m1x1 , Fy1 = m1 y1 , Fz1 = m1z1

(4.1)
Fx p = m p x p , Fy p = m p y p , Fx p = m p z p

En donde Fx1, Fy1, y Fz1 son las componentes rectangulares de F1, etc. Es importante
observar que como se ha supuesto que F1, F2, etc., incluyen las fuerzas de restricción,
las relaciones (4.1) son válidas, aunque las partículas tengan cualquier tipo de
restricción.

Suponiendo ahora que cada una de las partículas sufre un desplazamiento virtual,
cuyas componentes son δx1, δy1 y δz1, etc., se procede a ejecutar las siguientes
operaciones matemáticas sencillas. Multiplicando Fx1 = m1x1 por δx1, Fy1 = m1 y1 por δy1,
etc., en todas las relaciones (4.1) y sumando todo el conjunto, se obtiene,
p p

∑ mi ( xiδx i + yiδyi + ziδzi ) = ∑ ( Fxiδx i + Fyiδyi + Fziδzi )


i =1 i =1
(4.2)
relación que si se interprete en forma adecuada, conduce a resultados de gran
alcance. (Véase la ecuación (3.3).) Nos referiremos a la ecuación (4.2) como ecuación
de D’Alembert.

Aquí deben hacerse varias observaciones importantes, semejantes a las que


siguieron a la ecuación (3.7).

(a) Con respecto a la validez de (4.2) no es necesario que δxi , δy i y δz i , representen


desplazamientos, ni que sean magnitudes infinitesimales. En realidad pueden rempla-
zarse por cantidades completamente arbitrarias como a1, b1 y c1.

(b) Sin embargo si se supone que representan desplazamientos de las partículas,


resulta claro que el miembro derecho de (4.2) es sencillamente una expresión general
del trabajo total δW hecho por las fuerzas F1, F2,… en los desplazamientos δx1, δy1,
δz1,... de todas y cada una de las partículas. Es decir,
p
δW = ∑ ( Fxiδx i + Fyiδyi + Fziδzi )
i =1
(4.3)

(c) Lo anterior es válido aunque los desplazamientos imaginarios (virtuales) no estén


de acuerdo con las restricciones; es decir, que las restricciones pueden
considerarle ligeramente “distorsionadas”. En tal caso, naturalmente, δW incluye el
trabajo hecho por las fuerzas de restricción.

(d)Pero si se considera que los desplazamientos están de acuerdo con las


restricciones, el trabajo hecho por las fuerzas de restricción se anula. (Véanse 105

176
numerales 2.13 y 2.14.) En otras palabras, las fuerzas de restricción quedan
efectivamente eliminadas de (4.2) y de (4.3).

(e)Con las condiciones enunciadas en (d), la relación (4.2) se denomina principio o


ecuación de D’Alembert.

Aunque a primera vista no lo refleje, la ecuación de D’Alembert es el principio más


general de todo el campo de la mecánica clásica e incluye la estática como caso
especial de la dinámica. Las ecuaciones del movimiento de cualquier sistema con un
número finito de grados de libertad, pueden obtenerse directamente de (4.2), en
cualquier sistema de coordenadas, mediante la aplicación de las ecuaciones de
trasformación apropiadas y de las ecuaciones de restricción. Las ecuaciones de
Lagrange son apenas una forma más conveniente de (4.2). Todas las demás
formulaciones como las ecuaciones de Hamilton, el principio de Hamilton, el principio
de Gauss de la mínima restricción, etc., pueden obtenerse a partir de las ecuaciones
de D’Alembert.

Continuando con la deducción, supóngase que el sistema tiene n grados de


libertad, en donde n≤3p, y que las 3p-n ecuaciones de restricción son de tal naturaleza
que todas las coordenadas superfluas pueden eliminarse de las ecuaciones de
trasformación,
xi = xi ( q1 , q 2 ,..., q n , t )
y i = y i ( q1 , q 2 ,..., q n , t )
(4.4)
z i = z i ( q1 , q 2 ,..., q n , t )

Con respecto a estas ecuaciones, deben tenerse en cuenta los siguientes hechos.
(a)Las relaciones (4.4), son ecuaciones de trasformación de las que se han eliminado
previamente las coordenadas superfluas, denominadas anteriormente, ecuaciones
“reducidas”. Aquí se consideran únicamente sistemas holonómicos. (Véase el
numeral 9.12.)
(b)Debido a las restricciones, el número de coordenadas generalizadas que aparece
en (4.4) es 3p-n menor que el número de coordenadas rectangulares.
(c) La aparición de t indica que pueden existir restricciones móviles, aun marco de
referencia móvil, o ambos.
(d)Estas ecuaciones tienen en cuenta todas las restricciones, en el sentido que los
desplazamientos δx1, δy1 y δz1, que se obtienen aplicando las relaciones
∂xi ∂x ∂x
δxi = δq1 + i δq2 + ... + i δqn ,etc.
∂q1 ∂q2 ∂qn
(4.5)
(conservando a t constante) a (4.4), están de acuerdo con las restricciones.
(e)Así, si δx1, δy1 y δz1, se determinan de esta manera, se puede estar seguro que el
trabajo ejecutado por las fuerzas de restricción suma cero. Por tanto, las fuerzas de
restricción pueden ser ignoradas. (Véase el numeral 2.14.)

Sustituyendo las relaciones (4.5) en (4.2) se obtiene, después de agrupar términos,


p
 ∂xi ∂yi ∂zi  p
 ∂xi ∂yi ∂zi 
∑ m  x
i i + y
i + z
i 
∂q1 
δq1 + ... + ∑ mi
 x
 ∂qi + y
i + z
i
δqn
∂qn 
i =1  ∂q1 ∂q1 i =1  n ∂qn

177
p
 ∂x ∂y ∂z  p
 ∂x ∂y ∂z 
= ∑  Fxi i + Fyi i + Fzi i δq1 + ... + ∑  Fxi i + Fyi i + Fzi i δqn
i =1  ∂q1 ∂q1 ∂q1  i =1  ∂qn ∂qn ∂qn 
(4.6)
Pero como q1 , q 2 ,.., q n son todas variables independientes (físicamente esto
significa que las partículas del sistema pueden desplazarse libremente de tal manera
que, sin violar las restricciones, una cualquiera de las q puede tomar cualquier valor
independientemente de los valores de las demás), pueden considerarse arbitrarios
todos los δq . Entonces supóngase que todos se hacen cero, excepto, por ejemplo,
δq1, con lo cual la ecuación (4.6) se reduce a
p
 ∂x ∂y ∂z  p
 ∂x ∂y ∂z 
δWq1 = ∑ mi  xi i + yi i + zi i δq1 = ∑  Fxi i + Fyi i + Fzi i δq1
i =1  ∂q1 ∂q1 ∂q1  i =1  ∂q1 ∂q1 ∂q1 
(4.7)
Utilizando aquí las relaciones correspondientes a (3.9), (3.10) y (3.11) y siguiendo el
mismo procedimiento del capítulo 3, (4.7) puede escribirse,
 d  ∂ p mi 2 2  ∂ p mi 2 
δWq1 =   ∑ ( xi + yi + zi )  −
  2
 ∑ ( x i + y i2 + z i2 )δq1
 dt  ∂q1 i =1 2  ∂q1 i =1 2 
p
 ∂x ∂y ∂z 
= ∑  Fxi i + Fyi i + Fzi i δq1
i =1  ∂q1 ∂q1 ∂q1 
(4.8)
Ecuaciones idénticas se obtienen de igual manera para q 2 , q 3 ,.., q n . Es decir,
d  ∂T  ∂T
 − = Fq r
dt  ∂q r  ∂qr
(4.9)
en donde r=1,2,.., n y las fuerzas generalizadas Fq r , son
p
 ∂x ∂y ∂z 
Fq r = ∑  Fxi i + Fyi i + Fzi i 
i =1  ∂qr ∂qr ∂qr 
(4.10)
Nótese que (4.9) tiene exactamente la misma forma que (3.18).

7.3. Expresión de T en forma adecuada.


1 p
Aunque T = ∑
2 i =1
mi ( x i2 + y i2 + z i2 ) , en donde el marco de referencia es inercial y

existen 3p coordenadas rectangulares, puede considerarse como la expresión básica


de la energía cinética, su forma final a la cual se le aplicarán las ecuaciones de
Lagrange, debe ser expresada en función de q1 , q 2 ,…, q n , las coordenadas
generalizadas, sus derivadas con respecto’ al tiempo, y posiblemente t. Las etapas
requeridas para esto se han explicado e ilustrado en el numeral 2.7. Como se
demostró allí y en los ejemplos que siguen, con frecuencia resulta provechoso
expresar primero T en función de un número cualquiera de coordenadas adecuadas.
Luego, por medio de las ecuaciones de trasformación y de las ecuaciones de
restricción, puede ponerse en forma final excluyendo las coordenadas superfluas.

7.4. Significado físico de las tuerzas generalizadas.

178
Una vez más, como se indicó en el capítulo 3, une fuerza generalizada Fq r ,
correspondiente a la coordenada q r , es una magnitud (no siempre una fuerza en el
sentido usual de la palabra) tal que Fq r δ r , es el trabajo hecho por todas las fuerzas
aplicadas al incrementar únicamente q, (dejando constantes el tiempo y todas las
demás coordenadas) en una magnitud igual a + δq r . Sin embargo, en este caso más
general es importante caer en cuenta que para un sistema de p partículas con varias
restricciones, un incremento de sólo q r puede requerir un desplazamiento de varias o
de todas las partículas. Por consiguiente δWq r debe incluir el trabajo hecho por Las
fuerzas aplicadas a todas las partículas, que como resultado de + δq r cambiarían de
posición.
En prueba de las afirmaciones anteriores obsérvese que (4.3) es una expresión
general del trabajo cuando a todas las partículas se lea da un desplazamiento
infinitesimal arbitrario. Pero si se supone que sólo q, varia, (4.5) se reduce a
∂xi ∂y ∂z
δxi = δqr , δyi = i δqr , δzi = i δqr
∂qr ∂qr ∂qr
y por tanto, (4.3) se hace
p
 ∂x ∂y ∂z 
δWa r = ∑  Fxi i + Fyi i + Fzi i δqr
i =1  ∂qr ∂qr ∂qr 
que según (4.10) es, sencillamente, Fq r δ r , (Véase el ejemplo 4.1.)

Todas las fuerzas inerciales (véase el numeral 3.3 (d)) se han tenido en cuenta, en
el lado izquierdo de (4.9). Por las razones expuestas e ilustradas en la última parte del
capítulo 2, las fuerzas de restricción (para el caso de restricciones “lisas”) se anulan en
(4.l0). Por tanto, en los análisis de las técnicas y de los ejemplos que siguen, estas
fuerzas se ignoran.

7.5. Técnicas para hallar expresiones para las tuerzas generalizadas.

Expresiones para Fq r , pueden encontrarse por cualquiera de las técnicas que


siguen, las cuales pueden aplicaras a cualquier tipo de fuerzas aplicadas y son
básicamente iguales a las explicadas en el numeral 3.3(c). (En ningún caso se
incluyen fuerzas inerciales.)

(a)Puede aplicarse directamente la relación (4.10). Las componentes rectangulares


Fxi , Fy i , y Fz i , de la fuerza Fi que actúa en mi, deben determinarse a partir de las
fuerzas conocidas del sistema. Utilizando (4.4) pueden obtenerse las expresiones
explícitas para ∂xi / ∂qr , ∂yi / ∂qr y ∂zi / ∂qr . Con frecuencia este método resulta muy
monótono.

(b)Suponiendo que todas las restricciones móviles, o todos los marcos de referencia
móviles, o el conjunto de todos ellos, son estacionarios, y que todas las
coordenadas, excepto q, son constantes, se incrementa q r en una magnitud + δq r .

En seguida, estudiando el problema entre manos, se escribe una expresión del


trabajo, δWqr , hecho por todas las fuerzas aplicadas a las partículas que deben
cambiar de posición como resultado de + δq r . Usualmente esto puede hacerse

179
directamente, sin necesidad de utilizar las componentes rectangulares de la fuerza.
Entonces, por la relación
δWq r = Fq r δqr
(4.11)
puede obtenerse Fq r en seguida.
Al aplicar este método, con frecuencia resulta provechoso escribir primero δWqr , en
función de un número cualquiera de coordenadas y luego expresarlo en términos de
q1 , q 2 ,…, q n .

(c) Siguiendo el procedimiento descrito en (b), en muchos casos es posible e incluso


provechoso, escribir una expresión del trabajo total δWtotal , cuando varían
simultáneamente todas las coordenadas. Como puede notarse en (4.6) y en los
ejemplos que siguen, esto puede escribirse en la forma
δWtotal = [...]1δq1 + [...]2 δq2 + ... + [...]n δqn (4.12)
en donde los paréntesis cuadrados pueden ser constantes, pero usualmente son
funciones de las coordenadas, de la velocidad, del tiempo, etc. Resulta claro que el
paréntesis cuadrado […]r es sencillamente Fq r . Así, todas las fuerzas
generalizadas
pueden leerse directamente en (4.12).

Una observación adicional: Para un sistema que tenga por ejemplo, cuatro grados
de libertad, se hace que Fq1 , Fq2 , Fq3 y Fq4 indiquen las fuerzas generalizadas
correspondientes a q1 , q 2 , q3 y q 4 respectivamente. Supóngase ahora, que se inicia
'
de nuevo el problema remplazando a q 3 y q 4 por otras coordenadas diferentes q3 y
q 4' . Las fuerzas generalizadas quedan entonces Fq1 , Fq2 , Fq3' y Fq4' pero Fq1 y Fq2 del
segundo caso son en general, diferentes de Fq1 y Fq2 del primero, aunque
correspondan a las mismas coordenadas, (Véase el ejemplo 4.1.)
(Debe mencionarse aquí qué cuando las fuerzas son conservativas, usualmente es
más conveniente determinar Fqr a partir de la función de la energía potencial (véase el
capítulo 5). En muchos casos de fuerzas disipativas, el método de la “función de la
potencia” resulta beneficioso (véase el capitulo 6). Sin embargo, independientemente
del tipo de las fuerzas aplicadas, cualquiera de las técnicas (a), (b) o (c) pueden ser
utilizadas.)

7.6. Ejemplos ilustrativos de la aplicación de las ecuaciones de Lagrange a


sistemas que incluyen varias partículas.

Ejemplo 4.1. Un sistema de tres partículas.

Considérese la disposición que se muestra en la figura 4-1. Si se supone que sólo


puede haber movimiento vertical, el sistema tendrá dos grados de libertad. Entre las
distintas posibilidades, se toman y1 y y 2 como coordenadas. Ignorando las masas de
180
las poleas,
1 ° 2 1 °2 1 °2
T = m1 y 1 + m2 s 2 + m3 s 3
2 2 2

° ° ° ° ° °
Pero como puede verse fácilmente, s 2 = y − y y s 3 = y + y . Por tanto
1 2 1 2

1 ° 2 1 ° ° 1 ° °
T = m1 y 1 + m2 ( y 1 − y 2 ) 2 + m3 ( y 1 + y 2 ) 2
2 2 2
° °
Que incluye ahora a y y y , únicamente. (Nótese que y es una coordenada no
1 2 2
inercial.)
La ecuación del movimiento correspondiente a y , se obtiene como sigue:
1

∂T ° ° ° ° °

°
= m1 y 1 + m2 ( y 1 − y 2 ) + m3 ( y 1 + y 2 )
∂ y1
Y
d ∂T °° °°
∂T
( ° ) = (m1 + m2 + m3 ) y 1 + (m3 − m2 ) y 2 , =0
dt ∂ y ∂y 2
1

°° °°
Por tanto, (m + m + m ) y + (m − m ) y = F
1 2 3 1 3 2 2 y1

Para obtener una expresión de Fy1 se aplica la ecuación (4.11). Así se determina el
trabajo hecho por la, fuerzas impulsoras (la gravedad), despreciando las fuerzas de
restricción (tensiones en los hilos), cuando se incrementa y1 en una cantidad + ∂y1
(bajando ligeramente m1 ) y haciendo que y 2 permanezca constante. Se obtiene
∂W y1 = + m1 g∂y1 − (m2 + m3 ) g∂y1 . El segundo término de esta expresión se origina en
el hecho de que como y 2 permanece constante, es preciso levantar a m 2 y m3 en
una cantidad Igual a aquella en que se ha bajado a m1 . Por tanto
Fy1 = (m1 − m2 − m3 ) g y la ecuación del movimiento completa, correspondiente a y1 es

181
°° °°
(m1 + m2 + m3 ) y 1 + (m3 − m2 ) y 2 = (m1 − m2 − m3 ) g
(1)
Para obtener la ecuación del movimiento de y 2 se observa que
d ∂T °° °°
∂T
( ° ) = ( m 2 − m3 ) y 2 + ( m3 − m 2 ) y 1 y =0
dt ∂ y ∂y 2
2

Se obtiene una expresión para Fy2 haciendo que y 2 aumente en una cantidad
+ ∂y 2 con y1 constante. Es claro que el trabajo ejercido por la gravedad es de
°°
∂W y2 = (m2 − m3 ) g∂ y 2 = Fy2 ∂y 2 . Por último, la ecuación del movimiento de y 2 tendrá
la forma
°° °°
( m 2 + m3 ) y 2 + ( m 3 − m 2 ) y 1 = ( m 2 − m3 ) g
(2)
°°
Las relaciones (1) y (2) pueden solucionarse simultáneamente para obtener y y
1
°°
y 2 y las ecuaciones resultantes pueden integrarse en seguida.
Como sencillo ejemplo de (4.12), nótese que
∂Wtotal = (m1∂y1 − m2 ∂s 2 − m3 ∂s3 ) g
(3)
Pero ∂s 2 = ∂y1 − ∂y 2 y ∂s3 = ∂y1 + ∂y 2 . Por tanto, eliminando ∂s 2 y ∂s3 .

∂Wtotal = (m1 − m2 − m3 ) g∂y1 + (m2 − m3 ) g∂y 2


En donde pueden leerse directamente Fy1 y Fy2 .
Como extensión de este ejemplo, úsense como coordenadas y1 y s 2 . Como
s 2 + s3 − 2 y1 =
1 ° 2 1 °2 1 ° °
constante, ° ° ° . Entonces, T = m1 y 1 + m2 s 2 + m3 ( 2 y1 − s 2 ) 2
s 3 = 2 y1 − s2 2 2 2
de donde
°° °°
(m1 + 4m2 ) y 1 − 2m3 s 2 = Fy1
(4)
°° °°
(m2 + m3 ) s 2 − 2m3 y 1 = Fs2
(5)

Para encontrar Fy1 se hace que s 2 permanezca constante (no se permite que m 2
cambie de posición) y se supone que y1 se incremente a y1 + ∂y1 ( m1 se mueve
ligeramente hacia abajo). Pero como puede verse, por simple inspección, esto
requiere un desplazamiento hacia arriba de m3 en una magnitud igual a 2∂y1 . Por
consiguiente,
∂W y1 = + m1 g∂y1 − 2m3 g∂y1 o sea que Fy1 = ( m1 − 2m3 ) g
(Nótese que las expresiones de Fy1 en (1) y es (4) no son iguales.) En forma

182
semejante, se
sigue que Fy 2 = (m3 − m2 ) g
Empleando (4.12), se puede usar (3) de nuevo. Eliminando ∂s 3 por medio de
∂s3 = 2∂y1 − ∂s 2 ,
∂Wtotal = (m1 − 2m3 ) g∂y1 + (m3 − m2 ) g∂s 2
obteniendo así, de nuevo, la, mismas expresiones para Fy1 y Fs2 .
Debe observarse que cuando una de la n coordenada vería, dejando fijas las otras,
las demás coordenadas que no entran en el problema, pueden, naturalmente, variar.
Por ejemplo pare encontrar Fy1 (véase la primera parte del ejemplo anterior) se dejó
fijo a y 2 y se hizo variar y1 . Al hacer esto s1 , s 2 y s 3 variaron.

Ejemplo 4.2. Énfasis adicional sobre las fuerzas generalizadas.


En la figura 4-2, despréciense las masas de las poleas. Supóngase únicamente
movimiento vertical y ténganse en cuenta las fuerzas que actúan externamente
f 1 ,..., f 5 y la gravedad. Por ejemplo, nótese que para un desplazamiento + ∂q1
(dejando fijas todas las demás coordenadas), m1 se mueve hacia abajo una distancia
∂q1 y m5 se mueve hacia arriba una distancia igual a 4∂q1 . Siguiendo este
razonamiento.

Fq1 = (m1 g + f 1 ) − 4(m5 g + f 5 )


Fq 2 = m2 g + f 2 − (m3 g + f 3 )
Fq3 = −(m2 + m3 ) g − f 2 − f 3 + 2(m3 g + f 3 )
Fq 4 = m5 g + f 5 − ( m4 g + f 4 )
Usando ahora como coordenadas q1 , q 2 , s y q 4 demuéstrese que
Fq1 = m1 g + f 1 − (m2 g + m3 g + f 2 + f 3 ) − 2(m5 g + f 5 )
Fs = (m2 + m3 ) g + f 2 + f 3 − 2(m5 g + f 5 )
Fq 2 y Fq 4 son iguales a las anteriores, sin embargo nótese la diferencia en la forma
de Fq1 en los dos casos.
En general la expresión Fq r depende de cuales son las otras coordenadas
empleadas.
Ejemplo 4.3.- movimiento de una palanqueta en un plano vertical

183
Las partículas de masas m1 y m 2 que se muestran en la figura 4-3 están
adheridas rígidamente a una varilla ligera y pueden moverse libremente en el plano
XY, bajo la acción de la gravedad. Suponiendo que no hay rotación alrededor del eje
de la varilla, y aplicando el teorema del centro de masa, se escribe
m1 + m3 °3 °2 I °
T= (x + y ) + θ 3
2 2
En donde (x, y) son las coordenadas del centro de masa, I es el momento de inercia
de la el centro de masa y es perpendicular a la varilla, y θ es el ángulo señalado.
Como el sistema tiene tres grados de libertad, y x, y y θ son coordenadas adecuadas,
T tiene ya la forma apropiada.
Aplicando las ecuaciones de Lagrange, se concluye inmediatamente que
°° °° °°
(m1 m2 ) x = Fs (m1 + m2 ) y = Fy I θ = Fθ
Dejando constantes a y y θ y aumentando x a x + ∂x , resulta claro que el trabajo
hecho por la gravedad ∂Ws = 0 . Por tanto Fs = 0 . En forma semejante,
Fy = −(m1 + m2 ) g y Fθ = 0 . Por consiguiente, las ecuaciones del movimiento, en
forma final son
°° °° °°
x = 0 , y = −g , θ = 0
Esto quiere decir que el centro de masa tiene el sencillo movimiento de un proyectil
(despreciando la resistencia del aire) y que la palanqueta gira con velocidad angular
°
constante θ .

Ejemplo 4.3A. Extensión del ejemplo 4,3.


Se trata de plantear las ecuaciones del movimiento de la palanqueta usando como
°
° °
coordenadas x1 , y1 y θ . Puede escribirse T como T = 1 m ( x 2 + y 2 ) + 1 m ( x 2 + y 2 )
1 1 1 2 1 1
2 2
. Pero se observa que x 2 = x1 + I cos θ y que y 2 = y1 + Isenθ . Derivando estas
° °
relaciones y eliminando x s y y s se obtiene

m1 + m2 °2 ° 2 m3 3 °3 ° ° ° °
T= ( x1 + y 1 ) + ( I θ − 2 I x 1 θ senθ + 2 I y 1 θ cos θ )
2 2
Aplicando les ecuaciones de Lagrange se obtienen los siguientes resultados:
°° °° °
(m1 + m2 ) x1 − m2 I θ senθ − m3 I θ 3 cos θ = Fs1

184
°° °° °
(m1 + m2 ) y1 + m2 I θ senθ − m3 I θ 3 cos θ = Fy1
°° °° °°
m3 ( I 2 θ − I x1 senθ + I y1 cos θ ) = Fθ
De aquí se sigue fácilmente que Fx1 = 0 , Fy1 = −(m1 + m2 ) g y Fθ = −m 2 gl cos θ .
Es Importante notar que al cambiar las coordenadas, la forma de las ecuaciones del
movimiento puede variar mucho. Además, aún cuando algunas da las coordenadas se
conserven ( θ en este caso), las fuerzas generalizadas cambian, como e. demostró en
el ejemplo 4.2.

Ejemplo 4.4. Péndulo con soporte deslizante.

El péndulo de la figura 4.4 está suspendido de un bloque de masa m 1 que puede


deslizarse libremente sin fricción a lo largo del eje horizontal X. Si se supone que r es
constante y que todo el movimiento está confinado al plano XY, el sistema tiene dos
grados de libertad. Se usaran como coordenadas x1 y θ . Iniciando con las
coordenadas x1 , x 2 y y 2 se ve que
°
° °
1 1
T = m1 x1 + m2 ( x 22 + y 22 )
2

2 2
° °
Pero x 2 = x1 + rsenθ y y 2 = r cos θ .Eliminando x 2 y y de T , se obtiene finalmente
2

° ° °
1 1 ° °
T = m1 x1 + m2 ( x1 + 2r x 1 θ cos θ + r θ 2 )
2 2 2

2 2
° °° °°
°° °°
de donde y m r x cos θ + m r 2 θ = F ° .
(m1 + m2 ) x 1 + m3 r θ cos θ − m2 r θ senθ = Fs1 2
2 1 2 θ

En la forma usual, se encuentra Fs = 0 y Fθ = − m2 grsenθ , y así se completan las


ecuaciones del movimiento.
Si se supone que el movimiento es de tal naturaleza que θ es siempre una
cantidad bien pequeña, puede reemplazarse cos θ en T por la unidad, senθ en Fθ
°
por θ y puede despreciarse el término en θ 2 . Las ecuaciones del movimiento se
convierten entonces en
°° °°
(m1 + m2 ) x 1 + m2 r θ = 0
°° °°
m2 r x1 + m2 r 2 θ = − m2 grθ

185
La primera ecuación puede integrarse en forma directa. Eliminando °° de la segunda
x1
ecuación por medio de la primera, se obtiene una forma fácilmente integrable. Los
resultados finales son

m2 r θ
x1 + = C1t + C 32 y θ = Asen(ϖ .t + δ )
m1 + m2
en donde C1 , C 2 , A y δ 2 son cantidades arbitrarias que se determinan por las
condiciones
(m1 + m2 ) g
iniciales específicas, y ϖ = . Supóngase que cuando
rm1
° ° ° °
t = 0, x1 = x0 , x1 = xθ1 , θ = θ 0 y θ = θ θ . Sustituyendo estas condiciones en las formas
Integradas, se obtienen cuatro ecuaciones de las cuales se deduce que
° m2 r ° m2 r
C1 = x 0 + = θθ C 2 = x0 + = θθ
m1 + m2 m1 + m2
°
° θθϖ
θ 2θ y tan δ = °
A = θ 02 + 2 θθ
ϖ
con lo cual se ilustra al método general para determinar las constantes de integración
a partir de las condiciones iniciales dadas.

Ejemplo 4.5. Las masas de la figuro 4-5 se mueven verticalmente bajo la


acción de la gravedad y los resortes.

Aplicando el teorema del numeral 2.10, se ve que

m1 + m2 + m3 °2 m1 ° 2 m2 °2 m3 °2
T =( )y + q1 + q2 + q3
2 2 2 2
Pero por la definición del centro de masa, m1 q1 = m 2 q 2 + m3 q3. Derivando esto y
° ° ° °
eliminando q de T1 , se tiene T = M y 2 + m1 ( m2 q3 + m3 q 3 y 2 ) 2 + m2 q32 + m3 q32
° ° °

1
2 2 m1 m1 2 2
en donde m = m1 + m 2 + m3 . Como el sistema tiene tres grados de libertad y como
186
y1 , q 2 y q3 son coordenadas adecuadas, se concluye que la segunda forma de T no
contiene coordenadas superfluas.
Al aplicar las ecuaciones de Lagrange se obtienen fácilmente las siguientes
ecuaciones del movimiento:
°°
m2 m m °°
(m1 + m2 ) q 2 + 2 3 q3 = Fq 2 ,
m1 m1

m2 m3 °° m3 (m1 + m2 ) °° °°
q3 + q3 = Fq3 , M y = Fy
m1 m1
Lo que sigue es una clara demostración de la naturaleza de las fuerzas
generalizadas y de la técnica de hallar sus expresiones. Por Inspección se demuestra
que para un desplazamiento general de todo el sistema (véase las ecuaciones (4.12),

δWtotal = −k1 (q1 + q 2 − I 1 )(δq1 + δq 2 ) − k 2 (q3 + q 2 − I 1 )(δq3 − δq 2 ) − Mgδy

en donde k1 y k 2 son las constantes elástica, y I 1 y I 2 son las longitudes normales


(sin estirar) de los resortes superior e inferior, respectivamente. Utilizando una vez más
m2 m
la relación del centro de masa δq1 = δq 2 + 3 δq3 y eliminando q1 y δq1 .
m1 m1
 − k (m + m2 ) m1 + m2 m 
δWtotal =  1 1 ( q 2 + 3 q3 − I 1 ) + k 2 (q 3 − q 2 − I 2 ) δq 2
 m1 m1 m1 
 − k m m + m2 m 
+ 1 3 ( 1 q2 + 3 q3 − I1 ) − k3 (q3 − q3 − I 3 )δq3 − Mgδy
 m1 m1 m1 

Esta ecuación tiene la forma de (4.12) y por tanto resulta claro que los coeficientes
de δq 2 , δq3 y δ . y fuerzas generalizadas Fq 2 , Fq3 y Fy respectivamente. Así se han
completado las ecuaciones del movimiento.
(Véase el problema 4.5.)

A manera de extensión del ejemplo, se determinan a continuación las fuerzas


generalizadas por aplicación directa de (4.10) que, para este sistema, toma la forma
∂y1 ∂y ∂y
Fq r = Fy1 + Fy 2 2 + Fy 3 3
∂q r ∂q r ∂q r
en donde q r puede representar a y1 a q 2 o a q3 . Fy1 es la fuerza vertical total que
actúa sobre m1 , etc. Por inspección de la figura se demuestra que (como
m m
q1 = 2 q 2 + 3 q3 )
m1 m1
m m 
Fy1 = m1 g − k1  2 q 2 + 3 q3 + q 2 − I 1 
 m1 m1 
m m 
Fy 2 = m2 g − k1  2 q3 + 3 q3 + q3 − I 1  − k 2 ( q3 − q 2 − I 1 )
 m1 m1 

187
Fy 3 = m3 g − k 2 ( q3 − q 2 − I 1 )
m2 m
Por otra parte y1 = y + q 2 + 3 q3 , y 2 = y − q2 , y 3 = y − q3
m1 m1

∂y1 ∂y ∂y
Entonces, por ejemplo Fq 2 está dada por Fq 2 = Fy1 + Fy 2 2 + Fy 3 3
∂q 2 ∂q 2 ∂q 2
∂y1 m2 ∂y 2 ∂y 3
Pero = , = −1 y = 0 . Así, esta relación se reduce fácilmente a la
∂q 2 m1 ∂q 2 ∂q 2
hallada anteriormente para Fq3 y Fy pueden obtenerse en seguida.
La ecuación del movimiento correspondiente a y demuestra que el centro de masa
cae con una aceleración constante g . Las otras dos ecuaciones se integran
fácilmente y pueden ser puestas en la forma
°° °°
a11 q 2 + b11 q 2 + a12 q 3 + b12 q 3 = A
°° °°
a 21 q 2 + b21 q 2 + a 23 q 3 + b22 q 3 = B
en donde A, B, las a y las b, son constantes. Aquí no se continúa el estudio de estas
ecuaciones ya que en el capitulo 10 se tratan en detalle los métodos de integración
aplicables a estas formas.

Ejemplo 4.6. El péndulo doble de la figura 2.10.

Supóngase que los hilos que sostienen las masas son inextensibles y que el
movimiento está confinado a un plano. La expresión (2.42) se reduce a
m1 2 °2 m2  2 °2 2 °2 
°
°
T= r1 θ + r θ + r φ + 2 r r θ φ cos( φ − θ ) 
2 2  1 2 1 2 
 

∂T ° ° °
De donde °
= m1 r12 θ + m2 r12 θ + m2 r1 r2 φ cos(φ − θ )
∂θ

∂  ∂T °° °° ° ° °
 = (m + m )r 2 θ + m r r φ cos(φ − θ ) − m r r φ (φ + θ ) sen(φ − θ )
∂t  ∂ θ°
 1 2 1 2 1 2 2 1 2

∂T ° °
Asimismo, °
= m 2 r1 r3 θ φ sen(φ − θ )
∂θ
°° °° °
(m1 + m2 ) r12 θ + m2 r1 r2 φ cos(φ − θ ) − m2 r1 r2 φ 2 sen(φ − θ ) = Fθ
En forma semejante la ecuación correspondiente φ es
°
°° °° °2
m2 r22 θ + m3 r1 r2 φ cos(φ − θ ) + m2 r1 r2 φ sen(φ − θ ) = Fφ
Para hallar Fθ supóngase que se incremente el ángulo θ en una cantidad igual a
+ δθ , dejando constante φ .

188
Esto significa que las dos masas deben ser elevadas ligeramente. Por tanto,
δW = −(m1 + m2 ) gr1 senθδθθ y Fθ = −(m1 + m2 ) gr1 senθ

Con θ fijo, la masa m1 no mueve y δWφ = −m 2 gr2 senφδθ , de donde


Fφ = −m2 gr2 senφ . Así, se tienen las ecuaciones del movimiento completas. Si el
movimiento es muy pequeño ( θ y φ sIempre pequeños) estas ecuaciones del
movimiento se reducen a la misma forma de las del ejemplo 4,5. y por consiguiente
pueden integrarse. (Véase el capitulo 10.)

Ejemplo 4.7. Un sistema que se mueve con aceleración lineal constante (Fig. 4.1).
El punto de apoyo del sistema de poleas de la figura 4-1 se mueve hacia arriba con
aceleración constante a
2
° °
1 ° ° 1 1
T = m1 ( I − y 1 ) + m2 s 22 + m3 s32
2 2 2
° °
En donde I = at , °
y ° ° °
por tanto,
y 2 + s 2 − y1 = at s2 = 2 y2 + s2
2
2 2
1 ° 1  ° °
 1  ° °

T = m1 ( at − y 1 ) + m2  at + y 1 − y 2  + m3  at + y 1 − y 2 
2 2   2  
Y entonces las ecuaciones del movimiento serán
°° °°
(m1 + m2 + m3 ) y1 + ( m3 − m2 ) y 2 + ( m2 + m3 − m1 )a = Fy1
°° °°
(m3 − m1 ) y1 + (m2 + m3 ) y 3 + (m3 − m2 )a = Fy 2
Como para determinar las fuerzas generalizadas se deja fijo el tiempo Y
Fy1 = ( m1 − m2 − m3 ) g y Fy 2 = (m2 − m3 ) g tal como en el ejemplo 4.1. En realidad,
en el caso de este sencillo ejemplo de aceleración lineal constante, las ecuaciones del
movimiento son las mismas excepto que. Efectivamente, g se ha aumentado a g + a.
Como extensión de lo anterior, el estudiante puede escribir fácilmente las
ecuaciones del movimiento suponiendo que h varía de cualquier forma determinada,
con respecto al tiempo. (Véase el problema 4.16.)

Ejemplo 4.5. Un sistema que se mueve con rotación y aceleración lineal.

Considérese el sistema que se muestra en la figura 4.6. Un pequeño tubo que


contiene las masas m1 y m 2 conectadas por medio de resortes, está montado
formando un ángulo α sobre una plataforma giratoria. El plano vertical que pasa por el
centro del tubo pasa también por el eje de rotación de la plataforma. El conjunto está
montado en un elevador que se mueve con aceleración hacia arriba α . Obtendremos
las ecuaciones del movimiento de m1 y m 2 en función de las coordenadas q1 y q 2 .

189
En coordenadas cilíndricas, fijas a la superficie de la Tierra y supuestas inerciales
° ° ° ° ° ° °
1 1
T= m1 ( r12 + r12 θ12 + z12 ) + m2 (r32 + r32 θ 2 + z 22 )
2 2
Tomando el origen de estas coordenadas en el centro de rotación del disco, se ve que
1
r1 = s + q1 cos α , θ1 = ϖ .t , z1 = q1 senα + α .t 2 ,
2
1
r2 = s + q 2 cos α , θ 2 = ϖ .t , z 2 = q 2 senα + α .t 2 ,
2
Por medio de estas relaciones puede expresarme T fácilmente como
 
1  °2
( )
°
2 2 
T = m1 q1 + 2 q1α t senα + s + q1 cos α ) ϖ + α t2 2

2  
 
 
 ° 
1
( )
°
+ m2 q 22 + 2 q 2 α t senα + s + q 2 cos α ) 2 ϖ 2 + α 2 t 2 
2  
 
Las únicas coordenadas que aparecen en T son q1 y q 2 y debe observarte
además que t aparece en forma explicita.

Al aplicar las ecuaciones de Lagrange, se obtiene


 °° 
m1  q1 + αsenα  − m1ϖ 2 ( s + q1 cos α ) cos α = Fq1
 
 °°

m2  q 2 + αsenα  − m2ϖ 3 ( s + q 2 cos α ) cos α = Fq 2
 
Ignorando el movimiento del sistema, el trabajo hacho por la gravedad al
Incrementar ligeramente a q1 únicamente, es
∂Wq1 = −m1 gsenαδq1 − k1 (q1 − I 1 )δq1 + k 2 ( q 2 − q1 − I 2 )δq1
En donde I 1 y I 2 representan las longitudes normales de los resortes primero y
segundo respectivamente. Así
Fq1 = −m1 gsenα − (k1 + k 2 )q1 + k 2 q 2 + k1 I 1 − k 2 I 2
En forma similar
Fq 2 = −m2 gsenα − ( k 2 + k 3 )q 2 + k 2 q1 + k 2 I 2 + k 2 ( I 1 I 2 )
Con esto se completan las ecuaciones del movimiento. Por Inspección puede
demostrarse que la aceleración del elevador tiene el efecto de Incrementar a g en una
magnitud Igual a α .
190
Ejemplo 4.9. Ecuaciones del movimiento cuando partes de un sistema se obligan
a moverse de una manera determinada.

Con lo que sigue se ilustra un tipo de problema que algunas veces se encuentra en
la práctica.
Se supone que en el sistema de la figura 4.1 se ha introducido un mecanismo
adherido al piso que ejerce una tuerza variable sobre m 2 de tal manera que s 2 varía
con el tiempo, de una manera determinada. Se trata de determinar la ecuación del
movimiento para el resto del sistema, despreciando las masas de las poleas.
Debido a este movimiento forzado (es decir, como s 2 una función conocida del
tiempo) y suponiendo movimiento vertical únicamente, el sistema tiene ahora sólo un
grado de libertad. Bien y1 o y 2 pueden servir como coordenada adecuada, y
suponiendo que los hilos están siempre tensos, s1 + y 2 + s 2 = C1 y s1 + y1 = C 2 .
° ° °
Por tanto
y 2 = y 1 + s 2 . Así pues se escribe,
 
1 °
1 °
1  ° °

T = m1 y1 + m2 s 2 + m3  2 y1 − s
2 2

2 2 2  
 
A fin de hacer el ejemplo más específico, se supone que la fuerza aplicada a m 2 es

tal que s = s + A senωt , en donde s a. es une constante; en tal caso,


2 0 0

° °
1 1 1
T= m1 y12 + m2 A 2ω 2 cos 2 ωt + m3 ( 2 y1 − Aω cos ω.t ) 2
2 2 2
y la ecuación del movimiento será
°°
(m1 + 4m3 ) y1 + 2m3 Aω 2 senωt = Fy1
(Nótese que no es necesario conservar el segundo término de T por ser función t
solamente.) Al aplicar la ecuación ∂Wy1 = Fy1δy1 dejando a t constante, se encuentra
Fy1 = ( m1 − 2m3 ) g . Con esto se completa la ecuación del movimiento. Se observa
que Fy1 aquí, no es igual a la del ejemplo 4.1.
A manera de ejemplo adicional considérese el sistema de la figura 2-15, que tiene
cuatro grados da libertad.
Supóngase ahora que una fuerza exterior que actúa sobre el eje de la polea
superior hace que s1 varíe de una manera determinada; y otra que actúa sobre m 2 le
imprime otro movimiento conocido. El sistema tiene ahora sólo dos grados de libertad,
y suponiendo que los hilos se conservan tensos, puede escribirse T en función de
° °
s 2 , s3 y t , por ejemplo. (Véase el problema 4.19.)

7.7. Fuerzas y movimientos de las partículas cargadas en un campo


electromagnético.
Constituye una rama importante de la dinámica, el estudio del movimiento de las
partículas cargadas y las masas, a través de campos eléctricos y magnéticos. Sin
embargo salvo en el caso especial de sistemas de coordenadas inerciales y
velocidades relativamente bajas (que supondremos a continuación) el problema debe
resolverse por métodos relativísticos. Este tema constituiría por si mismo un capitulo
de buen tamaño.
191
Con las suposiciones anteriores, las componentes rectangulares de la fuerza sobre
° ° °
una partícula con carga Q, que se mueve con velocidad ( x, y, z ) a través de un
espacio en donde
Existe un campo eléctrico E, de componentes ( E x , E y , E z ) y un campo magnético

B( B x , B y , B z ) están dadas por


° ° ° ° ° °
Fx = QE x + Q( y B z − z B y ) ; Fy = QE y + Q( z B z − x B z ) ; Fz = QE z + Q( x B y − y B z )
(4.13)
en donde E y B pueden ser funciones de las coordenadas y del tiempo.
Utilizando estas expresiones de Fx , Fy , Fz ) en (4.10), el procedimiento para
plantear las ecuaciones del movimiento es tal como se ha hecho en-los ejemplos
anteriores.

Ejemplo 4.10. Ecuaciones del movimiento de una palanqueta cargada en un


espacio con campo eléctrico y magnético.
Las pequeñas esferas de la figura 4-3 portan cargas − Q1 y + Q2 respectivamente,
distribuidas uniformemente. Supóngase un campo magnético en la dirección del eje Z
y un campo eléctrico E, en la dirección de X, siendo ambos uniformes en el plano XY.
Al moverse la palanqueta, m1 sufre la acción de una fuerza.
° °
Fs1 = −Q1 E − Q1 B y1 , Fy1 = Q1 B x1

Y algo semejante para m 2 . Por tanto para un desplazamiento virtual general,

° ° ° °
δWtotal = −(Q1 E + Q1 B y1 )δx1 + Q1 B x1 δy1 + (Q2 E + Q2 B y 2 )δx 2 − Q3 B x3 δy 3
Tomando a x, y y θ como coordenadas generalizadas (véase el ejemplo 4.3) por las
° ° °
relaciones x1 = x − I 1 cos θ y1 = y − I 1 senθ , etc. se concluye que x = x − I θ senθ
1 1

δx1 = δx + I 1 senθδθ , etc. Por tanto, la expresión anterior puede escribirse finalmente
como
° °
δWtotal = [(Q2 − Q1 ) E + (Q3 − Q1 ) y + B(Q2 I 2 + Q1 I 1 ) θ cos θ ]δx
° °
+ [ B (Q1 − Q2 ) x + B (Q1 I 1 + Q2 I 2 ) θ senθ ] δy
° °
− (Q1 I 1 + Q2 I 2 ) [ E senθ + B ( x cos θ + y senθ )]δy
en donde pueden leerse directamente las expresiones de las fuerzas generalizadas.
(Ya que tiene la forma de (4.12).) T , y por tanto las ecuaciones del movimiento, tienen
exactamente las mismas formas que en el ejemplo 4.3. (Véase el problema 4.20)

7.8. Consideraciones sobre el significado físico de las ecuaciones de


Lagrange.
Las observaciones del numeral 3.10 relacionadas con una sola partícula se extienden
a continuación para un sistema de p partículas.

192
Supóngase que en las ecuaciones (4.4) t y todas las coordenadas, menos q r se
conservan constantes. Entonces, estas ecuaciones se convierten en
x1 = x1 (q r ) , y1 = y1 (q r ) , z1 = z1 (q r )
(4.14)
Como x1 , y1 y z1 son las coordenadas rectangulares de la partícula individual m1 ,
existirá un conjunto de tales ecuaciones para cada una de las p partículas. Es decir,
que (4.14) representa p conjuntos de ecuaciones.
Si se permite que q r varíe y se hace la gráfica de las coordenadas x1 , y1 y z1
(4.14), -de una cualquiera de las partículas m1 se obtiene una curva (en general, una
curva en el espacio tridimensional) que representa una trayectoria posible para m1 de
conformidad con las restricciones: Nos referiremos a esta curva como a la línea de q r
para m1 . Es claro que la localización y forma de tal curva depende de los valores
constantes asignados a t y a las demás coordenadas, así como de la naturaleza de
las restricciones. En este sentido puede existir un número ilimitado de líneas de q r
para una partícula cualquiera. Pero en un instante determinado y para ciertos valores
dados a las demás coordenadas, puede trazarse una línea específica de q r relativa al
sistema de ejes X, Y, Z. De la misma manera las líneas de q r pueden trazarse para
cada una de las partículas.

Las ideas anteriores no presentan ninguna dificultad puesto que se refieren a líneas
y superficies tridimensionales comunes. Como un ejemplo sencillo, considérese el
péndulo doble de la figura 2.10. Las ecuaciones (2.13) corresponden a (4.4). Las
líneas de θ para m1 y para m 2 pueden trazaras en el plano .XY para diversos valores
constantes de φ . En la misma forma pueden trazarse las líneas de φ para m 2 . (No
existen líneas de φ para m1 .) (Véase el ejemplo 4.11.)

El significado anterior de las líneas de q r cumple un útil propósito en lo que sigue


Designando por δs1r al desplazamiento lineal de m1 a lo largo de una línea de q r , se
observa que sus componentes δx1 , δy1 y ∂z1 son justamente los desplazamientos
virtuales considerados en las ecuaciones (4.2), (4.3), etc. Los cosenos directores,
I 1r , m1r y n1r de la tangente a la línea de q r en cualquier punto, están dados por.
δx1 δy1 δz1
I 1r = , m1r = , n1r =
δs1 r δs1 r δs1 r
(4.15)
1
en donde el elemento de trayectoria es δs1r = (δx12 + δy12 + δz12 ) 2 . (Nótese que δs1r
es exactamente el mismo desplazamiento (lineal) que se supuso dado a m1 con el
objeto determinar δWq r en la ecuación (4.11).) ,Pero por (4.4), con t y todas las q
δx1
fijas excepto q r , δx1 = δq r , etc. Así pues,
δq r
1
 δx  2  δy  2  δz  2  2
δs1r =  1  +  1  +  1   δq r = h1r δq r
 δqr   δqr   δqr  
(4.16)

193
1 δx1 1 δy1 1 δz1
Finalmente I 1r = , m1r = , n1r = 1
h1r δq r h1r δq r h1r δq r
(4.17)
Como la componente v ' de un vector v en la dirección de una recta con cosenos
directores I , m y n está dada por v ' = Iv x + mv y + nv z , se deduce que f ir , la
componente de la fuerza aplicada F1 que actúa sobre m1 según la tangente a su línea
de q r es
1  δx δy δz 
f ir =  Fxi 1 + Fy i 1 + Fz i 1 
h1r  δqr δqr δqr 
(4.18)
En igual forma, la componente air de la aceleración ai de la partícula m1 en la
dirección de la misma tangente es,
1  °° δx1 °° δy1 °° δz1 
air =  xi + yi + zi 
h1r  δqr δqr δqr 
(4.19)

Ahora, multiplicando y dividiendo los dos lados de (4.7), (habiendo remplazado a


δq1 por δq r ), por hir y utilizando la relación δsir = hir δq r , se observa que las
ecuaciones de Lagrange pueden escribirse como
p p

∑ miα ir δsir = ∑ f ir δsir = Fqr δq r


i =1 i =1
(4.20)
Teniendo en cuenta el sencillo significado de air , f ir y δs ir , se observa con claridad
una simple interpretación física y geométrica de las ecuaciones de Lagrange, por
medio de (4.20).
Por otra parte, nótese que, como puede verse en (4.19), una expresión de air , la
aceleración lineal de m1 en la dirección de su línea de q r , puede obtenerse en forma
inmediata a partir de
   
1  ∂  δT1  δT1 
m1α ir =  − ° 
hir  ∂t  δ q°
  r  δ qr 
(4.21)

° ° °
1
en donde T1 = m1 ( x1 + y1 + z12 ) se expresa en coordenadas generalizadas por
2 2

2
medio de las ecuaciones (4.4).

Ejemplo 4.11.
Considere el sistema que se muestra en la figura 4-7. Las partículas de masas m1 y
m2 están suspendidas de los extremos de un hilo que pasa por los pequeños anillos
lisos en a y en b . La masa m1 puede moverse en contacto con el cono C1 en tanto
que m 2 debe moverse únicamente en contacto con el plano vertical P (por la acción
de dos superficies planas, paralelas y lisas que no se muestran en el dibujo). El cono

194
está fijo, pero el plano P se hace oscilar alrededor del eje vertical B , según
α = Asenω.t , en donde α se mide a partir del eje X.

Como r1 + r2 = c = constante y θ 1 = constante, el sistema tiene trae grado, de


libertad. De acuerdo con la notación general, se escribe q1 = r1 , q 2 = φ y q3 = ϑ2 . En
función de estas coordenadas, las ecuaciones (4.4), como puede verse fácilmente en
la figura, tienen la forma, para m1 ,
x1 = q1 cos q 2 senθ1 , y1 = q1 cos q 2 senθ1 , z1 = k + q1 cos θ1

Para m 2
x 2 = [ I + ( c − q1 ) senq3 ] cos( Asenω.t ) ,
y 2 = [ I + ( c − q1 ) senq3 ] sen( Asenω.t ) ,
z 2 = h − (c − q1 ) cos q3
Nótese que en este ejemplo en particular no todas las coordenadas aparecen en
todas las ecuaciones de (1) y (2).
Al hacer variar a q1 y trazar las relaciones (1) y (2) pera diferentes valores
constantes de q 2 , q3 y t , se obtienen las líneas de q1 de m1 (recta, sobre el cono) y
las líneas de q1 de m 2 (rectas radiales sobre P). En forma semejante se obtienen las
líneas de q 2 de m1 y las de q3 de m 2 . Como q 3 no aparece en (I ) no existen las
líneas de q 3 para m1 . Asimismo, es evidente que no hay líneas de q 2 para m 2 .
Nótese, que a11 es la componente de la aceleración lineal de m1 a lo largo de una de
sus líneas de q1 sobre el cono, y que a 21 es la aceleración de m 2 a lo largo de su
línea de q1 en P . Asimismo, a 23 , por ejemplo, es la aceleración de m 2 en la dirección
de la línea de q 3 en el plano P . Las expresiones de estas aceleraciones pueden
encontrarse aplicando (4.21) a

 
 ° 
1 °
1  ° °

T = m1  q12 + q12 q 22 sen 2θ1  + m2 q12 + ( c − q1 ) q32 + ( I + ( c − q1 ) senq3 ) A 2ω 2 cos 2 ω.t 
2 2

2   2  
 
 

7.9. Experimento sugerido.

195
Determinación de las frecuencias del movimiento del sistema de “dos partículas”
que se muestra en la figura 4.8.

El equipo necesario es sencillo y los resultados obtenidos son interesantes. Los


valores de las masas y de las constantes eléctricas no tienen características críticas;
los que se muestran en el diagrama son solamente sugeridos.
Suponiendo movimiento vertical únicamente y utilizando como coordenadas a q1 y
q 2 que indican los desplazamientos verticales de m1 y m2 de sus posiciones de
equilibrio, se plantean las ecuaciones del movimiento. Estas ecuaciones de segundo
orden con coeficientes constantes pueden integrarse fácilmente por medio de métodos
comunes. Las soluciones mostrarán que al iniciar el movimiento de alguna manera
arbitraria, cada una de las masas sufrirá la combinación de dos movimientos
armónicos simples de diferentes frecuencias f 1 y f 2 . (Las dos masas oscilan con las
mismas frecuencias pero con diferentes amplitudes.)
Para obtener una comprobación experimental de las frecuencias calculadas, se
procede de la siguiente manera: Aplicando un movimiento oscilatorio a m1 (o a m 2 )
con la mano, luego de cierta práctica, es posible excitar bien f 1 o f 2 o f, únicamente.
Se aseguran los buenos resultados si se tiene en cuenta que cuando la frecuencia
aplicada es aproximadamente igual a f 1 o a f 2 , se requiere muy poco esfuerzo para
logar oscilaciones grandes. Al retirar la mano, el sistema continúa oscilando en uno de
sus modos naturales. El tiempo cubierto por cincuenta oscilaciones, determinado con
un cronómetro confiable, produce un buen valor experimental de la frecuencia. Cuando
se ha logrado suficiente precisión en las mediciones de m1 , m 2 , k1 y k 2 , los valores
experimentales y calculados para f 1 y f 2 concuerda estrechamente.
Por observación directa es fácil hacer una comprobación cuantitativa de las
amplitudes relativas del movimiento de m1 y m 2 para f 1 , o para f 2 .
Es posible lograr una comprensión adicional considerable sobre el comportamiento
de los sistemas oscilantes al observar m1 y m 2 luego de haber iniciado el movimiento
de alguna manera arbitraria, de modo que las dos frecuencias resulten incitadas
simultáneamente.

196

You might also like