Professional Documents
Culture Documents
EN CIENCIAS ECONÓMICAS Y
FINANCIERAS
3
En efecto, al realizar las moléculas el movimiento desordenado, de cuando en
cuando se acercan a las paredes de la vasija o a la superficie de otros cuerpos a una
distancia bastante pequeña. Del mismo modo, las moléculas también se pueden
aproximar bastante cerca una a otra. En este caso, entre las moléculas del gas, o
entre las moléculas del gas y las de la substancia de la pared, se originas unas fuerzas
de interacción que disminuyen rápidamente con la distancia. Bajo la acción de estas
fuerzas las moléculas del gas cambian la dirección de su movimiento. Este proceso
(cambio de dirección), como sabemos, lleva el nombre de choque.
El choque de las moléculas entre sí juega un papel muy importante en el
comportamiento del gas. Esta cuestión la examinaremos detalladamente mas
adelante. Por ahora es importante considerar el choque de las moléculas con las
paredes de la vasija., o con otra superficie cualquiera que está en contacto con el gas.
La interacción de las moléculas del gas y de las paredes determina, precisamente, de
fuerza que experimentan las paredes por parte del gas y, naturalmente, la igual fuerza
de sentido contrario que experimenta el gas por parte de las paredes. Es claro, que la
fuerza que sufren las paredes por parte del gas será tanto mayor, cuanto mayos sea el
área de su superficie. Con objeto de no utilizar la magnitud que depende de tal factor
casual como son las dimensiones de la pared, se ha aceptado caracterizar la acción
del gas sobre las paredes no por la fuerza, sino por la presión p, es decir, por la fuerza
F relacionada a la unidad de superficie S de la pared, perpendicular a esa fuerza.
F
p=
S
La propiedad del gas de ejercer presión sobre las paredes de la vasija que lo
contiene, es una de las propiedades fundamentales del gas. Precisamente, por su
presión se puede frecuentemente descubrir su presencia. Por eso, la magnitud de la
presión es una de las características más importantes del gas.
La presión del gas sobre las paredes de la vasija, como ya propuso Daniel Bernoulli
en el siglo XVIII, es una consecuencia de los choques innumerables de las moléculas
gaseosas contra las paredes. Estos golpes de las moléculas contra las paredes
conducen a un determinado desplazamiento de las partículas del material de la pared,
o sea, a su deformación. La pared deformada actúa sobre el gas con una fuerza
elástica, dirigida en cada punto, perpendicularmente a la pared. Esta fuerza es igual en
su valor absoluto a la fuerza con la que el gas actúa sobre la pared y de sentido
contrario.
A pesar de que las fuerzas de interacción de cada molécula por separado con las
moléculas de la pared durante el choque son desconocidas, sin embargo, las leyes de
mecánica permiten hallar la fuerza media, originada por la acción conjunta de todas las
moléculas del gas, es decir, hallar la presión del gas.
Supongamos que el gas está encerrado en una vasija que tiene forma de
paralelepípedo (fig. 2), y que el gas se encuentra en estado de equilibrio. En el caso
dado, esto significa que el gas, como un todo, está en reposo en relación a las
paredes de la vasija: el número de moléculas que se mueven en una dirección
arbitraria determinada es igual en su media al número de moléculas, cuyas
velocidades estás dirigidas en sentido contrario.
Calculemos la presión del gas sobre una de las paredes de la vasija, por ejemplo,
sobre la pared derecha abcd. Dirijamos el eje de coordenadas X a lo largo de la arista
del paralelepípedo perpendicularmente a la pared abcd como está indicado en la fig.2.
Cualesquiera que sean las direcciones de las velocidades υ de las moléculas, solo nos
interesa la proyección v x de las velocidades de las moléculas sobre el eje X: en
4
dirección hacia la pared abcd las moléculas se mueven, precisamente, con la
velocidad v x .
Separemos mentalmente una capa de gas con espesor ∆x , adyacente a la pared
elegida. Por parte de la pared deformada sobre ella actúa la fuerza elástica F. Con una
fuerza de tal valor absoluto también actúa el gas sobre la pared. Según la segunda ley
de Newton el impulso de la fuerza F∆t (donde ∆t es un intervalo arbitrario de tiempo)
es igual al cambio del impulso del gas en nuestra capa. Pero el gas se encuentra en
estado de equilibrio, de modo que la capa no recibe ningún incremento del impulso en
dirección del impulso de la fuerza (contra la dirección positiva del eje X). Esto ocurre
porque,
5
desde ella de moléculas con impulso negativo, el cambio total del impulso en la capa
será igual a
1 1
nmv x2 S∆t − − nmv x2 S∆t = nmv x2 S∆t
2 2
Este cambio del impulso de la capa compensa el cambio que debería ocurrir bajo la
acción del impulso de fuerza F∆t . Por eso, podemos escribir:
F∆t = nmv x2 S∆t
Dividiendo ambas partes de esta igualdad por S∆t obtenemos:
F
= p = nmv x2 (2.1)
S
Hasta ahora, sin decirlo suponíamos que todas las moléculas del gas tenían
velocidades, cuyas proyecciones v x eran iguales. En realidad esto no es así. Las
velocidades de las moléculas v y sus proyecciones v x sobre el eje X, naturalmente,
son distintas en las diferentes moléculas. La cuestión sobre la diferencia de
velocidades de las moléculas gaseosas en condiciones de equilibrio serán examinadas
detalladamente en el § 12. De momento tendremos en cuenta la diferencia de las
velocidades de las moléculas y de sus proyecciones en el eje de coordenadas,
2
sustituyendo la magnitud v x que entra en la fórmula (2.1) por su valor medio v x2 de
modo que a la fórmula de la presión del gas (2.1) le daremos la forma siguiente:
p = n mv x2 (2.2)
v 2 = v x2 + v y2 + v z2 , (2.3)
Por eso
v 2 = v x2 + v y2 + v z2 = v x2 + v y2 + v z2
(la última igualdad significa que se puede cambiar el orden de realización de las
operaciones de sumar y hallar la media). Debido al desorden completo de los
movimientos moleculares se puede suponer que el valor medio de los cuadrados de
las proyecciones de velocidades sobre los tres ejes coordenados son iguales entre sí,
es decir,
v x2 = v 2y = v z2
v2
v x2 =
3
6
1
p = nmv 2
3
2 mv 2
p= n (2.4)
3 2
Los raciocinios elementales expuestos son justos para cualquier pared de la vasija
y para cualquier superficie que se puede colocar mentalmente en el gas. En todos los
casos obtenemos para la presión del gas el resultado expresado en la fórmula (2.4).
mv 2
La magnitud en la fórmula (2.4) es una molécula de gas. Por consiguiente, la
2
presión del gas es igual a dos tercios de la energía cinética media de las moléculas de
la unidad de volumen de gas.
Esta es una de las conclusiones más importantes de la teoría cinética del gas ideal.
La fórmula (2.4) establece la relación entre las magnitudes moleculares, es decir, las
que se refieren a una molécula por separado y la magnitud de la presión que
caracteriza el gas como un todo, la magnitud macroscópica que se mide directamente
en la experiencia. La ecuación (2.4) algunas veces se llama ecuación fundamental de
la teoría cinética de los gases ideales.
Es importante subrayar que la presión del gas se determina por la energía cinética
media de sus moléculas. Esto significa que la presión del gas es una magnitud
orgánicamente ligada a la condición de que el gas está compuesto de un gran número
de moléculas. Por eso, no tiene sentido hablar, por ejemplo, de la presión creada por
una o muy pocas moléculas. Sobre los conceptos que solo tiene sentido para los
sistemas compuestos de muchas partículas se dice que tienen un carácter estadístico.
Observemos aquí que la magnitud del valor medio del cuadrado de la velocidad v 2
que figura en la fórmula (2.4) que hay que distinguirlo del cuadrado del valor medio de
la velocidad v 2 . Si la raíz cuadrada de v 2 es igual a la velocidad media de v , la v 2
no es igual a v .
La magnitud v 2 = v (y no v ) se llama velocidad media cuadrática de las
moléculas. Si el movimiento de las moléculas es completamente caótico, entonces su
velocidad media cuadrática es aproximadamente un 9% mayor que la velocidad
media.
1 Pa = 1 N/m2
1 bar = 105 Pa
1 din/cm2 =0,1 Pa
7
En la técnica se utiliza, ampliamente, la unidad de presión, denominada atmósfera
técnica (abreviadamente at) que es igual a 1 kgf/cm2. Esta unidad solo se diferencia en
un 2% del bar:
1.3. TEMPERATURA
De la ecuación (2.4)
2 mv 2
p= n
3 2
Se deduce que la presión del gas ideal es proporcional a su densidad (la densidad
del gas se determina por el número n de moléculas en la unidad de volumen) y a la
energía cinética media del movimiento de translación de las moléculas. Cuando n es
invariable y, por lo tanto, para un volumen V invariable de gas ( n = N V , donde N
es el número de moléculas en la vasija), la presión del gas solo depende de la energía
cinética media de las moléculas.
Sin embargo, es conocido por la experiencia que para un volumen constante la
presión del gas solo se puede cambiar por un método: calentándolo o enfriándolo; al
calentar el gas crece su presión, al enfriarlo, disminuye. El gas calentado o enfriado,
como cualquier cuerpo, se caracteriza por su temperatura, que es una magnitud
especial utilizada desde hace mucho tiempo en la ciencia, técnica y vida doméstica.
Por consiguiente, deberá existir un enlace entre la temperatura y la energía cinética
media de las moléculas.
Antes de aclarar este enlace examinemos qué magnitud física representa la
temperatura.
Para nuestra vida cotidiana la temperatura es una magnitud que distingue lo
<caliente> de lo <frío>. Y la primera representación sobre la temperatura se originó de
la sensación de calor y frío. Podemos utilizar estas sensaciones conocidas por
nosotros para aclarar la particularidad principal de la temperatura como magnitud
física.
Tomemos tres vasijas. Rellenemos una de ellas con agua caliente y la otra con
agua fría y la tercera con una mezcla de agua fría y caliente. Introduzcamos una
8
mano, por ejemplo, la derecha en la vasija con agua caliente y la izquierda en la vasija
con agua fría. Manteniendo las manos en estas vasijas durante un tiempo
determinado, llevémoslas luego a la tercera vasija. ¿Qué nos indican nuestros
sentidos sobre el agua de esta vasija? A la mano derecha le parece que su agua está
fría, a la izquierda, que está caliente. Pero esta discordancia desaparece si
mantenemos largo rato ambas manos en la tercera vasija. Después de un tiempo
determinado ambas manos empiezan a sentir una sensación, exactamente igual,
correspondiente a la temperatura del agua de la tercera vasija.
Todo consiste en que las manos, que al principio estuvieron en las vasijas con agua
caliente y fría, tenían distintas temperaturas, diferentes una de otra y de la temperatura
en la tercera vasija. Se necesita un tiempo determinado para que la temperatura de
cada mano se haga igual a la temperatura del agua donde están sumergidas.
Entonces la temperatura de las manos se iguala. Las sensaciones serán iguales. Es
necesario, como suele decirse, que en sistema de cuerpos <mano izquierda – mano
derecha – agua> se establezca el equilibrio térmico.
Este experimento sencillo demuestra que la temperatura es una magnitud que
caracteriza el estado del equilibrio térmico: los cuerpos que se encuentran en estado
de equilibrio térmico tienen la misma temperatura, y viceversa, los cuerpos con una
misma temperatura se encuentran, uno con respecto al otro, en equilibrio térmico. Si
dos cuerpos se encuentran en equilibrio térmico con un tercer cuerpo cualquiera,
entonces ambos cuerpos se encuentran entre si en equilibrio térmico. Esta importante
afirmación es una de las leyes fundamentales de la Naturaleza. Sobre ella está basada
la propia posibilidad de medición de la temperatura. En el experimento descrito, por
ejemplo, se trataba del equilibrio térmico de ambas manos después de que cada una
de ellas resultó estar en equilibrio térmico con el agua.
Si un cuerpo o sistema de cuerpos no se encuentran en estado de equilibrio térmico
y si el sistema está aislado (no tiene interacción con otros cuerpos), entonces después
de un tiempo determinado se establece por sí mismo el estado de equilibrio térmico. El
estado de equilibrio térmico, es el estado al cual pasa cualquier sistema aislado.
Después de haber alcanzado tal estado, él no se cambia más y no ocurre en el
sistema ningún cambio macroscópico. Uno de los indicios del estado de equilibrio
térmico es la igualdad de temperaturas en todas las partes del cuerpo o de todo el
sistema de cuerpos. Es conocido que durante el proceso de establecimiento del
equilibrio térmico, es decir, durante el igualamiento de temperaturas de los dos
cuerpos, ocurre una transmisión de calor de un cuerpo a otro. Por consiguiente, desde
el punto de vista experimental, la temperatura del cuerpo es una magnitud que
determina si él transmitirá calor a otro cuerpo con temperatura distinta o lo recibirá de
él.
La temperatura ocupó un lugar especial entre la serie de magnitudes físicas. Esto
no es extraño si se tiene en cuenta que en la época, cuando apareció esta magnitud
en la ciencia, no era conocido precisamente, qué procesos internos originan en la
sustancia la sensación de frío o calor.
La particularidad de la temperatura como magnitud física consiste ante todo en que
ella a diferencia de muchas otras magnitudes no es aditiva. Esto significa, que si
dividimos mentalmente un cuerpo en partes, entonces la temperatura de todo el
cuerpo no será igual a la suma de temperatura de sus partes. En esto se diferencia la
temperatura de las magnitudes, como, por ejemplo, la longitud, volumen, masa, cuyos
valores en el cuerpo total constituyen la suma de los valores de las magnitudes
correspondientes de todas sus partes.
A consecuencia de esto, no se puede medir la temperatura del cuerpo directamente
como se mide la longitud o masa, es decir, por el método de comparación con el
patrón. Si podemos decir de una barra que su longitud es tantas veces mayor que la
9
longitud de otra barra, la pregunta sobre cuántas veces una temperatura se contiene
en otra no tiene sentido.
Para medir la temperatura ya hace mucho tiempo se utiliza el hecho de que un
cuerpo al cambiar su temperatura cambia sus propiedades. Por lo tanto, cambian las
magnitudes que caracterizan estas propiedades. Por eso, para crear un aparato que
mida la temperatura, es decir, el termómetro, se elige cualquier sustancia (sustancia
termométrica) y una determinada magnitud que caracteriza las propiedades del cuerpo
(magnitud termométrica). La elección de una y otra es completamente arbitraria. Por
ejemplo, en los termómetros de vida doméstica, el mercurio es la sustancia
termométrica y la longitud de la columna de mercurio es la magnitud termométrica.
Para que se puedan adjudicar determinados valores numéricos a la magnitud de la
temperatura, hay que dar de antemano tal o cual dependencia entre la magnitud
termométrica y la temperatura. La elección de esta dependencia también es arbitraria:
mientras no exista el termómetro no se puede establecer experimentalmente esta
dependencia. En el caso del termómetro de mercurio, por ejemplo, se elige la
dependencia lineal entre la longitud de la columna de mercurio (volumen de mercurio)
y la temperatura.
Aun nos queda establecer la unidad de temperatura, el grado (a pesar de que por
principio se lo podía expresar en las mismas unidades en que se mide la magnitud
termométrica, por ejemplo, ¡en centímetros, según el termómetro de mercurio!). La
magnitud del grado también se elige arbitrariamente (lo mismo que la sustancia
termométrica, la magnitud termométrica y la forma de la función que liga la magnitud
termométrica con la temperatura). La medida del grado se establece del modo
siguiente. So eligen, otra vez más, arbitrariamente, dos temperaturas (que se
denominan puntos de referencia) — corrientemente son la temperatura de fusión del
hielo y la de ebullición del agua a la presión atmosférica — y se divide este intervalo
de temperaturas en un número determinado (también arbitrario) de partes iguales, de
grados, y a una de estas dos temperaturas se le adjudica determinado valor numérico.
Con ello se determina el valor de la segunda temperatura y de cualquiera otra
intermedia. De tal modo se obtiene la escala de temperaturas. Está claro, que con
ayuda del método descrito se puede obtener un conjunto infinito de termómetros
diferentes y escalas de temperaturas.
La termometría actual está basada en la escala del gas ideal y abastecida con
ayuda del termómetro de gas. Por principio, el termómetro de gas es una vasija
cerrada, rellena de un gas ideal y abastecida con un manómetro para medir la presión
del gas. Esto significa que en tal termómetro sirve de sustancia termométrica un gas
ideal, y de magnitud termométrica, la presión del gas para volumen constante. La
dependencia entre la presión y la temperatura se toma (¡precisamente se toma!) como
si fuese lineal. Tal suposición conduce a que la relación entre las presiones para las
temperaturas de ebullición del agua ( p e ) y de fusión del hielo ( p o ) es igual a la
relación d e estas mismas temperaturas:
p e Te
=
p o To
p e p o = 1,3661
10
TeTo = 1,3661
Te − To = 100
De las dos últimas igualdades se deduce que la temperatura de fusión del hielo To ,
según la escala que elegimos anteriormente, es igual a 273,15 grados y la temperatura
de ebullición del agua Te es igual a 373,15 grados. Para medir la temperatura de
cualquier cuerpo con ayuda del termómetro de gas es necesario poner el cuerpo en
contacto con el termómetro de gas y, esperando hasta el equilibrio, medir la presión p
del gas en el termómetro. Entonces la temperatura del cuerpo T se determina por la
fórmula
273,15
T= p
po
donde p o es la presión del gas en el termómetro, colocado en el hielo en fusión.
En la práctica se utiliza raramente el termómetro de gas. Sobre él recae un papel
más responsable: según él se gradúan todos los termómetros utilizados.
La temperatura igual a cero en nuestra escala, evidentemente, es la temperatura
para la cual sería igual a cero la presión del gas ideal. (Esto no significa que el gas
ideal en realidad se puede enfriar tanto que su presión se hace igual a cero). Si la
magnitud termométrica se hace nula para el cero de la escala termométrica, entonces
tal escala se denomina escala absoluta, y la temperatura contada sobre tal escala se
denomina temperatura absoluta. La escala del termómetro de gas aquí descrita se
considera absoluta. Frecuentemente, también la llaman escala Kelvin, y a la unidad de
temperatura en esta escala, el grado Kelvin (designación: K).
En la técnica y vida doméstica, frecuentemente se utiliza la escala de temperaturas
que se diferencia de la descrita en que a la temperatura de fusión del hielo se le
adjudica el valor cero (para uno misma medida del grado). Esta escala se denomina
escala de Celcius. La temperatura t contada por esta escala está ligada a la
temperatura absoluta T por la relación evidente:
t = T − 273,15
En lo sucesivo utilizaremos la escala Kelvin.
De lo dicho se deduce que la temperatura caracteriza el equilibrio térmico de los
cuerpos: pasando al estado de equilibrio se igualan las temperaturas de los cuerpos, y
en el estado de equilibrio la temperatura de todas las partes del cuerpo o sistema de
cuerpos es una misma: con esto está ligado el proceso de medición de la temperatura.
En efecto, para medir el valor de la magnitud termométrica a las temperaturas de
fusión del hielo y de ebullición del agua es necesario llevar el termómetro al estado de
equilibrio con el hielo en fusión y con el agua hirviendo, y para medir la temperatura de
cualquier cuerpo es necesario asegurar la posibilidad de establecer el equilibrio
térmico entre el termómetro y el cuerpo. Y solamente entonces, cuando se ha
conseguido tal equilibrio, se puede considerar que la temperatura del cuerpo es igual a
la temperatura contada por el termómetro.
11
Por lo tanto, la temperatura es lo que se iguala en el proceso del establecimiento
del equilibrio en el sistema. Pero el propio concepto de igualación significa que se
entrega algo de una parte del sistema a la otra. La ecuación
(2.4) que hemos obtenido para la presión del gas ideal nos
permite comprender qué significa el entregar «algo».
Imaginémonos un cilindro aislado con un gas ideal en el
que se estableció el equilibrio térmico, de modo que la
temperatura es igual en todas las partes del volumen gaseoso.
Supongamos que, sin alterar el equilibrio, colocamos en el
cilindro un émbolo móvil que divide el volumen del gas en dos
partes (fig. 3, a). En las condiciones de equilibrio el émbolo se
encontraría en reposo. Esto significa que durante el equilibrio
son iguales no sólo las temperaturas, sino también las presiones a ambos lados del
émbolo. De acuerdo con la ecuación (2.4) también son iguales las magnitudes
( )
n mv 2 / 2 :
mv 2 mv 2
n = n
2
izquierda 2 derecha
12
a la parte menos caliente, en resultado de lo cual se igualaría la energía cinética media
de las moléculas. El émbolo sólo hace visible la entrega de energía, ya que su
movimiento está ligado a la realización de un trabajo.
Los razonamientos sencillos expuestos a pesar de que no son muy rigurosos
demuestran que la magnitud conocida ya hace tiempo, bajo la denominación de
temperatura, es realmente la energía cinética media del movimiento de traslación de
las moléculas. El que hayamos recibido este resultado para el caso del gas ideal, no
cambia la cuestión. No existe fundamento para considerar que esto no se relaciona
también a los cuerpos líquidos y sólidos.
Es cómodo considerar, cuando se aplica el gas ideal, que la temperatura es igual a
dos tercios de la energía cinética media de las moléculas, ya que esto simplifica la
expresión de la fórmula (2.4) para la presión del gas. Designando por Θ la
temperatura determinada de tal forma podemos escribir:
2 mv 2
=Θ
3 2
p = nΘ
Según esta definición, la temperatura debe, naturalmente, medirse en unidades de
energía (en julios para el sistema SI, y en ergios para el sistema CGS). Sin embargo,
no es cómodo utilizar tal unidad de temperatura. Incluso una unidad tan pequeña como
el ergio, es demasiado grande para servir de unidad de medición de la temperatura.
Con su empleo, las temperaturas que se encuentran con frecuencia estarían
expresadas por números ínfimamente pequeños. Por ejemplo, la temperatura de
fusión del hielo sería igual a 5,65⋅10-14 erg. Además, la medición de la temperatura
expresada en ergios, sería muy dificultosa.
Por esta causa e incluso porque se utilizaba la magnitud de temperatura mucho
antes de que fuesen desarrolladas las representaciones cinético-moleculares, que
aclararon el verdadero sentido de la temperatura, la miden en unidades viejas, en
grados, a pesar de la convencionalidad de esta unidad.
Pero si se mide la temperatura en grados, entonces es necesario introducir el
coeficiente correspondiente, que transforme las unidades de energía en grados. Está
admitido designarlo por la letra k. Entonces la ligazón entre la temperatura T, medida
en grados, y la energía cinética media se expresa por la igualdad:
2 mv 2
= kT
3 2
de aquí tenemos
mv 2 3
= kT (3.1)
2 2
k = 1,380662 ⋅ 10 −23 J / K
En el sistema CGS
p = f (V , T )
Esto significa que el estado de un gas se determina sólo por dos parámetros (por
ejemplo, la presión y el volumen, la presión y la temperatura o por ultimo, el volumen y
la temperatura) el tercer parámetro se determina por los otros dos de forma unívoca.
Si la ecuación de estado es conocida en forma explícita, entonces se puede calcular
cualquier parámetro conociendo los otros dos.
Para el estudio de los distintos procesos en los gases (y no sólo en los gases) es
cómodo utilizar la representación gráfica de la ecuación de estado, en forma de curvas
que relacionan uno de estos parámetros con el otro, cuando el tercero está dado y es
constante. Por ejemplo, cuando se da la temperatura constante, la relación entre la
presión del gas y su volumen tiene la forma representada en la fig. 4. A las diferentes
curvas les corresponden diferentes valores de temperatura: mientras más alta sea la
temperatura tanto más alta descansará la curva en el gráfico. En este diagrama el
estado del gas está representado por un punto. La curva que relaciona un parámetro
con otro indica el cambio de estado, llamado proceso en el gas. Así, por ejemplo, las
curvas do la fig. 4 representan el proceso de dilatación o compresión del gas para una
temperatura constante dada. En adelante, utilizaremos ampliamente gráficos
semejantes al estudiar los distintos procesos en los sistemas moleculares.
La ecuación de estado para los gases ideales
se puede obtener fácilmente de las ecuaciones
fundamentales de la teoría cinetica (2.4) y (3.1).
En efecto, poniendo en la ecuación (2.4) en
lugar de la energía cinética media de las
moléculas su expresión de la ecuación (3.1)
obtenemos:
p = nkT (4.1)
15
pV = NkT (4.2)
µ1 = m1 N 1 , µ 2 = m2 N 2 (4.3)
M
pV = N 0 kT (4.4)
µ
pV = RT (4.6)
El así llamado movimiento browniano sirve como una de las demostraciones más
convenientes de la realidad del movimiento de las moléculas. Fue descubierto en el
año 1827 por oí botánico ingles Brown al estudiar las pequeñísimas esporas de la
suspensión acuosa. Al mirar con un microscopio de gran aumento, el descubrió que
éstas se encuentran en movimiento desordenado continuo, como si ejecutasen un
baile salvaje y fantástico.
Los experimentos sucesivos demostraron que estos movimientos no están ligados
al origen biológico de las partículas o con cualquier movimiento del líquido.
Semejantes movimientos son realizados por cualesquier partículas pequeñas
suspendidas en el líquido o en el gas. Movimientos desordenados de tal género los
realizan, por ejemplo, las partículas de humo en el aire inmóvil. Tal movimiento
desordenado de las partículas suspendidas en el líquido o en el gas recibió el nombre
de movimiento browniano.
Experimentos especiales mostraron que el carácter del movimiento browniano
depende de las propiedades de líquido o gas en el que están suspendidas las
partículas y no depende de las propiedades de la sustancia de estas partículas. La
velocidad de movimiento de las partículas brownianas crece con el aumento de la
temperatura y con la disminución de las dimensiones de las partículas.
Todas estas leyes son fáciles de explicar si admitimos que los movimientos de las
partículas en suspensión se originan a consecuencia de los choques, que sufren ellas
por parte de las moléculas en movimiento del líquido o gas en que se encuentran
Naturalmente, cada partícula browniana está sometida a tales golpes por todas
partes. Durante el movimiento completamente desordenado de las moléculas,
parecería ser y era de esperar, que el número de choques que recibe la partícula
17
desde cualquier dirección debería ser exactamente igual al número de choques desde
dirección contraria, de manera que todos estos choques deben compensarse
completamente unos con otros y la partícula debe quedarse inmóvil.
Así, precisamente, ocurre si las partículas no son muy pequeñas. Pero cuando
tenemos partículas microscópicas (10-4, 10-5 cm) la cuestión es diferente. Del hecho
que los movimientos moleculares son caóticos, se deduce solamente que en termino
medio el número de choques es igual para las distintas direcciones. Pero en un
sistema tan estadístico como un líquido o gas son inevitables las desviaciones de los
valores medios. Tales desviaciones de los valores medios de unas u otras magnitudes,
que se realizan en un pequeño volumen o durante pequeños intervalos de tiempo, se
llaman fluctuaciones.
Si en un líquido o gas se encuentra un cuerpo de dimensiones corrientes, entonces
el número de choques que sufren por parte de las moléculas es tan grande que no se
pueden apercibir ni golpes separados, ni el predominio casual de golpea en una
dirección sobre los golpes en otra dirección. Para las partículas pequeñas el número
general de golpes que sufren no es relativamente grande, de modo que se hace
sensible el predominio de golpes, ya sea en una o en otra dirección. Precisamente,
gracias a tales fluctuaciones del número de choques, se originan los movimientos
convulsivos tan característicos de las partículas en suspensión que se llaman
movimiento browniano.
Está claro, que los movimientos de las partículas brownianas no son movimientos
moleculares: nosotros vemos no el resultado del choque de una molécula, sino el
resultado del predominio del número de choques en una dirección sobre el número de
golpes en dirección contraria. El movimiento browniano sólo descubre, claramente, la
misma existencia del movimiento molecular desordenado.
De tal modo, el movimiento browniano se explica por que se origina una fuerza
resultante de determinada dirección, como resultado de la desigualdad casual del
número de choques de las moléculas con la partícula en distintas direcciones. Ya que
las fluctuaciones son corrientemente momentáneas, después de un corlo intervalo de
tiempo cambia la dirección de la resultante y junto con ella cambia la dirección de
desplazamiento de la partícula. De aquí que el caos observado en los movimientos
brownianos refleje el caos de los movimientos moleculares.
La explicación cualitativa expuesta del movimiento browniano la completaremos con
el examen cuantitativo de este fenómeno. Su teoría cuantitativa fue dada por primera
vez por Einstein e independientemente por Smolujovsky (el año 1905). Aquí
expondremos la deducción de la consecuencia más fundamental de esta teoría, más
sencilla que la de estos autores.
A consecuencia de la compensación incompleta de los choques de las moléculas
sobre la partícula browniana, como vimos, actúa cierta fuerza resultante F, bajo cuya
acción se mueve la partícula. Además de esta fuerza sobre la partícula actúa la tuerza
de rozamiento f, originada por la viscosidad del medio y dirigida en sentido contrario a
la fuerza F.
Para sencillez supongamos que la partícula tiene forma de esfera con un radio a.
Entonces la fuerza de rozamiento puede ser expresada por la fórmula de Stokes
f = 6πηav
donde η es el coeficiente de rozamiento interno del líquido (o gas), y v es la
velocidad de movimiento de la partícula. La ecuación del movimiento de la partícula
(segunda ley de Newton) tiene por eso la forma:
mr = F − 6πηar (7.1)
18
Aquí, m es la masa de la partícula, r es su radio vector con relación a un sistema de
coordenadas arbitrario, r = v es la velocidad de la partícula y F es la resultante de las
fuerzas originadas por los choques de las moléculas.
Examinemos la proyección del radio vector r sobre uno de los ejes de coordenadas,
por ejemplo, sobre el eje X. Para esta componente la ecuación (7.1) se escribe en la
forma:
mx = Fx − 6πηax (7.2)
1 d 2 ( x 2 ) dx 1 d( x2 )
2
xx = − , xx =
2 dt 2 dt 2 dt
m d 2 (x2 ) d(x2 )
2
dx
− m = −3πηa + xFx
2 dt 2 dt dt
Esta igualdad es justa para cualquier partícula y por lo cual también es justa para
los valores medios de las magnitudes que figuran en ella, si se toman los valores
medios de un número bastante grande de partículas. Por esta razón, se puede
escribir:
m d 2 (x2 ) d(x2 )
2
dx
− m = −3πηa + xFx
2 dt 2 dt dt
19
El valor medio de la magnitud xFx que entra en la igualdad es igual a cero ya que
para un gran número de partículas x y Fx pueden tomar con la misma frecuencia tanto
valores positivos como negativos.
Por eso la ecuación (7.2) toma la forma:
( )
m d 2 x2
− m
dx
= −3πηa
2
d x2 ( ) (7.4)
2 dt 2 dt dt
2
dx representa en esta ecuación el valor medio del cuadrado de la
La magnitud
dt
proyección de la velocidad sobre el eje X. Ya que el movimiento de las partículas es
completamente caótico, entonces los valores medios de los cuadrados de las
proyecciones de la velocidad, según todos los tres ejes de coordenadas, deberán ser
iguales unos a otros, es decir,
2 2 2
dx dy dz
+ +
dt dt dt
Es también evidente, que la suma de estas magnitudes deberá ser igual al valor
medio del cuadrado de la velocidad v 2 de las partículas:
2 2 2
dx dy dz
+ + = v
2
dt dt dt
Por consiguiente,
2
dx 1 2
= v
dt 3
De tal modo, la expresión que nos interesa, que figura en (7.4) es igual a:
2
dx 1 2 mv 2
m = mv 2 =
dt 3 3 2
mv 2
La magnitud es la energía cinética media de la partícula browniana. Al chocar
2
las partículas brownianas con las moléculas del liquido o gas se intercambian con ellas
la energía y se encuentran en equilibrio térmico con el medio en donde se mueven.
Por eso la energía cinética media del movimiento de traslación de la partícula
browniana deberá ser igual a la energía cinética media de las moléculas de líquido (o
gas) que como sabemos es igual a 3/2 kT:
mv 2 3
= kT
2 2
y por consiguiente,
20
2
dx 2 mv 2
m = = kT
dt 3 2
m dZ
− kT = −3πηaZ
2 dt
dZ 6πηa
=− dt
kT m
Z−
3πηa
6πηa
Z t
dZ
∫0 kT
= −∫
m
dt
Z− 0
3πηa
o bien
kT kT 6πηa
In Z − − In − = − t
3πηa 3πηa m
De donde
Z=
kT
1 − e
−
6πηa
m
t
= ( )
d x2
3πηa
dt
21
6πηa
Fácilmente nos podemos cerciorar que la magnitud e − m t es insignificantemente
pequeña para las condiciones corrientes del experimento. En efecto, las medidas de
las partículas brownianas no sobrepasan de 10-4 cm, la viscosidad del líquido por lo
común es próxima a la viscosidad del agua, es decir, aproximadamente igual a 10 -2 (en
el sistema de unidades CGS), la densidad de la sustancia de las partículas es del
orden de la unidad. Teniendo presente, que la masa m de la particula es igual a
4 3 6πηa
πa ρ , obtenemos que el exponente −
m
t , para t > l0--5s, es tal que la magnitud
3
6πηa
− t
se puede despreciar. Por consiguiente, si el intervalo de tiempo entre las
e m
d 2
dt
( )
x =
kT
3πηa
(7.6)
∆x2 kT
= (7.6a)
∆t 3πηa
de donde
kT
∆x2 = ∆t (7.7)
3πηa
22
disminuimos estos intervalos, entonces resulta que cada segmento rectilíneo de la fig.
7 se desarrolla en una trayectoria en zigzag, tan compleja, como la de toda la figura.
Los movimientos moleculares caóticos conducen a que las partículas del gas se
distribuyan uniformemente por el volumen de la vasija, de modo que en cada unidad
de volumen en término medio se contiene el mismo número de partículas. En el estado
de equilibrio, la presión y temperatura también son iguales en todo el volumen. Pero
esto ocurre así, sólo en el caso, cuando sobre las moléculas actúan fuerzas externas.
Con la existencia de tales fuerzas, los movimientos moleculares conducen a un
comportamiento particular de los gases.
Examinemos, por ejemplo, un gas (aire) que se
encuentra bajo la acción de la fuerza de gravedad. Si
no existiese el movimiento térmico de las moléculas,
todas ellas «caerían» sobre la Tierra bajo la acción
de la fuerza de gravedad y todo el aire formaría una
capa delgadísima sobre la superficie de la Tierra. Si no
existiese la fuerza de gravedad, pero existiesen los
movimientos moleculares, las moléculas se
dispersarían por todo el espacio universal. La
existencia de la atmosfera, como envoltura aérea de la
Tierra, en su forma actual, es debida a la presencia
23
conjunta del movimiento térmico de las moléculas y de la fuerza de atracción a la
Tierra. Con ello se establece una distribución de las moléculas, completamente
determinada, según la altura de la atmósfera. En correspondencia a esta distribución
de las moléculas se establece una ley determinada para el cambio de presión de un
gas con la altura que no es difícil hallar.
Examinemos una columna vertical de aire (fig. 8). Supongamos, que al nivel de la
Tierra, donde x=0, la presión es igual a p0 y a la altura x es igual a p. Al cambiar la
altura en dx la presión cambia en dp. La presión del aire a una altura determinada será
igual, como es sabido, al peso de la columna vertical de aire que se encuentra a esta
altura sobre una superficie igual a la unidad. Por eso, dp es igual a la diferencia de los
pesos de las columnas de aire sobre la unidad de superficie a las alturas x y x + dx, o
sea, igual al peso de la columna de aire de altura dx y superficie de la base de una
unidad dp=-pg dx, donde p es la densidad del aire (la masa de la unidad de volumen) y
g es la aceleración de la fuerza de gravedad. La densidad p del gas es igual,
evidentemente, al producto de la masa m de la molécula por el número n de ellas en la
unidad de volumen:
p = mn
p mp
De la teoría cinética se sabe [fórmula (4.1)] que n = . Por consiguiente, p =
kT kT
mg
y dp = − pdx
kT
dp mg
=− dx (8.1)
p kT
mg
In p = − x + In C (8.1a)
kT
mg
− x
p = Ce kT (8.1b)
C = p0
Por consiguiente, la relación que nos interesa entre la presión del aire y la altura
sobre la superficie de la Tierra tiene la forma:
mg
− x
p = po e kT (8.2)
24
µ
O teniendo en cuenta que m = ( µ es el peso molecular, es decir, la masa del
N0
mol, N0 es el número de Avogadro), obtenemos:
µg
− x
p = p0 e RT (8.2a).
mg
− x
n = n0 e kT (8.3)
donde n y n0 son los números de moléculas en una unidad de volumen en los puntos,
entre los cuales la diferencia de alturas es igual a x. Esta fórmula, así como la fórmula
(8.2a), indica que la atmósfera de la Tierra debe prolongarse hasta el infinito.
Al deducir la fórmula barométrica (8.2a) o (8.3) suponíamos que la aceleración de la
fuerza de gravedad g era constante, es decir, no dependía de la altura x. A base de
esto, al integrar la ecuación (8.1) sacamos a g fuera del signo integral. Tal
simplificación es aceptable para valores de x relativamente pequeños (del orden de
decenas de kilómetros). Para grandes alturas es necesario tener en cuenta, que la
aceleración da la fuerza de gravedad disminuye a la medida que nos separamos de la
superficie de la Tierra. En efecto, de la ley de gravitación universal se deduce que a la
distancia r desde el centro de la Tierra, la aceleración de la gravedad es
M M
g = (r) = γ =γ
r 2
( r0 + x ) 2
donde γ es la constante de gravitación (en el sistema SI tiene el valor
γ = 6,67 × 10 −11 N ⋅ m 2 / kg 2 y en el sistema CGS γ = 6,67 ⋅ 10 −8 din ⋅ cm 2 / g 2 ), M es la
masa de la Tierra y r0 es el radio de la Tierra. Por eso, la ecuación (8.1) deberá ser
escrita en la forma
dp Mm dx
= −γ
p kT ( r0 + x ) 2
25
Después de la integración obtenemos:
Mm 1
In p = γ + In C
kT r0 + x
o bien
Mm 1 M m r02 mg r02
p = C exp γ = C exp γ 2 = C exp
kT r0 + x ro kT r0 + x kT r0 + x
(8.4)
mgr0
−
C = p0 e kT
mgr0 r
p = p 0 exp− 1 − 0 (8.5)
kT r0 + x
mgr0
−
p∞ = p 0 e kT
26
el origen). No existe ningún fundamento para considerar que la conducta de un gas
cambia esencialmente si actúa sobre él, en lugar de la fuerza de gravedad otra fuerza
cualquiera, y que ja expresión de la energía toma otra forma. Si el Cas se encuentra
en cualquier campo de fuerzas, de modo que sus partículas poseen cierta energía
potencial, entonces el número de partículas quo poseen la energía U dada se
determina por la fórmula
U
−
n = no e kT
(9.1)
U
−
n =e kT
no (9.2)
n
De la fórmula (9.2) se ve que la parte de partículas con una energía U dada
n0
depende, además del valor de esa energía, solamente de la temperatura. Esto permite
tratar a la misma temperatura de una forma algo distinta, precisamente como magnitud
de la cual depende la forma de distribución de las partículas según su energía.
Para una temperatura dada la parte de moléculas, que poseen una u otra energía U',
depende del valor de U y disminuye, rápida mente, con el aumento de U. Esto
significa, que la parte de moléculas con una gran energía siempre es muy pequeña.
n
Cuanto más baja sea la temperatura, tanto más rápido disminuirá con el aumento
n0
de U.
N`
W = lim
N →∞ N
En el caso que hemos examinado con los números de los billetes, la probabilidad
del número par es igual a 1/2. Naturalmente, tal será la probabilidad del número impar.
La suma de estas dos probabilidades es igual a la unidad. Ella nos da, evidentemente,
la probabilidad del «suceso» consistente en que el billete tenga un número par o
impar. Pero tal suceso es inevitable, o sea que la probabilidad igual a la unidad,
significa la certeza. Por el contrario, si cualquier suceso no es posible (por ejemplo, la
falta absoluta de números), entonces su probabilidad es igual a cero.
En el ejemplo con los billetes (lo mismo que con el lanzamiento de las monedas) el
«experimento» (la compra de billetes'), puede llevar a uno de los dos resultados: el
número de billete puede ser par o impar, y ambos resultados tienen la misma
posibilidad. Pero no siempre ocurre así. Por ejemplo, del hecho de que al tirar sobre el
blanco son posibles sólo dos resultados, acertar o errar, no se deduce que la
probabilidad de acertar es igual a 1/2, ya que el acertado o yerro no son resultados de
tiro igualmente posibles. Y si se realiza un gran número de disparos, la relación entre
el número de aciertos y el número de disparos, es dudoso que sea igual a la mitad:
para el tirador hábil, abastecido con un arma de buen reglaje, será próximo a la
unidad, para el mal tirador se diferenciará poco de cero. Sin embargo, a pesar de que
la probabilidad de cada uno de los dos resultados de tiro posible no es igual a 1/2, su
suma también en este caso será igual a la unidad: |se puede afirmar con completa
seguridad que el tiro conduce a un resultado determinado, acierto o yerro!.
Teorema de la suma de probabilidades. Examinemos ahora otro ejemplo que nos
permite formular uno de los principios más importantes de la teoría de probabilidades,
y además nos da todavía otra definición do la propia magnitud de la probabilidad. Ella
será útil en lo sucesivo.
Supongamos que en una caja se encuentran 20 bolas pulidas, completamente
iguales según sus dimensiones y peso, y supongamos que 5 de ellas están pintadas
de color blanco y las restantes, de negro. Si sacamos ahora de la caja una bola, ya
que las bolas no se diferencian una de la otra en nada, a excepción del color, está
claro, que la probabilidad de sacar una bola cualquiera será igual a la probabilidad de
sacar otra cualquiera. Para cada bola que deseásemos señalar de cualquier forma, la
probabilidad de que sea sacada es evidentemente igual a 1/20.
Examinemos ahora ¿qué probabilidad hay para que sea sacada una bola blanca?
Ya que para cada bola (lo mismo da blanca que negra) la probabilidad de que sea
sacada es igual a 1/20 y en total hay 5 bolas blancas (y nos es igual cuál se sacará de
ellas), entonces la probabilidad buscada será igual a la suma de las probabilidades de
todas las bolas blancas:
1 1 1 1 1 5
W= + + + + =
20 20 20 20 20 20
28
Este resultado expresa uno de los principios más importantes de la teoría de
probabilidades, el teorema de la suma de probabilidades, que dice así:
Si Wlt Wa, W3, etc., son las probabilidades de varios sucesos que se excluyen unos
a otros, entonces la probabilidad de que se realice uno cualquiera de ellos es igual a la
misma de las probabilidades de todos estos sucesos.
Esto significa, que la suma de probabilidades de varios sucesos nos da la
probabilidad de que se realice o uno, o el otro, o el tercero, etc. Aquí suponemos que
estos sucesos, o aunque sea dos de ellos, no pueden ocurrir al mismo tiempo. De
modo que en nuestro ejemplo la probabilidad de sacar una de las bolas blancas es
5/20, y ya que la operación de sacar la bola se realiza sólo una vez, si se ha sacado
una bola blanca, ya no se puede sacar ninguna otra.
El ejemplo expuesto nos permite dar una nueva definición de la probabilidad que se
diferencia un poco de la anterior. Hemos halla-do que la probabilidad de ser sacada
una bola blanca es igual a 5/20. Pero el número 20 es el número de todos los
resultados posibles de la operación de sacar la bola, y el número 5 es el número de
casos (de los 20 posibles) que favorecen la realización del suceso dado, la aparición
de la boja blanca.
Esto precisamente, permite definir la probabilidad del suceso dado como el cociente
del número de casos que favorecen su realización y el número total de casos posibles
si iodos los casos son igualmente posibles,
Esta definición de la probabilidad pertenece a Laplace. Como se ve fácilmente, ella
no contradice a la definición anterior. En la definición de la probabilidad, que
acabamos de exponer, es de importancia el hecho de que todos los casos sean
igualmente posibles, igualmente probables. Precisamente así está planteada la
cuestión en nuestro ejemplo con las bolas.
En las aplicaciones de la teoría de probabilidades en la Física, corrientemente,
también solemos encontrarnos con sucesos igualmente probables.
Volvamos ahora a la fórmula .de la ley de Boltzmann (9.2). De todo la que fue dicho
aquí sobre la probabilidad, está claro que la magnitud n/na tiene en esta fórmula,
precisamente, el sentido de probabilidad. En efecto, cualquiera de las n0 moléculas
puede poseer la energía potencial U. Es decir, n0 es el número total de casos posibles.
Bn realidad, n moléculas poseen esta energía U. Por consiguiente, n es el número que
denominábamos anteriormente número de casos «favorables». Por eso, la relación
n/n0 que llamábamos (completamente fundamentado) parte de moléculas que poseían
la energía U, es al mismo tiempo la probabilidad de que cualquiera de las n0
moléculas posea tal energía.
Teorema de la multiplicación de probabilidades. Todavía nos | queda por
exponer otro principio importante de la teoría de probabilidades, el teorema de la
multiplicación de probabilidades. El se refiere al caso, cuando se determina la
probabilidad de un suceso complejo consistente en la simultaneidad de dos o más
sucesos independientes. Los sucesos se llaman independientes, si la probabilidad de
uno de ellos no depende de que se realice o no, otro cualquiera. Volviendo a los
ejemplos anteriores con los billetes y el tirador podemos, por ejemplo, plantear la tarea
siguiente: ¿cuál es la probabilidad de que el tirador, al dirigirse al campo de tiro en el
tranvía, adquiera un billete con número par, y que luego su primer disparo sea
coronado con el éxito? Es claro que estos dos sucesos son independientes.
Supongamos que para nuestro tirador la probabilidad W1 de acertado es igual a
0,8. Esto significa, que de las 10 asistencias al campo de tiro, en ocho casos caerá en
el blanco del primer disparo. Pero con esto, solamente en la mitad de ellas, al mismo
tiempo adquiere te billete con número par, ya que la probabilidad Wt de recibir tan
billete par es igual' a 1/2. Es decir, la probabilidad WJt buscada del suceso complejo,
la coincidencia de un número par con el disparo acertado, es igual al producto de las
probabilidades de cada uno de ellos:
29
W12 = W1W2 = 0.8 * 0.5 = 0.4
a=
N 1 a1 + N 2 a 2 + N 3 a 3 + ...
=
∑N a 1 1
N 1 + N 2 + N 3 + ... ∑N 1
a=
N1 N
a1 + 2 a 2 + ..... =
∑N 1
a1
N N ∑N
Pero N1/N, es decir, el cociente del número de observaciones para las cuales la
magnitud a tiene un valor a1 y del número total de observaciones N es la probabilidad
de este valor. Exactamente igual, N2/N es la probabilidad de que el valor de a sea
igual a a2, etc. Por consiguiente, el valor medio de la magnitud a es igual a la suma de
los productos de sus distintos valores por las probabilidades correspondientes.
a = W1 a1 + W2 a 2 + W2 a 2 + .... = ∑ Wi ai
30
1.9. CONCEPTO DE DISTRIBUCIÓN. FUNCIÓN DE DISTRIBUCIÓN
mu 2
= mgx
2 ,
32
Esto significa, que (v) es igual a la parte de partículas, cuyas velocidades se
encuentran en el intervalo unitario de velocidades próximo a la velocidad v.
Pasando al límite, la fórmula (11.2) se puede volver a escribir en la forma:
dn/n = f(v) dv (11.3)
33
mv 2 o mv 2 2
= + mgz
2 2 (12.1)
donde Vz es el valor de la componente z de la velocidad a la altura z.
Está claro, aquellas moléculas que tengan la energía cinética no pueden elevarse a
una altura mayor que z. Para ellas la máxima altura de elevación z se determina por la
igualdad z = vz 0 / 2 g . A esta altura, para tales moléculas Vz se hace igual a cero,
2
∞ ∞
N t = ∫ n z v z f (v z )dv z = n z ∫ v z f (v z )dv z
0 0
Durante el equilibrio, como se indicó, N↑ y N↓ deberán ser iguales entre sí,
∞ ∞
n zo = ∫ f (v
2 gz
zo )v zo dv z = n z ∫ f (v z )v z dv z
0
Dividiendo ambas partes de esta igualdad por nz0 y teniendo en cuenta que, de
mgz
nz −
acuerdo a la fórmula barométrica = e kT obtenemos:
nz o
∞ mgz ∞
−
∫
2 gz
f (v zo )v zo dv zo = e kT
∫ f (v
0
z )v z dv z
34
De la ley de conservación de la energía por medio de su diferenciación obtenemos
vz o dvz o = vz dvz
mgz
f (vz ) = f (vz o )e kT
mv z2
−
f (vz ) = Ae kT
mv 2
−
mv z2
dn − z
d n = nAe 2 kT
dvz o = Ae 2 kT dvz
n
∫
2 kT
=A
−∞
n ∫e
−∞
dvz = 1
De donde
mv z2
∞ −
2 kT
A=(∫e dvz ) −1
−∞
35
Para calcular la integral introduzcamos la nueva variable x2 = mv2z / 2KT
2kT 2kT
vz = x y dv z = dx
m m
Por eso
mv z2
∞ − ∞
2 kT 2kT
∫e ∫e
− x2
dv z = dx
−∞
m −∞
Se sabe que
∞
∫ e dx = π
2
−x
−∞
Por consiguiente
mv z2
∞ −
2 kT 2πkT
∫e
−∞
dvz =
m
Gráficamente, esta función tiene la forma representada en la fig. 11. Del gráfico se
ve que la función f(uz) tiende a cero cuando vz —>oo. Pero la parte de moléculas con
la componente z de la velocidad, igual a cero, no es igual a cero. Como se ve de la
fórmula (12.5) y de la curva fig. 11, la parte de moléculas cuyas componentes z de
velocidades es próxima a cero, es igual a ÍA (en esto consiste el sentido físico de esta
(constante). Al elevar la temperatura disminuye esta parte de moléculas.
La función de distribución de las moléculas según las componentes de velocidad la
obtuvimos, considerando el gas en el campo de gravedad. Recordemos que esto no
significa que esto significa que la forma de la distribución de las moléculas según
sus componentes de velocidad esté de algún modo relacionada con la acción de
la fuerza de gravedad o que precisamente la fuerza de gravedad cree esta
distribución.
Como ya indicamos, la fórmula barométrica que utilizamos
en nuestra deducción, por sí misma, es una consecuencia de la distri-
bución de las moléculas según sus velocidades. El papel de la fuerza
de gravedad en nuestra deducción sólo consiste en que ella «reveló.»
la distribución que existía en el gas. El que la fuerza de gravedad no
juegue un papel en el establecimiento de la distribución ya se ve por
el hecho de que en la función de distribución no figura la magnitud g
que caracteriza la fuerza de gravedad.
36
1.11.DISTRIBUCIÓN DE LAS MOLÉCULAS POR VELOCIDADES
= Ae ,
2 kT
= Ae 2 kT
ndv x ndv y
Ahora también podemos hallar la probabilidad de que la velocidad de la molécula
satisfaga al mismo tiempo las tres condiciones:
1) La componente según el eje X descansa en los límites de vx a vx + dvx
2) La componente según el eje Y descansa en los límites de vy a vy + dvy
3) La componente según el eje Z descansa en los límites de vz a vz + dvz
Los valores de las componentes de la velocidad según cada uno de los ejes. Por
eso, la probabilidad de que la velocidad de la molécula satisfaga al mismo tiempo las
tres condiciones indicadas es la probabilidad de un <<suceso>> complejo. Y como
sabemos ella es igual al producto de las probabilidades de cada uno de los sucesos
por separado. Si designamos por dnxyz el número de moléculas en la unidad de
volumen del gas, cuyas componentes sobre los ejes coordenados descansan en los
límites indicados anteriormente, entonces podemos escribir
mv 2
dn xyz −
= A3 e 2 kT
dv x dv y dv z
n
v 2 =v x2 +v y2 +v z2
donde de aquí
2
mv
−
dn xyz = nA e 3 2 kT
dv x dv y dv z
o 3
mv 2
m − 2 kT2
dnxyz = n e dv x dv y dv z
2πkT (13.1)
37
Imaginémonos que hemos reunido todas las moléculas de la unidad de volumen del
gas cuyas componentes de velocidad v están comprendidas en los intervalos
anteriormente indicados y luego las soltamos.
Después de 1 s todas se encontrarán a la distancia v de su posición inicial, en el
paralelepípedo con los lados dvx , dvy y dvz , es decir, en el volumen dw =
dvx dvy dvz . Esto está indicado en la fig. 12, en donde está representado
nuestro experimento mental en un sistema específico de coordenadas, sobre cuyos
ejes están colocados las componentes vx , vy , y vz . El número de moléculas,
referido a la unidad de volumen de este paralelepípedo (no confundirlo con el número
3
mv 2
dnxyz m − 2 kT 2
= n e
dw 2πkT
Esta magnitud no puede depender, naturalmente, de la dirección del vector de
velocidad v. Por eso, no es difícil hallar ahora la función de distribución de las
moléculas según las velocidades, independientemente de su dirección. En realidad su
reunimos todas las moléculas de la unidad de volumen del gas, cuyas velocidades
están incluidas en el intervalo de v a v+ dv por todas las direcciones, y luego las
soltamos, entonces esparciéndose en todas direcciones, después de un segundo se
encontrarán distribuidas uniformemente en una capa esférica de espesor dv y de
radio v (fig. 13). Esta capa esférica está compuesta de aquellos <<paralelepípedos>>
sobre los que se habló anteriormente. El número de moléculas en la unidad de esta
capa (de nuevo, no se le puede confundir con el número de moléculas en la unidad de
volumen del gas) es el mismo que en cada paralelepípedo, es decir, se determina por
la fórmula (13.1). El número de moléculas en toda la capa es el número de moléculas
38
en la unidad de volumen del gas, cuyas velocidades descansan en el intervalo de v a
v+ dv.
Este número sería igual a
3
mv 2
m 2 −
dn = n e 2 kT
dΩ
2π kT
donde dΩ es el volumen de la capa esférica a 4лv2 dv. De tal modo,
3
mv 2
m 2 2 − 2 kt
dn =4πn v e dv =
2πkT
3
mv 2
4 m 2 2 −2 kT
= n v e dv,
π 2kT
o
3
mv 2
dn 4 m 2 2 −2 kT
= v e dv
n π 2kT
Está fórmula expresa la ley de Maxwell de distribución de las moléculas según las
velocidades.
La magnitud dn/n es la probabilidad de que una molécula de gas, elegida
arbitrariamente, resulte que descansa en el intervalo entre v y v+ dv. En otras
palabras, dn/n es la parte de todas moléculas de la unidad de volumen, cuyas
velocidades descansan en el intervalo de v a v+ dv .
La magnitud
3
mv 2
dn 4 m 2 − 2 kT
f ( v) =
2
= ve
ndv π 2kT
Representa la función de distribución de las moléculas según sus velocidades. Ella
determina la parte de moléculas de la unidad de volumen de gas, cuyas velocidades
están comprendidas en el intervalo de velocidades igual a la unidad, que comprende a
la velocidad dada.
La forma gráfica de la función de distribución de Maxwell está representada en la
fig. 14. Como era de esperar ella se hace se hace cero para v=0 y para v→ ∞: en el
gas no hay moléculas inmóviles y no hay moléculas con velocidades infinitamente
grandes. Como se ve en la curva de la fig. 14, la función de distribución tiene un
máximo para un determinado valor de la velocidad vmp Esto significa que la parte
mayor de todas las moléculas del gas se mueven con velocidades, cuyos valores son
próximos a vmp. También se puede decir que las velocidades próximas a vmp se
registran en las moléculas del gas más frecuentemente que otras y la probabilidad de
que la velocidad de la molécula sea próxima a vmp es la máxima. Por eso, la velocidad
vmp que corresponde al máximo de la curva de distribución de Maxwell se llama la
velocidad más probable.
39
Con objeto de comprender mejor la diferencia entre distribución según las
velocidades y distribución según las componentes de las velocidades, examinemos la
analogía con otro proceso, en el cual las leyes de
causalidad juegan el papel principal, como en el caso del
establecimiento de la distribución de moléculas.
Imaginémonos que se realiza el tiro sobre el punto
central del blanco. Por muy hábil que sea el tirador y
perfecta su arma, las baladas no caerán cerca, a
diferentes distancias de él (fig. 15). Esto explica por
diferentes factores que son imposibles de tener en
cuenta: las cargas del cartucho no completamente
iguales, la influencia del viento y otras (en el caso de un
gas, el choque entre las moléculas juega el papel de tales factores causales, sobre el
que se hablará más adelante).
40
41
Se puede dividir toda la superficie del blanco en bandas anulares (fig. 16) como se
hace en los concursos de tiro, trazando una serie de circunferencias a una misma
distancia ∆r una de la otra, y determinar
el número de impactos que
corresponden a una distancia dad r del
centro en el intervalo de r hasta r + ∆r.
En este caso, el número de impactos en
el círculo central, si éste es
suficientemente pequeño, será próximo
a cero, porque en un círculo
suficientemente pequeño no se puede
acertar. Al aumentar el número de
impactos en ella, alcanzando un
máximo determinado, después del cual
disminuirá y a una distancia lo
suficientemente alejada del centro se
hará igual a cero (véase la curva de la
fig. 16).
Se puede proceder de otro modo.
Dividimos la superficie del blanco en
bandas, trazando una serie de rectas
paralelas, situadas a la misma distancia
∆r una de la otro (fig, 17).
Si determinamos ahora el número de impactos ∆n, correspondientes a cada banda,
resulta, como se ve fácilmente en la figura, que decrece monótonamente a medida que
nos separamos de la banda central, tendiendo a cero a una distancia del blanco
suficientemente grande; esto se ve en la curva de la fig. 17 análoga a la curva de la fig.
11.
El primero de los métodos expuestos para describir la distribución, corresponde a la
determinación de la función f(vx), según las componentes de velocidades.
Utilizando la curva de distribución de las moléculas según sus velocidades, se
puede hallar, gráficamente, la parte dn/n de moléculas en la unidad de volumen del
gas, cuyas velocidades descansan en el intervalo dv dado de velocidades. Ella es
igual a la superficie de la franja rayada en la
fig. 14, con base dv y altura f(v). Está claro
que toda la superficie limitada por la curva de
distribución y el eje de las velocidades nos da
el número total de moléculas en la unidad de
volumen.
Como se ve la fórmula (13.3) la forma de la
curva de distribución depende de la
naturaleza del gas (en la fórmula ente la masa
m de la molécula) y de la temperatura. En la
fig. 18 están dadas las curvas de distribución
de las moléculas de nitrógeno según sus
velocidades para distintas temperaturas. De
ellas se ve que al elevar la temperatura,
crecen las velocidades de las moléculas, de
modo que toda la curva se desplaza al lado
de las grandes velocidades. Pero las
superficies limitadas por las curvas y el eje de
las velocidades, quedan, naturalmente,
42
invariables. A consecuencia de esto disminuye el máximo de la curva al elevar la
temperatura.
Al deducir la ecuación de
Maxwell de la distribución de las
moléculas según sus velocidades
no teníamos en cuenta los
choques entre las moléculas, a
pesar de que los choques no
pueden dejar de influenciar en las
velocidades de las moléculas y,
por lo tanto, también sobre su
distribución según las velocidades.
Precisamente debido a los
choques se establece la
distribución de Maxwell según las
velocidades. En efecto,
supongamos que el gas se
encuentra en tal estado en que
todas las moléculas tienen las mismas (en módulo) velocidades. Tal estado no puede
ser estable (equilibrado), porque los choques entre las moléculas, indiscutiblemente,
conducirán a que las velocidades de las moléculas dejen de ser iguales. En cada
choque entre las moléculas aumenta la velocidad de una de ellas y disminuye la
velocidad de la otra. Y, precisamente, Maxwell llamó la atención sobre el hecho de que
debía existir tal estado, durante el cual el número de moléculas, cuyas velocidades
aumentan al chocar, es igual al número de moléculas para las cuales disminuye la
velocidad a consecuencia de los choques. Tal estado es el de equilibrio.
Precisamente a este estado corresponde la distribución de Maxwell según las
velocidades. Después Boltzmann demostró que si un gas se encuentra en el estado,
para el cual las moléculas están distribuidas por sus velocidades no según Maxwell,
entonces tal el gas, debido a los choques de las moléculas pasa por sí mismo al
estado con la distribución de Maxwell.
La distribución de Maxwell (algunas veces la llama: distribución Maxwell –
Boltzmann) es la distribución equilibrada. Con esto empezamos nuestro análisis. Por
eso, por ejemplo, al deducir la fórmula (12.4) no nos era necesario tener en cuenta los
choques.
En efecto, si algunas moléculas que dejaron la capa de ∆z 0 no alcanzaron la capa
∆z debido a los choques, sin embargo, otras moléculas, que no debieron caer en ella,
llegaron a ella como resultado de los choques.
Los movimientos moleculares realizados en el gas, siempre los llamábamos
caóticos. Ahora podemos dar una definición exacta sobre el concepto caótico de los
movimientos térmicos: el movimiento de las moléculas es completamente
desordenado (caótico) si las velocidades de las moléculas están distribuidas según la
ley de Maxwell.
Tales movimientos completamente caóticos los realizan las moléculas cuando el
gas se encuentra en estado de equilibrio. Como vimos en el §3, este estado se
caracteriza por la magnitud de la temperatura, que a su vez se determina por la
energía cinética media del movimientote las moléculas. De aquí se deduce que la
temperatura se determina por la energía cinética media, precisamente, de los
movimientos caóticos. Cualquier movimiento dirigido de las moléculas, cualesquiera
que fuesen velocidades en tal movimiento, no tiene ninguna relación con la
temperatura. Por muy grande que sea la velocidad del aire que forma un viento fuerte
ella no lo hace más caliente. Los vientos, incluso los más fuertes, pueden ser fríos y
43
calientes, porque la temperatura del gas no se determina por la velocidad dirigida del
viento, sino por los movimientos caóticos, que las moléculas realizan al mismo tiempo
que el movimiento dirigido del gas como un todo e independiente de él.
∫vnf (v )dv,
0
y la velocidad media aritmética v es igual a
∞ ∞
− 1
v = ∫ vnf ( v ) dv = ∫ vf ( v ) dv.
n0 (14.1)
0
Poniendo aquí la expresión (13.3) obtenida anteriormente para f(v) obtenemos:
3
∞ mv 2
− 4 m 2 −
v= ∫ e
3
v 2 kT
dv
π 2 kT 0
(14.2)
∫ dz = 1
−z
ze
0
Por lo tanto, para la integral de la fórmula (14.2) obtenemos la expresión:
∞ mv 2 2
− kT
∫ e dv = 2
3
v 2 kT
0 m
Poniéndola en (14.2) hallamos para v la expresión:
3
2
− 4 m kT
2 8kT
v=
.2 =
(14.3) π 2kT m m
1
mv 2
1 m −
f ( vx ) =
2
e 2 kT
n 2kT
Poniendo esta expresión en (14.4) obtenemos:
1
∞ mv x2
− 1 m 2 −
vx =
n 2 kT
∫v e
−∞
x
2 kT
dv x .
45
La integral que figura en esta fórmula se resuelva con la ayuda de la sustitución de
variable mv2x/2kT≡z2. Entonces para |vx| se obtiene la expresión:
(14.5)
− 2kT
vx = .
πm
Esta expresión permite resolver la tarea interesante sobre el número medio de
golpes de las moléculas sobre la unidad de superficie de la pared de la vasija en la
unidad de tiempo.
En el § 2 (pág. 26) vimos que en el número de moléculas que atraviesan la
superficie con un área S en el tiempo ∆t es igual a 1/2nvx S ∆t.
De aquí se deduce que en la unidad de superficie en la unidad de tiempo caen
1/2nvx moléculas. Sustituyendo aquí vx por su valor medio |vx| obtenemos que el
número medio de golpes v de las moléculas contra la unidad de superficie en la unidad
de tiempo es igual a:
−
− 1 − nv
vx = n vx = .
2 4
Velocidad media cuadrática de las moléculas. Para hallar la velocidad media
−2
cuadrática de las moléculas es necesario calcular la relación entre la suma de los
v
cuadrados de las velocidades de las moléculas de la unidad de volumen y el número
de moléculas en este volumen. Repitiendo los razonamientos anteriores obtenemos:
− ∞
2
v = ∫ v f ( v ) dv.
2
0
Poniendo aquí la expresión (13.3) de f (v) obtenemos:
3
− ∞ mv x2
m 2 −
v = 4π ∫v e
2 4
2 kT
dv.
2kT 0
Por medio de la integración por partes hallamos la integral que entra aquí y
obtenemos:
5
∞ mv x2
− 3 2kT 2
∫v e dv = π
4 2 kT
0
8 m (14.6)
3
mv 2
d d 4 m 2 2 −2 kT
f (v ) = v e
dv dv π 2kT
Esta igualdad se cumplirá si
2 −mv
2
d v e 2 kT =0
dv
Realizando la diferenciación obtenemos:
mv 2
− mv 2
v e2 2 kT
1 −2kT
=0
Esta igualdad se cumple bien para v=0, bien para v=∞, o bien con la condición de
que 1-(mv2mp /2kT)=0. Es claro, que las dos primeras condiciones no corresponden al
máximo de la curva de la distribución. Por consiguiente, el valor v mp se determina de la
condición:
mv 2 mp
1− =0,
2kT
de donde
2kT
vmp =
m
Comparando las expresiones (14.3), (14.6) y (15.1), hallamos la relación entre las
velocidades calculadas:
3π 3
v= v = 1.09v = vmp = 1.22vmp
8 2
Como se ve la diferencia entre estos tres valores no es muy grande: las velocidades
media aritmética y media cuadrática son próximas a la velocidad más probable.
47
corrientes sino relativas, tomando por unidad de velocidad la velocidad más probable
vmp de las moléculas. La velocidad relativa u, por consiguiente, será igual a
v
u =
vmp
Aquí v es la velocidad dada las moléculas y Vmp es la velocidad más probables
para la temperatura dada. Como acabamos de aclarar.
En la fórmula de Maxwell
3
mv 2
d 4 m 2 −
= ve
2 2 kT
dnv π 2kT
figura dos veces la expresión m/2kT. Sustituyendo en ella esta expresión por su igual
1/v2mp y designando v/vmp por la letra u, se le puede dar a la ecuación de Maxwell la
forma siguiente:
d 4 −u2 2
= e u
(16.1) ndu π
Esta ecuación es universal. En esta forma la función de distribución no depende ni
del género de gas ni de la temperatura.
Semejante ecuación también se puede escribir para la función de distribución de las
moléculas según las componentes de velocidad sobre los ejes coordinados. Si se
trata, por ejemplo, de la componente x de la velocidad, entonces, introduciendo
también aquí la velocidad relativa ux = vx / vmp se puede representar la función de
distribución (12.5)en la forma
du 1 − u x2
= e
(16.2) ndu x π
Para resolver distintas tareas ligadas con la distribución de las moléculas según sus
velocidades es cómodo utilizar las fórmulas de distribución, precisamente, en la forma
(16.1) y (16.2). En la fig. 19 está representada la curva de distribución para las
velocidades relativas.
Las funciones
4 2
u 2 e −u
π
Y
1 2
e −u x
π
48
Pueden ser calculadas de antemano para los diferentes valores u y u x y
representadas en forma de gráficos, a partir de los cuales se pueden determinar las
magnitudes buscadas. En la tabla 1 están expuestos los valores de estas funciones,
calculados con una exactitud suficiente para resolver muchas tareas.
Supongamos, por ejemplo, que se exige hallar la parte de moléculas de nitrógeno
cuyas velocidades están comprendidas entre 275 y 276 m/s para la temperatura
ambiente (300k).
Ante todo hallamos la velocidad más probable:
2kT 2 RT 2.8,31.103.3.10 2
vmp = = = ≈ 394m / s
m µ 28
La velocidad relativa u será igual a:
v 275
u= = ≈ 0.70
vmp 394
De la expresión u = v / vmp. En el caso dado, el intervalo de velocidad igual a 1 m/s,
es suficientemente pequeño para considerar que du = ∆ v/ vmp = 0.0025. Según el
gráfico, que puede construir cualquiera con los datos de la tabla 1, hallamos que la
velocidad realtiva u = 0.70 al valor de la función
dn 4 2 −u 2
= u e =0.677.
ndu π
De aquí
dn
= 0,677.0,0025 = 1,7.10 − 3
n
Es decir, sólo 0.17% de todas las moléculas poseen velocidades que descansan
dentro del intervalo de velocidades, indicado en la tarea.
4 1 4 1
u, f (u) = f (ux ) = u, f (u) = f (ux ) =
2 2 2 2
u 2e − u e−u x u 2e − u e−u x
ux π π ux π π
0.1 0.022 0.558 1.2 0.770 0.133
49
0.5 0.439 0.439 1.6 0.477 0.044
Una de las tareas interesantes, creadas por la distribución de las moléculas según
sus velocidades es la determinación de la parte de moléculas, cuyas velocidades
superan a la dada. Para resolver tales tareas también es cómodo utilizar la fórmula de
Maxwell para las velocidades relativas, es decir, la fórmula
dn 4 2
= u 2 e −u du
es necesario hallarπ
Está claro que si ndu la parte de moléculas, cuyas velocidades
superan a un valor dado determinado v, y por lo tanto determinado u, entonces es
necesario integrar la ecuación entre los límites desde el u dado hasta el infinito, de
modo que ∞
n>u 4
∫z
−z2
= 2
e dz
n π u
Donde n>u es el número de moléculas, cuyas velocidades relativas son mayores que
la u dada. Por consiguiente, la solución de la tarea se reduce al cálculo de la integral
que figura aquí. En la tabla 2 están expuestos sus valores para distintos valores de u.
En la tabla se ve que el número de moléculas, cuyas velocidades superan a la más
probable, es decir, las moléculas con v>vmp alcanzarán el 57.24% de todas las
moléculas del gas, o sea, más de la mitad.
Esto significa que la curva de distribución de Maxwell no es simétrica con relación al
máximo, lo que se ve claramente de los gráicos representados anteriormente (véase
las figs. 14, 18, 19).
∞ ∞ ∞
4 4 4
∫z e ∫z e ∫z e
2 −z2 2 −z2 2 −z2
u dz u dz u dz
π u π u π u
50
0.3 0.9807 1.0 0.5724 1.7 0.1230
Se sabe que la energía media de la molécula del gas ideal, si consideramos a sus
partículas como puntos, se determina por la expresión:
mv 2 3
= kT
2 2
Es necesario señalar otra vez, que esta expresión es justa para las moléculas
consideradas como puntos, capaces de realizar solamente movimiento de translación.
Tal representación del gas se puede justa para los gases monoatómicos. Si la
molécula del gas contiene no uno, sino varios átomos, entonces puede realizar
también otras formas de movimiento, giratorio y oscilatorio, con los cuales también
está ligada una determinada energía.
Sin embargo, limitémonos por ahora sólo al caso de los gases monoatómicos y
escribamos la expresión para la energía de todas las moléculas de la masa dada de
gas. Si el gas contiene N moléculas, entonces su energía total U será igual a:
3
U= NkT (20.1)
2
51
Para una mol esta expresión toma la forma:
3 3
U= N 0 kT = RT (20.2)
2 2
Esta energía se llama energía interna del gas ideal. Energía interna de un cuerpo
se llama en general a la energía total que se refiere a las mismas moléculas, es decir,
su energía “invisible”. Aquí entra la energía cinética del movimiento de las mismas
moléculas, la energía cinética del movimiento de los átomos dentro de la molécula (si
la molécula no es monoatómica), la energía potencial de interacción de los átomos
dentro de la molécula e incluso la energía cinética de las partículas que entran en la
composición de los átomos (núcleos y electrones). En ella no se incluye, sin embargo,
la energía cinética que el gas puede poseer, si él se mueve como un cuerpo entero, y
la energía potencial que puede poseer si se encuentra en un campo de fuerzas
cualesquiera.
La energía interna de una masa dada de gas ideal depende, como se ve de las
fórmulas (20.1) y (20.2), solo de la temperatura y no depende ni de la presión, ni del
volumen del gas. (Para los gases reales esto no es cierto).
Se sabe, sin embargo, que un gas, como cualquier otro cuerpo, se puede calentar
o enfriar con otro método durante el cual el trabajo no juega ningún papel a primera
vista. Este método consiste en que el cuerpo se pone en contacto con otro cuerpo
que tiene una temperatura diferente a la suya propia. Se puede conseguir el mismo
resultado sin el contacto directo, cuando dos cuerpos con diferentes temperaturas
están separados por cualquier medio o incluso por el vacío. En el primer caso se dice
que el calentamiento o enfriamiento se realiza por medio de la conductibilidad térmica,
en el segundo caso, por medio de la irradiación.
52
El mecanismo de transmisión de energía en el método por contacto consiste en que
las partículas de los cuerpos en contacto, durante los choques entre sí, se cambia su
energía de modo que las partículas del cuerpo más caliente pierden energía,
entregándola a las partículas del cuerpo menos caliente. Es decir, en este caso, en
lugar de un cambio de energía a cuenta de trabajo gastado, se consigue el mismo
resultado por medio de la transmisión de la energía de las partículas en movimiento
caótico de un cuerpo, a las partículas del otro cuerpo.
También se utiliza la unidad 1000 veces menor que la kilocaloría, o sea, la caloría
– gramo, o simplemente, caloría (cal):
1 cal = 4.1868 J
53
I = 4186.8 J / kcal = 4.1868 J / cal
Este trabajo mecánico se realiza al comprimir el gas con una fuerza externa cuando
el gas se calienta, o al dilatar el gas cuando el mismo realiza un trabajo, enfriándose
con ello. El cambio de volumen del gas también puede realizarse sin cambiar su
temperatura, entonces se exige correspondientemente un trabajo menor.
dA = dQ − dU
o
dQ = dU + dA (23.1)
54
Esta ecuación expresa la ley más importante de la naturaleza, la ley de
conservación de la energía aplicable a la energía mecánica y térmica. Esta ley recibió
el nombre de primer principio de la Termodinámica.
S dx = - dV
de donde
dA = - p dV (23.2)
Por el contrario, durante la dilatación del gas, es decir, al aumentar el volumen del
gas en dV , el mismo gas realiza un trabajo contra las fuerzas externas igual a + p
dV .
∫ p.dV
1
es igual a la superficie rayada por debajo de la curva.
55
Si el paso desde el estado 1 al estado 2 se realiza de tal modo que el cambio de la
presión con el volumen se representa con la curva II entonces el trabajo ligado a este
paso será otro.
En relación a la energía interna U se puede decir que depende sólo del estado del
cuerpo, y su cambio no depende de los estados intermedios, en los que se encontraba
el cuerpo. Por eso la ecuación (23.3) se puede escribir en la forma:
2 2
∫ dQ = U1 − U 2 + ∫ p.dv
1 1
donde U1 y U2 son los valores de la energía interna del cuerpo en los estados
correspondientes 1 y 2.
En caso particular, si el cuerpo, como resultado de todos los cambios de estado,
volvió al estado inicial, es
decir U1 = U2 , en este caso
se dice que el proceso de
cambio de estado es circular
o cíclico. Tal proceso se
representa gráficamente por
una curva cerrada (Fig. 33) y
el trabajo realizado (o
gastado) en este caso se
determina por la superficie
rayada.
Es evidente, que si el trabajo
A = ∫ p.dV ,
56
se eleve su presión a pesar del aumento de volumen (y al contrario, al comprimirse, el
gas puede dar calor a un cuerpo más frío y bajar su presión).
57
cuasiestáticamente), es decir, empieza a desplazarse el émbolo hacia arriba. Es
evidente que la presión exterior p1 se ha hecho menor que la presión p de equilibrio y,
por consiguiente, que el trabajo exterior es
p1 dV < p dV
-p1 dV < -p dV
Además, el gas puede dilatarse sin realizar en general ningún trabajo exterior.
Este caso se puede realizar uniendo dos vasijas una con otra, una de las cuales está
llena de gas y la otra vacía. Entonces, el gas fluye desde la primera vasija a la
segunda y ocupa, por consiguiente, mayor volumen. Pero con ello no se realizará
ningún trabajo exterior (ya que no existen ningunas fuerzas externas, contra las
cuales se podría realizar este trabajo). Este proceso se llama proceso de dilatación en
el vacío. Y en efecto, durante todo este proceso el gas no se encuentra en equilibrio
(por muy lento que transcurra).
dQ = dU + p dV
Está claro, que cuando se conserva constante la presión del gas, se exige mayor
cantidad de calor.
58
Se llama capacidad calorífica de un cuerpo a la cantidad de calor que es necesario
comunicarle o quitarle para que cambie su temperatura en un grado Kelvin.
C
c=
µ
Donde µ es el peso molar de la substancia (numéricamente igual a la masa de un
mol).
Si calentamos un mol de sustancia no en 1 grado, sino en dT grado, entonces el
calor, gastado en esto, es igual a
dQ = C dT
de donde
dQ
C= (24.1)
dT
Supongamos que el calentamiento se realiza en condiciones, cuando queda
constante el volumen (V= const.). El calor molar correspondiente se llama calor
específico a volumen constante o calor isocórico (equivolumétrico))1 y se designa por
Cv
dQ
Cv = (24.2)
dT v
Ya que el calor se gasta con ello en el cambio de la energía interna dU, entonces
dQ = dU y
dU
Cv = (24.3)
dT v
1
El término equivolumétrico es equivalente al término isocórico. (N del T)
59
dQ = Cv dT + p dV (24.4)
dQ
Cp =
dT p
utilizando los resultados de la teoría cinética de los gases, se puede calcular
fácilmente los calores molares del gas ideal.
2
mv 2 mv x2 mv y mv z2
= + +
2 2 2 2
donde vx, vy, vz son las componentes de la velocidad de la molécula según los tres ejes
coordenados. El caos completo de los movimientos moleculares nos permite
considerar que los valores medias de las energías cinéticas, según las tres
direcciones, son iguales unos a otros
2
mv x2 mv y mv z2 1 mv 2 (26.1)
= = =
2 2 2 3 2
mv 2 3
= kT
2 2
60
1
entonces cada uno de los tres sumandos de la igualdad (26.1) es igual a kT .
2
Si existiese, por ejemplo, un gas hipotético tal, cuyas moléculas pudiesen moverse
solo a lo largo de una línea determinada (gas de una dimensión), entonces, la energía
cinética media de la molécula de tal gas sería igual a kT / 2. El calor molar a volumen
constante de tal gas, sería igual no a 3/2 R, sino a ½ R. El gas de dos dimensiones es
decir, el gas cuyas moléculas están limitadas en su movimiento por un plano
determinado, poseería un calor específico Cv igual a 2/2 R = R1
dQ = CvdT + pdV
se ve que el calor aportado al gas puede originar un cambio de temperatura del mismo
(dT) y un cambio de volumen (dV). En los párrafos anteriores examinamos, desde el
punto de vista energético, el proceso del cambio de temperatura del gas. Ahora
llamamos la atención sobre la cuestión de la dilatación o compresión del gas ideal, es
decir, sobre la cuestión del cambio de su estado al variar el volumen.
61
Si en estas condiciones trasladamos el émbolo hacia abajo con ayuda de una
fuerza exterior (véase fig. 31), el gas se comprimirá, y la fuerza exterior realizará un
trabajo. Por el contrario, durante la dilatación realiza un trabajo positivo la fuerza que
presiona sobre el émbolo.
Para determinar el trabajo durante el cambio isotérmico del volumen del gas, es
necesario calcular la integral de acuerdo con la ecuación (23.2)
∫ dA = ∫ pdV
a lo largo de la isotermia. No podemos sacar p fuera del signo integral, ya que la
presión varía continuamente durante la dilatación. Pero la presión cambia con el
cambio del volumen según la ley de Boyle-Mariotte, es decir, pV = RT = cons tan te ,
RT
donde p = .
V
Poniendo esta expresión de p bajo el signo de integración, obtenemos para el
trabajo A, durante el cambio del volumen de V1 a V2.
V2 V
dV 2
dV V
A = ∫ RT = RT ∫ = RT ln 2 (29.1)
V1 V V1 V V1
M V
A= RT ln 2 (29.2)
µ V1
V2 p
= 1
V1 p2
62
Por eso, en las fórmulas (29.1) y (29.2), en lugar de la relación de los volúmenes se
puede poner la relación inversa de las presiones. Entonces,
M p
A= RT ln 1
µ p2
Como ya se indicó anteriormente, durante la dilatación isotérmica el calor
transmitido al gas se gasta sólo en la relación de trabajo exterior. Por el contrario,
durante la compresión isotémica, el trabajo de las fuerzas externas pasa a aumentar la
energía interna (calentamiento) de los cuerpos circundantes. Esto corresponde,
dQ
formalmente, a que la capacidad calorífica del gas es igual a ∞ (ya que dT = 0).
dT
− pdV = Cv dT (30.1)
Esto significa, que el trabajo, ligado al cambio de volumen del gas, deberá
acompañarse con el cambio de la energía interna, y por lo tanto, de la temperatura. El
signo menos de la expresión (30.1) significa que el aumento de volumen del gas
(dilatación) va acompañado con la disminución de su temperatura, y con la
compresión, con el aumento de la temperatura. En el primer caso el gas realiza un
trabajo a cuenta de su propia energía interna, por eso desciende su temperatura. En el
segundo caso, la fuerza exterior realiza el trabajo y, a cuenta de este trabajo, crece la
energía interna, y por lo tanto aumenta la temperatura del gas.
Cv dT + pdV = 0 (30.2)
pV = RT ,
pdV + Vdp
pdV + Vdp = RdT , de donde dT =
R
pdV + Vdp
Cv + pdV = 0 ,
R
CvVdp + C p pdV = 0
Cp
Designemos la relación de los calores específicos por = γ , entonces, la última
Cv
ecuación toma la forma:
dp dV
+γ = 0. (30.3)
p V
dp dV
∫ p
+γ∫
V
=0
Esta es la relación buscada entre la presión y el volumen del gas ideal, durante el
proceso adiabático del cambio de volumen.
RT γ
V = const
V
TV γ −1 = const , (30.5)
γ
RT
p = const
p
2
Adiabata y adiabática son términos equivalentes (N. del T.)
65
T γ p1−γ = const (30.6)
1− γ
Tp γ
= const (30.7)
Es claro que las objeciones hechas sobre los límites de aplicación de la ecuación
de Poisson también se refieren a las fórmulas (30.5) y (30.7).
Calculemos el trabajo de dilatación del gas (1 mol) desde un valor inicial del
volumen V1 has V2. Como anteriormente, el trabajo elemental durante el cambio de
volumen en dV será igual a
dA = pdV .
pV γ = const ,
pV γ = p1 A1γ
p1V1γ
p=
Vγ
p1V1γ
dA = γ dV
V
V2 V
dV 2
dV
A = ∫ pV γ
= p1 1 ∫
V
1 1
γγ
γ
V1 V V2 V
66
Después de la integración obtenemos, para la integral de la parte derecha de la
igualdad, la siguiente expresión:
V2
dV 1 1 1
∫V V γ − 1 V1 V2γ −1 .
γ
= γ −1
−
1
p1V1γ 1 V1
γ −1
A= . 1 −
γ − 1 V1γ −1 V2
RT1
De la educación de estado se deduce que p1 = , de donde obtenemos la
V1
expresión final:
RT1 V1
γ −1
A= 1 − . (31.1)
γ − 1 V2
M RT1 V1
γ −1
A= 1 − . (31.2)
µ γ − 1 V2
γ −1
V T2
Ya que PV1 1
γ −1
=TV
2 2
γ −1
, entonces 1 = . Por eso, la fórmula para el trabajo
V2 T1
durante el cambio adiabético del volumen se puede representar en la forma
RT1 T2 R
A= 1 − = ( T1−T2 ) = CV ( T1 − T2 ) ,
γ − 1 T1 γ − 1
R
Ya que = CV
γ −1
67
El trabajo durante la dilatación adiabética del gas, depende fundamentalmente del
Cp
valor del exponente de la adiabata γ = . Se ve fácilmente, que si γ → 1 , el trabajo
Cv
de la dilatación adiabética tenderá al valor del trabajo en el proceso isotérmico.
Podemos convencernos de esto, hallando el valor límite de la parte derecha de la
ecuación (31.1) para γ → 1 (utilizando el Teorema de L´Hopital).
valor V2, que es igual a ∫ pdV , se representa por toda la superficie rayada, limitada
V1
por los tramos correspondientes de la curva AB y el segmento del eje de las abscisas.
68
3. ELEMENTOS DE LA TERMODINÁMICA
La teoría cinética de los gases explica muchos fenómenos de los gases ideales, en
los cuales los movimientos de las moléculas se pueden considerar libres, debido a la
pequeñez de las fuerzas de interacción entre ellas. En los casos cuando no se pueden
depreciar las fuerzas de interacción, como, por ejemplo, en los gases reales, la teoría
describe con mucha más precisión los procesos que ocurren en ellos. Esto se explica
con el cuadro detallado de los movimientos moleculares no es conocido en la mayoría
de los casos, ya que no se consigue tener en cuenta, lo suficientemente exacto, todas
las fuerzas que actúan sobre las moléculas. Cualquier sistema molecular está
compuesto de un número enorme de partículas que interaccionan entre sí, que se
mueven constantemente y cambian su posición mutua. En tales condiciones es
imposible conocer, exactamente, las fuerzas que actúan sobre la molécula en
cualquier momento de tiempo, y por lo tanto conocer sus movimientos. Por eso, no se
pueden determinar teóricamente el enlace entre los movimientos moleculares y las
propiedades de la substancia.
69
la energía y del impulso. Estas se pueden utilizar sin saber con detalle el carácter de la
interacción de los cuerpos y de sus movimientos, porque estas leyes son justas para
cualesquiera movimientos y cualesquiera interacciones.
Así, por ejemplo, si ponemos en contacto dos cuerpos que poseen la misma
temperatura, entonces, como es bien conocido de la experiencia diaria, el calor no
70
pasará de un cuerpo a otro y la temperatura de los cuerpos en contacto queda
invariable, los cuerpos se encontrarán en equilibrio. Mientras tanto, no está excluido
que en algunos, puntos de contacto de estos cuerpos las partículas de uno de ellos
poseen una energía cinética mayor, que las partículas del otro. En estos puntos se
realizará, naturalmente, el paso de calor de un cuerpo a otro. Pero él se compensará,
indudablemente, con el pasó inverso en otros puntos, donde la diferencia de energías
tenga el signo contrario.
Observemos que las leyes de la Termodinámica sobre las que hablaremos en este
capítulo, sólo se refieren a los sistemas compuestos de un gran número de partículas.
71
Si por cualquier causa el sistema no se encuentra en equilibrio o ha sido sacado de
él y luego se le deja a su albedrío (esto significa, que no se somete a las acciones
externas), entonces, como demuestra la experiencia, se realiza por sí mismo el paso al
estado de equilibrio. Se puede incluso decir que el estado de equilibrio es aquel
estado, al cual pasa cualquier sistema molecular en ausencia de acciones externas
sobre él. El proceso de paso al equilibrio se llama relajación y el tiempo empleado en
él se llama tiempo de relajación.
Así, por ejemplo, si dos cuerpos que están en contacto, poseían al principio una
diferencia de temperaturas y fueron, puestos a su albedrío, entonces, se iguala, al fin y
al cabo la temperatura de ambos cuerpos. Pero el proceso inverso, el aumento de la
diferencia de temperaturas entre ellos, no se realiza sin la acción exterior.
Los ejemplos expuestos indican una particularidad importante de los procesos que
se realizan en los sistemas moleculares, que es su irreversibilidad. En esto,
precisamente, los procesos moleculares se diferencian de los puramente mecánicos,
los cuales se caracterizan por su rigurosa reversibilidad.
Así, por ejemplo, cuando cae una bola elástica sobre una superficie dura, se realiza
el cambio de la energía potencial de la bola en cinética, ya que en el momento, cuando
la bola se pone en contacto con la tabla en donde cae, su energía cinética es
exactamente igual a la energía potencial inicial, si no existe la fuerza de rozamiento
con el aire, durante el movimiento de la bola hacia abajo. Al chocar, se origina la fuerza
de elasticidad (debido a la deformación de la bola y de la tabla), y si no interrumpimos
el proceso, entonces estas fuerzas obligan a la bola a empezar el movimiento inverso
72
hacia arriba. Con ello de nuevo la energía potencial, esta vez la energía de
deformación, se transformará en la energía cinética del movimiento de la bola y ésta
se elevará a la misma altura, que cuando empezó su caída. Este proceso puede
repetirse muchas veces. Está claro, que el movimiento hacía arriba de la bola es un
proceso inverso a su caída, y no es difícil observar que durante su elevación la bola
pasa por todos los mismos estados intermedios, determinados por sus coordenadas
que tenía durante su caída, pero en orden contrarío. Por consiguiente, este proceso
puramente mecánico es reversible. Es cierto, que el proceso pasará como acabamos
de describir, sólo en el caso si no existen las fuerzas de rozamiento con el aire, si la
hola es completamente elástica, si también la tabla sobre la que ella choca es
completamente elástica. Todos estos «sí» indican que el proceso reversible, incluso en
el ejemplo mecánico examinado, es una determinada idealización, ya que de hecho no
existen cuerpos completamente elásticos, nunca se puede excluir completamente la
fuerza de rozamiento, etc. Pero, por lo menos en su esencia, el movimiento mecánico
es reversible.
Supongamos que un muelle, sujeto por uno de sus extremos, se deforma (se estira)
con una fuerza F, aplicada a su otro extremo (fig. 90). El muelle se estira aumentando
su energía potencial a cuenta del trabajo de la fuerza F. Si después de que el muelle
resulta estar estirado en una longitud determinada suspendemos la acción de la
fuerza, entonces, el muelle vuelve a su estado inicial, disminuyendo
correspondientemente su energía potencial.
73
evidentemente, es la primera en «sentir» que la fuerza ha dejado de actuar. De esta
parte se transmite poco a poco la deformación a lo largo del muelle, hasta que no se
restablezca el estado inicial.
74
igualarse en todo en volumen del gas. Como vimos (véase la pág. 116) el trabajo de
dilatación del gas era el máximo en este caso.
Recordemos una vez más que los procesos cuasiestáticos pueden ser
representados como la curva de la presión en función del volumen o de la
temperatura. El proceso irreversible no puede ser representado por esta curva. Si el
proceso no está en equilibrio (no es cuasiestático), entonces, no se puede hablar de
una determinada presión o una determinada temperatura, correspondiente al valor
dado del volumen. Todos los procesos que se desarrollan naturalmente, tales como el
paso del calor del cuerpo más caliente al menos caliente, la igualación de
concentraciones en las mezclas gaseosas, etc., siempre son procesos irreversibles y
naturalmente no cuasiestáticos.
De tal modo, vemos que los procesos ligados a los movimientos térmicos de
las moléculas, se diferencian de los movimientos mecánicos en que ellos
frecuentemente suelen ser irreversibles.
Entre tanto, el movimiento de las moléculas de por sí, por lo menos en su
primera aproximación, se someten a las leyes de la Mecánica, y nosotros utilizamos
estas leyes al deducir las ecuaciones fundamentales de la teoría de los gases ideales.
Surge la pregunta natural ¿de qué modo el conjunto de partículas, cada una de las
cuales se somete a las leyes de la Mecánica y cuyos movimientos son, por
consiguiente, reversibles, sólo es capaz de cambios irreversibles (si excluimos los
procesos cuasiestáticos, que no se realizan por sí mismos)?
Como veremos ahora, la causa de esto es la grandiosidad del número de
partículas y el caotismo absoluto de sus movimientos. Para aclarar la causa de esta
diferencia cualitativa, que se origina durante el cambio cuantitativo del número de
partículas, examinemos el siguiente ejemplo.
Sea que la vasija de volumen V esté rellena de aire. Dividamos
imaginariamente el volumen de la vasija, supongamos en cinco partes, cada una de
las cuales con un volumen Vt, e introduzcamos en una de ellas, por ejemplo, en la
inferior, una molécula señalada con un rayado (fig. 91), verbigracia, la molécula de
éter. Tomando parte en los movimientos térmicos desordenados con las partículas de
aire, nuestra molécula abandonará pronto el volumen separado y en el proceso de su
movimiento sucesivo caerá en todas las cinco partes de la vasija, y entre otras, en
aquella parte que acababa de abandonar.
Si planteamos la pregunta de si es un proceso reversible
el paso de la molécula de éter desde el volumen Vt rayado al no
rayado, deberemos responder a ella afirmativamente, ya que sin
ninguna acción externa nuestra molécula se encuentra de nuevo,
rápidamente, en la parte de volumen de la vasija abandonada por
ella. Y si controlamos cada segundo su posición, no existe
ninguna duda de que aproximadamente en una quinta parte de
observaciones la encontraremos en el volumen Vt. Utilizando el
concepto de probabilidad que introducimos anteriormente (pág.
65) se puede decir, que la probabilidad de hallar la molécula en el
volumen Vt es igual a 1/5. Esta probabilidad es bastante grande
para considerar el proceso reversible, capaz de desarrollarse en
ambas direcciones.
Si introducimos ahora no una, sino dos moléculas de éter, entonces la probabilidad
de encontrarse a un mismo tiempo en el volumen Vt, de acuerdo al teorema de la
multiplicación de probabilidades (las moléculas se mueven independientemente una
de otra, por eso aquí se debe emplear precisamente este teorema) será igual a (1/5)2.
75
Esta probabilidad ya es mucho más pequeña, de modo que el proceso del paso de dos
moléculas de V a Vt se puede considerar reversible con menos derecho. Si
introducimos 3, 4, 5… moléculas de éter, entonces la probabilidad de hallarlas de
nuevo en el volumen inicial será correspondientemente igual a
3 4 5
1 1 1
; ; ;...
5 5 5
Con el crecimiento del número de partículas de éter, introducidas al principio en
el volumen Vt, la probabilidad de hallarlas de nuevo allí se hará cada vez menor. Por
consiguiente, el proceso de la mezcla de las partículas de éter en el aire se hará cada
vez menos reversible.
Esto quedará más claro, si traducimos nuestro raciocinio al lenguaje del tiempo.
Supongamos que la molécula que abandonó a Vt regresa allí después de 2 segundos.
Para esperar el regreso no de una sino de dos moléculas ya se exigen 2 2 s, para 3, 23
s, y así sucesivamente. Pero si hay 100 moléculas de éter, entonces para observar el
regreso a Vt de todas las 100 moléculas, ya sería necesario 2100 s y este número ya
tiene más de treinta cifras, y este tiempo supera en unos millones a la edad de la
Tierra. En la naturaleza, sin embargo, el número de partículas corrientemente alcanza
no 100, ni 1000 sino miles de millones, decenas, centenas y miles de miles de
millones. Está claro, que el proceso de difusión de un gas en otro se puede considerar
completamente irreversible, a pesar de que sea posible por principio el proceso
reversible natural. Pero éste es tan poco probable que se le puede considerar
prácticamente imposible.
Generalizando el ejemplo que acabamos de exponer, podemos decir que si del
1
volumen V separamos el volumen Vt igual a parte de V,
m
V
Vt = ,
m
entonces, la probabilidad W de que se encuentren en la parte separada N
N
1
partículas, será igual a , y si N es muy grande, entonces, la probabilidad W será
m
muy pequeña. Imaginémonos ahora que en el volumen V de la vasija, privada de gas,
V
separamos el volumen V =
t
que está separado del volumen restante por un
m
tabique. Introduzcamos N moléculas de gas en el volumen Vt y quitemos el tabique.
Está claro que, después de esto, en el gas todas sus partículas ocuparán todo el
volumen V. Si mantenemos la temperatura constante, entonces esto será una
dilatación isotérmica del gas, desde el volumen Vt hasta el volumen V. Tal dilatación
representa en sí un cambio de estado del gas y ahora deberemos hablar sobre la
mayor o menor probabilidad del estado.
En nuestro caso se trata del paso de un estado, durante el cual se encuentra
reunido el gas en el volumen Vt (estado Vt), al estado, cuando él ocupe el volumen V
(estado V). La probabilidad W del primero de ellos es igual, como ya hemos visto, a
V
(1/m) N, o bien, ya que m = , entonces
Vt
N
V t
W = .
V
Con referencia al estado V, ya que el gas no puede encontrarse en ninguna
parte, a excepción del volumen V (Vt es también una parte de V), entonces, la
76
probabilidad de este estado es igual a la unidad. Esto ya se ve de la fórmula (6.1), si
ponemos en ella Vt = V.
La probabilidad W del estado, durante el cual el gas se concentra en una parte
del volumen, en lugar de ocuparlo todo entero, para grandes valores de N (el número
de partículas de la substancia siempre es, prácticamente, muy grande) será
extraordinariamente pequeña, incluso si Vt se diferencia poco de V.
Como ejemplo, calculemos la probabilidad W de que el gas, para la presión
atmosférica y a la temperatura ambiente (T = 300K) rellene uniformemente la vasija de
volumen V = 1 cm3, a excepción de una parte de él igual a una milésima de millón. Es
decir, que
V −V t Vt
= 1− = α = 10 −9 .
V V
El número de molécula es
p
N= ≈ 2,4·10 19 ,
kT
N
V t 1 1 1
W = = (1 − α ) N = 1
≈ 19 −9
≈ .
1010
V (1 − α ) α
0 , 43· 2 , 4·10 ·10
− Nα 10 10
77
Es decir, la irreversibilidad de los procesos en los sistemas moleculares,
compuestos de partículas, cada una de las cuales se somete a las leyes de la
Mecánica, es decir, se mueve reversiblemente, se explica exclusivamente con que el
número de estas partículas es muy grande. Si éstas fueran muy pocas, el sistema no
conocería ningún proceso irreversible.
Con referencia a los procesos cuasiestáticos, ya que el paso al equilibrio se
realiza en estos casos a través de los estados intermedios, ellos pueden transcurrir
con una probabilidad igual en cualquier dirección.
∫ dU = ∫ dQ − ∫ dA.
1 1 1
Aquí es importante señalar que la cantidad de calor aportado, así como
también el trabajo realizado por el sistema (o sobre él), depende de qué modo
precisamente se realizó el paso del estado 1 al estado 2. El cambio de la energía dU,
evidentemente, no depende del camino del paso, sino sólo de los estados inicial y
final. Por eso, se puede escribir que
2 2 2
∫ dU = U
1
2 − U 1 = ∫ dQ − ∫ dA,
1 1
pero no se puede escribir
2 2
∫ dQ = Q2 − Q1
1
ó ∫ dA =A
1
2 − A1
∫ dQ = ∫ dA,
donde el signo ∫ significa la integración por el contorno cerrado.
El primer principio de la Termodinámica es igualmente aplicable a los procesos
en equilibrio y no en equilibrio. A pesar de que lo últimos no pueden ser representados
en forma de curva, los estados inicial y final del sistema también están, en este caso,
completamente determinados.
Recordemos aquí las relaciones fundamentales que obtuvimos aplicando el
primer principio de la Termodinámica al gas ideal.
El trabajo realizado por un mol del gas ideal, durante su dilatación isotérmica desde
el volumen V1 hasta el volumen V2 es igual a:
3
Esto significa matemáticamente que, a diferencia de dU, las magnitudes dA y dQ no son
diferenciales totales
79
V2
A = RT ln .
V1
R (T1 − T2 )
A=
γ −1
Cp
Aquí γ = es la relación entre la capacidad calorífica para una presión
Cv
constante y la capacidad calorífica para un volumen constante. Recordemos que las
fórmulas expuestas se refieren al caso, cuando el cambio de estado del gas se realizó
cuasiestáticamente, es decir, por un camino reversible.
Es importante señalar que el primer principio de la Termodinámica no indica en
qué dirección van los procesos de cambio de estado. Desde el punto de vista del
primer principio, el calor, por ejemplo, puede pasar del cuerpo caliente al frío, y del frío
al caliente. Sólo es necesario que la energía entregada por un cuerpo y la recibida por
el otro sean iguales una a otra. La irreversibilidad de los procesos de la naturaleza no
se deduce, por consiguiente, del primer principio de la Termodinámica.
Las relaciones expuestas anteriormente permiten calcular la cantidad de calor
segregada como resultado de la realización de trabajo mecánico. Como se sabe,
puede considerarse resultado del trabajo mecánico realizado la aparición de una
cantidad de calor igual a él. Esto significa que la energía del movimiento macroscópico
se transforma por completo en energía de los movimientos microscópicos de las
moléculas de substancia.
Examinemos ahora el proceso inverso de la transformación del calor en trabajo
mecánico.
Como sabemos se llama calor a la energía que se transmite del cuerpo con
mayor temperatura al cuerpo con menor temperatura, por ejemplo, durante su
contacto. Por sí misma, esta transmisión de energía no va acompañada con la
realización de trabajo, ya que con ello no hay ningún desplazamiento de los cuerpos.
Ella conduce sólo al aumento de la energía interna del cuerpo, al que se le entrega el
calor y a la igualación de temperaturas, después de lo cual se suspende el mismo
proceso de transmisión térmica. Pero si el calor se transmite al cuerpo que en este
caso se dilata, entonces, él puede realizar un trabajo. De acuerdo a la ley de
conservación de la energía este trabajo será igual a:
dA = dQ − dU ,
dA = dQ.
Un trabajo mayor claro está no puede haber. Por consiguiente, para obtener el
trabajo máximo, igual al calor empleado, es necesario transmitir calor al cuerpo que se
80
dilata, de modo que entre él y la fuente de calor no haya diferencias de temperaturas,
porque, repetimos, el proceso irreversible de la conductibilidad calorífica es incapaz de
transformar el calor en trabajo, conduciendo solamente al aumento de la energía
interna en perjuicio del trabajo. Es cierto, que si no hay diferencias de temperaturas
entre la fuente de energía y el cuerpo al que se le transmite el calor, entonces, no se
transmitirá el calor. Pero, para que se transmita el calor, es suficiente que la diferencia
de temperaturas entre ellos sea infinitamente pequeña lo que prácticamente no se
diferencia del isotermismo completo. En tales condiciones el proceso de transmisión
de calor ocurre de un modo infinitamente lento y, por eso, es reversible.
Todo esto se relaciona al acto único de transmisión de calor al cuerpo que
realiza un trabajo. En este caso repetimos, el cuerpo puede realizar un trabajo igual al
calor entregado por la fuente. Por ejemplo, si un mol de un gas ideal, al recibir el calor,
se dilata isotérmicamente desde el volumen V1 hasta el volumen V2, con ello se
realizará un trabajo igual a R ln(V 2 / V1 ) .
Pero para la Técnica tienen importancia no estos procesos unitarios de
transformación de calor en trabajo. Los mecanismos reales existentes para obtener
trabajo a cuenta del calor (máquinas de vapor, motores de combustión interna, y etc.)
actúan, como sabemos, cíclicamente, es decir, en ellos los procesos de transmisión
del calor y de su transformación en trabajo mecánico se repiten periódicamente. Para
eso, es necesario que el cuerpo que realiza el trabajo, al recibir una cierta cantidad de
calor de la fuente y realizar un trabajo determinado, vuelva después de esto al estado
inicial, para empezar de nuevo el mismo proceso. En otras palabras, el cuerpo deberá
realizar procesos circulares.
El conjunto de cambios de estado en resultado de los cuales se restablece él
(el estado) se llama ciclo.
Recordemos, que si caracterizamos el cuerpo con su presión y volumen,
entonces su estado se representa por un punto del diagrama p – V. El cambio de
estado se representa en este diagrama con una línea, por ejemplo, la línea AaB del
diagrama de la fig. 92. El proceso circular (ciclo) se representa por una línea curva
cerrada, por ejemplo, la línea AaBbA. El trabajo realizado en un ciclo es igual a la
superficie abarcada por esta curva cerrada (véase la pág. 114, fig. 33).
Principio de Kelvin. Surge la pregunta importante ¿se puede obtener un trabajo,
durante el proceso cíclico que sea igual al calor transmitido por la fuente? A primera
vista, parece ser que para esto no hay ninguna barrera.
Como resultado del ciclo el cuerpo que realizó el trabajo
retorna a su estado inicial y, por consiguiente, queda
invariable la energía interna y el trabajo deberá ser igual al
calor absorbido. Sin embargo, en realidad, un conjunto de
datos experimentales, obliga a dar una contestación
negativa a la pregunta. Ya en el siglo pasado (año 1854)
fue formulado por V. Thomson (Kelvin) en forma del
siguiente principio:
Es imposible realizar un proceso cíclico, cuyo
único resultado sea la transformación en trabajo del calor quitado de cualquier cuerpo,
sin que haya ocurrido ningún cambio en el otro cuerpo o cuerpos.
De acuerdo a este principio, basado en numerosísimos datos experimentales,
referentes al trabajo de las máquinas térmicas, el calor quitado a la fuente se puede
transformar en trabajo (en el proceso cíclico) con la condición indispensable, de que
además de esta transformación deberá cambiarse el estado de cualquier otro cuerpo
(o cuerpos). Es decir, en el proceso de transformación del calor en trabajo, además de
la fuente de calor, de donde se quita el calor, y del cuerpo que realiza el trabajo, al cual
se le entrega directamente el calor, también deberá participar otro cuerpo (o cuerpos)
81
cualquiera. ¿Qué cuerpo misterioso es ése y cuál es su papel en el proceso de
transformación del calor en trabajo?
Como ya sabemos, para la transformación del calor en trabajo, es necesario
naturalmente <<quitar>> calor de la fuente y transmitírselo a otro cuerpo de menor
temperatura. Pero la simple transmisión no está ligada a ningún trabajo. Por eso, tal
transmisión no se realiza, directamente, sino a través de otro cuerpo, que al dilatarse
realiza <<de paso>> un trabajo mecánico y regresa a su estado inicial. Él se llama
cuerpo de trabajo4, mientras que la fuente se llama calentador y el cuerpo con
temperatura más baja, al cual se le entrega el calor es el refrigerador. Precisamente el
refrigerador es <<aquel cuerpo>> del que se habla en el principio de Kelvin. Él por sí
mismo no realiza ningún trabajo, pero es necesario, por que el cuerpo de trabajo le
debe entregar calor.
La afirmación de que para realizar un trabajo en la máquina cíclica es
necesario la participación de dos cuerpos con diferente temperatura se denomina
Principio de Carnot.
¿Pero por qué no tuvimos necesidad de este cuerpo complementario que
recibe calor, pero no realiza trabajo, cuando hablamos del acto unitario de
transformación del calor en trabajo, y por qué no se puede prescindir de él, cuando se
trata del proceso cíclico?
La cuestión consiste, evidentemente, en que durante el proceso cíclico, circular,
el cuerpo de trabajo, después de que al dilatarse realizó un trabajo a cuenta del calor
recibido del calentador, debe volver al estado inicial. Si, por ejemplo, al dilatarse el
cuerpo de trabajo, realizando un trabajo, pasa a través de una serie de estados a lo
largo de la curva AaB (fig. 92), para que vuelva a su estado inicial es necesario
comprimirlo. Pero para esto es necesario realizar un trabajo sobre el cuerpo de
trabajo. Pero este trabajo deberá ser menor que el trabajo, realizado por el cuerpo de
trabajo durante la dilatación. De otra forma el objetivo del ciclo no será conseguido. Y
para que el trabajo durante la compresión sea menor que el trabajo de dilatación, el
cuerpo de trabajo debe pasar durante la compresión por una serie de estados por la
curva que descansa por debajo de la curva de dilatación, por ejemplo, por la curva
BbA de la fig. 92. Pero la curva más baja del diagrama p – V corresponde a una
temperatura más baja. Esto significa que el cuerpo de trabajo antes de la compresión
debe ser enfriado, de él se debe quitar alguna cantidad de calor y entregárselo al
refrigerador. Por eso, ninguna máquina térmica (cíclica) no puede realizarse,
solamente, con la fuente de calor y el cuerpo de trabajo.
Si fuese posible limitarse sólo con la fuente de calor y el cuerpo de trabajo,
entonces para obtener trabajo podrían utilizarse tales <<fuentes>> de calor, como son
el agua de los mares y océanos, la corteza terrestre, la atmósfera de la Tierra, de las
cuales se podría tomar una cantidad de calor, prácticamente ilimitada. La máquina que
trabajase a base del calor de estas fuentes, que no exige por lo tanto ningún
combustible, tendría tanta importancia como el <<perpetuum mobile>> (tal máquina
imaginaria se llama perpetuum mobile de segundo género). Sin embargo, ella no está
<<prohibida>> por la ley de conservación de la energía, el trabajo se realiza a base del
calor. Pero la experiencia muestra, que tal máquina no puede ser construida. Para que
trabaje la máquina térmica cíclica es necesario el refrigerador, cuerpo con temperatura
más baja que el calentador. Precisamente, la atmósfera, corrientemente, sirve de
refrigerador.
A esta cuestión volveremos más adelante.
4
También se suele llamar <<portador de calor>> (N. del T.)
82
Examinemos ahora el proceso circular, durante el cual, el calor, quitado de
cualquier cuerpo, se puede transformar en trabajo, precisamente, de la mejor forma,
es decir, de modo que se obtenga el máximo de trabajo.
Para realizar este proceso es necesario tener, como sabemos, tres cuerpos: la
fuente de calor, del cual se extrae el calor (calentador), un cuerpo más frío, al cual se
le entrega el calor (refrigerador), y el cuerpo de trabajo, por medio del cual se realiza la
transmisión y se efectúa el propio trabajo. Supongamos, además, para sencillez del
razonamiento, que el calentador y el refrigerador tienen una capacidad calorífica, tan
grande, que sus temperaturas no cambian porque al primero se le quite y al segundo
se le entregue una determinada cantidad de calor. Examinemos cómo el cuerpo de
trabajo, realmente, realiza un trabajo en estas condiciones, a base del calor entregado
por el calentador.
Empecemos el proceso circular sobre el cuerpo de trabajo partiendo de que él
se encuentra comprimido hasta una presión determinada y está en contacto con el
calentador y tiene, por lo tanto, la misma temperatura qu
él (punto A en la fig. 93). Aquí no se verifica el proceso de
conducción de calor, ya que no hay diferencia de
temperaturas. Por lo tanto, tampoco se realiza la
transmisión de calor sin realizar trabajo. Ya que nuestra
tarea consiste en obtener el máximo de trabajo no
debemos permitir en nuestro ciclo tales procesos. Demos
ahora la posibilidad al cuerpo de trabajo de dilatarse y
desplazarse y desplazarse cualquier cuerpo, por ejemplo,
un émbolo sin interrumpir su contacto con el calentador.
Por lo tanto, la dilatación será isotérmica (curva AB en la
fig. 93). Con ello se realizará un trabajo. Se realiza,
evidentemente, a cuenta del calor quitado del calentador,
que sin embargo, no cambia su temperatura, gracias a su gran capacidad calorífica.
El calor recibido por el cuerpo de trabajo ahora es necesario entregárselo al
refrigerador. Esta transmisión tampoco es conveniente realizarla, por el contacto
directo del cuerpo de trabajo con el refrigerador, ya que la temperatura del cuerpo de
trabajo, que se dilata isotérmicamente, es mayor que la temperatura del refrigerador y
la transmisión de calor durante el contacto no irá acompañada con la realización de
trabajo útil. Por eso es necesario, al principio, enfriar al cuerpo de trabajo hasta la
temperatura del refrigerador y ya después de esto se les pueden poner en contacto.
Para el enfriamiento del cuerpo de trabajo, éste deberá estar aislado del calentador, y
luego es necesario darle la posibilidad de dilatarse adiabáticamente (mirar la curva BC
de la fig. 93), hasta que él no tome la temperatura del refrigerador (durante la
dilatación adiabática los cuerpos se enfrían). El cuerpo, en esta segunda etala,
dilatándose y trasladando el émbolo, por ejemplo, realiza, complementariamente, un
trabajo mecánico. Después de conseguir, de tal modo, el enfriamiento del cuerpo de
trabajo, se le pone en contacto con el refrigerador. Con esto se termina la primera
mitad del ciclo, durante el cual el cuerpo de trabajo realizó un trabajo útil a cuenta del
calor recibido del calentador.
Ahora es necesario volver al cuerpo de trabajo al estado inicial, es decir,
restablecer la presión y temperaturas iniciales. Esto significa, que el cuerpo de trabajo
debe ser comprimido y puesto de nuevo en contacto con el calentador. Este contacto,
como anteriormente, no se debe realizar mientras la temperatura del cuerpo de trabajo
sea más baja que la temperatura del calentador. Por eso, el retorno al estado inicial
también se realiza en dos etapas. Al principio se comprime el cuerpo de trabajo sin
alterar su contacto con el refrigerador, es decir, isotérmicamente (mirar la curva CD en
la fig. 93). Luego, aislando el cuerpo de trabajo del refrigerador, complementariamente,
se le comprime adiabáticamente, para que se caliente hasta la temperatura del
83
calentador (mirar la curva DA en la fig. 93). Durante la compresión adiabática, el
cuerpo se calienta a cuenta del trabajo externo realizado sobre él. Después que en el
proceso de compresión adiabática la temperatura del cuerpo se hace igual a la
temperatura del calentador, se les pone en contacto y con ello se finaliza el ciclo: el
cuerpo de trabajo se encuentra en su estado inicial, y el proceso puede ser empezado
de nuevo.
El proceso circular descrito se compone, de tal modo, de dos dilataciones y dos
compresiones isotérmicas y adiabáticas. Durante las dilataciones, el cuerpo de trabajo
realiza un trabajo útil: las compresiones, por el contrario se realizan a cuenta del
trabajo realizado sobre el cuerpo de trabajo por las fuerzas externas.
En ninguno de todos los estadios del proceso circular examinado no se permite
el contacto de dos cuerpos con distintas temperaturas, y de este modo, se evita el
origen del proceso irreversible de conducción calorífica. Por consiguiente, el ciclo se
verifica de forma reversible (para la completa reversibilidad es necesario realizar las
propias dilataciones y compresiones muy lentamente, por principio, con una lentitud
infinita, de modo que estos procesos sean cuasiestáticos).
El ciclo descrito, realizado por el cuerpo de trabajo, lleva el nombre de ciclo de
Carnot, en nombre del científico francés que lo examinó por primera vez.
Como resultado del proceso circular de Carnot una determinada cantidad de
calor resulta ser transmitida por medio del cuerpo de trabajo desde el calentador al
refrigerador. En la marcha del proceso, el cuerpo de trabajo realiza, además de esto,
un trabajo. A su tiempo las fuerzas externas realizan un trabajo sobre el cuerpo de
trabajo. ¿Se obtiene con esto un trabajo mecánico útil, es decir, se consigue el objetivo
de todo el proceso?
A primera vista parece ser que el trabajo realizado por el cuerpo de trabajo,
durante sus dilataciones en los dos primeros estadios del ciclo, se compensa,
completamente, con el trabajo realizado por las fuerzas externas en los dos estadios
siguientes de modo, que el trabajo útil al fin de cuentas es igual a cero. Sin embargo,
no es difícil de cerciorarse, que en realidad el trabajo positivo realizado por el cuerpo
durante su dilatación es mayor que el trabajo negativo realizado sobre él, durante su
compresión y, por consiguiente, una parte del calor, recibido del calentador, realmente,
se transforma en trabajo mecánico.
Nos podemos convencer de esto, lo más sencillamente, en el caso cuando el
cuerpo de trabajo es un gas ideal, para el cual se puede calcular exactamente el
trabajo de dilatación y compresión. Como vemos, las conclusiones obtenidas con ello,
no dependen de la naturaleza del cuerpo de trabajo, es decir, son justas para cualquier
cuerpo.
Examinemos cuantitativamente todo el ciclo de Carnot, cuando el cuerpo de
trabajo es un gas ideal (mirar la fig. 93).
Supongamos que de cuerpo de trabajo sirve 1 mol de un gas ideal, y que el
estado inicial se caracteriza por la presión p0 y el volumen V0, es decir, por el punto A
P0V0
en la fig. 93. La temperatura del gas T0 = , según nuestras condiciones, es igual
R
a la temperatura del calentador. La temperatura del refrigerador la designamos a
través de T1. Es decir, T0 > T1.
En el estado inicial, el cuerpo de trabajo tiene contacto con el calentador. El
primer estadio del proceso circular que realiza el gas es su dilatación isotérmica (se
conserva el contacto con el calentador) hasta el volumen V1. La presión,
correspondientemente, desciende por la isoterma hasta el valor p1 (punto B en la fig.
93).
El trabajo positivo, realizado por el gas durante la dilatación, es igual a:
84
V1
A1 = RT0 ln = Q0 ,
V0
donde Q0 es la cantidad de calor quitado del calentador por el gas. A cuenta de este
calor fue realizado el trabajo A.
El segundo estadio consiste en que el gas se aísla del calentador y su
dilatación sucesiva se realiza adiabáticamente, a consecuencia de lo cual se enfría el
gas. Esta dilatación adiabática se suspende cuando la temperatura del gas se hace
igual a la temperatura del refrigerador T1. El valor del volumen, hasta el cual debe
dilatarse el gas, se puede determinar teniendo en cuenta que durante la dilatación
adiabática es justa la igualdad
γ −1
V2 T0
= (80.3)
V1 T1
RT0 V1
γ −1
R( T − T )
A2 = 1 − = 0 1
(80.4)
γ − 1 V 2 γ − 1
V3 V
A3 = RT1 ln = − RT1 ln 2 = Q1 (80.5)
V2 V3
v −1
V3 T0
= (80.6)
V0 T1
γ −1 γ −1
ya que, como anteriormente, T1V3 = T0V0
El trabajo de compresión en el último estadio del ciclo es igual a
85
R( T1 − T0 ) R( T0 − T1 )
A4 = =− (80.7)
γ −1 γ −1
A = A1 + A2 + A3 + A4
V1 R ( T0 − T1 ) V R( T0 − T1 ) V V
A = RT0 ln + − RT1 ln 2 − − = RT0 ln 1 − RT1 ln 2
V0 γ −1 V3 γ −1 V0 V3
V 2 V3 V1 V 2
De (80.3) y (80.6) se deduce que = o, = . Designemos esta
V1 V 0 V0 V3
relación por r. Entonces
V1 V
ln = ln 2 = ln r (80.8)
V0 V3
Ya que V1 > V0 y V2 > V3, entonces ln r > 0.
Por consiguiente, el trabajo total es
A = R( T0 − T1 ) ln r (80.9)
y ya que T0 > T1, entonces, A > 0. Es decir, el trabajo, realizado por el gas durante la
dilatación es mayor que el trabajo de las fuerzas externas, gastado en su compresión.
De tal modo, a cuenta del calor recibido del calentador por el cuerpo de trabajo, ha
sido realizado cierto trabajo útil. Sin embargo, este trabajo no es igual a la cantidad Q0
de calor que recibió el cuerpo de trabajo del calentador.
De la cantidad de calor entregada por el calentador
V1
Q0 = RT0 ln
V0
V3
Q1 =RT1 ln ,
V2
86
Q0 − Q1 = R( T0 − T1 ) ln r = A (80.10)
Q0 V Q V
= R ln 1 ,− 1 = R ln 2
T0 V0 T1 V3
Q0 Q1
Sumándolas y teniendo en cuenta (80.8), obtenemos: − = 0 , de donde
T0 T1
Q0 Q1
= (80.11)
T0 T1
Rendimiento del ciclo de Carnot. Del análisis expuesto del proceso circular de
Carnot se deduce que por medio de su ayuda no se puede transformar completamente
en energía mecánica el calor tomado del calentador. Parte de este calor
imprescindiblemente deberá entregarse al refrigerador, a un cuerpo que tenga una
temperatura más baja que el calentador.
Si la cantidad de calor recibida del calentador por el cuerpo de trabajo es igual
a Q0, y se ha transformado en trabajo una parte Q0 - Q1 de este calor, entonces, la
relación
Q0 − Q1
η=
Q0
representa en sí el rendimiento del proceso circular (más exactamente, de las
máquinas que trabajan según este proceso). Como se ve en la fórmula (80.11), el
rendimiento η del ciclo de Carnot se determina por la igualdad:
Q0 − Q1 Q T
η= = 1− 1 = 1− 1 (80.12)
Q0 Q0 T0
Ahora se puede exponer una demostración más rigurosa del primer teorema de
Carnot (véase la página anterior), que se puede formular así: el rendimiento de la
88
máquina térmica que trabaja para los valores dados de temperaturas del calentador y
del refrigerador, no puede ser mayor que el rendimiento de la máquina que trabaja
según el ciclo inverso de Carnot para unos mismos valores de las temperaturas del
calentador y del refrigerador.
Acoplemos estas máquinas (con un eje común, por transmisiones a correa, etc.) para
que una de ellas pueda poner en movimiento a la otra. Supongamos que la máquina II
trabaja según el ciclo directo, es decir, recibe el calor Q del calentador, realiza un
trabajo A2 y entrega al refrigerador una cantidad de calor igual a
Q – A2
Durante esto, ella pone en movimiento a la máquina I, de modo que esta máquina
realiza el ciclo inverso. Por consiguiente, la máquina I, transporta el calor desde el
refrigerador al calentador, a cuenta del trabajo realizado sobre ella por la máquina II.
Supongamos que la máquina I lo transmite al calentador en cada ciclo una cantidad Q
de calor, es decir, el mismo que absorbe la máquina II en un ciclo. Supongamos que el
trabajo necesario para esto sea igual a A1. El calor tomado del refrigerador por la
máquina I es, por lo tanto, igual a
Q – A1
Q – A1 > Q – A2
Esto significa, que el único resultado de todo el ciclo ha sido la extracción de una
cantidad de calor igual a A2 – A1 del refrigerador y de su transformación en trabajo.
Pero esto contradice al principio de Thompson. Por consiguiente, η2 no puede ser
mayor que el rendimiento η1 de la máquina reversible de Carnot.
Demostremos ahora la justeza del segundo teorema de Carnot sobre la
independencia del rendimiento de la máquina reversible de Carnot del género del
cuerpo de trabajo. Tomemos de nuevo a las dos máquinas unidas entre sí I y II con un
calentador y refrigerador común. En este caso ambas máquinas trabajan según el ciclo
reversible de Carnot, diferenciándose una de la otra solamente por la substancia de
trabajo. Demostremos que son iguales los rendimientos η1 y η2, de ambas máquinas.
De nuevo supondremos que la máquina II realiza el ciclo directo y la máquina I el
89
inverso. Al principio supondremos que el rendimiento de ambas máquinas es diferente:
sea, por ejemplo,
η1 < η 2
Q > Q2
η1 = η 2
Ya que el cuerpo de trabajo de una de las máquinas puede ser un gas ideal, y ya
T1 − T2
mostramos que para este caso η = , donde T2 y T1 son las temperaturas
T
correspondientes del refrigerador y calentador, entonces, de aquí se deduce que el
rendimiento será uno mismo para cualquier máquina reversible de Carnot. Para el ciclo
irreversible el rendimiento es
T1 − T2
η< (82.1)
T
Recordemos que
Q1 − Q2
η= ,
Q1
Q1 + Q2 T1 − T2
<
Q1 T1
90
O bien,
Q1 Q2
+ <0 (82.2)
T1 T2
Evidentemente, [véase (80.11)] si el cuerpo sufre un proceso circular reversible,
entonces,
Q1 Q2
+ =0 (82.3)
T1 T2
3.11.ENERGÍA LIBRE
91
Imaginémonos un determinado cuerpo, por ejemplo, un gas en donde pueden
ocurrir procesos isotérmicos reversibles de dilatación y compresión. Para esto es
necesario colocar el gas en un termostato (véase § 28) o ponerlo en contacto con un
cuerpo do gran capacidad calorífica, cuya temperatura es constante. Al dilatarse, el
gas puede producir un trabajo mecánico, por consiguiente, nuestro sistema,
compuesto del termostato y del gas, posee una energía determinada. Aquella parte de
energía, que para las condiciones dadas puede ser utilizada para su transformación en
trabajo mecánico, so llama energía libre.
Es decir, el sistema no puede realizar un trabajo superior al valor de su energía
libre.
En este sentido, aquí tenemos una situación algo diferente a la del sistema
mecánico. En Mecánica, como se sabe, la energía de un cuerpo, o sistema de
cuerpos, es igual a la suma de las energías potencial y cinética. Ambas formas de
energía de los cuerpos macroscópicos (y sólo estos cuerpos se examinan en la
Mecánica) pueden ser transformadas por completo en trabajo mecánico. La energía
interna de un sistema molecular no puede ser transformada por completo en trabajo,
en el caso que nos interesa.
Por eso, si nos interesamos por la magnitud del trabajo que el sistema puede
realizar en el estado dado durante un proceso isotérmico, entonces, la energía interna
no es la característica apropiada de este estado. La energía interna caracteriza al
sistema si nos interesamos por el trabajo que es capaz de producir este sistema
durante el proceso adiabático. Precisamente, el trabajo producido durante el proceso
adiabático es igual al cambio (disminución) de la energía interna. La energía libre
deberá caracterizar al sistema desde el punto de vista de su «capacidad de trabajo»,
durante su cambio isotérmico de estado (cambio de volumen).
Para que a cada estado se le pueda yuxtaponer un determinado valor numérico de
energía libre, es necesario tomar como origen de medidas un estado determinado, del
mismo modo que se hizo al determinar la energía potencial en la Mecánica. Esta
indeterminación del valor absoluto de la energía libre no crea ninguna dificultad ya que
lo esencial no es el propio valor de la energía libre del sistema sino su cambio, lo que
determina al trabajo. Recordamos, además, que el trabajo de dilatación o compresión
de un cuerpo tiene un valor determinado si este proceso se desarrolla en forma
equilibrada, es decir, cuasiestáticamente.
De tal modo, la energía libre de un sistema se mide por el trabajo que puede
producir el sistema (por ejemplo, un gas ideal), cambiando isotérmica y
reversiblemente su estado desde aquel estado en que se encontraba anteriormente al
estado inicial, en el cual se admite que la energía libre es igual a cero (origen de
medidas).
Si designamos por F la energía libre del sistema, entonces, el trabajo infinitamente
pequeño dA, que realiza el sistema durante el, proceso isotérmico reversible, será
dA = −dF (83.1)
92
V2
A = RTM ln (83.2)
V1
El segundo miembro de la ecuación (83.2) representa en sí el decrecimiento de la
energía libre de 1 mol de gas durante tal dilatación. Esto significa, que a la
temperatura dada, la energía libre de una masa de gas dada, será tanto mayor cuanto
menor sea el volumen ocupado por ella, es decir, mientras más comprimido esté.
Recordemos, que la energía interna del gas ideal no depende del volumen que él
ocupa; un mol de gas, comprimido en un balón, tiene la misma energía interna que el
gas no comprimido para una misma temperatura. Pero el gas comprimido tiene una
gran energía libre porque él durante la dilatación isotérmica puede realizar un trabajo
mayor.
Cuando este gas comprimido realiza en realidad un trabajo al dilatarse
isotérmicamente (elevando, por ejemplo, un émbolo con carga), entonces, este trabajo
se realiza a cuenta del calor, que es necesario comunicar al gas desde el termostato, o
de otro cuerpo de gran capacidad calorífica (si no, el gas se enfría y el proceso no será
isotérmico).
Pero, a pesar de todo, nosotros hablamos sobre la energía libre de un gas con
objeto de subrayar que el gas es, precisamente, el cuerpo, gracias al cual se crea la
posibilidad de realizar un trabajo.
Si el proceso de cambio isotérmico de volumen se desarrolla irreversiblemente,
entonces, ya que el trabajo realizado con esto es menor que durante el proceso
reversible, el cambio de energía libre será mayor que el trabajo realizado, de modo
que la fórmula (83.1) se debe escribir en la forma:
dA ≤ dF
A1 − A2 = 0
Y, por consiguiente,
93
A1 = A2
Es decir, el trabajo realizado por el cuerpo solamente depende del estado inicial y
final del mismo. Por consiguiente, la energía libre es una función de estado.
Más adelante será expuesta la fórmula general de la energía libre.
3.12.ENTROPÍA
dQ = dU + dA
ya que el trabajo dA, realizado por el cuerpo (o sobre el cuerpo) depende de por
qué camino ha sido realizado, mientras que el cambio de la energía interna dU no
depende en qué forma se realizó el cambio de estado.
Pero si las mismas cantidades de calor Q0, entregado al cuerpo por el calentador a
la temperatura T0 y Q1, entregado por el cuerpo al refrigerador a la temperatura T 1, no
son iguales entre sí, entonces, como vimos [véase la fórmula (80.11)], las relaciones
entre estos calores y las temperaturas, a las cuales fueron absorbidos o entregados,
numéricamente son iguales entre sí (pero tienen signo contrario)
Q0 Q
= 1
T0 T1
94
Q
La relación se llama algunas veces, según Lorentz, calor reducido, de modo que
T
la última ecuación habla sobre la igualdad de los calores reducidos, recibidos o
entregados por el cuerpo de trabajo durante el proceso circular.
Esta particularidad del calor permite introducir una magnitud termodinámica
peculiar, la entropía, que tiene un valor fundamental en la Física. La importancia de
esta magnitud se determina, como ahora será mostrado, con que es una función de
estado y por aquel papel que juega en todos los procesos de la naturaleza y, en parti-
cular en el proceso de transformación del calor en trabajo.
Cualquier cambio de estado del cuerpo o del sistema de cuerpos se puede
representar, en caso general, como resultado de un número infinito de cambios
pequeños. Durante cada uno do los cambios infinitamente pequeños de estado del
sistema o bien se absorbe, o bien se segrega una cantidad infinitamente pequeña de
calor dQ (si el proceso no es adiabático). Pongámonos de acuerdo en considerar dQ
positivo, cuando el sistema absorbe calor, y negativo, cuando lo segrega.
Se puede mostrar que si el sistema a consecuencia de cualquier cambio de estado
pasó reversiblemente del estado A al estado B, entonces, la suma de las cantidades
do calor reducido, es decir, la magnitud
B
dQ
∫
A
T
no depende del camino, por el cual se realizó el paso de A a B. Para esto es suficiente
mostrar que durante el proceso circular, cuando coinciden el estado inicial y final, esta
integral es igual a cero
dQ
∫ T
=0
dQ
∫ T
(84.1)
B
dQ
SB − SA = ∫ (84.4)
A
T
La igualdad (84.4) permite determinar no el valor absoluto de la función
correspondiente al estado dado, sino solamente su cambio durante el paso de un
estado a otro. Pero, como siempre se hace en estos casos, se puede elegir un estado
determinado, al cual se lo adjudica el valor S igual a cero, y con él se comparan todos
los demás estados. Por eso, en lo sucesivo consideraremos que la función S es
precisamente igual a la integral (84,1):
dQ
S=∫ (84.5)
T
La magnitud S determinada de este modo se llama entropía. En la práctica siempre
es necesario conocer no la propia magnitud S, sino sólo su cambio durante el cambio
96
de estado del sistema. Por eso, es indiferente, a qué estado precisamente se le
adjudica la entropía cero. Está admitido (y para ello existe el fundamento suficiente) en
considerar, que para el cero absoluto de temperatura la entropía es igual a cero.
Esto significa, que para hallar la entropía del sistema en el estado dado, es
necesario trasladarlo (esto se puede hacer mentalmente) desde este estado al estado
cero por cualquier camino reversible (indiferente por cuál, precisamente) y hallar el
dQ
valor de ∫ T
a lo largo de este camino. Por supuesto, la propia entropía del sistema
no depende de si será o no realizado en realidad este proceso reversible.
Lo mismo se refiere al cambio de entropía. De acuerdo a (84.4), para determinar la
diferencia entre los valores de la entropía del sistema en dos de sus estados
(equilibrados) A y B, es necesario llevar el sistema por cualquier proceso reversible
B
dQ
desde el estado A al estado B y calcular el valor de ∫
A
T
para tal proceso.
dQ
dS = (84.6)
T
En sentido matemático esta igualdad es interesante porque la magnitud dQ, que no
es un diferencial total, ya que Q no es función de estado, sin embargo, se hace una
diferencial total después de la división por T. La magnitud 1/T, de tal modo, es el factor
de integración para dQ. La temperatura se puede determinar, desde el punto de vista
formal matemático, como una magnitud cuyo valor inverso es el factor de integración
para dQ.
Utilizando la ecuación (84.6) y recordando que dQ = dU + dA (primer principio de la
Termodinámica) obtenemos:
TdS = dU + dA (84.7)
dQ
∫ T
<0 (84.8)
Esta desigualdad se llama desigualdad de Clausius. Para el caso particular del ciclo
irreversible de Carnot, ya nos cercioramos [véase (82.2)] de que la suma de los
calores reducidos es
Q1 Q2
+ <0
T1 T2
97
La desigualdad (84.8) es una generalización de esto para cualquier sistema. Para
una demostración rigurosa de esta desigualdad invitamos al lector a dirigirse a los
cursos especiales de la Termodinámica.
En la misma medida, la ecuación (84.3) es una generalización de (82.3).
La entropía , siendo una función de estado del cuerpo o del sistema de cuerpos,
puede servir de tal parámetro de estado del cuerpo (por ejemplo, del gas) como las
magnitudes ya conocidas: la temperatura T, la presión p, y el volumen V.
De modo semejante, como cualquiera de estas magnitudes es función de las otras
dos, así la entropía puede ser expresada a través de dos cualesquiera de los
parámetros p, V y T. mostraremos cómo se puede haces esto. Esto es tanto más
importante, ya que la entropía no se puede medir directamente en la experiencia de
modo semejante a al temperatura, el volumen o la presión. Volvamos a escribir la
ecuación (84.7) teniendo en cuenta que dA=p dV, y obtenemos:
dU + pdV
dS =
T
o bien,
∂U ∂U ∂ 2U ∂ 2U
dU = dx + dy y =
∂x ∂y dx∂y dy∂x
∂T ∂S ∂T ∂S ∂p ∂V ∂p ∂V
− = − (85.2)
∂x ∂y ∂y ∂x ∂x ∂y ∂y ∂x
∂T ∂S ∂T ∂S ∂p ∂V ∂p ∂V
− = − ,
∂V ∂T ∂T ∂V ∂V ∂T ∂T ∂V
∂T ∂V
Pero si T y V son variables independientes, entonces, = = 0 y, por
∂V ∂T
consiguiente, tenemos
98
∂S ∂p
= (85.3)
∂V T ∂T V
Además de esto, tendremos en cuenta que dS es una diferencial total:
∂S ∂S
dS = dT + dV (85.4)
∂T V ∂V T
La última igualdad significa que el aumento toral de la entropía se compone del
aumento de entropía, originado separadamente por el aumento de la temperatura y
por el aumento del volumen. De (85.3) y (85.4) se deduce que
∂S ∂p
dS = dT + dV (85.5)
∂T V ∂T V
( dQ ) V
(dS )V =
T
Donde CV es la capacidad calorífica del cuerpo para volumen constante, por
consiguiente,
∂S C
dT = V dT ,
∂T V T
y finalmente,
CV ∂p
dS = dT + dV (85.6)
T ∂T V
De tal modo, nosotros expresamos dS a través de las magnitudes que se miden en
la experiencia p, V, T y CV.
Exactamente, del mismo modo, se puede expresar el cambio de la entropía dS a
través del cambio de temperatura dT y de la presión dp, es decir, eligiendo a T y p
como variables independientes. Para ello es necesario poner en la ecuación (85.2) a T
y p en lugar de x e y.
Obtenemos:
∂T ∂S ∂T ∂S ∂p ∂V ∂p ∂V
− = −
∂T ∂p ∂p ∂T ∂T ∂p ∂p ∂T
∂T ∂p
Pero = = 0 , ya que T y p son las variables independientes.
∂p ∂T
∂S ∂V
= − , (85.7)
∂p T ∂T p
99
y, correspondientemente, por analogía con (85.6)
Cp ∂V
dS = dT − dp (85.8)
T ∂T p
T ,V0
CV dT T ,V ∂p
S (V , T ) − S (V0 , T0 ) = ∫
T0 ,V0
T
− ∫
T ,V0 ∂T
dV
V
p0 ,T p ,T
C p dT ∂V
S ( p, T ) − S ( p0 , T0 ) = ∫
p0 ,T0 ,
T
− ∫
p0 ,T
dp
∂T p
En particular, para 1 mol de un gas ideal
T
CV dT T
∫
T0
T
= CV ln ,
T0
V
∂p V ∂p R
∫ ∂T
V0 V
dV = R ln
V0
, ya que =
∂T V V
Obtenemos:
T V
∆S = S (V , T ) − S (V0,T0 ) = CV ln + R ln
T0 V0
V
∆S = R ln (85.9)
V0
U = f (T ,V ) ,
dU + pdV 1 1
dS = = dU + pdV
T T T
∂U ∂U
dU = dV + dT ,
∂V T ∂T V
1 ∂U 1 ∂U
dS = + p dV + dT
T ∂V T T ∂T V
∂p ∂S
dS = dV + dT
∂T V ∂T V
De la comparación de los coeficientes de dV en ambas igualdades se hace evidente
que
1 ∂U ∂p
+ p =
T ∂V T ∂T V ,
∂U ∂p
= T −p
∂V T ∂T V (85.10)
∂p dQ
T
Es útil observar que la expresión
∂T V no es otra cosa que dV , es decir, la
cantidad de calor, que corresponde a la unidad del cambio de volumen, que es
necesario al cuerpo para que crezca su volumen, pero con ello quede constante la
temperatura.
Para el gas ideal.
101
∂p ∂U
T = p y por eso, =0
∂T V ∂V T
Empleemos (85.10) para calcular la energía interna del gas, cuyo estado se
describe por la ecuación de Van der Waals
RT a
p= − 2.
V −b V
∂p RT ∂U a
T = y = 2,
∂T V V − b ∂V T V
de donde
∂U ∂U a
dU = dT + dV = CV dT + 2 dV
∂T V ∂V T V
y, por consiguiente,
a a
U = ∫ CV dT + ∫ 2
dV =C V T − + B ,
V V
i
U = CV T = RT ,
2
(i es el número de grados de libertad de la molécula del gas). Pero esto significa
que
B=0
102
Si en cualquier sistema ocurre un proceso adiabático, esto significa que nuestro
sistema es cerrado. Es cerrado en el sentido de que está aislado de las fuentes
externas de calor, tanto de las que le entregan calor, como de las que absorben calor.
Evidentemente, que si el proceso de cambio de estado es reversible en tal sistema,
entonces el cambio de entropía será igual a cero, ya que en la igualdad
dQ
dS =
T
la magnitud dQ es igual a cero. Durante el cambio adiabático del estado del sistema
cerrado, su entropía queda invariable.
Verdaderamente los cuerpos externos con relación al sistema pueden realizar un
trabajo sobre tal sistema y el propio sistema puede realizar trabajo sobre los cuerpos
externos. En este sentido el sistema no es cerrado. Pero si incluimos estos cuerpos en
nuestro sistema, entonces la variación de entropía en tal sistema ya completamente
cerrado queda igual a cero como antes, por que los cambios de estado de los cuerpos
que realizan trabajo, o de los cuerpos, sobre los cuales son solo partes mecánicas de
nuestro sistema.
Pero se puede demostrar que para cualquier cambio reversible de estado del
sistema cerrado, la entropía no varía.
En efecto, supongamos que un cuerpo cualquiera, capaz de dilatarse o
comprimirse, de intercambiar el calor con las fuentes de calor, recibe calor de unas
fuentes y entrega calor a otras, Supongamos también que sobre el cuerpo se realiza
un trabajo o el propio bajo o sobre los cuales se realiza un trabajo, fuentes de trabajo.
Examinemos el sistema cerrado, incluyendo también los cuerpos y las fuentes de calor
y las fuentes de trabajo.
Supongamos que el estado del cuerpo cambia reversiblemente debido a que él
intercambia calor con la fuente de calor y debido también a que él realiza trabajo o
sobre él se realiza trabajo. La realización de trabajo (de cualquier signo) como
acabamos de ver, no conduce a cualquier cambio de entropía. La entropía sólo cambia
durante el intercambio de calor entre el cuerpo y la s fuentes de calor. Si el cuerpo, por
ejemplo, recibió calor de la fuente, que designamos por dQcuer, entonces su entropía se
dQcuer
cambia en la magnitud , donde T es la temperatura del cuerpo. Pero con esto la
T
fuente perdió la misma cantidad de calor, Si designamos por dQ fuen a la cantidad de
calor perdido, entonces, es evidente que dQcuer = −dQ fuen . Con esto, la entropía de la
dQ fuen
fuente de calor varía en la magnitud − , donde T es la temperatura de la fuente.
T
Ya que el proceso de intercambio de calor es reversible, entonces la temperatura del
cuerpo deberá ser igual a la temperatura de la fuente. De otro modo ocurrirá el
proceso irreversible de conductibilidad científica. Por eso, está claro que
dQcuer dQ fuen
=− ó dS cuer = −dS fuen
T T
T1
η = 1−
T0
104
corteza terrestre se pueden considerar inagotables, tal máquina, prácticamente, no se
distinguiría del motor eterno.
La máquina térmica hipotética, descrita, cuya acción consiste sólo en que con
ella se realiza el trabajo mecánico a cuenta del calor, se llama, perpetuum mobile de
segundo género, a diferencia del perpetuum mobile de primer género; en el cual, en
contradicción con la ley de conservación de la energía, se crea más trabajo que la
energía gastada. El rendimiento de esta máquina sería igual a la unidad, puesto que
durante el proceso de dilatación isotérmica del gas ideal dA = dQ.
Sin embargo, en realidad, tal máquina no puede actuar, ya que inútilmente
esperaremos que las moléculas de un gas se reúnan por sí mismas en una parte del
volumen de la vasija: un tal auto concentración de las moléculas va acompañada de
una disminución de la entropía y. por eso, es imposible. Observemos que aquí se trata
de la imposibilidad de la máquina cíclica, que repite constantemente el proceso de
transformación del calor en trabajo. Esto es muy importante porque es completamente
posible la transformación unitaria, ella no contradice ni al primero, ni al segundo
principio de la Termodinámica.
Algunas veces también se formula el segundo principio de la Termodinámica en
forma de afirmación sobre la imposibilidad del motor eterno de segundo género,
semejante a como se puede expresar el primer principio en forma de afirmación sobre
la imposibilidad del motor eterno de primer género.
El segundo principio de la Termodinámica también da contestación a al
pregunta sobre qué se necesita para que pueda actuar la máquina térmica cíclica.
Nosotros no podemos quitar sencillamente calor de la fuente (calentador) con
ayuda del cuerpo de trabajo y transformar este calor en trabajo, porque este proceso
va acompañado con una disminución de la entropía del calentador (el cuerpo de
trabajo realiza un proceso circular, y su entropía queda constante). Es decir, es
necesario tener un sistema compuesto no de dos cuerpos, calentador y cuerpo de
trabajo, sino de tres, y precisamente el papel del tercero deberá consistir en aumentar
su entropía, por lo menos en aquella magnitud, en la que disminuye la entropía, por lo
menos en aquella magnitud, en la que disminuye la entropía del calentador como
dQ
resultado de haberle quitado calor dS = . Para que aumente la entropía del
T
tercer cuerpo, hay que entregarle parte del calor tomado del calentador, Este tercer
cuerpo es el refrigerador. Ya que su temperatura es inferior, entonces, hay que
entregarle menos calor que el quitado del calentador, de modo que parte de este calor
se puede transformar en trabajo. En estas condiciones la entropía del sistema
<<calentador cuerpo de trabajo – refrigerador>> queda constante, lo que ya es
permisible por el segundo principio de la Termodinámica, que sólo prohíbe los
procesos con disminución de entropía.
De aquí se deduce que es imposible, por principio, transformar en trabajo todo
el calor recibido del calentador por el cuerpo de trabajo con ayuda de una máquina de
acción cíclica. Parte de calor irremisiblemente se debe entregar al refrigerador. Este es
aquel precio que hay que pagar para que la otra parte de calor se transforme en
trabajo.
Aquí hemos examinado el caso, cuando al refrigerador se le comunica tal
cantidad de calor que aumenta su entropía en tanto, que compensa la disminución de
entropía del calentador. Está claro, que ésta es aquella cantidad mínima de calor
perdido, sin la cual en general, la máquina no puede trabajar. Con ello, la entropía
queda constante y se transforma en trabajo la máxima parte del calor recibido del
calentador, de modo que el rendimiento será el máximo. Ya sabemos, que la
constancia de la entropía corresponde al proceso reversible. He aquí el porqué la
máquina ideal con el máximo rendimiento deberá ser reversible. Precisamente por
105
esto, durante la descripción del ciclo de Carnot dirigimos la atención a las
circunstancia de que durante su realización no se realicen los procesos irreversible de
conducción calorífica, y las dilataciones y compresiones se realicen por n camino
reversible.
En realidad, no es posible asegurar en la máquina real el proceso reversible
completo en todos los estadios del ciclo. Por eso, la entropía no quedará constante
sino crecerá. Esto a su vez significa que en la máquina real hay que entregar al
Q0 Q1
refrigerador más calor que el determinado por la igualdad = .
T0 T1
Por consiguiente, en este caso una parte mayor de calor que en la máquina
reversible recibido del calentador queda inaccesible para su transformación en trabajo,
y el rendimiento de la máquina será menor que el rendimiento calculado para el ciclo
reversible de Carnot.
En general, el aumento de entropía significa que el calor se hace menos
accesible para su transformación en trabajo mecánico. Esto se ve fácilmente en el
siguiente cálculo.
Imaginémonos a una fuente de calor con temperatura T1 , que entrega una
cantidad de calor Q al cuerpo de trabajo. Si la temperatura del refrigerador es T0 ,
Q Q0
entonces, la cantidad de calor Q0 entregado a él se determina de la igualdad: =
T1 T0
de donde
T0
Q0 = Q
T1
T
Q − Q0 = Q1 − 0 .
T1
T
Q − Q´0 = Q1 − 0
T2
De aquí se deduce, que si la cantidad de calor Q, pasa del cuerpo con temperatura
T1 al cuerpo con temperatura T2 entonces, la <capacidad de trabajo> del calor (es
decir, la magnitud de aquella parte suya que puede ser transformada en trabajo) se
cambia en la magnitud
106
T T 1 1
Q1 − 0 − Q1 − 0 = Q − T0
T2 T1 T1 T2
(88.1)
1 1
De acuerdo con la fórmula 87.1, la expresión Q T − T es igual, al aumento de
1 2
entropía tomado con signo contrario, durante el paso del calor del cuerpo con
temperatura T1 al cuerpo con temperatura T2 ( T1 > T2 ) . Por consiguiente, el cambio de
la <<capacidad de trabajo>> del calor durante su paso de un cuerpo a otro se
determina por el cambio de entropía durante tal paso. De la fórmula (88.1) se ve que el
crecimiento de entropía conduce a la disminución de la accesibilidad del calor para su
transformación en trabajo. El crecimiento de la entropía nos conduce a la
desvalorización de la energía térmica, a la reducción de la posibilidad de obtener
trabajo a cuenta de él. Desde este punto de vista, se puede considerar al segundo
principio de la Termodinámica como la afirmación de que, en cualquier sistema cerrado
cualquier proceso (irreversible) se desarrolla de tal modo, que la cantidad de energía
capaz de transformarse en trabajo disminuyen tendiendo a cero durante el equilibrio.
Por eso, está claro que a la entropía también va ligada la energía libre que
introducimos anteriormente, que representa en sí aquella parte de energía que,
durante el proceso isotérmico (dT=0); puede ser transformada en trabajo mecánico.
Escribamos la ecuación de la ley de conservación de la energía dQ = dU + dA
dQ
Ya que dS = , entonces, dQ = TdS , y nuestra ecuación toma la forma:
T
dU = T dS – dA
(88.2)
o bien,
dA = - d (U – TS)
(ya que T = const, entonces, S dT = 0)
La última igualdad indica que el trabajo dA, durante el proceso isotérmico, es igual
al cambio de una función determinada U – TS. Ella representa en sí, evidentemente la
energía libre del sistema F:
F = U – TS
La energía libre, es decir, la energía capaz de dar un trabajo mecánico, por
consiguiente, es igual a la energía interna U con descuento de la magnitud TS. Claro
está que TS representa en sí aquella parte de energía que no puede ser transformada
en trabajo, y es algunas veces la llaman por eso energía ligada.
La magnitud situada en la parte derecha de la ecuación (88.1) precisamente
representa Ens. El cambio de la energía ligada T0 ∆S . El es igual al cambio de la
<capacidad de trabajo> de la energía térmica.
N!
Z=
n!( N − n)!
(en este caso el número 0! Se considera igual a 1). Nos podemos fácilmente
convencer de que para cualquier número N el valor de Z será el máximo, cuando
N
n= , es decir, la distribución uniforme de las moléculas en el volumen de la vasija
2
se realiza del mayor número de modos. Por supuesto, se obtiene el mismo resultado si
dividimos la vasija no en dos, sino en un número arbitrario de partes.
De aquí se puede pasar fácilmente a la probabilidad de esta o aquella
distribución de las partículas entre ambas mitades de la vasija. Si en el ejemplo
examinado por nosotros con 6 moléculas el número total de modos de distribución de
las moléculas era igual a 64 y 6 de ellas no conducen al estado, en el cual en la parte
izquierda de la vasija se encuentra una molécula, entonces, es evidente que la
probabilidad de este estado es igual a 6/64. La probabilidad de la distribución
108
uniforme será igual a 20/64. En general, la probabilidad de W de que en la parte
izquierda de la vasija se encuentren n de las N partículas será igual a:
N!
W =
n!( N − n)!2 N
N
Está claro que la probabilidad W tiene un máximo para n = .
2
Para un gran número N de partículas, el número de modos, para los cuales se
realiza la distribución uniforme de las partículas en el volumen de la vasija, será la
mayoría aplastante, en comparación con cualquiera de las distribuciones no uniformes,
En la marcha de los movimientos térmicos, ininterrumpidos, caóticos de las
moléculas, el gas se puede hallar en cualquiera de los estados imaginables, pero,
ciertamente, en la mayoría aplastante de los casos, lo hallamos en el estado en que se
realiza por el mayor número de distribuciones, es decir, en el estado de la distribución
uniforme. Este es el estado de equilibrio. Y si el gas por cualquier causa no se
encuentra en equilibrio, entonces, dejándolo a su albedrío, indispensablemente pasará
a este estado.
De tal modo, se puede caracterizar cada estado del sistema no sólo por su
probabilidad matemática W determinada por la igualdad
N
V `
W = ,
V
Que expusimos en el 76, sino también por el número de modos, en los cuales se
realiza este estado. Esta última magnitud se llama probabilidad termodinámica.
Está claro, que ambas probabilidades están ligadas una con otra. Pero a
diferencia de W, que siempre es menor que la unidad, la probabilidad termodinámica
que designaremos por w se expresa por números grandes.
Con la magnitud de probabilidad termodinámica puede estar ligada la entropía,
ya que una y otra tienen el valor máximo en el estado de equilibrio, y el paso de
cualquier sistema al equilibrio va acompañado con el crecimiento y de la entropía y de
la probabilidad termodinámica.
Por causas que aquí no vamos a exponer, Boltzmann ligó la entropía S y la
probabilidad termodinámica W con la relación:
w
S = k ln ,
w0
Donde k es la constante de Boltzmann que ya conocemos.
S = k ln w – K ln w0 = k ln w – S0
La magnitud
S0 = k ln w0
Se puede tomar como origen de medidas de la entropía. Entonces, la entropía
contada desde este origen se expresan por la igualdad
S = k ln w
109
Vimos que la probabilidad del tal estado, durante el cual el gas, compuesto de
R
N partículas, está concentrado en un una parte del volumen de la vasija V ´= es
m
N N
1 1 V´
W = = N
=
igual a : m V V
V´
Introduzcamos su magnitud inversa
N
1 V
w= = (89.3)
W V´
No
V
w= ,
V´
R
donde No es el número de Avogadro. Ya que N 0 = , entonces,
k
R
V k
w= t
V
R V
Tomando el logaritmo de esta igualdad, obtenemos: ln w= ln , ó
k V´
V
k ln w = R ln .
V´
La magnitud situada a la izquierda de esta igualdad representa en sí la
entropía, de acuerdo a la fórmula de Boltzmann.
S = k ln w
Supongamos que el mol de gas se dilata isotérmicamente, desde el volumen
V ´= V1 hasta el volumen V ´= V2 . Escribamos la expresión de la entropía antes y
después de la dilatación:
S1 = k ln w1 = R (ln V − ln V1 ),
S 2 = k ln w2 = R (ln V − ln V2 )
Restando una ecuación de la otra, obtenemos la magnitud del cambio de
entropía como resultado de la dilatación:
110
w1 V
∆S = S 2 − S1 = k ln = R ln 2 . (89.4)
w2 V1
Tal fórmula también la obtuvimos anteriormente (85.9).
Se sabe que el trabajo de dilatación durante el proceso isotérmico es igual a:
V2
A = RT ln
V1
Comparando esta expresión con (89.4) hallamos que
A
∆S = .
T
Por otra parte, según la ley de conservación de la energía, en el proceso
isotérmico A= ∆Q , de donde
∆Q
∆S = .
T
De tal modo obtenemos la misma expresión de ∆S que obtuvimos del análisis
del ciclo de Carnot.
La ligazón entre la entropía y la probabilidad permite tratar de otro modo al
segundo principio de la Termodinámica. El ahora significa que cualquier proceso de la
naturaleza se desarrolla de tal modo que el sistema pasa al estado, cuya probabilidad
es mayor. Junto con ello la afirmación contendida en el segundo principio pierde su
carácter categórico. El hecho de que cada proceso que marcha por sí solo conducen
al estado de mayor probabilidad, no significa que es imposible otra dirección del
proceso. Como ya indicamos anteriormente, sólo significa que le paso al equilibrio es
solamente más probable que la libre separación del estado de equilibrio. Por eso, de
hecho el segundo principio es necesario comprenderlo de tal modo, que si el sistema
se encuentra en cualquier estado con una entropía dada, será de esperar, con una
probabilidad aplastante, que el sistema pasará a un estado de mayor entropía, es
decir, que el cambio más probable de la entropía es su crecimiento. Por principio, son
imaginables también los procesos que van acompañados de una disminución de
entropía.
Aquí es necesario recordar que las fluctuaciones, que hemos recordado más
de una vez, representan en sí tales cambio de estado, que van acompañados de una
disminución de entropía 8y, naturalmente, de probabilidad). Pero estas desviaciones
pequeñas del estado de equilibrio no contradicen al segundo principio. Ellas son
consecuencia inevitable, precisamente del carácter probable de la entropía.
111
incomparablemente más fácil transformar el movimiento ordenado en caótico, que
producir la transformación contraria.
Esto se aclara con el siguiente ejemplo. Imaginémonos una caja con bolas
negra y blancas, dispuestas de tal modo que en cada mitad de la caja se encuentren
las bolas de un color (fig 97.a). Ahora es suficiente sacudir unas cuantas veces la caja
para que las bolas se mezclen en ella y se dispongan en completo desorden (fig.
97,b). La simple sacudida de la caja transformó el orden en la distribución de las bolas
en desorden.
Sin embargo, con estas sacudidas no se pueden llevar las bolas de nuevo al
estado ordenado, para que en cada mitad de la caja de nuevo se encuentren las bolas
de un color. Hablando en rigor, al repetir muchas veces las sacudidas, por principio,
es posible que cualquier golpe de turno conduzca al establecimiento del orden. Pero
este suceso casual, evidentemente, es extremadamente poco probable. Al desorden
conducen, prácticamente, cada sacudida, al orden sólo una ente muchas.
112
Con ello también está ligado el hecho de que cualquier forma de energía pasa
al fin y al cabo a calor, ya que la energía térmica es la energía de los movimientos
desordenados, mientras que las demás formas de energía están ligadas con un
movimiento más ordenado.
Resumiendo todo lo dicho anteriormente sobre la entropía, formulemos una vez
más sus propiedades fundamentales;
La entropía es una función del estado del sistema.
Para calcular la entropía del sistema en el estado dado con relación a cualquier
dQ
estado tomado como cero, es necesario calcular el valor de ∫ T
para cualquier
proceso reversible de su estado. La entropía crece en un sistema cerrado que cambia
irreversiblemente del sistema. La entropía está ligada, directamente, con la
probabilidad del estado. El crecimiento de la entropía del sistema pasa del estado
menos probable al más probable. La entropía es la medida de desorden del sistema.
El crecimiento de la entropía, durante el proceso irreversible, significa que la
energía que poseía el sistema se hace menos accesible para su transformación en
trabajo mecánico. En el estado de equilibrio, cuando la entropía ha alcanzado su valor
máximo, en general, la energía del sistema no puede ser transformada en trabajo.
113
Desde el punto de vista del mecanismo del fenómeno, la paradoja de Maxwell
se resuelve d la forma siguiente. Absteniéndose, por supuesto, de la idea sobre el
<<diablo>> situado en el orificio, con la intención de alterar el segundo principio de la
Termodinámica, deberemos tener presente, precisamente, un dispositivo determinado.
Ya que este dispositivo se pone en acción por los golpes de las moléculas (aunque
sean de las rápidas), entonces, él mismo debe tener medidas moleculares. Por eso,
las piezas de este dispositivo tomarán parte en los movimientos moleculares (del tipo
Browniano). Pero estos movimientos son completamente desordenados, estadísticos.
A consecuencia de ello, el orificio se abrirá según la ley de la casualidad, de modo que
a través de él pasarán no sólo las moléculas rápidas, sino también las lentas y no
ocurrirá la diferencia de temperaturas esperada, en concordancia completa con el
segundo principio de la Termodinámica.
4. FUNDAMENTOS BÁSICOS
Las tres leyes de Newton (naturalmente incluyendo los conceptos básicos de masa,
longitud, tiempo, fuerza, las leyes de la geometría, el álgebra y el cálculo) junto con el
concepto del trabajo virtual, pueden considerarse como los fundamentos sobre los
cuales se basa toda la mecánica clásica (el campo para el cual se cumplen las
condiciones C,D y E del numeral 1.6). Sin embargo conviene señalar desde el
comienzo que las leyes básicas de la dinámica pueden ser expresadas
(matemáticamente) de varias maneras diferentes a la forma dada por Newton. Las
más importantes de estas formas (que serán tratadas más adelante) son:
Todas ellas son básicamente equivalentes. Por ejemplo, si se parte de las leyes de
Newton y del principio del trabajo virtual (ver el numeral 2.13 del capítulo 2) se puede
deducir cualquiera de las formas anteriores. Así pues, una cualquiera de las cinco
formulaciones puede tomarse como base de los desarrollos teóricos y de la solución
de los problemas.
114
La escogencia de una de las cinco formas depende del trabajo que se ha de
realizar. Por ejemplo, las ecuaciones de Newton son adecuadas para la solución de
muchos problemas sencillos, el principio de Hamilton es importante en varias
consideraciones teóricas; y las ecuaciones de Hamilton han sido útiles en ciertas
aplicaciones, asi como en el desarrollo de la mecánica cuántica.
dv
F =m (1.1)
dt
Fx = m x Fx = m y Fx = m z
115
dx d 2x
(En el presente texto se utilizará la conveniente notación: = x, 2 = x , etc) (1.2)
dt dt
Condición A
La ecuación (1.1) implica algún “marco de referencia” con respecto al cual se mide
dv
. Las ecuaciones (1.2) indican que el movimiento se ha referido a un sistema de
dt
ejes rectangulares X, Y, Z.
5
El término “partícula”, un concepto imaginario, puede representarse como una pequeña
porción de materia, tan diminuta que su posición en el espacio se determina por las tres
coordenadas de su “centro” . En este caso su energía cinética de rotación con respecto a
cualquier eje que la atraviese, puede depreciarse.
2
El término “marco inercial” puede definirse en abstracto, sencillamente como aquel, con
respecto al cual, las ecuaciones de Newton en su forma sencilla (1.2) son válidas. Pero esta
definición no le indica al ingeniero o científico aplicado, donde hallar tal marco, o si ciertas
coordenadas específicas son inerciales. Por otra parte, la definición de las estrellas fijas, si
suministra esta información. Desde luego, debe observarse que mediciones hechas con gran
precisión podrían demostrar que el marco de las “estrellas fijas” fuera ligeramente no-inercial.
3
Un marco de referencia adherido a la superficie de la Tierra es claramente no-inercial debido
a las rotaciones anuales y diarias, y a los demás movimientos del globo. A pesar de esto, la
aceleración de este marco es tan pequeña que para muchos efectos (pero en ningún caso para
todos los efectos) puede considerarse como inercial. Un marco que no gire (con sus ejes
dirigidos siempre hacia las mismas estrellas fijas) con su origen adherido al centro de la Tierra
es una mejor aproximación de un marco inercial. Un sistema de ejes que no giren, con su
origen en el centro del Sol, constituye un marco inercial excelente (aunque posiblemente no es
aún “perfecto”)
116
Lo anterior no implica, sin embargo, que no se puedan utilizar coordenadas no-
inerciales. Por el contrario, como podrá notarse en forma evidente, los marcos no-
inerciales se emplean quizá con la misma frecuencia que los marcos inerciales. En los
ejemplos que siguen se observará como debe escribirse la segunda ley de Newton en
el caso de coordenadas no-inerciales. En los capítulos 3 y 4 se demuestra que las
ecuaciones de Lagrange (una vez expresada la energía cinética en la forma
apropiada) conducen a las ecuaciones del movimiento correctas en coordenadas
inerciales, no inerciales o mixtas.
Ejemplo 1.1
En la figura 1-1, (a) representa una esfera de masa m, bajo la acción de una esfera
exterior F (con componentes Fx y Fy) sometida a la gravedad. Si se supone que el
marco X1, Y1 es inercial, considerando el movimiento solamente en un plano y tomando
la esfera como una partícula, las ecuaciones del movimiento con respecto a la Tierra,
son
(1) m x1 = Fx (2) m y1 = Fy − mg
Por otra parte, las relaciones entre la “coordenadas del vagón” y las “coordenadas
de la Tierra” , para m, serían
117
1 2
(3) x1 = x2 + v1t + azt (4) y1 = y2 + h
2
(5) m x2 = Fx − ma x (6) m y2 = Fy − mg
Es claro que la ordenada y2 es inercial puesto que (2) y (6) tienen la misma forma.
Sin embargo, la abscisa x2 es no-inercial, ya que (1) y (5) son diferentes. La ecuación
(5) es un ejemplo sencillo de la segunda ley de Newton escrita para un marco no-
inercial. (Nótese la magnitud del error que se cometería si se escribiera, en cambio,
m x2 = Fx )
Si el hombre lanza una bola (Fig. 1-1 (b)) hacia arriba con una velocidad v 0, su
trayectoria en el vagón sería parabólica y debe calcularse como si la gravedad tuviera
la magnitud y dirección indicadas antes. Si el hombre tiene una masa M, ¿Cuál será su
“peso” en el vagón?
Como una extensión de este ejemplo, supóngase que el coche se hace oscilar
sobre la vía, alrededor de un punto fijo, según δ = δ 0 + Asenωt en donde δ 0 , A y ω
son constantes. La ecuación (6) continua sin modificación, pero al derivar x1=x2+ δ 0
+Asen ω t y al insertarla en (1), se obtiene
m x2 = mAω 2 senωt + Fx
Para el hombre será difícil colocarse sobre una báscula, no importa donde este
ésta, puesto que su “peso” total cambio con el tiempo en magnitud y en dirección.
Ejemplo1.2:
118
Considérese el movimiento de una partícula de masa m (Fig. 1.2) con respecto a
los ejes X2 y Y2 que giran con velocidad angular constante w con relación al marco
inercial de X1 y Y1.
Las ecuaciones de
movimiento en las coordenadas
inerciales, son
m x1 = Fx1 m y1 = Fy1
x1 = x2 cos ω t − y2 senω t
y1 = x2 senω t + y2 cos ω t
[ ]
Fx1 = m x 2 cos ω t − 2 x2ω senω t − 2 y2ϖ cosϖ t − x2ω 2 cos ω t + y2ω 2 senω t − y2 senω t (9)
119
Estas son las ecuaciones del movimiento con respecto a los ejes no-inerciales X 2 y
Y2. Nótese que sería un error escribir Fx 2 = m x2 y Fy 2 = m y2 . Este ejemplo pone en
evidencia que cualquier marco giratorio es no-inercial.
Condición B.
d
F= (mv)
dt
Pueden citarse varios ejemplos en los que la masa de un objeto varía con su
posición (una bola de nieve que rueda por una pendiente cubierta de nieve), que varía
con el tiempo (un carro tanque con un orificio en un extremo por el cual sale un líquido,
o un cohete durante la etapa en que se quema el combustible), o que varía con la
velocidad (un objeto que se mueve con una velocidad cercana a la de la luz). Sin
embargo, en este texto no se considerarán problemas de masa variable.
Condición C.
En general, las masas del sistema deben ser grandes en comparación con las de
los átomos y las de las partículas atómicas. La dinámica de las partículas atómicas
pertenece al campo de la mecánica cuántica. A pesar de esto, hay algunas situaciones
“fronterizas”; por ejemplo, la deflexión de un haz de electrones en un tubo de rayos
catódicos usualmente se calcula con suficiente precisión por medio de la mecánica
clásica.
Condición D.
Sea grande o pequeña la masa, su velocidad debe ser muy inferior a la de la luz.
Como se sabe, por la teoría especial de la relatividad, la masa de cualquier objeta
aumenta con la velocidad. En el caso de velocidades “ordinarias” este cambio de masa
es muy pequeño, pero a medida que la velocidad se aproxima a la de la luz, la
proporción de este aumento se vuelve muy importante. Por consiguiente, la relación
(1.2) no describirá con precisión el movimiento de un electrón, un protón, o una pelota,
si éstos se mueven con una velocidad aproximada de 2 x 1010 cm/seg. (Naturalmente,
esta condición podría incluirse en B)
Condición E.
En el caso de que ciertas masas del sistema sean muy grandes, o si se consideran
intervalos de tiempo muy largos ( un siglo o más), o en problemas que abarquen estas
dos condiciones, la teoría general de la relatividad concuerda mejor con la experiencia
que la dinámica de Newton. Por ejemplo, la dinámica relativística, predice que el
perihelio de la órbita del planeta Mercurio debe avanzar un ángulo de 43” por siglo, lo
cual coincide muy bien con los resultados de mediciones astronómicas.
(a) Partiendo de unas fuerzas dadas que actúan sobre un sistema de masas, y
conocidas las restricciones, la posición y la velocidad de cada una de las
masas en un instante determinado, se requiere hallar el “movimiento” del
sistema, es decir, la posición, la velocidad y la aclaración de4 cada una de las
masas, en función del tiempo.
(b) Partiendo de unos movimientos dados para un sistema, se requiere hallar un
posible conjunto de fuerzas que produciría tales movimientos. En general,
algunas o todas las fuerzas pueden variar con el tiempo.
La mayor parte de los problemas de la dinámica aplicada son del tipo (a). El
procedimiento general es el mismo en todos aquellos que pertenecen a este tipo. Por
conveniencia el procedimiento puede dividirse en cuatro etapas.
k
τ − τθ 2 − g cosθ + (τ − τ 0 ) = 0
m
τ θ + 2τθ − gsenθ = 0
121
en donde τ 0 es la longitud del resorte sin estirarse y k es la constante elástica usual
del resorte. La integración de estas ecuaciones diferenciales de segundo orden dan
τ y θ en función del tiempo.
Con el fin de ilustrar las observaciones de los numerales anteriores y para obtener
una visión general de la dinámica, antes de iniciar el estudio detallado del método de
Lagrange, considérese el ejemplo siguiente.
122
Las masas m1 y m2 están conectadas a los resortes (cuyas constantes elásticas son
k1 y k2 ) y al bloque B, como se muestra en la figura 1-4, abajo. Se hace mover el
bloque según s=A senwt, por medio de la fuerza F. Los puntos fijos p0, p1 y p2 se han
localizado de modo que p0p1 y p1p2 son las longitudes de los resortes, primero y
segundo respectivamente, sin estirar. Todos los movimientos se efectúan sobre una
línea horizontal lisa. Se desprecian las masas de los resortes.
Debe entenderse que las soluciones que se dan a continuación no tienen por objeto
mostrar los detalles en su totalidad, sino que tratan solamente de ilustrar las etapas
fundamentales. Por esto, los manejos matemáticos que no parecen esenciales en una
visión general, se omiten. Se determina primero (a) y de aquí se siguen sin dificultad
(b), (c),… y (g).
Las ecuaciones del movimiento, obtenidas por aplicación directa de las leyes de
Newton o e las ecuaciones de Lagrange, son
m x1 + k2 x2 − k 2 x1 = 0 (2)
Con el fin de hacer el problema más específico, se fijan las siguientes cantidades:
123
m1= 400g., m2=300g. A=5cm
k1=6 x 104 dinas/cm, k2=5 x 104 dinas/cm, ω =12 rad/seg
Con lo cual se han completado las tres primeras etapas del numeral 1.8
Por simple inspección se nota que cada una de las soluciones a las partes (b),
(c),…y (g) pueden determinarse directamente partiendo de las formas finales de (3) y
(4). Así pues, todos los detalles adicionales se le dejan al lector.
4.10.Resumen y observaciones
124
solución de todo problema de dinámica, la definición de un “marco
inercial” y la verificación del papel que desempeña éste.
1.2 ¿Qué puede decirse con respecto al “origen” y a las maneras de expresar las
leyes de la dinámica?
1.3 Indicar con claridad el significado del término “marco inercial de referencia”
1.4 Demostrar que cualquier marco de referencia que se mueve con velocidad lineal
constante (sin rotación) con respecto a un marco inercial, es así mismo inercial.
1.6 El cable que sostiene un ascensor se rompe haciendo que éste caiga libremente
(despréciese la resistencia del aire). Demostrar que para cualquier sistema
mecánico cuyos movimientos se refieran al ascensor, el campo gravitatorio de la
Tierra, se anula efectivamente.
1.8 Si el coche de la figura 1-1 se mueve con velocidad constante sobre una vía
circular horizontal, ¿cuáles de las coordenadas x2, y2 o z2 de m1 (o de cualquier
otro punto referido al marco X2, Y2 y Z2) serán no inerciales? Explicar. (Supóngase
que Z1 tiene la dirección del radio de curvatura de la vía)
1.9 Supóngase que el marco X2, Y2 de la figura 1-2 tiene un tipo definido de rotación
(como θ = constante, θ = constante o θ = θ 0 senωt ). Demostrar que las
coordenadas x2, y2 son no-inerciales. Véase el ejemplo 1-2.
1.11 Supóngase que el origen del sistema X2, Y2 de la figura 1-2 tiene una aceleración
constante ax, en la dirección del eje X1, y que simultáneamente x2, y2 giran con
velocidad angular constante ω . Demostrar que las ecuaciones (11) y (12) del
ejemplo 1.2, deben reemplazarse por.
Fx 2 = m x2 − mx2ω 2 − 2mωy2 + max cos ωt
Fy 2 = m y2 − my2ω 2 + 2mωx2 − max senωt
1.12 Supóngase que el marco X, Y al cual está sujeto el péndulo de la figura 1-5; se
mueve con velocidad constante vx en la dirección X y vy en la dirección Y (sin
rotación del marco). Demostrar que la ecuación del movimiento del péndulo, en el
sentido de θ , es rθ = − gsenθ ¿El periodo de oscilación se altera por el
movimiento del marco del cual pende?
rθ = − ax cosθ − gsenθ
y por tanto, que θ no es inercial. ¿El péndulo tiene ahora un periodo igual al del
problema 1.12?
1.14 Enunciar y dar ejemplos de las dos principales clases de problemas que se
encuentran en la dinámica clásica. Describir el procedimiento general que se siguen
en la solución de los problemas del primer tipo.
126
5. FUNDAMENTOS BÁSICOS II
Los diferentes tópicos bajo este capítulo se estudiarán, principalmente, por medio
de ejemplos específicos.
127
Fig. 2-1
Puede verse que las relaciones (2.1) pueden escribirse en una forma más
conveniente, como sigue
x1 = x0 + l1 x 2 − l 2 y 2 (2.2)
y1 = y 0 + m1 x 2 + m2 y 2
En donde l1, m1 y l2 son los cosenos directores de los ejes X2, Y2 respectivamente,
con relación al marco X1, Y1.
Extendiendo el razonamiento, supóngase que el origen de X2, Y2 se mueve con
una velocidad que puede ser constante (con componentes vz y vy) con respecto al
marco X1, Y1; y simultáneamente, que los ejes X2, Y2 giran con gran velocidad angular
constante w, de tal manera que θ = wt . Las ecuaciones (2.1) y (2.2) pueden
escribirse:
x1 = v z t + x 2 cos w t − y 2 sen w t
y1 = v y t + x 2 sen w t + y 2 cos w t
Nótese que son ahora funciones tanto de como del tiempo. Naturalmente,
pueden escribirse ecuaciones adecuadas para cualquier tipo de movimiento que se
suponga.
Frecuentemente se encuentran ecuaciones de transformación semejantes a las
anteriores, las cuales se designan simbólicamente por
x1 = x1 ( x 2 , y 2 , t ). y1 = y1 ( x 2 , y 2 , t ).
128
Fig. 2-2
x1 = x 0 + l1 x 2 + l 2 y 2 + l3 z 2
y1 = y 0 + m1 x 2 + m2 y 2 + m3 z 2 (2.4)
z1 = z 0 + n1 x 2 + n2 y 2 + n3 z 2
En donde l1, m1 y n1, son los cosenos directores del eje X2, etc.
Desde luego, el marco X2, Y2, Z2 podría estarse moviendo, en cuyo cado
(conocido el movimiento) x0, y0, z0 y los cosenos directores podrían expresarse en
función del tiempo, o sea x1 = x1(x2, y2, z2, t), etc.
Este sistema, bastante conocido, se muestra en la figura 2-3. Se observa que las
ecuaciones que relacionan las coordenadas (x, y, z) con ( r , θ , z ) son
129
Las coordenadas esféricas, consistentes en dos ángulos, φ y θ , y una distancia r ,
usualmente se designan como en la figura 2-4. Observando la figura se demuestra que
Fig. 2-5
x = q1 cos α + q2 cos β
y = q1 senα + q2 senβ (2.7)
q ,1 = q1 + q2 cos( β − α )
q , 2 = q2 + q1 cos( β − α ) (2.8)
s2 = xsenβ − y cos β
s1 = y cos α − xsenα (2.9)
1
x = r1 (1 − q 2 ) 2 , y = r1q (2.10)
130
Fig. 2-6
q
xy = 2 A y=( )x (2.11)
1 − q2
Fig. 2-7
En la figura 2-7 se muestran las gráficas de las coordenadas A y q. Las “curvas
de q” se obtienen dejando A constante y haciendo gráficas de la primera relación de
(2.11). En la misma forma, las “curvas de A” resultan de la segunda relación, con q
constante.
Es evidente, por los ejemplos mencionados, que puede emplearse una gran
variedad de coordenadas (longitudes, ángulos, funciones trigonométricas, áreas, etc.).
131
Fig. 2-8 Fig. 2-9
y1 = h + s4 + q1 − l1 − l 2 − 2C , y 3 = h − s4 − q1 + l1
y 2 = h − s4 − 2q1 + l1 , y 4 = h − s4 (2.12)
en donde l1y l2 son las longitudes de los cables. Nótese que las posiciones verticales
de todas las cuatro masas con conocidas, si se han dado los valores de dos
coordenadas únicamente (s4, q1).
Las dos masas, m1 y m2, de la figura 2-10, están suspendidas de un soporte rígido
y pueden moverse libremente en el plano X, Y.
(a) Suponiendo que r1 y r2 son hilos de longitud fija, se requieren dos coordenadas
tales como ( θ , φ ), (x1, x2), (y1, y2), etc.
132
Fig. 2-10
(a) Supóngase que en la figura 2-1, el origen O posee una velocidad inicial (vx, vy)
y una aceleración constante (ax, ay), mientras los ejes giran con velocidad
angular constante w. Lógicamente las ecuaciones (2.2) toman la forma
x1 = v x t + 12 a x t 2 + x2 cosω t − y 2 senω t (2.14)
y1 = v y t + 12 a y t 2 + x 2 senω t − y 2 cosω t
Una vez más se ve que x1 = x1(x2, y2, t), etc.
(b) Si se hace oscilar a lo largo de una recta inclinada, al soporte de la figura 2-10,
según x0 = A0 + Asenω t y y 0 = B0 + Bsenω t , las relaciones (2.13) tendrán la
forma
x 2 = A0 + Asenω t + r1 senθ + r2 senφ (2.15)
y 2 = B0 + Bsenω t − r1 cos θ − r2 cos φ
etc., lo cual puede indicarse como x2 = x2(r1, r2, θ , φ , t), etc. Es importante entender y
desarrollar un sentido del significado físico y geométrico asociado con relaciones
simbólicas de este tipo.
133
(c) Si en la figura 2-9 se le da al soporte una aceleración vertical constante con
velocidad inicial v1, entonces h = v1t + 12 at y las relaciones (2.12) deben
2
(d) Supóngase que los ejes Q1 y Q2 de la figura 2-5 giran alrededor del origen con
velocidades angulares constantes, w1 y w2, de modo que α = ω1t y β = ω 2 t .
Aún así es posible usarlos como “marco de referencia” (aunque para la mayoría de
los problemas no resulta muy deseable). Las relaciones (2.7) se convierten en
x = q1 cos ω1t + q2 cos ω 2 t (2.16)
y = q1 senω1t + q2 senω 2 t
o bien, x = x(qi , q2, t), etc.
134
A continuación se incluyen ejemplos que tienen desde uno, hasta muchos grados de
libertad.
Una partícula restringida a moverse en una línea recta (una cuenta ensartada en un
hilo rígido) cuya ecuación es y = a + bx. Si se conoce x o y, la otra queda determinada.
Una cuenta con posibilidad de moverse libremente en un hilo rígido de cualquier forma
conocida: Parabólica, helicoidal, etc.
En péndulo simple con su movimiento confinado a un plano. O un hilo cuyo hilo se tira
hacia arriba por un pequeño orificio en un tablero fijo, a una rata constante. (La
longitud del péndulo es una función conocida del tiempo.) Nótese que el tiempo nunca
se incluye como un grado de libertad.
La cuenta que se muestra en la figura 2-11, que puede deslizarse libremente a lo
largo de la varilla que gira alrededor de p, de alguna manera determinada.
Fig. 2-11
Fig. 2-12
Una partícula con libertad para moverse en contacto con un plano o con una
superficie conocida cualquiera: Esférica, cilíndrica, etc.
La palanqueta de la figura 2-12, que puede deslizarse libremente a lo largo del eje Y y
al mismo tiempo girar alrededor del mismo eje.
El sistema de masas y poleas de la figura 2-9. En la ecuación (2.12) se observa queso
se han dado los valores de s4 y q1, se conoce la configuración completa. Si el soporte
AB se está moviendo, se requieren dos coordenadas y t; sin embargo, aún así se
considera que existen dos grados de libertad.
El péndulo doble de la figura 2-10, siendo r1 y r2 los hilos de longitud constante.
Fig. 2-13
135
Una partícula libre de moverse en el espacio. Coordenadas posibles: (x, y, z), (r , φ ,
θ ), etc.
Un tablero o una lámina que puede deslizarse libremente sobre un plano. Se requieren
dos coordenadas para traslación y una para rotación.
El péndulo doble de la figura 2-10, si se supone que r 1 es una banda de caucho y r 2
tiene longitud fija.
Un cuerpo rígido que puede girar libremente alrededor de cualquier punto fijo. O, como
se muestra en la figura 2-13. La orientación queda completamente determinada por
θ , φ , α . (m es una partícula cualquiera del cuerpo.)
El sistema de la figura 2-8 con un resorte adicional y una masa conectado a m2.
El cuerpo rígido de la figura 2-13 con la posibilidad que la unión esférica se mueva
siempre en contacto con el plano XY. Un sistema de cinco poleas montadas como se
indica en la figura 2-16.
Fig. 2-16
136
de grados de libertad si no existieran los resortes, es decir, sin ninguna conexión entre
las masas?
El péndulo doble de la figura 2-10, con las partículas y suspendidas por bandas de
caucho y con posibilidad de moverse libremente en el espacio.
Un cuerpo rígido que puede moverse libremente en el espacio, aunque se
encuentre sujeto a resortes de cualquier forma.
El cuerpo rígido de la figura 2-13 con otro cuerpo rígido ligado a él por medio de
una unión esférica, por ejemplo en P.
El sistema de poleas de la figura 2-15 con resortes intercalados de cada uno de los
cables que sostienen a y a .
(g) Muchos grados de libertad.
Dos tableros articulados entre sí, de modo que el ángulo entre ellos puede variar y
además pudiendo moverse el conjunto de cualquier manera aparte de la restricción de
la articulación. Tal sistema tiene siete grados de libertad.
Una sucesión de siete poleas como las de la figura 2-16 tiene siete grados de
libertad. Un sistema consistente en tres partículas suspendidas una de la otra, como
formando un péndulo triple posee ocho grados de libertad siempre y cuando dos de los
hilos sean elásticos y el movimiento no esté restringido a un plano. Si las tres cuerdas
son elásticas el sistema tiene nueve grados de libertad.
Dos cuerpos rígidos ligados por medio de una unión esférica y con posibilidad de
moverse en el espacio con libertad, tiene nueve grados de libertad.
Dos cuerpos rígidos ligados por medio de una unión esférica y con posibilidad de
moverse en el espacio con libertad, tienen nueve grados de libertad.
Fig. 2-17
137
Fig. 2-18
Se ve entonces, que los sistemas mecánicos pueden tener cualquier número finito
de grados de libertad. El número depende en cada caso del número de masas que se
consideren y de las restricciones geométricas que se impongan a sus movimientos
Inclusive, muchos sistemas pueden considerarse como un número ilimitado de grados
de libertad. Un resorte espiral, una cuerda en vibración, la cara de un tambor, etc., son
ejemplos de este caso, si se supone que están compuestos de un número ilimitado de
partículas. En muchos problemas, aunque no en todos ellos, las masas de los
resortes, de los hilos, etc., pueden despreciarse. Así se hará en este texto.
Los sistemas que poseen un “número infinito de grados de libertad” se tratan por
otros métodos bien distintos.
138
restricción. Si el alambre está en forma parabólica, y = bx2 y z = 0 son las ecuaciones
de restricción.
Considere una vez más la figura 2-19. Se ve que para movimiento vertical
únicamente
Como extensión de este ejemplo, supóngase que los ejes X y Y del ejemplo en
consideración son los mismos X2 y Y2 que se trasladan y giran en la figura 2-1;
entonces, y2 = s + (tan ω1 t) x2. Por consiguiente, las ecuaciones de trasformación
(2.14), en función de x2 y t (igualmente podrían haberse expresado en función de y2 y
t) tienen la forma
1
x1 = v x t + a z t 2 + x 2 cosϖt − ( s + x 2 tanϖ 1t ) senϖt
2
(2.19)
1
y1 = v y t + a y t 2 + x 2 senϖt + ( s + x 2 tanϖ 1t ) cosϖt
2
en donde, tanto x1 como y1 son ahora funciones de x2 y t solamente.
En breve se verá claramente la gran importancia que tienen relaciones como (2.21)
para obtener expresiones de velocidad, energía cinética, energía potencial, etc., en
función únicamente de las coordenadas independientes.
Notas. (a) En algunos casos, el álgebra que se utilizaría para eliminar las
coordenadas superfluas puede resultar complicada. (b) Los casos, relativamente
escasos, de sistemas “noholonómicos”, permiten solamente que sus ecuaciones de
restricción se escriban en forma diferencial, no integrable. Véase el numeral 9.12.
(1) La velocidad para un elemento de trayectoria. ∆s. (∆s considerado como vector.)
. ds
en donde s es una cantidad vectorial de magnitud, , dirigida según la tangente a la
dt
trayectoria en a. Para apreciar mejor las ideas físicas y geométricas implicadas, puede
pensarse que la partícula tiene una velocidad “en la dirección de la trayectoria” en
todos los puntos de su recorrido.
140
.
sistema que se desee de tal manera que al pasar al límite ∆t → 0, s queda expresada
en ese mismo sistema. Ejemplos:
En coordenadas rectangulares, ( ∆s ) 2 = ( ∆x ) 2 + ( ∆y ) 2 + ( ∆z ) 2 . Dividido por ( ∆t ) 2 y
pasando al límite, puede escribirse
s 2 = x 2 + y 2 + z 2
(2.23)
Fig. 2-19
Fig. 2-20
En las coordenadas esféricas (véase la figura 2-20),
( ∆s ) 2 = ( ∆r ) 2 + r 2 ( ∆θ ) 2 + r 2 sen 2θ ( ∆φ ) 2
Por tanto s 2 = r 2 + r 2θ 2 + r 2 senθφ 2 (2.24)
2 2
s12 = r 1
+ r 1θ 2
s 22 = r
2
1
2
( )
+ r 1θ 2 + 2 r1r2 + r1r2θφ cos(φ − θ ) (2.26)
Naturalmente, esto supone que h sea constante. Nótese que todas las velocidades
se expresan en función de
s 4 y q 1 , únicamente.
Para utilizar en un ejemplo posterior, considérense las velocidades verticales, y
1 y
y
2 de m1 y m 2 , de la figura 2-8, con respecto al eje X, inmóvil. Se trata de
expresarlas en términos de y 1 y q 1 . Como puede verse en el diagrama,
y1 = y + q1 , y 2 = y − q2 y m1 q1 =m 2 q 2 (relación del centro de masa). Por
tanto,
m1
1 = y
y +q
1 , 2 =y
y − q
1 (2.28)
m2
(3) La velocidad expresada
en función de las coordenadas móviles.
Como un caso sencillo, supóngase que los ejes X2, Y2 y Z2 de la figura 2-2 se
mueven paralelamente al marco fijo X1, Y1, Z1 con aceleración constante (ax, ay, az).
Las ecuaciones de transformación serán, x1 = v x t + 12 a x t + x 2 , etc.
2
142
respecto a la Tierra. La línea ab está adherida a la superficie de D1. Los ejes X2 y Y2
están fijos a la superficie de D2. Una partícula de masa m puede moverse libremente,
pero en contacto con D2. Se trata de hallar una expresión
para su
velocidad con respecto a la Tierra, pero en función de las coordenadas polares
móviles, r,α, y otras magnitudes.
Puede observarse finalmente que
x1 = s cosθ1 + r cos β , y1 = ssenθ1 + rsenβ
en donde β = θ1 + θ 2 + α . Derivando y sustituyéndola en v 2 = x 12 + y 12 , se obtiene,
f = F cosθ = F cos(α − β )
= F cos α cos β + Fsenαsenβ )
143
Fig. 2-22
Pero como Fcos α = Fx y cosβ =1, etc., se tiene que f = Fxl + Fym . Extendiendo
esto a las tres dimensiones
f = Fxl + Fym + Fzn (2.33)
Fig. 2-23
Supóngase que F es una fuerza que actúa sobre un cuerpo en el punto a, y que
este punto de aplicación se mueve sobre la trayectoria de a hasta b. Entonces (aunque
el desplazamiento no se deba por compleo a F , sino también a otras fuerzas que
estén actuando sobre el cuerpo) el elemento de trabajo dW hecho por F estará dado
por dW= F ds cos θ, una cantidad escalar. Teniendo en cuenta (2.34) esto puede
escribirse,
144
Esta expresión general es correcta, inclusive en el caso en que F varíe en magnitud
y en dirección a medida que cambia de posición (puede ser una función de x, y y z)
Supóngase que ahora F es la fuerza neta que acelera la partícula m mientras esta
se mueve sobre la trayectoria AB. El trabajo realizado sobre la partícula está dado por
(2.36) y si X, Y, Z son ejes inerciales, f x = mx , etc. Si se escribe, xdx = x dx , la
ecuación (2.36) queda,
B
W = ∫ m( x dx + y dy + z dz ) = m2 ( x 2 + y 2 + z 2 ) A = m2 (v B2 − v A2 )
B
lo cual es una expresión del trabajo necesario para cambiar la velocidad de la partícula
desde v A hasta v B , una magnitud escalar que depende únicamente de m y de los
valores de v A y v B .
Si la velocidad inicial v A =0, se tiene que W = 12 mv B lo cual conduce a la siguiente
2
m .2 . 2 .2
T= (x + y + z ) véase la ecuación (2.23)
2
145
m .2 2 . 2 2 .
T= (r + r θ + r sen 2θ φ 2 ) véase la ecuación (2.24)
2
(2.39)
m .2 .2 . .
T= [ q1 + q2 + 2 q1 q 2 cos(β − α ) ] véase la ecuación (2.25)
2
.
Utilizando las ecuaciones (2.11) y la primera de las anteriores (con z = 0) puede
expresarse T en función de las coordenadas Ay q, y sus derivadas con respecto al
tiempo.
(2) Energía cinética del péndulo doble (fig 2.10). En coordenadas rectangulares
m1 .2 . 2 m . .
T= ( x1 + y1 ) + 2 ( x 22 + y 22 ) (2.40)
2 2
.
y de (2.40), quedando
.
m1 x12 r12 m2 .2 . 2 (2.41)
T= ( 2 ) + ( x2 + y2 )
2 r1 − x12 2
En función de las coordenadas r1, r2, θ y φ (suponiendo que todas son variables, y
con referencia a las ecuaciones (2.26)).
.
.
m . .
m . . . . . .
T = 1 (r12 + r12 θ 2 ) + 2 (r12 + r12 θ 2 + r22 + r22 φ 2 + 2(r12 r22 + r1r2 )
2 2
(3) Energía cinética del sistema de la figura 2-9. Despreciando las masas de las
poleas y suponiendo únicamente movimiento vertical
m1 . 2 m2 . 2 m3 . 2 m4 . 2
T= y1 + y2 + y3 + y4
2 2 2 2
. 2 . 2
1 1 . .
T = (m1 + m3 + m4 ) y1 + (m2 + m4 ) y 2 + 2m4 y1 y 2 (2.43)
2 2
146
Aplicando acá las relaciones (2.27), en forma inmediata puede expresarse T en
. .
función de s y de q , si se desea.
4 1
Como se ha observado, las coordenadas superfluas pueden ser eliminadas de T por
medio de las ecuaciones de restricción. Esta posibilidad reviste importancia en
desarrollos posteriores.
. 2
1 1 . .
T= m1 y1 + m2 ( y1 − y 3 ) 2
2 2
. .
Si, por otra parte, se eliminan y y y de la expresión original, T, en función de
1 2
. .
y y q1 (y es inercial pero q1 es no-inercial) queda,
m1 + m2 . 2 m1 m1 + m2 .
T =( )y + ( ) q1 (2.44)
2 2 m2
. m1 + m2 . 2 1 m1m2 . 2
.
Y en función de y y y , T = ( )y + ( ) y3
3 2 2 m1 + m2
en donde vx, αx, etc… son constantes. Nótese que la expresión incluye
explícitamente el tiempo.
(c) Si el origen 0, de la figura 2.1, posee una velocidad inicial (vx, vy) y una
aceleración constante (αx, αy) al mismo tiempo que los ejes giran con una
velocidad angular constante w, de las ecuaciones (2.14) tenemos
147
. . .
x1 = vx + α xt + x2 cos wt − x2 wsenwt − y2 senwt − y2 w cos wt
.
Al tomar esta ecuación junto con la expresión de y y remplazarlas en
1
1 .2 . 2 .
T= m x1 + y1 tendremos a T en función de x2, y2 , x. 2 , y , t.
2 2
(d) Con referencia a la figura 2-21 y a al ecuación (2.31) reobserva que la energía
cinética de la partícula que puede deslizarse libremente en contacto con la
segunda superficie giratoria, está dada por
1 2 . 2
.
. . . . .
T = m s θ 1 + 2s θ1 r sen(θ 2 + α ) + r 2 β 2 + r2 + 2 s θ 1 β r cos(θ 2 + α ) (2.46)
2
Debe notarse que (2.46) es correcta, no importa la suposición que se haga respecto
de las variaciones con el tiempo de θ1 y de θ2. En el caso de velocidades angulares
. .
constantes, sencillamente se remplazan θ y θ por las constantes w1 y w2. Pero si se
1 2
supone que D1 y D2 oscilan según θ1 = A senαt y θ2 = Bsenbt, entonces se deben
. .
remplazar θ y θ por Aacosαt y Bbcosbt, respectivamente. En tal caso T incluirá a t,
1 2
explícitamente. En tal caso T incluirá a t, explícitamente.
Así pues
1 p 2. 2. .2 1 p . . ´ . . ´ . . ´
2 2 2
T = ∑ mi xi + yi + zi = ∑ mi x + xi + y + yi + z + zi
2 i =1 2 i =1
Al hacer la expansión escribiendo M = ∑m, y teniendo en cuenta que por la
.
definición del centro de masa, ∑m1x1 = 0, que ∑m1 x 1 = 0, etc…, la expresión anterior
se reduce a
1 p . ´ . ´ .´
2 2 2
M 2. . .
2
T= xi + yi + zi + ∑ mi xi + yi + zi
2
(2.47)
2 2 i =1
148
(a) Tal expresión demuestra que la energía cinética de un sistema de partículas es
igual a la de una “partícula” única de masa M = ∑m, (masa total del sistema)
localizada en el centro de masa y moviéndose solidariamente con él, sumada a las
energías cinéticas de todas las partícula calculadas con respecto al marco X´, Y´, Z
´, como si éste último fuera inercial.
(b) Lo anterior es igualmente cierto, sin importar si las partículas son libres o si tienen
cualquier tipo de restricción. En realidad esto puede aplicarse inclusive a los
cuerpos rígidos, en cuyo caso el movimiento con relación al marco móvil sólo
puede tomar la forma de una rotación.
(c) Si el sistema se supone dividido en dos o más grupos de partículas, es evidente
que el teorema puede aplicarse a cada uno de estos grupos en forma individual.
(d) A pesar de que (2.47) se ha escrito en coordenadas rectangulares, es lógico
pensar que esta forma de T puede expresarse en cualquier otro sistema
conveniente de coordenadas por medio de las ecuaciones de transformación
adecuadas.
(1) Como etapa introductoria considérese la energía cinética de una partícula única
que tenga tres grados de libertad (sin restricciones). Suponiendo que alguna o todas
las coordenadas generalizadas se mueven (q1, q2 ,q3 ), las ecuaciones de
transformación pueden indicarse como
x = x( q1 , q2 , q3 , t ); y = y ( q1 , q2 , q3 , t ) ; z = z ( q1 , q2 , q3 , t )
Derivando
. ∂x . ∂x . ∂x . ∂x
x= q1 + q2 + q3 + , etc
∂q1 ∂q2 ∂q3 ∂t
Por conveniencia escribimos
. . . .
x = a1 q1 + a2 q 2 + a3 q 3 + α
. . . . . . . .
Y similarmente, y = b1 q + b2 q + b3 q + β , z = c1 q + c2 q + c3 q + λ
1 2 3 1 2 3
∂y
En donde, por ejemplo, b3 = , etc
∂q3
. . .
Elevando al cuadrado estas expresiones y remplazando x 2 , y y z 2 en
2
m .2 . 2 .2
T = ( x + y + z ) , se obtiene finalmente,
2
2 .2 . 2 .2 . .
1a (
+ b1
2
+ c1
2
q1 + a )
2
2 + b 2
2 (
+ c2
2
q 2 + a 2
3 + b3)
2
+ c3(
2
q 3 + 2 ( a a
1 2 )
+ b b
1 2 + c c
1 2 ) q 1 q2
1 . . . . .
T = m + 2( a1a3 + b1b3 + c1c3 ) q1 q 3 + 2( a2 a3 + b2b3 + c2c3 ) q 2 q 3 + 2( a1α + b1β + c1γ ) q1 +
2 . .
2( a2α + b2 β + c2γ ) q 2 + 2( a3α + b3 β + c3γ ) q 3 + α 2 + β 2 + γ 2
(2.48)
149
.2
Nótese que T contiene cuatro clases de términos: los que contienen q , los que
r
. . .
tienen q q , los que llevan q únicamente y por último, los que no incluyen ninguna
r s r
velocidad de las coordenadas. Sin embargo todos los términos son dimensionalmente
2
equivalentes a Mv
El ejemplo que se da a continuación aportará un mayor sentido a la expresión
siguiente. Haciendo referencia a la figura 2-5 y suponiendo que el origen de los ejes
Q1 y Q2 tiene una aceleración lineal constante α (sin rotación), se ve que
1
x = x0 + vz t + α xt 2 + q1 cosα + q2 cos β (2.49)
2
1
y = y0 + v y t + α yt 2 + q1senα + q2 senβ
2
.2 . 2 1 .2 . 2
Derivando y remplazando x y y en m x + y , tenemos
2
[ ]
2 2
( )
. . . . .
1q + q 2 + 2 q q
1 2 cos ( β − α ) + 2 ( v x + a x t ) cos α + v y + a y t senα q 1+
1
[ ] ( )
T = m 2 ( vx + axt ) cos β + ( v y + a y t ) senβ q 2 + 2( vx ax + v y a y )t + ax2 + a y2 t 2 +
.
(2.50)
2
v x + v y
2 2
Por simple inspección puede concluirse que (2.50) tiene exactamente la forma de
(2.48).
En efecto, cada uno de los términos de (2.50) puede ser obtenido del
correspondiente de (2.48) al evaluar los factores a, b, c, etc., por medio de las
relaciones (2.49).
La relación (2.50) presenta una buena oportunidad para destacar un punto básico.
A pesar de su complejidad, el miembro derecho de la ecuación es sencillamente
2
m ∆s
, en donde ∆s es un desplazamiento de p con relación al marco inercial X, Y.
2 ∆t
(2)
. n . . n . . n .
x i = ∑ aik q k + α i y i = ∑ bik q k + β i z i = ∑ cik q k + γ i (2.52)
k =1 k =1 k =1
∂x ∂x
Aquí, por ejemplo, aik = ,α i = , etc. Nótese que aik ≠ aki, etc.
∂qk ∂t
Por un proceso directo de elevación al cuadrado, puede demostrarse que
150
.2 n n . . n .
x i = ∑∑ aik ail q k q t + 2α i ∑ aik q k + α i2 (2.53)
k =1 i =1 k =1
. 2 .2 .2 . 2 .2
Ecuaciones semejantes se pueden obtener para y y z . Eliminando x i , y y z i de
i i i
1 p .2 . 2 .2
T= ∑ mi xi + y i + z i
2 i =1
Y agrupando los términos,
n n
1 p . . n
p .
T = ∑∑ ∑ mi ( aik ail + bik bil + cik cil ) q k q l + ∑ ∑ mi ( α i aik + β i bik + γ i cik ) q k +
k =1 i =1 2 i =1 k =1 i =1
(2.54)
( )
p
1
∑ mi α i + βi + γ i
2 i =1
2 2 2
151
cambio no solamente en magnitud, sino también en dirección. Teniendo esto en
cuenta, se define la aceleración del punto móvil en p1, como
∆v1 dv
a= para ∆t→0, o sea, a = (2.57)
∆t dt
Fig 2-24
Es claro que a es un magnitud vectorial que tiene la dirección de ∆v1 cuando ∆t→0.
Esta definición trae consigo el hecho importante de que el vector aceleración, en
general no lleva la dirección del movimiento. (Nótese que el vector velocidad v = ds/dt,
definido en el numeral 2.7 lleva siempre la “dirección de la trayectoria”.)
.. 2 .. 2 .. 2
a2 = x + y + z
(2.58)
Naturalmente su dirección está determinada por los cosenos directores
.. .. ..
x/ a, y/ a, z/ a
Como se demuestra en el numeral 3.9 del cap , éstas y otras expresiones para
la aceleración pueden determinarse fácil y rápidamente a partir de las
ecuaciones e Lagrange.
153
completo la superficie; b) δs en cualquier dirección sobre la superficie móvil, y c) en
cualquier dirección sobre la superficie, considerada ahora como estacionaria.
p
δW = ∑ ( Fxiδxi + Fyiδyi + Fziδzi ) (2.62)
i =1
∂xi ∂x ∂x ∂x
δxi = δq1 + i δq2 + ... + i δqn + i δt , etc
∂qi ∂q2 ∂qn ∂t
Estos desplazamiento no violan las restricciones, pero durante el tiempo
trascurrido δt los marcos móviles y las restricciones móviles habrán cambiado de
posición ligeramente. Entonces, como se demostrará en los ejemplos, δW todavía
contiene el trabajo hecho por las fuerzas de restricción.
(c) Determinando los desplazamientos por medio de (2.21) pero conservando el
tiempo
constante ,
∂xi ∂x ∂x
δxi = δq1 + i δq2 + ... + i δqn , etc (2.63)
∂qi ∂q2 ∂qn
Este sistema para eliminar las fuerzas de restricción es una de las grandes
realizaciones del método de Lagrange
Las consideraciones anteriores son de vital importancia en el principiop de D´Alembert.
En los cap 3 y 4 se verá con claridad su trascendencia en un método concreto de
planteamiento de las ecuaciones del movimiento, prácticamente todo sistema
dinámico.
5.14.RESUMEN Y OBSERVACIONES
154
Una de las primeras etapas en la solución de cualquier problema es la selección de las
coordenadas adecuadas. Las ecuaciones de transformación desempeñan un papel
muy importante al expresar la energía cinética, la aceleración y muchas otras
magnitudes importantes, en unción de las coordenadas seleccionadas. Varios
desarrollos teóricos dependen del uso de las ecuaciones de transformación.
Utilizando estas ecuaciones, las coordenadas superfluas pueden ser eliminadas de las
ecuaciones de transformación, de la energía cinética, de la energía potencial y demás
magnitudes.
4. Velocidad en coordenadas generalizadas (2.7)
La velocidad de una partícula puede expresarse en términos de cualquier sistema de
coordenadas generalizadas y de sus derivadas con respecto al tiempo. Con frecuencia
aparece t. las etapas posteriores no pueden emprenderse sin un conocimiento de
cómo se hace esto. De aquí la importancia del numeral2.7.
6. Aceleración (2.12)
El análisis hecho por objeto aclarar la definición básica de aceleración y demostrar que
sus componentes en cualquier dirección pueden expresarse en coordenadas
generalizadas. Sin embargo, a pesar de que la aceleración desempeña un papel
básico en todas alas ecuaciones del movimiento, la técnica anterior no tiene una
importancia vital ya que, como se demuestra en el numeral 3,10 las ecuaciones de
Lagrange tiene en cuenta automáticamente las componentes de la aceleración.
Una última palabra: como se verá en los capítulos 3 y 4 los puntos 1 a 7 anteriores
(exceptuando el 6) constituyen la materia básica fundamental para poder entender las
155
ecuaciones de Lagrange y son, en realidad, las etapas preliminares que deben
seguirse al aplicar estas ecuaciones.
_____________________________________________________________________
*Nota sobre la ecuación (3.3). Multiplicando las relaciones (3.1) por a, b y c
respectivamente y sumando se obtiene
M (xa + yb + zc) = Fxa+Fyb+Fzc
Lo cual es una relación verdadera, independiente de la naturaleza de a, b y c. Pueden
representarse constantes de cualquier valor, desplazamientos, velocidades o aún funciones
de variables. Así, en cuanto concierne a (3.3) δx, δy, δz son magnitudes completamente
arbitrarias. Sin embargo, para nuestro objetivo, las consideraremos como componentes de
δs, el desplazamiento virtual infinitesimal de m. Además, en lo que sigue, se supondrán de
acuerdo con la restricción. Al considerarlo así 3.3 se denomina con frecuencia “principio de
D´Alembert”).
Ejemplo específico para demostrar el significado de (3.4):
x = Csenθ cos φ ,
Supóngase que la superficie restrictiva es una esfera de radio constante, r = C. En
coordenadas esféricas, las relaciones específicas correspondientes a (3.4) serán
entonces,
x = Csenθ cos φ , y = Csenθsenφ , z = C cos φ (3.5)
δx δx δy δy δz δz
δx = δq1 + δq 2 , δy = δq1 + δq 2 , δz = δq1 + δq 2 , (3.6)
δq1 δq 2 δq1 δq 2 δq1 δq 2
157
Sustituyendo (3.6) en la ecuación de D´Alembert, (3.3), y agrupando términos.
(3.7)
¨ δx ¨ δy ¨ δz ¨ δx ¨ δy ¨ δz
δW = m x δq1 + y δq1 + z δq1 δq1 + m x δq 2 + y δq 2 + z δq 2 δq 2
δq1 δq1 δq1 δq 2 δq 2 δq 2
δx δy δz δx δy δz
δW = F x + Fy +Fz δq1 + F x δq 2 + Fy + Fz δq 2
δq1 δq1 δq1 δq 2 δq 2 δq 2
En este punto el estudiante debe tener plena conciencia de ciertos hechos básicos.
a. Como (3.4) representa las ecuaciones de la superficie restrictiva (3.6)
representa un desplazamiento de acuerdo con la restricción. Por tanto δW de
(3.7) corresponde a un desplazamiento de conformidad con la restricción
(sobre la superficie). Considerando una vez más la esfera como caso especial
δx, δy, δz determinados a partir de (3.5) son δx = C cos θ cos φδθ – senθδφ,
etc. Lo cual representa claramente, un desplazamiento sobre la esfera.
b. Las coordenadas q1 y q2 (θ y φ en (3.5)) son variables independientes; es decir,
pueden dársele a ambas pequeños valores arbitrarios sin violar la restricción.
¨ δx ¨ δy ¨ δz ¨ δx ¨ δy ¨ δz
(3.8)
δWq1 = m x +y +z δq1 = Fx + Fy + Fz δq1
δq1 δq1 δq1 δq1 δq1 δq1
.
¨ δx d . δx d δx
x = x − x
δq1 dt δq1 dt δq1 (3.9)
.
(3.10)
δx d x
=
δq1 dq1
.
d δx δ x (3.11)
=
dt δq1 δq1
158
Remplazando 3.10 en 3.9 se tiene
.
¨ δx .
.
d . δx . dx
x = x −x (3.12)
δq1 dt δ q.1 dt
.2 .2 (3.13)
δx δx 2
d
¨ δx
2
x = −
δq1 dt δ q.1
δ q1
Sustituyendo 3.13 y las relaciones semejantes para y y z en 3.8, se concluye que
. . .
. . .
m x 2 + y 2 + z 2 m x 2 + y 2 + z 2
d δ − δ
δWq1 = .
δq1
dt 2 .
2
δ q1 δ q1
(3.14)
δx δy δz
= F x
+F y +Fz δq1 Pero 1/2m (x2 + y2 + z2 ) es la energía
δ q1 δ q1 δ q1 cinética T de la partícula por tanto,
finalmente se escribe
d δT δT δx δy δz (3.15)
.
−y = Fx + Fy + Fz
dt δ q1 δq1 δq1 δq1 δq1
*Para probar las relaciones (3.9), (3.10) y (3.11), se procede de la siguiente manera.
Considérese la identidad
¨
δx . δx δx . d δx
x = x +x
δq1 δq1 δq1 dt δq1
Que es iguala 3.9. Para obtener 3.10 se observa que la derivada de la primera ecuación en 3.4,
con respecto al tiempo es
. dx . δx
x= q+ q2
dq1 δq 2
159
Derivando ahora ésta, parcialmente con respecto a q1, se nota que
.
dx δx
=
.
d q1 δq1
Para probar 3.11 se ve primero que como x = x(q1,q2), la derivada parcial, dx/dq1 es, en general,
función de q1 y de q2, es decir dx/dq1 =φ(q1,q2). Derivando esto con respecto al tiempo, se
obtiene
¨
d δx δ δx . d δx .
= q1+ q2
dt δq1 δq1 δq1 dq 2 δq1
Pero por la expresión de x, se sigue que
dx δ δx . d δx .
= q1+ q2
dq1 δq1 δq1 dq1 δq 2
d δT δT δx δy δz (3.16)
dt δ q. − δq = Fx δq + Fy δq + Fz δq
2 2 2 2 2
Las expresiones 3.15 y 3.16 son las ecuaciones de Lagrange que se trataban de
deducir.
Por conveniencia se escribe,
δx δy δz
Fx + Fy + Fz = Fqr
δq r δq r δq r (3.17)
d δT δT
dt δ q. − . = Fqr (3.18)
r δ qr
Como se verá en el capítulo siguiente, las ecuaciones de Lagrange tienen
exactamente la misma forma para un sistema de muchas partículas.
160
Para el caso que se acaba de considerar (una partícula con dos grados de libertad),
existen dos ecuaciones de Lagrange. Si se supusieran tres grados de libertad (una
partícula sin restricciones), las relaciones (3.4) contendrían todas a q1, q2 y q3, y
finalmente se obtendrían tres ecuaciones de Lagrange. En general, hay tantas
ecuaciones del movimiento de Lagrange, cuantos grados de libertad se tengan.
Sin embargo (y esto es importante tanto desde el punto de vista de las ideas
básicas, como para ciertas aplicaciones) aunque en realidad la partícula tenga
únicamente dos grados de libertad, todavía es posible escribir tres ecuaciones de
Lagrange. Ignorando la restricción, se escribe x = x(q1,q2, q3), etc. Suponiendo que q1,q2
y q3 son variables independientes y siguiendo exactamente el procedimiento anterior,
se obtiene una ecuación de Lagrange correspondiente a cada una de las tres
coordenadas. Existe, sin embargo, la siguiente consideración importante: El
desplazamiento δs, correspondiente a δq1, δq2 y δq3, obviamente no está de acuerdo
con la restricción. (En el ejemplo especial en consideración,
δx = δrsenθ cos φ + rδθ cos θ cos φ − rδφsenθsenφ ,
δx δy δz
δx = δq1 δy = δq1 δz = δq1
δq1 δq1 δq1 161
Sustituyendo en la ecuación anterior para δW, se tiene
δx δy δz
δWq1 = Fx + Fy + Fz δq1
δq1 δq1 δq1
Que es, claramente, Fq1δq1. Entonces una fuerza generalizada es una magnitud de
tal naturaleza que el producto Fqrδqr es el trabajo hecho por fuerzas impulsoras (sin
incluir fuerzas "inerciales", ni de restricción) cuando q1 sólo varía en una cantidad igual
a + δqr.
Para obtener Fqr. Al determinar δWq r , el trabajo se toma como positivo o como
negativo según si la fuerza o fuerzas tienden a hacer aumentar o disminuir la
coordenada qr.
Si la partícula tiene dos o tres grados de libertad, en ocasiones es más
convenientes suponer desplazamientos simultáneos δq1, δq2 y δq3 y escribir el trabajo
total correspondiente δW total, el cual tomará la forma
162
Sirven como ejemplos. Una mirada al miembro izquierdo de 3.3 y a las ecuaciones
siguientes hasta 3.18 muestra que las fuerzas inerciales aparecen exclusivamente
d δT δT
dt δ q. − δq
r r
Así mismo, es claro que en Fqr aparecen únicamente fuerzas aplicadas. En otras
palabras, al escribir las ecuaciones de movimiento de Lagrange, para cualquier
sistema, debe recordarse que el miembro izquierdo de 3.18 automáticamente tiene en
cuenta todas las fuerzas inerciales y que al tratar de hallar expresiones para F qr,
solamente deben considerarse fuerzas impulsoras. (Nunca se incluyen en Fqr fuerzas
tales como la centrífuga, la de Coriolis, etc.)
Ejemplo 3.1:
Considérese el movimiento de un proyectil con respecto a un sistema de ejes
rectangulares adherido a la Tierra. Considerando estos ejes como inerciales y tratando
el proyectil como una partícula de masa m, se escribe,
m . 2 . 2 .2
T= x + y + z De donde
2
¨
dT d δT
. δT
= m x , = m x, =0
.
dt . δx
dx δ x
163
Para tanto mx = Fx. En forma similar my = Fy y mz = Fz . Despreciando la resistencia
del aire, la única fuerza es la atracción de la gravedad en la dirección negativa de z.
Así pues δWt = -mgδz y Fz = -mg. Obviamente, Fx = Fy = 0. Entonces, finalmente,
¨ ¨ ¨
m x = 0, m y = 0, m z = −mg.
1 .2 . 2 .2
T= m x + y + z
2
T=
1 ¨
2
(
m x 1 + 4b 2 x 2 ) Aplicando la ecuación de Lagrange,
δT d δT . 2
2 δT
. 2
= m x (1 + 4b 2 x 2 ), ( )
. ¨
= m x 1 + 4b 2 2
x + 8 m x xb , = 4 m x xb 2
.
dt δ x .
δx
δx
Finalmente,
. 2
m x(1 + 4b x ) + 4m x xb 2 = Fz
¨
2 2
. 2
( )
¨
m x 1 + 4b 2 x 2 + 4m x xb 2 = −2mgbx
164
parábola y que su dirección, dada por los cosenos directores alfa y beta, se mantiene
constante. Se tiene que para un pequeño desplazamiento,
δW = mgδy + αfδx + βfδy Véase la ecuación 2.35
El miembro izquierdo de la ecuación del movimiento continúa inmodificado. Nótese
que todos los resultados anteriores pueden igualmente expresarse en función de y y y
´, en cambio de x y x´, eliminando desde el principio x´de T, etc.
Ejemplo 3.3: Movimiento de una partícula sobre un tablero horizontal liso, bajo la
acción de un resorte.
Un hilo sujeto a la partícula pasa por un orificio en una mesa horizontal lisa y está
atado a un resorte débil, como se muestra en la figura 3-1. El extremo inferior del
resorte está rígidamente unido a un punto tal que cuando m esta en el orificio, el
resorte no está estirado. El sistema tiene dos grados de libertad y usando
coordenadas polares, T = ½ m (r´ 2 + r2 θ´2). La única fuerza que actúa sobre la masa
es la del resorte. Así, para un desplazamiento arbitrario de la partícula, δW = -krδr en
donde k es la constante usual de la ley de Hooke, del resorte. No existe ninguna
fuerza actuando perpendicularmente a r. Por tanto, las ecuaciones de Lagrange
conducen a
¨
. 2 d 2 .
(1)m r − mr θ = −kr , (2) mr θ = 0
dt
1 .2 .2
T= m x + y , δW = −krδr = −k ( xδx + yδy )
2
165
1 ¨ 2
T = m( r + r θ )
2 2
2
de donde se sigue que mr-mrθ2=Fr y mr2θ+2mrr´θ=Fθ. A continuación se ilustran dos
métodos para obtener las fuerzas generalizadas. Imagínese que se le da a la pesa un
desplazamiento δs arbitrario, en el que tanto θ como r sufren cambios positivos. El
trabajo hecho por la gravedad y la banda de caucho está dado por
Fr = −k (r − rθ ) + mg cos θ
δx δy δz
Fqr = Fx + Fy + Fz
δqr δqr δqr
Teniendo en cuenta la gravedad y la tensión de la banda, se observa que las
componentes x y y de la fuerza sobre la pesa, son
Fx = −k (r − rθ ) senθ , Fy = mg − k (r − ro) cos θ
δx δy
Fr = Fx + Fy = −k (r − ro) sen 2θ + [ mg − k (r − ro ) cos θ ] cosθ = −k (r − ro) + mg cosθ
δqr δqr
que es idéntica a la expresión obtenida anteriormente. En la misma forma puede
obtenerse Fθ.
^ ^ ^
m x δx + yδy + zδz = Fxδx + Fy δy + Fz δz
δx δx δx
δx = δq1 + δq 2 + δqt
δq1 δq 2 δqt
Y teniendo en cuenta que δq1 y δq2 y δt son arbitrarios, puede hacerse δq2=0 y δt=0.
Entonces 3.22 se reduce a
¨ ¨
¨
δx ¨ δy ¨ δz δx δy δz
m x +y +z δq1 = Fx
δq1 + Fy + Fz δq1
δq1 δq1 δq1 δq1 δq1
167
Finalmente, aplicando las relaciones 3.9, 3.10 y 3.11 como en el numeral 3.2 (que
son válidas aunque 3.21 contenga explícitamente el tiempo), se obtiene una ecuación
de Lagrange que tiene exactamente la misma forma de 3.15 . De la misma manera,
haciendo δq1 y δt=0 se llega a 3.16. Por consiguiente, los marcos de referencia
móviles, las restricciones móviles, o la combinación de ambas condiciones, no
producen ningún cambio en las ecuaciones de Lagrange; (3.18) continúa siendo la
forma general.
¨
δx δy δz
Fx δqr + Fy δqr + Fz δqr δqr = Fqrδqr = δWqr
Las derivadas de x, y y z se
toman con respecto a qr únicamente dejando fijo t y todas las demás coordenadas.
Así, es muy claro que δWqr es el trabajo ejecutado por la fuerza actuante, cuando, con
las condiciones mencionadas se determinan suponiendo el marco de referencia y las
restricciones en reposo y luego procediendo exactamente como se explicó en el
numeral 3.3(b) y (c); y como se ilustró en el numeral 3.5. Si sucede que algunas, o
todas las fuerzas, son funciones del tiempo, como ocurre con frecuencia, debe
seguirse aún el procedimiento anterior. Como todo desplazamiento, determinado por
las ecuaciones 3.21 con t constate, está de acuerdo con las restricciones, el trabajo
hecho por la fuerza de restricción es igual a cero. Por tanto, como es usual, esta
fuerza debe ser ignorada.
c. Se observará que considerando δq1=0, δq2=0 y δt no es igual 0, obtenemos, a
partir de 3.22, la relación
¨ ¨
¨ δz ¨
(3.23)
δx ¨ δy
δx δy δz
m x + y + z δt = Fx + Fy + Fz δt
δt δt δt δt δt δt
Como el lector puede demostrar fácilmente, el lado derecho de 3.23 es,
sencillamente el trabajo hecho sobre la partícula por la fuerza total (incluyendo la
fuerza de restricción) cuando el marco d referencia, las restricciones o ambos,
desplazaran su posición ligeramente en el tiempo δt. Sin embargo, como 3.23 es
redundante en cuanto se refiere al planteamiento de las ecuaciones del movimiento,
no recibirá por ahora ninguna consideración adicional.
168
El siguiente ejemplo sencillo debe servir para clarificar algunas ideas básicas. Una
varilla rígida lisa, como se muestra en la figura 3.3, se hace girar con velocidad angular
constante, en un plano alrededor del origen de los ejes X y Y. Una cuenta de masa m
puede deslizarse libremente sobre la varilla, bajo la acción de una fuerza F, que
incluye la fuerza de restricción. Por medio de la aplicación directa de la ecuación de D
´Alembert 3.3 se plantea la ecuación del movimiento, que para este caso, es
sencillamente,
m(x¨δx+y¨δy)=Fxδx+Fyδy (1)
Ejemplo 3.6:
169
Con referencia a la figura 3-4, la plataforma giratoria D tiene una velocidad angular
determinada por el motor M1. Adherido a la plataforma se encuentra el mecanismo
impulsor M2 que hace girar la varilla lisa pa, alrededor del eje horizontal en p, de
alguna manera en particular. La varilla pa y las verticales pb y oc se encuentran todas
en el mismo plano. Una cuenta de masa m puede deslizarse libremente a lo largo de la
varilla, bajo la acción de la gravedad.
Suponiendo que alfa y teta son funciones conocidas del tiempo, el sistema tiene un
grado de libertad. Tomando r como coordenada, se plantea la ecuación del
movimiento, y se encuentra Fr.
Se concluye fácilmente que
1 . 2 2 .2 . 2 2
T = m r + r θ + α ( s + rsenθ )
2
(1)
Esta expresión es válida independientemente de la forma como varíen con el
tiempo alfa y teta. Supongase que α=W1=constante, y que la varilla se hace oscilar,
por medio del mecanismo M2, alrededor de la vertical pb, según θ= θosen w2t. Por
consiguiente,
1 . 2 2 2 2 . 2 .
2
T = m r + r θ o w2 cos w2 t + w1 (δ + rsen(θ o senw2 t ))
2
(2)
2
Que incluye únicamente a r,r´y t. Aplicando la ecuación de Lagrange, se lega a
{ }
¨
m r − m rθ o2 w22 cos 2 w2 t + w12 [ s + rsen(θ o senw2 t )] sen(θ o senw2 t ) = F (3)
Con el fin de hallar una expresión para Fr, se ignoran por completo los movimientos
de la plataforma y de la varilla; es decir que durante el desplazamiento +δr, t
permanece constante (θ y α permanecen constantes). Por tanto
O sea Fr=-mgcos(θosenw2t)
Debe notarse que si la varilla no tiene un movimiento obligado sino que puede girar
libremente alrededor de p, el sistema tiene entonces dos grados de libertad. En este
caso, despreciando la masa de la varilla, 1 continua siendo la expresión correcta para
T. Las ecuaciones del movimiento correspondientes a r y θ, pueden escribirse en
forma inmediata y se ve que
(3)
ds 2 = dx 2 + dy 2 + dz 2
dx
dx = dq1, Etc. Entonces 3 se convierte en
dq1
δx 2 δy 2 δz 2 2
ds =
2
+ + dq1
δq1 δq1 δq1 (5)
Según (2)
dx 1 δx
l1 = =
1
h1 δq1 (6)
δx
2
δy
2
δz
2
2
dq1 + +
δq1 δq1 δq1
171
1 dy 1 dz .
m1 = n1 =
h1 dq1 h1 dq1
1 dx 1 dy 1 dz (7)
l2 = , m2 = , n2 =
h 2 dq 2, h 2 dq 2 h 2 dq 2
1 ¨ dx ¨ dy ¨ dz (8)
a q1 = x +y +z
h1 dq1 dq1 dq1
Teniendo en cuenta las etapas que condujeron al miembro izquierdo de 3.15,
evidentemente puede escribirse 8 en la siguiente forma
1 d dT ´ ¨ dT ´
a q1 = −y (9)
h1 dt dq1 dq1
En donde T´=1/2(x´2+y´2+z´2 ), expresada en coordenadas generalizadas. En
general,
1 d dT ´ ¨ dT ´
a q1 = −y
h1 dt dqr dqr
(3.24)
Es esta una manera sencilla y fácil de obtener las expresiones generales de las
componentes de la aceleración en la dirección de las coordenadas. Véase el siguiente
ejemplo.
Ejemplo 3.7
Considerando el sistema de coordenadas esféricas , se trata de obtener la conocida
expresión de ao, la componente de la aceleración según la dirección de la tangente a
una de las curvas coordenadas de θ, por medio de la utilización de 3.24.
Para estas coordenadas.
1 ¨2 ¨2 2 ¨2
T´ = (r + r θ + r sen 2θφ 2
2
De donde
d dT δT ´ ¨ ´ ´
− = r 2
θ + 2 r r θ − r 2φ 2 senθ cos θ
´´
dt d θ δθ
172
1
δx δy δz
[ ]
2 2 2 2 1
hθ = + + = ( r cosθ cos φ ) + ( r cosθsenφ ) + r 2 sen 2θ
2 2 2 =r
δθ δθ
δθ
Por tanto
¨
´ ´ ´ 2
a o = r θ + 2 r θ − r φ senθ cos θ
En forma similar pueden obtenerse inmediatamente ar y ao. Si el movimiento de un
punto o una partícula está restringido a una superficie móvil después de eliminar una
coordenada superflua, las ecuaciones 4 serán
(10)
x = x(q1, q 2, t ), y = y (q1, q 2, t ), z = z (q1, q 2, t )
Con el objeto de clarificar aún más el sentido físico de las ecuaciones de Lagrange,
considérese lo siguiente:
Escribiendo T=1/2m(r´2+ r´2θ2+ r´2φ2 sen2 θ), según el numeral 3.9, se sigue que
1 d dT ¨ dT
+y = maθ
h1 dt dθ dθ Asimismo, el lector puede demostrar fácilmente que
1 dx dy ¨ dz
1 3.25
Fx + Fy + Fx = Fθ = f θ
hθ dθ dθ dθ hθ
173
Así pues la interpretación física de las ecuaciones de Lagrange para un sistema de
una partícula es muy sencilla y además observa en cada una de las ecuaciones se
tienen en cuenta automáticamente las componentes de la aceleración.
Lo anterior es válido para cualquier sistema de coordenadas y cualquier tipo de
restricciones.
Considérese, por ejemplo, una partícula sobre una plataforma giratoria montada en
un ascensor
acelerado. Supóngase que se desean obtener las componentes de la aceleración
de la partícula,
expresadas en función de ciertas coordenadas cuyo marco se encuentra adherido a
la plataforma,
y que se requiere tener en cuenta los movimientos de la Tierra, del ascensor y de la
plataforma.
Aun en este caso tan complicado, es fácil escribir T para la partícula y (.1.24) da los
resultados
buscados, en forma inmediata. El estudiante debe comparar este método con el
sistema vectorial
normal. Véase el problema 3.34.
6.10.Experimento sugeridos:
Experimento 3.1
Determínese el período de un pedúnculo que se muestra en la figura 3-6 (véase en
el problema 3.7). El punto p soporta por medio de un hilo largo y ligero colgado de su
extremo superior de un cielo raso suficientemente alto. Al moverse el péndulo. p
describe el arco de un gran círculo pero para movimientos pequeños este puede
considerarse como una línea recta horizontal. Si se determinan con cuidado los
valores de k y m. los resultados experimentales y los calculados concuerdan con una
buena precisión.
6.11.Resumen y observaciones
174
2. Detalles importantes relacionados con estas ecuaciones (numeral 3.3.b y c
a. La energía cinética T debe expresarse en función de las coordenadas generalizadas
que se hayan escogido, y de sus derivadas con respecto al tiempo. Deben eliminarse
de T todas las coordenadas superfluas.
b. Es importante entender con claridad el sentido físico de las fuerzas generalizadas
no solamente para facilitar el uso de las ecuaciones de Lagrange, sino también para
lograr una apreciación de lo que ocurre.
175
Considérese un sistema de p partículas cuyas masas m1, m2,…, mp sufren la acción de
las fuerzas F1, F2,…, Fp, respectivamente. Debe entenderse que F1, por ejemplo, repre-
senta la suma vectorial de todas las fuerzas de cualquier origen (incluyendo las
fuerzas de restricción) que actúan sobre m1, etc. Así, suponiendo masas constantes y
un marco de referencia inercial, las ecuaciones de “partícula libre”, para cada una de
ellas, serán:
Fx1 = m1x1 , Fy1 = m1 y1 , Fz1 = m1z1
(4.1)
Fx p = m p x p , Fy p = m p y p , Fx p = m p z p
En donde Fx1, Fy1, y Fz1 son las componentes rectangulares de F1, etc. Es importante
observar que como se ha supuesto que F1, F2, etc., incluyen las fuerzas de restricción,
las relaciones (4.1) son válidas, aunque las partículas tengan cualquier tipo de
restricción.
Suponiendo ahora que cada una de las partículas sufre un desplazamiento virtual,
cuyas componentes son δx1, δy1 y δz1, etc., se procede a ejecutar las siguientes
operaciones matemáticas sencillas. Multiplicando Fx1 = m1x1 por δx1, Fy1 = m1 y1 por δy1,
etc., en todas las relaciones (4.1) y sumando todo el conjunto, se obtiene,
p p
176
numerales 2.13 y 2.14.) En otras palabras, las fuerzas de restricción quedan
efectivamente eliminadas de (4.2) y de (4.3).
Con respecto a estas ecuaciones, deben tenerse en cuenta los siguientes hechos.
(a)Las relaciones (4.4), son ecuaciones de trasformación de las que se han eliminado
previamente las coordenadas superfluas, denominadas anteriormente, ecuaciones
“reducidas”. Aquí se consideran únicamente sistemas holonómicos. (Véase el
numeral 9.12.)
(b)Debido a las restricciones, el número de coordenadas generalizadas que aparece
en (4.4) es 3p-n menor que el número de coordenadas rectangulares.
(c) La aparición de t indica que pueden existir restricciones móviles, aun marco de
referencia móvil, o ambos.
(d)Estas ecuaciones tienen en cuenta todas las restricciones, en el sentido que los
desplazamientos δx1, δy1 y δz1, que se obtienen aplicando las relaciones
∂xi ∂x ∂x
δxi = δq1 + i δq2 + ... + i δqn ,etc.
∂q1 ∂q2 ∂qn
(4.5)
(conservando a t constante) a (4.4), están de acuerdo con las restricciones.
(e)Así, si δx1, δy1 y δz1, se determinan de esta manera, se puede estar seguro que el
trabajo ejecutado por las fuerzas de restricción suma cero. Por tanto, las fuerzas de
restricción pueden ser ignoradas. (Véase el numeral 2.14.)
177
p
∂x ∂y ∂z p
∂x ∂y ∂z
= ∑ Fxi i + Fyi i + Fzi i δq1 + ... + ∑ Fxi i + Fyi i + Fzi i δqn
i =1 ∂q1 ∂q1 ∂q1 i =1 ∂qn ∂qn ∂qn
(4.6)
Pero como q1 , q 2 ,.., q n son todas variables independientes (físicamente esto
significa que las partículas del sistema pueden desplazarse libremente de tal manera
que, sin violar las restricciones, una cualquiera de las q puede tomar cualquier valor
independientemente de los valores de las demás), pueden considerarse arbitrarios
todos los δq . Entonces supóngase que todos se hacen cero, excepto, por ejemplo,
δq1, con lo cual la ecuación (4.6) se reduce a
p
∂x ∂y ∂z p
∂x ∂y ∂z
δWq1 = ∑ mi xi i + yi i + zi i δq1 = ∑ Fxi i + Fyi i + Fzi i δq1
i =1 ∂q1 ∂q1 ∂q1 i =1 ∂q1 ∂q1 ∂q1
(4.7)
Utilizando aquí las relaciones correspondientes a (3.9), (3.10) y (3.11) y siguiendo el
mismo procedimiento del capítulo 3, (4.7) puede escribirse,
d ∂ p mi 2 2 ∂ p mi 2
δWq1 = ∑ ( xi + yi + zi ) −
2
∑ ( x i + y i2 + z i2 )δq1
dt ∂q1 i =1 2 ∂q1 i =1 2
p
∂x ∂y ∂z
= ∑ Fxi i + Fyi i + Fzi i δq1
i =1 ∂q1 ∂q1 ∂q1
(4.8)
Ecuaciones idénticas se obtienen de igual manera para q 2 , q 3 ,.., q n . Es decir,
d ∂T ∂T
− = Fq r
dt ∂q r ∂qr
(4.9)
en donde r=1,2,.., n y las fuerzas generalizadas Fq r , son
p
∂x ∂y ∂z
Fq r = ∑ Fxi i + Fyi i + Fzi i
i =1 ∂qr ∂qr ∂qr
(4.10)
Nótese que (4.9) tiene exactamente la misma forma que (3.18).
178
Una vez más, como se indicó en el capítulo 3, une fuerza generalizada Fq r ,
correspondiente a la coordenada q r , es una magnitud (no siempre una fuerza en el
sentido usual de la palabra) tal que Fq r δ r , es el trabajo hecho por todas las fuerzas
aplicadas al incrementar únicamente q, (dejando constantes el tiempo y todas las
demás coordenadas) en una magnitud igual a + δq r . Sin embargo, en este caso más
general es importante caer en cuenta que para un sistema de p partículas con varias
restricciones, un incremento de sólo q r puede requerir un desplazamiento de varias o
de todas las partículas. Por consiguiente δWq r debe incluir el trabajo hecho por Las
fuerzas aplicadas a todas las partículas, que como resultado de + δq r cambiarían de
posición.
En prueba de las afirmaciones anteriores obsérvese que (4.3) es una expresión
general del trabajo cuando a todas las partículas se lea da un desplazamiento
infinitesimal arbitrario. Pero si se supone que sólo q, varia, (4.5) se reduce a
∂xi ∂y ∂z
δxi = δqr , δyi = i δqr , δzi = i δqr
∂qr ∂qr ∂qr
y por tanto, (4.3) se hace
p
∂x ∂y ∂z
δWa r = ∑ Fxi i + Fyi i + Fzi i δqr
i =1 ∂qr ∂qr ∂qr
que según (4.10) es, sencillamente, Fq r δ r , (Véase el ejemplo 4.1.)
Todas las fuerzas inerciales (véase el numeral 3.3 (d)) se han tenido en cuenta, en
el lado izquierdo de (4.9). Por las razones expuestas e ilustradas en la última parte del
capítulo 2, las fuerzas de restricción (para el caso de restricciones “lisas”) se anulan en
(4.l0). Por tanto, en los análisis de las técnicas y de los ejemplos que siguen, estas
fuerzas se ignoran.
(b)Suponiendo que todas las restricciones móviles, o todos los marcos de referencia
móviles, o el conjunto de todos ellos, son estacionarios, y que todas las
coordenadas, excepto q, son constantes, se incrementa q r en una magnitud + δq r .
179
directamente, sin necesidad de utilizar las componentes rectangulares de la fuerza.
Entonces, por la relación
δWq r = Fq r δqr
(4.11)
puede obtenerse Fq r en seguida.
Al aplicar este método, con frecuencia resulta provechoso escribir primero δWqr , en
función de un número cualquiera de coordenadas y luego expresarlo en términos de
q1 , q 2 ,…, q n .
Una observación adicional: Para un sistema que tenga por ejemplo, cuatro grados
de libertad, se hace que Fq1 , Fq2 , Fq3 y Fq4 indiquen las fuerzas generalizadas
correspondientes a q1 , q 2 , q3 y q 4 respectivamente. Supóngase ahora, que se inicia
'
de nuevo el problema remplazando a q 3 y q 4 por otras coordenadas diferentes q3 y
q 4' . Las fuerzas generalizadas quedan entonces Fq1 , Fq2 , Fq3' y Fq4' pero Fq1 y Fq2 del
segundo caso son en general, diferentes de Fq1 y Fq2 del primero, aunque
correspondan a las mismas coordenadas, (Véase el ejemplo 4.1.)
(Debe mencionarse aquí qué cuando las fuerzas son conservativas, usualmente es
más conveniente determinar Fqr a partir de la función de la energía potencial (véase el
capítulo 5). En muchos casos de fuerzas disipativas, el método de la “función de la
potencia” resulta beneficioso (véase el capitulo 6). Sin embargo, independientemente
del tipo de las fuerzas aplicadas, cualquiera de las técnicas (a), (b) o (c) pueden ser
utilizadas.)
° ° ° ° ° °
Pero como puede verse fácilmente, s 2 = y − y y s 3 = y + y . Por tanto
1 2 1 2
1 ° 2 1 ° ° 1 ° °
T = m1 y 1 + m2 ( y 1 − y 2 ) 2 + m3 ( y 1 + y 2 ) 2
2 2 2
° °
Que incluye ahora a y y y , únicamente. (Nótese que y es una coordenada no
1 2 2
inercial.)
La ecuación del movimiento correspondiente a y , se obtiene como sigue:
1
∂T ° ° ° ° °
°
= m1 y 1 + m2 ( y 1 − y 2 ) + m3 ( y 1 + y 2 )
∂ y1
Y
d ∂T °° °°
∂T
( ° ) = (m1 + m2 + m3 ) y 1 + (m3 − m2 ) y 2 , =0
dt ∂ y ∂y 2
1
°° °°
Por tanto, (m + m + m ) y + (m − m ) y = F
1 2 3 1 3 2 2 y1
Para obtener una expresión de Fy1 se aplica la ecuación (4.11). Así se determina el
trabajo hecho por la, fuerzas impulsoras (la gravedad), despreciando las fuerzas de
restricción (tensiones en los hilos), cuando se incrementa y1 en una cantidad + ∂y1
(bajando ligeramente m1 ) y haciendo que y 2 permanezca constante. Se obtiene
∂W y1 = + m1 g∂y1 − (m2 + m3 ) g∂y1 . El segundo término de esta expresión se origina en
el hecho de que como y 2 permanece constante, es preciso levantar a m 2 y m3 en
una cantidad Igual a aquella en que se ha bajado a m1 . Por tanto
Fy1 = (m1 − m2 − m3 ) g y la ecuación del movimiento completa, correspondiente a y1 es
181
°° °°
(m1 + m2 + m3 ) y 1 + (m3 − m2 ) y 2 = (m1 − m2 − m3 ) g
(1)
Para obtener la ecuación del movimiento de y 2 se observa que
d ∂T °° °°
∂T
( ° ) = ( m 2 − m3 ) y 2 + ( m3 − m 2 ) y 1 y =0
dt ∂ y ∂y 2
2
Se obtiene una expresión para Fy2 haciendo que y 2 aumente en una cantidad
+ ∂y 2 con y1 constante. Es claro que el trabajo ejercido por la gravedad es de
°°
∂W y2 = (m2 − m3 ) g∂ y 2 = Fy2 ∂y 2 . Por último, la ecuación del movimiento de y 2 tendrá
la forma
°° °°
( m 2 + m3 ) y 2 + ( m 3 − m 2 ) y 1 = ( m 2 − m3 ) g
(2)
°°
Las relaciones (1) y (2) pueden solucionarse simultáneamente para obtener y y
1
°°
y 2 y las ecuaciones resultantes pueden integrarse en seguida.
Como sencillo ejemplo de (4.12), nótese que
∂Wtotal = (m1∂y1 − m2 ∂s 2 − m3 ∂s3 ) g
(3)
Pero ∂s 2 = ∂y1 − ∂y 2 y ∂s3 = ∂y1 + ∂y 2 . Por tanto, eliminando ∂s 2 y ∂s3 .
Para encontrar Fy1 se hace que s 2 permanezca constante (no se permite que m 2
cambie de posición) y se supone que y1 se incremente a y1 + ∂y1 ( m1 se mueve
ligeramente hacia abajo). Pero como puede verse, por simple inspección, esto
requiere un desplazamiento hacia arriba de m3 en una magnitud igual a 2∂y1 . Por
consiguiente,
∂W y1 = + m1 g∂y1 − 2m3 g∂y1 o sea que Fy1 = ( m1 − 2m3 ) g
(Nótese que las expresiones de Fy1 en (1) y es (4) no son iguales.) En forma
182
semejante, se
sigue que Fy 2 = (m3 − m2 ) g
Empleando (4.12), se puede usar (3) de nuevo. Eliminando ∂s 3 por medio de
∂s3 = 2∂y1 − ∂s 2 ,
∂Wtotal = (m1 − 2m3 ) g∂y1 + (m3 − m2 ) g∂s 2
obteniendo así, de nuevo, la, mismas expresiones para Fy1 y Fs2 .
Debe observarse que cuando una de la n coordenada vería, dejando fijas las otras,
las demás coordenadas que no entran en el problema, pueden, naturalmente, variar.
Por ejemplo pare encontrar Fy1 (véase la primera parte del ejemplo anterior) se dejó
fijo a y 2 y se hizo variar y1 . Al hacer esto s1 , s 2 y s 3 variaron.
183
Las partículas de masas m1 y m 2 que se muestran en la figura 4-3 están
adheridas rígidamente a una varilla ligera y pueden moverse libremente en el plano
XY, bajo la acción de la gravedad. Suponiendo que no hay rotación alrededor del eje
de la varilla, y aplicando el teorema del centro de masa, se escribe
m1 + m3 °3 °2 I °
T= (x + y ) + θ 3
2 2
En donde (x, y) son las coordenadas del centro de masa, I es el momento de inercia
de la el centro de masa y es perpendicular a la varilla, y θ es el ángulo señalado.
Como el sistema tiene tres grados de libertad, y x, y y θ son coordenadas adecuadas,
T tiene ya la forma apropiada.
Aplicando las ecuaciones de Lagrange, se concluye inmediatamente que
°° °° °°
(m1 m2 ) x = Fs (m1 + m2 ) y = Fy I θ = Fθ
Dejando constantes a y y θ y aumentando x a x + ∂x , resulta claro que el trabajo
hecho por la gravedad ∂Ws = 0 . Por tanto Fs = 0 . En forma semejante,
Fy = −(m1 + m2 ) g y Fθ = 0 . Por consiguiente, las ecuaciones del movimiento, en
forma final son
°° °° °°
x = 0 , y = −g , θ = 0
Esto quiere decir que el centro de masa tiene el sencillo movimiento de un proyectil
(despreciando la resistencia del aire) y que la palanqueta gira con velocidad angular
°
constante θ .
m1 + m2 °2 ° 2 m3 3 °3 ° ° ° °
T= ( x1 + y 1 ) + ( I θ − 2 I x 1 θ senθ + 2 I y 1 θ cos θ )
2 2
Aplicando les ecuaciones de Lagrange se obtienen los siguientes resultados:
°° °° °
(m1 + m2 ) x1 − m2 I θ senθ − m3 I θ 3 cos θ = Fs1
184
°° °° °
(m1 + m2 ) y1 + m2 I θ senθ − m3 I θ 3 cos θ = Fy1
°° °° °°
m3 ( I 2 θ − I x1 senθ + I y1 cos θ ) = Fθ
De aquí se sigue fácilmente que Fx1 = 0 , Fy1 = −(m1 + m2 ) g y Fθ = −m 2 gl cos θ .
Es Importante notar que al cambiar las coordenadas, la forma de las ecuaciones del
movimiento puede variar mucho. Además, aún cuando algunas da las coordenadas se
conserven ( θ en este caso), las fuerzas generalizadas cambian, como e. demostró en
el ejemplo 4.2.
2 2
° °
Pero x 2 = x1 + rsenθ y y 2 = r cos θ .Eliminando x 2 y y de T , se obtiene finalmente
2
° ° °
1 1 ° °
T = m1 x1 + m2 ( x1 + 2r x 1 θ cos θ + r θ 2 )
2 2 2
2 2
° °° °°
°° °°
de donde y m r x cos θ + m r 2 θ = F ° .
(m1 + m2 ) x 1 + m3 r θ cos θ − m2 r θ senθ = Fs1 2
2 1 2 θ
185
La primera ecuación puede integrarse en forma directa. Eliminando °° de la segunda
x1
ecuación por medio de la primera, se obtiene una forma fácilmente integrable. Los
resultados finales son
m2 r θ
x1 + = C1t + C 32 y θ = Asen(ϖ .t + δ )
m1 + m2
en donde C1 , C 2 , A y δ 2 son cantidades arbitrarias que se determinan por las
condiciones
(m1 + m2 ) g
iniciales específicas, y ϖ = . Supóngase que cuando
rm1
° ° ° °
t = 0, x1 = x0 , x1 = xθ1 , θ = θ 0 y θ = θ θ . Sustituyendo estas condiciones en las formas
Integradas, se obtienen cuatro ecuaciones de las cuales se deduce que
° m2 r ° m2 r
C1 = x 0 + = θθ C 2 = x0 + = θθ
m1 + m2 m1 + m2
°
° θθϖ
θ 2θ y tan δ = °
A = θ 02 + 2 θθ
ϖ
con lo cual se ilustra al método general para determinar las constantes de integración
a partir de las condiciones iniciales dadas.
m1 + m2 + m3 °2 m1 ° 2 m2 °2 m3 °2
T =( )y + q1 + q2 + q3
2 2 2 2
Pero por la definición del centro de masa, m1 q1 = m 2 q 2 + m3 q3. Derivando esto y
° ° ° °
eliminando q de T1 , se tiene T = M y 2 + m1 ( m2 q3 + m3 q 3 y 2 ) 2 + m2 q32 + m3 q32
° ° °
1
2 2 m1 m1 2 2
en donde m = m1 + m 2 + m3 . Como el sistema tiene tres grados de libertad y como
186
y1 , q 2 y q3 son coordenadas adecuadas, se concluye que la segunda forma de T no
contiene coordenadas superfluas.
Al aplicar las ecuaciones de Lagrange se obtienen fácilmente las siguientes
ecuaciones del movimiento:
°°
m2 m m °°
(m1 + m2 ) q 2 + 2 3 q3 = Fq 2 ,
m1 m1
m2 m3 °° m3 (m1 + m2 ) °° °°
q3 + q3 = Fq3 , M y = Fy
m1 m1
Lo que sigue es una clara demostración de la naturaleza de las fuerzas
generalizadas y de la técnica de hallar sus expresiones. Por Inspección se demuestra
que para un desplazamiento general de todo el sistema (véase las ecuaciones (4.12),
Esta ecuación tiene la forma de (4.12) y por tanto resulta claro que los coeficientes
de δq 2 , δq3 y δ . y fuerzas generalizadas Fq 2 , Fq3 y Fy respectivamente. Así se han
completado las ecuaciones del movimiento.
(Véase el problema 4.5.)
187
Fy 3 = m3 g − k 2 ( q3 − q 2 − I 1 )
m2 m
Por otra parte y1 = y + q 2 + 3 q3 , y 2 = y − q2 , y 3 = y − q3
m1 m1
∂y1 ∂y ∂y
Entonces, por ejemplo Fq 2 está dada por Fq 2 = Fy1 + Fy 2 2 + Fy 3 3
∂q 2 ∂q 2 ∂q 2
∂y1 m2 ∂y 2 ∂y 3
Pero = , = −1 y = 0 . Así, esta relación se reduce fácilmente a la
∂q 2 m1 ∂q 2 ∂q 2
hallada anteriormente para Fq3 y Fy pueden obtenerse en seguida.
La ecuación del movimiento correspondiente a y demuestra que el centro de masa
cae con una aceleración constante g . Las otras dos ecuaciones se integran
fácilmente y pueden ser puestas en la forma
°° °°
a11 q 2 + b11 q 2 + a12 q 3 + b12 q 3 = A
°° °°
a 21 q 2 + b21 q 2 + a 23 q 3 + b22 q 3 = B
en donde A, B, las a y las b, son constantes. Aquí no se continúa el estudio de estas
ecuaciones ya que en el capitulo 10 se tratan en detalle los métodos de integración
aplicables a estas formas.
Supóngase que los hilos que sostienen las masas son inextensibles y que el
movimiento está confinado a un plano. La expresión (2.42) se reduce a
m1 2 °2 m2 2 °2 2 °2
°
°
T= r1 θ + r θ + r φ + 2 r r θ φ cos( φ − θ )
2 2 1 2 1 2
∂T ° ° °
De donde °
= m1 r12 θ + m2 r12 θ + m2 r1 r2 φ cos(φ − θ )
∂θ
∂ ∂T °° °° ° ° °
= (m + m )r 2 θ + m r r φ cos(φ − θ ) − m r r φ (φ + θ ) sen(φ − θ )
∂t ∂ θ°
1 2 1 2 1 2 2 1 2
∂T ° °
Asimismo, °
= m 2 r1 r3 θ φ sen(φ − θ )
∂θ
°° °° °
(m1 + m2 ) r12 θ + m2 r1 r2 φ cos(φ − θ ) − m2 r1 r2 φ 2 sen(φ − θ ) = Fθ
En forma semejante la ecuación correspondiente φ es
°
°° °° °2
m2 r22 θ + m3 r1 r2 φ cos(φ − θ ) + m2 r1 r2 φ sen(φ − θ ) = Fφ
Para hallar Fθ supóngase que se incremente el ángulo θ en una cantidad igual a
+ δθ , dejando constante φ .
188
Esto significa que las dos masas deben ser elevadas ligeramente. Por tanto,
δW = −(m1 + m2 ) gr1 senθδθθ y Fθ = −(m1 + m2 ) gr1 senθ
Ejemplo 4.7. Un sistema que se mueve con aceleración lineal constante (Fig. 4.1).
El punto de apoyo del sistema de poleas de la figura 4-1 se mueve hacia arriba con
aceleración constante a
2
° °
1 ° ° 1 1
T = m1 ( I − y 1 ) + m2 s 22 + m3 s32
2 2 2
° °
En donde I = at , °
y ° ° °
por tanto,
y 2 + s 2 − y1 = at s2 = 2 y2 + s2
2
2 2
1 ° 1 ° °
1 ° °
T = m1 ( at − y 1 ) + m2 at + y 1 − y 2 + m3 at + y 1 − y 2
2 2 2
Y entonces las ecuaciones del movimiento serán
°° °°
(m1 + m2 + m3 ) y1 + ( m3 − m2 ) y 2 + ( m2 + m3 − m1 )a = Fy1
°° °°
(m3 − m1 ) y1 + (m2 + m3 ) y 3 + (m3 − m2 )a = Fy 2
Como para determinar las fuerzas generalizadas se deja fijo el tiempo Y
Fy1 = ( m1 − m2 − m3 ) g y Fy 2 = (m2 − m3 ) g tal como en el ejemplo 4.1. En realidad,
en el caso de este sencillo ejemplo de aceleración lineal constante, las ecuaciones del
movimiento son las mismas excepto que. Efectivamente, g se ha aumentado a g + a.
Como extensión de lo anterior, el estudiante puede escribir fácilmente las
ecuaciones del movimiento suponiendo que h varía de cualquier forma determinada,
con respecto al tiempo. (Véase el problema 4.16.)
189
En coordenadas cilíndricas, fijas a la superficie de la Tierra y supuestas inerciales
° ° ° ° ° ° °
1 1
T= m1 ( r12 + r12 θ12 + z12 ) + m2 (r32 + r32 θ 2 + z 22 )
2 2
Tomando el origen de estas coordenadas en el centro de rotación del disco, se ve que
1
r1 = s + q1 cos α , θ1 = ϖ .t , z1 = q1 senα + α .t 2 ,
2
1
r2 = s + q 2 cos α , θ 2 = ϖ .t , z 2 = q 2 senα + α .t 2 ,
2
Por medio de estas relaciones puede expresarme T fácilmente como
1 °2
( )
°
2 2
T = m1 q1 + 2 q1α t senα + s + q1 cos α ) ϖ + α t2 2
2
°
1
( )
°
+ m2 q 22 + 2 q 2 α t senα + s + q 2 cos α ) 2 ϖ 2 + α 2 t 2
2
Las únicas coordenadas que aparecen en T son q1 y q 2 y debe observarte
además que t aparece en forma explicita.
Con lo que sigue se ilustra un tipo de problema que algunas veces se encuentra en
la práctica.
Se supone que en el sistema de la figura 4.1 se ha introducido un mecanismo
adherido al piso que ejerce una tuerza variable sobre m 2 de tal manera que s 2 varía
con el tiempo, de una manera determinada. Se trata de determinar la ecuación del
movimiento para el resto del sistema, despreciando las masas de las poleas.
Debido a este movimiento forzado (es decir, como s 2 una función conocida del
tiempo) y suponiendo movimiento vertical únicamente, el sistema tiene ahora sólo un
grado de libertad. Bien y1 o y 2 pueden servir como coordenada adecuada, y
suponiendo que los hilos están siempre tensos, s1 + y 2 + s 2 = C1 y s1 + y1 = C 2 .
° ° °
Por tanto
y 2 = y 1 + s 2 . Así pues se escribe,
1 °
1 °
1 ° °
T = m1 y1 + m2 s 2 + m3 2 y1 − s
2 2
2 2 2
A fin de hacer el ejemplo más específico, se supone que la fuerza aplicada a m 2 es
° °
1 1 1
T= m1 y12 + m2 A 2ω 2 cos 2 ωt + m3 ( 2 y1 − Aω cos ω.t ) 2
2 2 2
y la ecuación del movimiento será
°°
(m1 + 4m3 ) y1 + 2m3 Aω 2 senωt = Fy1
(Nótese que no es necesario conservar el segundo término de T por ser función t
solamente.) Al aplicar la ecuación ∂Wy1 = Fy1δy1 dejando a t constante, se encuentra
Fy1 = ( m1 − 2m3 ) g . Con esto se completa la ecuación del movimiento. Se observa
que Fy1 aquí, no es igual a la del ejemplo 4.1.
A manera de ejemplo adicional considérese el sistema de la figura 2-15, que tiene
cuatro grados da libertad.
Supóngase ahora que una fuerza exterior que actúa sobre el eje de la polea
superior hace que s1 varíe de una manera determinada; y otra que actúa sobre m 2 le
imprime otro movimiento conocido. El sistema tiene ahora sólo dos grados de libertad,
y suponiendo que los hilos se conservan tensos, puede escribirse T en función de
° °
s 2 , s3 y t , por ejemplo. (Véase el problema 4.19.)
° ° ° °
δWtotal = −(Q1 E + Q1 B y1 )δx1 + Q1 B x1 δy1 + (Q2 E + Q2 B y 2 )δx 2 − Q3 B x3 δy 3
Tomando a x, y y θ como coordenadas generalizadas (véase el ejemplo 4.3) por las
° ° °
relaciones x1 = x − I 1 cos θ y1 = y − I 1 senθ , etc. se concluye que x = x − I θ senθ
1 1
δx1 = δx + I 1 senθδθ , etc. Por tanto, la expresión anterior puede escribirse finalmente
como
° °
δWtotal = [(Q2 − Q1 ) E + (Q3 − Q1 ) y + B(Q2 I 2 + Q1 I 1 ) θ cos θ ]δx
° °
+ [ B (Q1 − Q2 ) x + B (Q1 I 1 + Q2 I 2 ) θ senθ ] δy
° °
− (Q1 I 1 + Q2 I 2 ) [ E senθ + B ( x cos θ + y senθ )]δy
en donde pueden leerse directamente las expresiones de las fuerzas generalizadas.
(Ya que tiene la forma de (4.12).) T , y por tanto las ecuaciones del movimiento, tienen
exactamente las mismas formas que en el ejemplo 4.3. (Véase el problema 4.20)
192
Supóngase que en las ecuaciones (4.4) t y todas las coordenadas, menos q r se
conservan constantes. Entonces, estas ecuaciones se convierten en
x1 = x1 (q r ) , y1 = y1 (q r ) , z1 = z1 (q r )
(4.14)
Como x1 , y1 y z1 son las coordenadas rectangulares de la partícula individual m1 ,
existirá un conjunto de tales ecuaciones para cada una de las p partículas. Es decir,
que (4.14) representa p conjuntos de ecuaciones.
Si se permite que q r varíe y se hace la gráfica de las coordenadas x1 , y1 y z1
(4.14), -de una cualquiera de las partículas m1 se obtiene una curva (en general, una
curva en el espacio tridimensional) que representa una trayectoria posible para m1 de
conformidad con las restricciones: Nos referiremos a esta curva como a la línea de q r
para m1 . Es claro que la localización y forma de tal curva depende de los valores
constantes asignados a t y a las demás coordenadas, así como de la naturaleza de
las restricciones. En este sentido puede existir un número ilimitado de líneas de q r
para una partícula cualquiera. Pero en un instante determinado y para ciertos valores
dados a las demás coordenadas, puede trazarse una línea específica de q r relativa al
sistema de ejes X, Y, Z. De la misma manera las líneas de q r pueden trazarse para
cada una de las partículas.
Las ideas anteriores no presentan ninguna dificultad puesto que se refieren a líneas
y superficies tridimensionales comunes. Como un ejemplo sencillo, considérese el
péndulo doble de la figura 2.10. Las ecuaciones (2.13) corresponden a (4.4). Las
líneas de θ para m1 y para m 2 pueden trazaras en el plano .XY para diversos valores
constantes de φ . En la misma forma pueden trazarse las líneas de φ para m 2 . (No
existen líneas de φ para m1 .) (Véase el ejemplo 4.11.)
193
1 δx1 1 δy1 1 δz1
Finalmente I 1r = , m1r = , n1r = 1
h1r δq r h1r δq r h1r δq r
(4.17)
Como la componente v ' de un vector v en la dirección de una recta con cosenos
directores I , m y n está dada por v ' = Iv x + mv y + nv z , se deduce que f ir , la
componente de la fuerza aplicada F1 que actúa sobre m1 según la tangente a su línea
de q r es
1 δx δy δz
f ir = Fxi 1 + Fy i 1 + Fz i 1
h1r δqr δqr δqr
(4.18)
En igual forma, la componente air de la aceleración ai de la partícula m1 en la
dirección de la misma tangente es,
1 °° δx1 °° δy1 °° δz1
air = xi + yi + zi
h1r δqr δqr δqr
(4.19)
° ° °
1
en donde T1 = m1 ( x1 + y1 + z12 ) se expresa en coordenadas generalizadas por
2 2
2
medio de las ecuaciones (4.4).
Ejemplo 4.11.
Considere el sistema que se muestra en la figura 4-7. Las partículas de masas m1 y
m2 están suspendidas de los extremos de un hilo que pasa por los pequeños anillos
lisos en a y en b . La masa m1 puede moverse en contacto con el cono C1 en tanto
que m 2 debe moverse únicamente en contacto con el plano vertical P (por la acción
de dos superficies planas, paralelas y lisas que no se muestran en el dibujo). El cono
194
está fijo, pero el plano P se hace oscilar alrededor del eje vertical B , según
α = Asenω.t , en donde α se mide a partir del eje X.
Para m 2
x 2 = [ I + ( c − q1 ) senq3 ] cos( Asenω.t ) ,
y 2 = [ I + ( c − q1 ) senq3 ] sen( Asenω.t ) ,
z 2 = h − (c − q1 ) cos q3
Nótese que en este ejemplo en particular no todas las coordenadas aparecen en
todas las ecuaciones de (1) y (2).
Al hacer variar a q1 y trazar las relaciones (1) y (2) pera diferentes valores
constantes de q 2 , q3 y t , se obtienen las líneas de q1 de m1 (recta, sobre el cono) y
las líneas de q1 de m 2 (rectas radiales sobre P). En forma semejante se obtienen las
líneas de q 2 de m1 y las de q3 de m 2 . Como q 3 no aparece en (I ) no existen las
líneas de q 3 para m1 . Asimismo, es evidente que no hay líneas de q 2 para m 2 .
Nótese, que a11 es la componente de la aceleración lineal de m1 a lo largo de una de
sus líneas de q1 sobre el cono, y que a 21 es la aceleración de m 2 a lo largo de su
línea de q1 en P . Asimismo, a 23 , por ejemplo, es la aceleración de m 2 en la dirección
de la línea de q 3 en el plano P . Las expresiones de estas aceleraciones pueden
encontrarse aplicando (4.21) a
°
1 °
1 ° °
T = m1 q12 + q12 q 22 sen 2θ1 + m2 q12 + ( c − q1 ) q32 + ( I + ( c − q1 ) senq3 ) A 2ω 2 cos 2 ω.t
2 2
2 2
195
Determinación de las frecuencias del movimiento del sistema de “dos partículas”
que se muestra en la figura 4.8.
196