Una introducci´n a la o Mec´nica Cu´ntica para “no a a iniciados”

´ Renato Alvarez Nodarse
Departamento de An´lisis Matem´tico, a a Facultad de Matem´ticas, Universidad de Sevilla a
23 de marzo de 2009

´ Indice general
1. Breve introducci´n a la mec´nica cl´sica o a a 1.1. Mec´nica Hamiltoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . a 1.2. Dos ejemplos representativos . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1. El oscilador arm´nico unidimensional . . . . . . . . . . . . . . . . o 1.2.2. Movimiento en un campo central de fuerzas . . . . . . . . . . . . . 1.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. ¿C´mo se gest´ la Mec´nica cu´ntica? o o a a 2.1. La radiaci´n del cuerpo negro . . . . . . . . . . . . . . . . . . . . . . . . . o 2.2. Einstein y el efecto fotoel´ctrico . . . . . . . . . . . . . . . . . . . . . . . . e 2.3. Bohr y el modelo at´mico . . . . . . . . . . . . . . . . . . . . . . . . . . . o 2.4. El nacimiento de la Mec´nica Cu´ntica . . . . . . . . . . . . . . . . . . . . a a 2.4.1. La dualidad onda-part´ ıcula . . . . . . . . . . . . . . . . . . . . . . 2.4.2. La Mec´nica matricial de Heisenberg . . . . . . . . . . . . . . . . . a 2.4.3. La Mec´nica ondulatoria de Schr¨dinger . . . . . . . . . . . . . . . a o 2.4.4. Una “deducci´n” de la ecuaci´n de Schr¨dinger . . . . . . . . . . . o o o 2.5. La interpretaci´n de la Mec´nica cu´ntica . . . . . . . . . . . . . . . . . . o a a 2.5.1. El principio de incertidumbre de Heisenberg . . . . . . . . . . . . . 2.6. El experimento de difracci´n y el principio de incertidumbre . . . . . . . . o 2.7. Las matem´ticas de la Mec´nica Cu´ntica . . . . . . . . . . . . . . . . . . a a a 2.7.1. El gato de Schr¨dinger . . . . . . . . . . . . . . . . . . . . . . . . . o 3. Mec´nica Cu´ntica I: “Movimiento” de una part´ a a ıcula material 3.1. Los postulados de la Mec´nica Cu´ntica . . . . . . . . . . . . . . . . . . . a a 3.2. El principio de incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1. Los estados estacionarios de la ecuaci´n de Schr¨dinger . . . . . . o o 3.3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1. Una part´ ıcula en un pozo de potencial . . . . . . . . . . . . . . . . 1 3 5 6 6 7 13 15 15 19 20 22 22 22 23 25 26 27 28 30 31 35 35 42 43 44 44

2

´ INDICE GENERAL 3.3.2. El efecto t´ nel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . u 3.3.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 49 51 51 55 61 62 63 65 67 68 69 69 70 71 71 71 72 80 83 83 84 86 89 92 94 94 94 96

4. Mec´nica Cu´ntica II: Espacios de Hilbert a a 4.1. Espacios eucl´ ıdeos y espacios normados . . . . . . . . . . . . . . . . . . . 4.2. Operadores en H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3. Los axiomas de la Mec´nica Cu´ntica . . . . . . . . . . . . . . . . . . . . a a 4.4. Discusi´n e implicaciones de los postulados . . . . . . . . . . . . . . . . . o 4.5. Representaci´n de los operadores xi y pi . . . . . . . . . . . . . . . . . . . o 4.6. Las ecuaciones de Heisenberg y de Schr¨dinger . . . . . . . . . . . . . . . o 4.6.2. Los estados estacionarios del sistema . . . . . . . . . . . . . . . . . 4.7. El principio de incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . 4.8. La mec´nica matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a 4.9. La ecuaci´n de Schr¨dinger y el postulado 4.3.5 . . . . . . . . . . . . . . . o o 4.10. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. Resolviendo la ecuaci´n de Schr¨dinger o o 5.1. El m´todo de Nikiforov-Uvarov . . . . . . . . . . . . . . . . . . . . . . . . e 5.1.1. La ecuaci´n hipergeom´trica generalizada . . . . . . . . . . . . . . o e 5.1.2. La ecuaci´n diferencial hipergeom´trica . . . . . . . . . . . . . . . o e 5.1.3. Los polinomios de Hermite, Laguerre y Jacobi . . . . . . . . . . . . 5.2. Resoluci´n de la ecuaci´n de Schr¨dinger . . . . . . . . . . . . . . . . . . o o o 5.2.1. El oscilador arm´nico cu´ntico unidimensional . . . . . . . . . . . o a 5.2.2. La ecuaci´n de Schr¨dinger en un potencial central . . . . . . . . . o o 5.2.3. Los arm´nicos esf´ricos . . . . . . . . . . . . . . . . . . . . . . . . o e 5.2.4. Resolviendo la parte radial de la ecuaci´n de Schr¨dinger . . . . . o o 5.2.5. El oscilador arm´nico tridimensional . . . . . . . . . . . . . . . . . o 5.3. El m´todo de factorizaci´n de Schr¨dinger . . . . . . . . . . . . . . . . . . e o o 5.3.1. Introducci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 5.3.2. El oscilador arm´nico . . . . . . . . . . . . . . . . . . . . . . . . . o 5.3.3. El m´todo de factorizaci´n . . . . . . . . . . . . . . . . . . . . . . e o

4.6.1. Equivalencia de las representaciones de Heisenberg y de Schr¨dinger 66 o

5.3.4. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 5.4. Factorizaci´n de la EDO hipergeom´trica . . . . . . . . . . . . . . . . . . 108 o e 5.4.1. El hamiltoniano y los operadores escalera . . . . . . . . . . . . . . 108 5.4.3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 5.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 5.4.2. Factorizaci´n de H(x, n) . . . . . . . . . . . . . . . . . . . . . . . . 109 o

´ INDICE GENERAL Bibliograf´ ıa Anexo A: Breve introducci´n al an´lisis funcional o a

3 114 117

A.1. Introducci´n: Estacios m´tricos y espacios normados . . . . . . . . . . . . 117 o e A.2. Espacios de Hilbert separables . . . . . . . . . . . . . . . . . . . . . . . . 123 A.2.1. Operadores en espacios de Hilbert . . . . . . . . . . . . . . . . . . 128 A.2.2. Teor´ Espectral de operadores compactos autoadjuntos . . . . . . 132 ıa Bibliograf´ ıa 137

Prefacio
Estas notas contienen el contenido de un curso de introducci´n a la Mec´nica cu´ntio a a ca impartido por el autor en la Universidad de Zaragoza en septiembre de 2005 y en Coimbra en febrero de 2006. Las mismas est´n divididas en 6 cap´ a ıtulos que contienen tanto los conceptos te´ricos como distintos m´todos de resoluci´n de la ecuaci´n de Schr¨dinger. o e o o o Quiero agradecer a todos los que de una forma u otra me han ayudado a que estas notas sean posibles. En primer lugar a mi familia, a los que les he robado un tiempo precioso. Adem´s agradezco a Manuel Alfaro, Jos´ Luis Cardoso, Mario P´rez Francisco J. (Pacho) a e e Ruiz, Jos´ Carlos Petronilho y Juan L. Varona sus comentarios y correcciones que me e han permitido mejorar notablemente la exposici´n. o

´ Renato Alvarez Nodarse Sevilla 12 de julio de 2008

Introducci´n o
Estas notas corresponden a un curso de introducci´n a la Mec´nica cu´ntica. En ´l o a a e se pretende dar una idea general de c´mo surgi´ la Mec´nica cu´ntica a principios del o o a a siglo pasado (XX) y exponer algunos de sus principales principios desde un punto de vista “matem´tico”. El trabajo estar´ dividido en dos partes. a a En la primera se describir´ la evoluci´n de la teor´ cu´ntica desde finales del sia o ıa a glo XIX hasta la aparici´n de la Mec´nica cu´ntica de Heisenberg y Schr¨dinger en o a a o 1926–1927, es decir, a partir de la idea revolucionaria de Planck sobre los “quanta”, la explicaci´n del efecto fotoel´ctrico por Einstein y la descripci´n de la dualidad ondao e o part´ ıcula de De Broglie, hasta la aparici´n de las dos principales teor´ matem´ticas: la o ıas a mec´nica matricial y la mec´nica ondulatoria. a a En la segunda parte introduciremos la Mec´nica Cu´ntica de una part´ a a ıcula as´ como ı sus bases axiom´ticas en un espacio de Hilbert separable. Finalmente, veremos algunos a de los m´todos usados para resolver la ecuaci´n de Schr¨dinger. e o o

1

2

´ INDICE GENERAL

Cap´ ıtulo 1

Breve introducci´n a la o mec´nica cl´sica a a
La F´ ısica se basa en medidas y observaciones experimentales de la realidad que nos rodea, es decir, en cuantificar o caracterizar los distintos fen´menos naturales mediante o expresiones cuantitativas o n´ meros. u Estas cantidades medibles u observables se denominan cantidades f´sicas (e.g. lonı gitud, velocidad, energ´ . . . ). El objeto o conjunto de objetos a estudiar se denomina ıa, sistema f´sico (e.g. una part´ ı ıcula, un ´tomo, un coche, . . . ). Cuando conocemos distina tas medidas de un sistema que lo caracterizan por completo en un momento de tiempo determinado (e.g. la posici´n y la velocidad de una part´ o ıcula de masa m) decimos que el sistema se encuentra en un cierto estado dado. El objetivo de toda teor´ f´ ıa ısica es, por tanto: 1. Describir el estado del sistema f´ ısico, es decir, dar una representaci´n cuantitativa o (matem´tica) del estado que lo defina biun´ a ıvocamente. 2. Conocer la din´mica del sistema, es decir dado un estado inicial en el momento t0 a conocer su evoluci´n temporal para t > t0 . o 3. Predecir los resultados de las mediciones de las cantidades f´ ısicas del sistema. La teor´ f´ ıa ısica en s´ misma est´ en general constituida, desde el punto de vista ı a abstracto, por tres apartados: 1. El formalismo: Conjunto de s´ ımbolos y reglas de deducci´n a partir de los cuales o se pueden deducir proposiciones y enunciados. En general toda teor´ comienza ıa fijando un cierto n´ mero de axiomas comunmente denominados postulados. u 2. Ley din´mica: Cierta relaci´n (o relaciones) entre algunos de los principales objetos a o del formalismo que permitan predecir acontecimientos futuros. 3. Reglas de correspondencia o interpretaci´n f´ o ısica: Conjunto de reglas que permiten asignar valores experimentales a algunos de los s´ ımbolos del formalismo. 3

4

´ ´ ´ Cap´ ıtulo 1. Breve introduccion a la mecanica clasica Como ejemplo ilustrativo vamos a describir la mec´nica newtoniana. a

En la mec´nica newtoniana el estado de un sistema viene dado por el conjunto de a trayectorias de todas las part´ ıculas que constituyen el sistema. Por ejemplo, para una part´ ıcula, el estado estar´ dado por la funci´n vectorial r(t) ∈ R3 que denota la posici´n a o o en cada instante de tiempo t. Los observables son las cantidades medibles como la posici´n o r(t), la velocidad v(t) = d/dt[r(t)], la energ´ cin´tica T = mv 2 (t), etc. ıa e La ley din´mica en este caso es la segunda ley de Newton: a ma(t) = F (t), a(t) = d2 r(t) , dt2

donde F es la fuerza resultante que act´ a sobre el sistema, i.e., es una ecuaci´n diferencial u o de orden 2. Finalmente, las reglas de correspondencia son “evidentes” y consisten en los valores num´ricos de las proyecciones de los vectores r, v, etc. sobre los ejes del e correspondiente sistema de coordenadas escogido. Veamos un ejemplo de sistema f´ ısico y algunas de sus propiedades. Supongamos que tenemos una part´ ıcula que se mueve en R3 bajo la acci´n de una o fuerza F (x, y, z) que s´lo depende de las coordenadas (posici´n). Supongamos adem´s o o a que existe una funci´n escalar V (x, y, z) tal que o F (x, y, z) = −∇V (x, y, z) = − ∂V ∂V ∂V k, i− j− ∂x ∂y ∂z

donde i, j y k, son los vectores unitarios correspondientes a los ejes x, y y z, respectivamente. Entonces, usando el producto escalar est´ndar de los vectores tenemos a F (x, y, z)dr = − ∂V ∂V ∂V dx + − dy + dz ∂x ∂y ∂z = −dV (x, y, z).

Luego, el trabajo de la fuerza F para mover nuestra part´ ıcula a lo largo de cierta curva Γ ∈ R3 se expresa mediante la integral
b Γ

F (x, y, z)dr = −V (x, y, z) ,
a

donde a y b son los extremos de dicha curva. En particular, para cualquier curva cerrada, F (x, y, z)dr =
Γ

F (x, y, z)dr = 0.

Las fuerzas con estas caracter´ ısticas se denominan conservativas y los correspondientes sistemas: sistemas conservativos. La raz´n de esta denominaci´n se explica por lo siguiente: Si usamos la segunda ley o o de Newton d (mv) dr = mvdv, F (x, y, z)dr = dt luego F (x, y, z)dr =
Γ Γ

mvdv =

1 mv 2 . 2
a

b

´ 1.1. Mecanica Hamiltoniana Juntando esta expresi´n con la anterior tenemos o 1 mv 2 + V (x, y, z) 2 Es decir, la cantidad E = T (v) + V (r)
b

5

= 0,
a

v 2 = v · v.

vale lo mismo en los extremos de la curva Γ. Como Γ es arbitraria deducimos que E es una cantidad invariante en el tiempo. Esta cantidad se denomina energ´ mec´nica del ıa a p2 1 sistema. T = 2 mv 2 = 2m se denomina energ´ cin´tica, V , energ´ potencial y p = mv, ıa e ıa impulso. En la mec´nica cu´ntica el formalismo es muy distinto y es el objetivo de este a a curso. Antes de pasar a discutirlo veamos brevemente otra forma de describir los sistemas mec´nicos cl´sicos: El formalismo can´nico o hamiltoniano. a a o

1.1.

Mec´nica Hamiltoniana a

Por sencillez seguiremos considerando el movimiento de una unica part´ ´ ıcula. Vamos a suponer que el espacio f´ ısico es un espacio de fases (r, p), donde r = (x, y, z) ∈ R3 y p = (px , py , pz ) denotan las componentes del vector posici´n y momento, o respectivamente. Definamos una funci´n H dependiente de la posici´n r y el impulso p o o H(r, p) = 1 2 (p + p2 + p2 ) + V (x, y, z), y z 2m x

que denominaremos hamiltoniano del sistema. Entonces, las ecuaciones din´micas del a sistema vienen dadas por las expresiones dx ∂H , = dt ∂px ∂H dy , = dt ∂py ∂H dz , = ∂t ∂pz dpx ∂H =− , dt ∂x dpy ∂H =− , ∂t ∂y dpz ∂H =− . ∂t ∂z

(1.1.1)

Est´ claro c´mo se generaliza el problema. Supongamos que el hamiltoniano depende a o de las coordenadas can´nicas q1 , . . . qN y sus correspondientes momentos p1 , . . . pN . o Entonces las ecuaciones din´micas son a dqi ∂H , = dt ∂pi dpi ∂H , =− dt ∂qi i = 1, 2, . . . , N. (1.1.2)

De esta forma la din´mica queda determinada por 2N ecuaciones con 2N inc´gnitas. a o Finalmente debemos destacar que, en general, las ecuaciones anteriores son equivalentes a las que se obtienen usando la segunda ley de Newton. As´ si ı, H(r, p) = 1 2 (p + p2 + p2 ) + V (x, y, z), y z 2m x

6

´ ´ ´ Cap´ ıtulo 1. Breve introduccion a la mecanica clasica

las ecuaciones (1.1.1) nos dan (s´lo incluiremos las ecuaciones para la coordenada x) o ∂H dx = dt ∂px =⇒ vx = px , m px = mvx ,

∂H dvx ∂V d2 x dpx =− =⇒ m =− = Fx =⇒ m 2 = Fx , dt ∂x dt ∂x dt es decir, recuperamos las ecuaciones de Newton de la mec´nica cl´sica. a a Dentro del formalismo can´nico hamiltoniano hay una operaci´n de especial imporo o tancia para entender el paso de la Mec´nica cl´sica a la cu´ntica: las llaves de Poisson. a a a Se definen las llaves de Poisson de dos cantidades f´ ısicas A := A(q1 , . . . , qN , p1 , . . . , pN ) y B := B(q1 , . . . , qN , p1 , . . . , pN ), funciones de las variables can´nicas qi y pi , i = o 1, 2, . . . , N , a la cantidad
N

{A, B} :=

k=1

∂A ∂B ∂A ∂B − ∂qk ∂pk ∂pk ∂qk

.

(1.1.3)

N´tese que las ecuaciones de Hamilton (1.1.2) se pueden escribir como o dqi = {qi , H}, dt dpi = {pi , H}, dt i = 1, 2, . . . , N.

N´tese adem´s que para las coordenadas can´nicas se tiene o a o {qi , qj } = 0 = {pi , pj }, {qi , pj } = δi,j , i, j = 1, 2, . . . , N. (1.1.4)

En general se puede probar que la ecuaci´n de evoluci´n para cualquier cantidad o o f´ ısica A es dA = {A, H}. (1.1.5) dt

1.2.
1.2.1.

Dos ejemplos representativos
El oscilador arm´nico unidimensional o

Comencemos con un sistema cl´sico de gran importancia: el oscilador arm´nico. a o Asumiremos que el eje de coordenadas est´ situado justo en la posici´n de equilibrio del a o oscilador, luego por x representaremos la desviaci´n del sistema del punto de equilibrio. o En este caso p2 1 H(x, p) = + kx2 , (1.2.1) 2m 2 luego ∂H(x, p) dx = , dt ∂p p dx = , dt m dp ∂H(x, p) =− =⇒ dt ∂x

dp = −kx =⇒ mx′′ (t) + kx(t) = 0. dt

1.2. Dos ejemplos representativos

7

Sus soluciones son: k , m donde A y δ depender´n de las condiciones iniciales x0 = x(0), v0 = v(0) y est´n dadas a a por v0 = −ωx0 tan δ y x0 = A cos δ. x(t) = A cos(ωt + δ), ω=

En la figura 1.2 representamos dos soluciones correspondientes a fases δ iguales y amplitudes distintas. N´tese que de la soluci´n no se deducen ning´ n tipo de restricciones o o u para los valores de A y δ. Si calculamos la energ´ ıa: E =T +V = 1 1 1 m[x(t)′ ]2 + kx2 = kA2 = const. 2 2 2

De lo anterior se deduce que la energ´ toma los valores reales E = 1 kA2 ≥ 0 y es una ıa 2 cantidad continua.
x
2 1 5 −1 −2 10 15 20 25

Figura 1.2: El oscilador arm´nico: soluciones o Obviamente este sistema es demasiado sencillo. Un caso m´s realista es el oscilador a amortiguado, es decir, cuando hay rozamiento. En este caso la ecuaci´n diferencial que o se obtiene es mx′′ (t) + αx′ (t) + kx(t) = 0, donde α > 0 es el coeficiente de viscosidad del medio. Dejamos, al lector que resuelva y analize la ecuaci´n como ejercicio. o

1.2.2.

Movimiento en un campo central de fuerzas

Veamos el caso correspondiente al potencial de una fuerza central, es decir, V (r) = −α/r. Ejemplos t´ ıpicos de dicha fuerza son la fuerza gravitatoria y la electroest´tica. a

111 000 111 000 111 000 111 000 111 000 111 000 111 000 111 000 111 000 111 000 111 000 111 000

k

m

111111111111111111111 000000000000000000000 111111111111111111111 000000000000000000000
0

x

Figura 1.1: El oscilador arm´nico o

x
2 1

t
−1 −2

5

10

15

20

25

t

8

´ ´ ´ Cap´ ıtulo 1. Breve introduccion a la mecanica clasica
z

m γ F(r)

β M 0 α y

x

Figura 1.3: Fuerza central de interacci´n entre dos part´ o ıculas.

En este caso tenemos H(r, p) = p2 α − , 2m r r= x2 + y 2 + z 2 . (1.2.2)

Entonces, las ecuaciones (1.1.1) nos dan mx′′ (t) = −α x , r3 my ′′ (t) = −α y , r3 mz ′′ (t) = −α z . r3

Vamos a considerar el movimiento de una part´ ıcula material de masa m en un campo de fuerzas centrales (ver figura 1.3). Sea F (r) la fuerza dirigida al origen de coordenadas y que s´lo depende de la distancia r al origen de coordenadas. Usando la Ley de Newton o tenemos las siguientes ecuaciones para cada coordenada x, y y z: mx′′ (t) = Fx (r), mz ′′ (t) = Fz (r), Pero my ′′ (t) = Fy (r), r= x2 + y 2 + z 2 .

x Fx (r) = F (r) cos α = F (r) , r y Fy (r) = F (r) cos β = F (r) , r z Fz (r) = F (r) cos γ = F (r) , r x mx′′ (t) = F (r) , r y my ′′ (t) = F (r) , r z mz ′′ (t) = F (r) . r

luego las ecuaciones del movimiento de nuestra part´ ıcula son (1.2.3)

1.2. Dos ejemplos representativos

9

Vamos a probar que el movimiento de la part´ ıcula es plano. Para ello multiplicamos la primera ecuaci´n en (1.2.3) por −y, la segunda por x y las sumamos. Ello nos da o m(xy ′′ − yx′′ ) = 0 m(yz ′′ − zy ′′ ) = 0 =⇒ xy ′′ − yx′′ = 0. Si ahora multiplicamos la segunda por z, la tercera por −y y sumamos tenemos =⇒ yz ′′ − zy ′′ = 0. Finalmente, multiplicando la primera por z, la tercera por −x y sumando, obtenemos m(zx′′ − xz ′′ ) = 0 =⇒ zx′′ − xz ′′ = 0. Ahora bien, integrando por partes en la primera de las tres ultimas ecuaciones vemos ´ c1 = (xy ′′ − yx′′ )dt = xy ′ − yz ′ − zy ′ = c2 , x′ y ′ dt − yx′ + y ′ x′ dt = xy ′ − yx′ .

An´logamente tenemos, para las otras dos, a zx′ − xz ′ = c3 .

Si multiplicamos la primera de las tres ultimas ecuaciones por z, la segunda por x y la ´ tercera por y y las sumamos obtenemos c1 z + c2 x + c3 y = 0, que es precisamente la ecuaci´n de un plano que pasa por el origen. As´ pues, tenemos o ı la siguiente propiedad: Propiedad 0. El movimiento de una part´cula sometida a una fuerza central es plano, o ı sea, su trayectoria esta contenida en un plano que pasa por el origen (hacia donde apunta dicha fuerza central). Dado un vector cualquiera en el plano, siempre podemos descomponerlo en sus respectivas componentes. Todo vector se puede escribir en funci´n de los vectores unitarios o i y j que definen a los ejes x e y, respectivamente. En particular, los vectores unitarios de las direcciones radial ur y angular uθ (ver figura 1.4) ur = i cos θ + j sen θ, N´tese que entonces o duθ dur = uθ , = −ur . (1.2.4) dθ dθ Adem´s, F = Fr ur + Fθ uθ , pero si la fuerza es radial entonces Fθ = 0. Escribamos a ahora las leyes de Newton para nuestra part´ ıcula en coordenadas polares. Comenzamos calculando el vector velocidad v= d(rur ) dur dr dur dθ dr dθ dr =r + ur = r + ur = r uθ + ur , dt dt dt dθ dt dt dt dt dv = dt = dθ duθ dr dur dr dθ d2 θ d2 r uθ + r 2 uθ + r + 2 ur + dt dt dt dt dt dt dt dt r d2 θ d2 r dr dθ uθ + +2 −r 2 dt dt dt dt2 dθ dt
2

uθ = −i sen θ + j cos θ.

(1.2.5)

donde hemos usado (1.2.4). An´logamente a a=

ur .

10

´ ´ ´ Cap´ ıtulo 1. Breve introduccion a la mecanica clasica

y

Fr r j u
θ

F(r) θ Fθ x

ur 0 i

Figura 1.4: Componentes radial y angular de un vector.

Luego, usando la Ley de Newton, tenemos 0 = Fθ = maθ = m r r d2 θ dr dθ +2 2 dt dt dt =⇒

dr dθ d 2 dθ d2 θ r = 0. +2 = dt2 dt dt dt dt

Es decir, r2 θ′ (t) = c, con c cierta constante. La propiedad anterior se conoce como Ley de las ´reas pues el ´rea que barre el radio vector r es tal que dA(t) = r2 /2dθ = r2 /2θ′ (t)dt, a a por tanto A′ (t) = r2 /2θ′ (t) = c/2. As´ hemos probado la siguiente propiedad1 ı, Propiedad 1. El movimiento de una part´cula sometida a una fuerza central es tal que ı el radio vector r recorre areas iguales en intervalos de tiempo iguales, i.e., dA(t)/dt = ´ r2 θ′ (t) = c. Supongamos ahora que la fuerza es de la forma F (r) = − αm ur , r2 (1.2.6)

es decir, una ley del inverso del cuadrado de la distancia. Nuevamente usando la ley de Newton, para la componente radial obtenemos Fr (r) = mar =⇒ d2 r −r dt2 dθ dt
2

=−

α . r2

(1.2.7)

Vamos a intentar resolver esta ecuaci´n diferencial. Obviamente es una ecuaci´n difereno o cial no lineal as´ que intentaremos convertirla en una ecuaci´n lineal. Para ello haremos el ı o
1 Esta propiedad se conoce como segunda Ley de Kepler, en honor al matem´tico y astr´nomo J. a o Kepler quien la descubri´ en la segunda mitad del siglo XVII cuando estudiaba la orbita del planeta o ´ Marte.

1.2. Dos ejemplos representativos

11

cambio de variable r = 1/u(θ) y pasaremos de la variable t a θ, es decir, intentaremos dar con la ecuaci´n de la trayectoria de nuestra part´ o ıcula. N´tese que en las nuevas variables, o la propiedad 1 de las ´reas se escribe como θ′ (t) = cu2 . Tenemos a dr dr dθ u′ (θ) = = − 2 cu2 (θ) = −cu′ (θ), dt dθ dt u (θ) du′ (θ) d2 r = −c = −cu′′ (θ)θ′ (t) = −c2 u2 (θ)u′′ (θ), 2 dt dt luego (1.2.7) se transforma en α u′′ (θ) + u(θ) = 2 , c que es lineal. La soluci´n de la ecuaci´n anterior la escribiremos en la forma o o u(θ) = c1 cos(θ) + c2 sen(θ) + α α = 2 [1 + e cos(θ − δ)] , c2 c

P D r Θ

luego, si escogemos los ejes coordenados de forma que δ = 0 –o lo que es lo mismo, que r sea m´ ınimo cuando θ = 0, i.e., c1 > 0 y c2 = 0– obtenemos la ecuaci´n para la o trayectoria r(θ) = c2 /α . 1 + e cos(θ)

¿Qu´ figura geom´trica define la ecuae e ci´n anterior? Para ello recordemos que el o lugar geom´trico de los puntos P (x, y) tales e que la distancia OP de P a un punto fijo O (foco) es igual a la distancia P D de p a una recta r dada (directriz) viene dado por la p f´rmula r = pe/(1 + e cos θ) (ver figura 1.5) o siendo e cierta constante (excentricidad). Es Figura 1.5: Propiedad de las secciones c´ni- conocido que si e < 1 la curva es una elipo se, si e = 1 una par´bola, y si e > 1 una a cas. hip´rbola. As´ pues, hemos demostrado la e ı siguiente propiedad:

0

Propiedad 2. La trayectoria de una part´cula sometida a una fuerza central es una ı secci´n c´nica, es decir, una elipse, una par´bola o una hip´rbola. o o a e Es f´cil comprobar que si una fuerza es central entonces existe una funci´n U (x, y, z) a o tal que ∂U ∂U ∂U Fx = − , Fy = − , Fz = − . ∂x ∂y ∂z En nuestro caso, adem´s, U (x, y, z) = U (r) = −α/r. Sumando las tres ecuaciones antea riores y usando la ley de Newton tenemos dU = ∂U ∂U ∂U dx + dy + dz = −m(x′′ dx + y ′′ dy + z ′′ dz) ∂x ∂y ∂z =⇒

12

´ ´ ´ Cap´ ıtulo 1. Breve introduccion a la mecanica clasica d U+

m ′2 (x + y ′2 + z ′2 = 0. 2 En otras palabras, la funci´n energ´a o ı E(t) = U + m 2 α m v = − + v2 2 r 2 (1.2.8)

es constante. Esto es, como ya hemos visto, la Ley de Conservaci´n de la Energ´ Si o ıa. aplicamos esta ley a nuestro sistema tenemos, usando (1.2.5), E= m 2 αm m 2 αm m αm 2 v − = (vθ + vr ) − = [(rθ′ (t))2 + (r′ (t))2 ] − . 2 r 2 r 2 r

Escojamos el momento de tiempo cuando θ = 0. Usando la propiedad 1 tenemos (rθ′ (t))2 = c2 /r2 , pero, seg´ n nuestra elecci´n, r′ = 0 (es m´ u o ınimo) y r = c2 [α(1 + e)]−1 , luego E= mα2 (e2 − 1) 2c2 =⇒ e= 1+E 2c2 . mα2

b a 0 S

r rm P

Figura 1.6: Movimiento de un planeta P alrededor del sol S. En el caso de los planetas (ver figura 1.6), al pasar el planeta por el punto m´s a cercano al foco (donde esta el sol) se tiene, por la ley de Newton, ma = αm 2 rm =⇒ v2 = α , rm

pero entonces para la energ´ E obtenemos el valor ıa E= αm m 2 α < 0, v − =− 2 r 2rm

y por tanto e < 1, o sea, los planetas se mueven siguiendo ´rbitas el´ o ıpticas. Esta es la conocida primera Ley de Kepler.

1.3. Problemas

13

Finalmente, tenemos que rm = ae, y (1 − e2 ) = b2 /a2 , donde a y b son los semiejes mayor y menor de la elipse, respectivamente. Entonces, como a es la semisuma de las distancias m´xima y m´ a ınima de nuestra part´ ıcula (planeta) al foco, a= c2 /α 1 c2 /α + 2 1 + e 1 − e cos =⇒ a= c2 , α(1 − e2 )

de donde deducimos que b2 = c2 a/α. Si ahora usamos que el ´rea de la elipse es A = πab, a y la propiedad 1, obtenemos que πab = cT /2 donde T es el tiempo que tarda la part´ ıcula en dar una vuelta entera sobre la ´rbita. Sustituyendo el valor de b en la expresi´n o o anterior obtenemos 4π T2 = , (1.2.9) a3 α es decir, el cuadrado del per´ ıodo de revoluci´n de los planetas es proporcional al cubo o de sus distancias medias. La propiedad anterior se conoce como tercera Ley de Kepler. N´tese que la constante de proporcionalidad no depende para nada del planeta, s´lo o o de α, que seg´ n la Ley de Gravitaci´n Universal es GMs , donde G es la constante de u o gravitaci´n universal y Ms la masa del sol. o

1.3.

Problemas

Problema 1.3.1 Estudia como se comporta una part´cula material que se mueve en un ı campo potencial definido por las siguientes funciones potencial:   x < 0,  U0 , x < 0,  0, 0, 0 < x < L, U0 , 0 < x < L, V (x) = V (x) =   U0 , x > L, 0, x > L, conocidas como pozo potencial y barrera de potencial. Problema 1.3.2 Discutir lo que ocurre si en vez de dos masas interactuando seg´n la u ley de gravitaci´n universal, lo que tenemos es un atomo de hidr´geno. En este caso la o ´ o f´rmula (1.2.6) se convierte en o ke2 (1.3.1) F (r) = − 2 ur . r Para terminar con este apartado y pasar a discutir lo que ocurre en el mundo cu´ntico a tenemos que recordar que en el caso del ´tomo de hidr´geno hay un problema a˜ adido y es a o n que al ser el electr´n una part´ o ıcula cargada en movimiento, est´ continuamente emitiendo a ondas electromagn´ticas por lo que su energ´ va disminuyendo. Esto implica que el e ıa electr´n va cayendo en espiral al n´ cleo. Este hecho contradice todos los experimentos o u conocidos.

14

´ ´ ´ Cap´ ıtulo 1. Breve introduccion a la mecanica clasica

Cap´ ıtulo 2

¿C´mo se gest´ la Mec´nica o o a cu´ntica? a
Antes de entrar a discutir el formalismo y las leyes din´micas de la Mec´nica Cu´ntia a a ca vamos a dar un bosquejo hist´rico de la misma. o William Thomson o, como era conocido, Lord Kelvin, pronunci´ a finales del siglo XIX una c´lebre frase: o e Hoy d´a la ciencia f´sica forma, esencialmente, un ı ı conjunto perfectamente armonioso, ¡Un conjunto pr´cticamente acabado! S´lo quedan dos “nubecia o llas”: la primera, el resultado negativo del experimento de Michelson-Morley. La segunda, las profundas discrepancias de la ley de Rayleigh-Jeans. Nadie, en aquel momento, pod´ imaginar que esas dos nuıa becillas desembocar´ en la Teor´a de la Relatividad de Einsıan ı tein y la Mec´nica Cu´ntica, teor´ que iban a cambiar radia a ıas calmente nuestra concepci´n de los fen´menos naturales y que o o representaron una Revoluci´n comparable, en cierta forma, a o la Revoluci´n Copernicana y la aparici´n de los Principia de o o Newton.

William Thomson

En estas notas nos dedicaremos a estudiar las bases de la segunda de estas dos grandes teor´ Antes de entrar es los detalles vamos a dar una breve introducci´n hist´rica, ıas. o o necesaria para entender como el problema planteado por Lord Kelvin –su segunda “nubecilla”– y su resoluci´n termin´ en la moderna teor´ cu´ntica. o o ıa a

2.1.

La radiaci´n del cuerpo negro o

La ley de Rayleigh-Jeans es una f´rmula que describe la radiaci´n de un “cuerpo o o negro”. Todos sabemos que al calentar un cuerpo este cambia de color –qui´n no ha e 15

16

´ ´ ´ ´ Cap´ ıtulo 2. ¿Como se gesto la Mecanica cuantica?

λ

v

Figura 2.1: Onda plana unidimensional: Si v es la velocidad de la onda, T el periodo y λ la longitud de onda, entonces λ = vT , ω = T /2π.

calentado de peque˜ o un clavo o un tornillo en el fog´n de casa o ha visto el color que n o toma una parrilla al hacer una parrillada–. Probablemente nuestra curiosidad nos lleva a preguntarnos –al menos todo f´ ısico lo deber´ hacer– ¿c´mo emiten la luz los cuerpos ıa o al calentarse? Para resolver estas dudas, los f´ ısicos de finales del siglo XIX idealizaron un cuerpo cualquiera y construyeron un modelo que llamaron cuerpo negro –tambi´n, e “cavidad”, etc–. La idealizaci´n consist´ en que el cuerpo negro ten´ que absorber –y o ıa ıa por tanto emitir– todas las “ondas” luminosas –recordemos que a finales del XIX hab´ ıa sido establecido sin ning´ n asomo de duda que la luz era una onda electromagn´tica– por u e igual sin importarle la longitud de onda de la misma. El primero en establecer una ley emp´ ırica para la radiaci´n del cuerpo negro fue o Wien quien obtuvo la f´rmula αω 3 e−βω/T , α y β par´metros experimentales, pero ´sta o a e s´lo correspond´ a la parte ultravioleta –altas frecuencias, o equivalentemente, longituo ıa des de onda peque˜ as– del espectro y fallaba en la banda infrarroja –bajas frecuencias, o n equivalentemente, longitudes de onda grandes–. Por otro lado, dos f´ ısicos ingleses, Rayleigh y Jeans, dedujeron una f´rmula para la banda infrarroja pero que no era compatible o con la f´rmula de Wien. o Definamos la densidad de energ´ (cantidad de energ´ por unidad de volumen) meıa ıa diante U (T ). Obviamente ´sta depender´ de la temperatura T . Adem´s, cada longitud de e a a onda –frecuencia– aportar´ su “granito de arena”, esta densidad por unidad de frecuencia a ω la denotaremos por u(ω, T ), as´ ı U (T ) =
0 ∞

u(ω, T )dω.

(2.1.1)

La f´rmula de Rayleigh-Jeans establec´ que o ıa u(ω, T ) = ω2 kT, π 2 c3

La manera de obtener esta f´rmula es muy sencilla. Era un hecho bien conocido en o en siglo XIX que el n´ mero de ondas estacionarias con frecuencias por unidad de volumen u

donde c es la velocidad de la luz y k es la constante de Ludwig Boltzmann. En particular, para frecuencias muy altas (zona de frecuencias ultravioletas) es muy grande lo cual est´ en contradicci´n con las mediciones experimentales. Esta es la llamada cat´strofe a o a ultravioleta y no es m´s que la segunda nubecilla de Lord Kelvin (ver figura 2.2). N´tese a o que al sustituir u(ω, T ) en (2.1.1) obtenemos U (T ) = ∞ lo cual no tiene sentido.

´ 2.1. La radiacion del cuerpo negro
u(ω, T ) Ley de Rayleigh-Jeans Curva experimental Ley de Plank

17

ω

Figura 2.2: Gr´fica de la intensidad u(ω, T ) contra la frecuencia de onda ω. a

ω2 en el interior de un cuerpo en el intervalo [ω, ω + △ω] era dnω = 2 3 . La suposici´n de o π c Rayleigh y Jeans fue suponer que a cada oscilaci´n electromagn´tica le correspond´ en o e ıa, media, una energ´ ε igual a kT . As´ ıa ı u(ω, T ) = ε dnω = ω2 kT. π 2 c3 (2.1.2)

El pr´ximo paso lo dio Max Planck. Desde el punto de vista de la f´ o ısica cl´sica la a deducci´n de Rayleigh y Jeans era impecable, por tanto Planck asumi´ que deb´ haber o o ıa alguna “ley” importante sin descubrir. En octubre de 1900 Planck encontr´ emp´ o ıricamente una f´rmula que describ´ perfectamente la ley experimental para la radiaci´n del o ıa o cuerpo negro. Dicha f´rmula para la energ´ media de la onda era la siguiente: o ıa ε = exp ω ω kT , −1

donde era cierta constante desconocida. Si ω/kT ≪ 1, entonces la f´rmula de Planck o daba ε ≈ kT . Adem´s, si ω/kT ≫ 1, Planck recuperaba la f´rmula de Wien. a o

Para explicar su formula Plank, rompiendo la concepci´n cl´sica, lanza la idea de que los “osciladores” que como a ponen los ´tomos absorben o emiten luz no de forma cona tinua, como era habitual en la f´ ısica cl´sica, sino mediante a porciones aisladas proporcionales a la frecuencia, es decir la energ´ se emit´ o absorb´ mediante “quantas” de energ´ ıa ıa ıa ıa E = ω.

Max Planck

Hay varias razones que justifican su audacia. La primera es que Planck consider´ su hip´tesis como un artificio mao o tem´tico pues le permit´ deducir su f´rmula emp´ a ıa o ırica. En efecto, a˜ os antes en gran f´ n ısico austriaco Ludwig Boltzmann hab´ demostrado que la probabilidad de que un sistema en ıa equilibrio tuviese una energ´ E era proporcional a la canıa E . Si E s´lo puede tomar valores que sean o tidad exp − kT

18

´ ´ ´ ´ Cap´ ıtulo 2. ¿Como se gesto la Mecanica cuantica?

m´ ltiplos enteros de ω, En = n ω, entonces la probabilidad pn de cada uno de estos u n ω y por tanto la energ´ media es ıa valores de energ´ es pn = exp − ıa kT

ε =

∞ n=0

pn En =

n=0 ∞

n ω exp −

n ω kT

n ω exp − kT n=0

= exp

ω ω kT

, −1

que es justamente la f´rmula que Plank hab´ encontrado emp´ o ıa ıricamente. Si ahora mulω2 tiplicamos por dnω = 2 3 obtenemos π c u(ω, T ) = ε dnω = ω3 4π 2 c2 1 ω kT , −1 (2.1.3)

exp

conocida como f´rmula de Planck para la densidad de energ´ de un cuerpo negro. o ıa La segunda raz´n fue que los quanta de Planck eran absorbidos o emitidos por la o materia que compon´ al cuerpo negro: es decir sus ´tomos. Y la estructura at´mica ıa a o era algo desconocido a principios del siglo XX, incluso muchos modelos de la materia consideraban a ´sta como un conjunto de osciladores, por lo que no era del todo descae bellada la idea de Planck de que estos osciladores s´lo pudiesen absorber la energ´ o o ıa emitirla mediante porciones individuales –podr´ ser una especie de resonancia, o algo ıa parecido–. No obstante para Planck la luz segu´ siendo una onda perfectamente continua ıa y perfectamente descrita por las leyes de Maxwell. Antes de continuar nuestra historia debemos hacer un breve par´ntesis para explicar e cu´les fueron las principales causas de que la hip´tesis de Planck calara tan hondo el la a o f´ ısica de principios de siglo. El primer hecho importante es que, como ya hemos mencionado, la f´rmula de Planck o se correspond´ exactamente con la curva experimental para el cuerpo negro obtenida ıa en los laboratorios. Pero adem´s permit´ resolver una de las paradojas de la f´ a ıa ısica cl´sica: la denominada “cat´strofe ultravioleta”, consecuencia de la f´rmula de Rayleigha a o Jeans. Si la f´rmula (2.1.2) era correcta entonces la densidad de equilibrio de la energ´ o ıa u(T ) de la radiaci´n (2.1.1) daba infinito, es decir que nunca se alcanzar´ el equilibrio o ıa termodin´mico entre la materia y la radiaci´n. Si usamos (2.1.3) tenemos a o U (T ) =
0 ∞

u(ω, T )dω =

π2 k4 4 T = σT 4 , 60c2 3

donde σ es una constante conocida tambi´n como constante de Boltzmann para la dene sidad o luminosidad de la energ´ de radiaci´n. Planck calcul´ adem´s el valor de la ıa o o a constante en su f´rmula para que se correspondiera con los valores experimentales obo teniendo el valor aproximado 1,05 × 10−34 Jules por segundo1 . Cuando sustituy´ este o valor el la f´rmula para σ obtuvo exactamente el valor num´rico de ´sta. Es decir, Planck o e e resolvi´ de forma brillante la segunda de las nubecillas de Lord Kelvin. o
1 Muchas

veces en vez de

se usa el valor h = 2π = 6,62 × 10−34 .

2.2. Einstein y el efecto fotoel´ctrico e

19

Estos resultados fueron publicados por Planck el 14 de octubre de 1900, d´ oficial del nacimiento de la teor´ ıa ıa cu´ntica. ¡Qui´n iba a imaginar que este trabajo iba a revoa e lucionar la f´ ısica por completo! El segundo hecho, que adem´s fue crucial en la historia a de la mec´nica cu´ntica, fue la prueba de Henri Poincar´ (en a a e el oto˜ o de 1911) de que la distribuci´n n o ε = Henri Poincair´ e exp ω ω kT , −1

s´lo se pod´ obtener bajo la suposici´n de que la energ´ o ıa o ıa est´ cuantizada, es decir desde el punto de vista matem´tico a a la f´rmula de Planck s´lo puede ser deducida bajo la supoo o sici´n de que la energ´ se emite y absorbe en porciones discretas de energ´ algo que era o ıa ıa totalmente distinto a la concepci´n cl´sica del mundo que se ten´ hasta la fecha. o a ıa

2.2.

Einstein y el efecto fotoel´ctrico e
El siguiente paso lo dio Einstein en 1905 en un ensayo titulado Sobre un punto de vista heur´stico acerca de la proı ducci´n y la transformaci´n de la luz que recibi´ el mismo o o o Max Planck para su publicaci´n en los Annalen der Physik. o Einstein, totalmente seducido por los quanta de Planck, lanza la hip´tesis de que no s´lo los “osciladores” materiales o o emit´ energ´ cuantificadamente, sino tambi´n los “oscilaıan ıa e dores” lum´ ınicos. Einstein retomando las ideas corpusculares sobre la luz –Newton ya hab´ desarrollado una teor´ ıa ıa corpuscular a finales del siglo XVII– considera la luz formada por part´ ıculas de masa cero y energ´ ω: los fotones. ıa Utilizando estas hip´tesis dio una explicaci´n sencill´ o o ısima al efecto fotoel´ctrico que hab´ descubierto Hertz en 1887 y e ıa que segu´ sin tener una explicaci´n satisfactoria. ıa o

Hertz hab´ descubierto que una placa met´lica sometiıa a da a una luz ultravioleta –altas frecuencias– emit´ electroıa nes. A˜ os m´s tarde se comprob´ que el n´ mero de dichos n a o u electrones aumentaba proporcionalmente a la intensidad de la radiaci´n pero “incompreno siblemente” la velocidad de ´stos no depend´ de la intensidad sino de la frecuencia de e ıa luz: a mayor frecuencia, mayor velocidad. Adem´s si la frecuencia era lo suficientemente a baja –o la longitud de onda muy grande– ya no se emit´ electrones independientemente ıan de lo intensa que fuese la luz incidente. Para resolver el problema Einstein razon´ como sigue: Supongamos que usamos una o luz monocrom´tica compuesta por quantas de energ´ luminosa ω, es decir que estamos a ıa bombardeando la l´mina met´lica con part´ a a ıculas luminosas cada una de las cuales tiene

Albert Einstein

20

´ ´ ´ ´ Cap´ ıtulo 2. ¿Como se gesto la Mecanica cuantica?

luz Metal

electrones

Figura 2.3: Efecto fotoel´ctrico e

una energ´ ω. Si denotamos por W la energ´ necesaria para extraer un electr´n del ıa ıa o metal, entonces la energ´ cin´tica de los electrones, Ec , se expresar´ mediante la f´rmula ıa e a o Ec = ω − W. (2.2.1)

¡Todas las observaciones descritas anteriormente son una consecuencia de la f´rmula o anterior! A˜ os m´s tarde, el f´ n a ısico estadounidense Robert Millikan comprueba experimentalmente la f´rmula de Einstein (2.2.1) y encuentra que es la misma de Planck. o Esta fue la gota que colm´ el vaso, pues al parecer la luz, que era aceptada un´nimemente o a por todos como un fen´meno continuo, ten´ al parecer cierta naturaleza corpuscular. o ıa

2.3.

Bohr y el modelo at´mico o
El pr´ximo paso en la historia lo dio el dan´s Niels Bohr. o e

Era un hecho aceptado en 1913 que el ´tomo estaba consa tituido por un n´ cleo “pesado” y “denso” que conten´ toda u ıa la materia del ´tomo y electrones girando a su alrededor. Este a modelo, una especie de sistema solar en miniatura, sencillo y funcional fue propuesto por Rutherford a partir de los resultados de experimentos de dispersi´n.2 S´lo ten´ un “peque˜ o” o o ıa n problema: como toda carga en movimiento acelerado emite ondas electromagn´ticas, los electrones que giraban alrededor del e n´ cleo deb´ perder energ´ y caer al n´ cleo –adem´s en un u ıan ıa u a tiempo r´cord: 10−5 segundos–. Por tanto, ten´ que haber ale ıa guna forma de poder “retener” a los electrones en sus ´rbitas. o Niels Bohr Adem´s, otro hecho conocido era que el espectro del ´tomo de a a hidr´geno, por ejemplo, estaba constituido por l´ o ıneas espectrales completamente separadas cuyas frecuencias se expresaban mediante la f´rmula de o Balmer –series de Balmer– y sus generalizaciones: ω=R 1 1 − 2 k2 n , n, k = 1, 2, 3, . . . ,

siendo R la constante de Rydberg.
2 Rutherford

bombardeaba atomos de oro con n´cleos de helio (part´ ´ u ıculas alpha).

´ 2.3. Bohr y el modelo atomico

21

El razonamiento de Bohr fue bastante l´gico: obligar al electr´n que se mantuviera o o en ciertas ´rbitas permitidas (estables) y para pasar de una de estas ´rbitas a otra este o o deber´ “saltar” por encima de todas aquellas no permitidas. Dichas ´rbitas, que Bohr ıa o consider´ circulares, deb´ ser tales que o ıan De todas las infinitas ´rbitas posibles s´lo son posibles aquellas en la que su moo o mento angular L = mvr, siendo m la masa del electr´n, v, su velocidad y r el radio o de la ´rbita, fuesen m´ ltiplos enteros de , i.e. mrv = n . o u La energ´ que absorbe o emite un ´tomo al saltar un electr´n de una ´rbita permiıa a o o tida a otra es igual a ω, es decir para saltar de una ´rbita a otra el ´tomo absorbe o a o emite un quanta de luz. Veamos las consecuencias de las hip´tesis cu´nticas de Bohr. o a Si usamos la ley de Newton F = ma, tenemos v2 e2 = 2. r r Utilicemos que L = mvr = n para eliminar la velocidad v. Ello nos da el valor de los radios rn de las o ´rbitas permitidas m rn = n . me2 Figura 2.4: El ´tomo de Bohr a
2 2 2 2
111111111111111 000000000000000 111111111111111 111111111 000000000000000 000000000 111111111111111 111111111 000000000000000 000000000 111111111111111 111111111 000000000000000 000000000 111111111111111 111111111 000000000000000 000000000 111111111111111 111111111 000000000000000 000000000 111111111111111 111111111 000000000000000 000000000 111111111111111 111111111 000000000000000 000000000 111111111111111 111111111 000000000000000 000000000 111111111111111 111111111 000000000000000 000000000 1111 0000 111111111111111 111111111 000000000000000 000000000 1111 0000 111111111111111 111111111 000000000000000 000000000 1111 0000 111111111111111 000000000000000 1111 0000 1111 0000

m

r

v

La energ´ de la ´rbita es, por tanto3 , ıa o En =

e e me4 1 1 mv 2 − = − = − 2 2. 2 r 2r 2 n me4 2 3 1 1 − 2 k2 n

(2.3.1)

Entonces, el salto entre dos ´rbitas daba para la frecuencia del fot´n emitido el valor: o o ω= En − Em = , n, k = 1, 2, 3, . . . .

Cuando Bohr sustituy´ en su f´rmula el valor de m, e y , tomando para esta ultima o o ´ el valor de encontr´ Planck, obtuvo justamente el valor de la constante de Rydberg R. o Es decir, era m´s que una simple constante introducida artificialmente por Planck: era a una de las constantes m´s importantes de la naturaleza. a Aunque el modelo de Bohr era muy funcional y explicaba muchos fen´menos, este o continuaba siendo muy incompleto y adem´s ten´ demasiados interrogantes. ¿De d´nde a ıa o sal´ ese extra˜ o postulado sobre las ´rbitas? Este era quiz´ el punto m´s “obscuro” ıa n o a a de toda la teor´ No obstante, en su art´ ıa. ıculo Bohr sienta las bases de lo que luego se denomin´ el Principio de correspondencia de Bohr. El ´l, Bohr postula c´mo deb´ ser la o e o ıa teor´ cu´ntica: ´sta ten´ que ser tal que, para n´ meros cu´nticos grandes, por ejemplo ıa a e ıa u a n en las f´rmulas anteriores, se transformase en la teor´ cl´sica. o ıa a A˜ os m´s tarde, Bohr junto a Sommerfeld mejoran mucho el modelo at´mico inicial n a o incluyendo ´rbitas el´ o ıpticas, entre otras cosas. Pero no es hasta 1925-1926 que no nace la nueva teor´ cu´ntica a manos de un joven f´ ıa a ısico alem´n: Werner Heisenberg y un f´ a ısico austriaco: Erwin Schr¨dinger. o
3 Hemos

sustituido el valor de v que nos da la ley de Newton.

22

´ ´ ´ ´ Cap´ ıtulo 2. ¿Como se gesto la Mecanica cuantica?

2.4.
2.4.1.

El nacimiento de la Mec´nica Cu´ntica a a
La dualidad onda-part´ ıcula

Antes de poder describir los fundamentos de la Mec´nica Cu´ntica tenemos que a a detenernos en un personaje singular: el franc´s Louis de Broglie. Luis de Broglie era e el hermano peque˜ o del Marqu´s Maurice De Broglie, un afamado f´ n e ısico experimental franc´s que dedicaba gran parte de su tiempo y dinero a la investigaci´n experimental e o –varias veces fue propuesto para el Nobel de F´ ısicas–. Un d´ de 1923 Louis, influenciado ıa por el trabajo de Einstein sobre el efecto fotoel´ctrico, postula que la dualidad ondae part´ ıcula que Einstein hab´ proclamado para la luz tambi´n hab´ de ser cierta para las ıa e ıa part´ ıculas materiales, como por ejemplo, el electr´n: Sus palabras fueron o ´ “En la Optica durante siglos ha sido demasiado despreciado el m´todo corpuse cular de estudio en comparaci´n con el ondulatorio. ¿No se habr´ cometido o a el error inverso en la teor´a sobre la materia? ”. ı Si Einstein hab´ recuperado la propiedad corpuscular paıa ra la luz, De Broglie la postul´ para la materia. Al enterarse o Einstein de las afirmaciones y trabajos de De Broglie afirm´: o “De Broglie ha levantado un extremo del gran velo”. Aunque Louis no consigui´ convencer a ninguno de los f´ o ısicos del laboratorio de su hermano para que verificase su hip´tesis –´stos o e estaban enfrascados en otros muchos proyectos, como los rayos X–, en 1927 C. Davisson y L. Germer descubrieron una figura de difracci´n al estudiar la dispersi´n de electrones que luego o o fue corroborada independientemente por G.P. Thompson y por P. Tartakovsky. La genialidad de De Broglie fue equiparar un electr´n a o una onda plana. Por ejemplo, si tenemos un electr´n de masa o m y velocidad v, De Broglie postul´ que el momento (impulso) o p del electr´n era o p = mv = E ω 2π 2π = = = , v v vT λ

Louis de Broglie

de esta forma De Broglie daba un significado f´ ısico a las ´rbitas de Bohr: ´stas eran justo o e aquellas ´rbitas tales que el cociente entre su longitud y la longitud de onda del electr´n o o era un n´ mero entero, es decir era una analog´ completa a las ondas estacionarias sobre u ıa un anillo (c´ ırculo).

2.4.2.

La Mec´nica matricial de Heisenberg a

La hip´tesis de De Broglie fue la clave para una de las dos formulaciones de la o Mec´nica cu´ntica: La mec´nica ondulatoria de Schr¨dinger. Pero antes debemos coa a a o mentar la primera versi´n de la Mec´nica cu´ntica, la mec´nica matricial, nacida en o a a a 1925 de la mano del joven f´ ısico alem´n Werner Heisenberg. a

´ ´ 2.4. El nacimiento de la Mecanica Cuantica

23

En opini´n de Heisenberg, una teor´ f´ o ıa ısica correcta ha de hacer uso unica y exclusivamente de cantidades o magnitudes ´ observables. Luego haciendo uso del principio de correspondencia de Bohr se lanz´ a entender los estados estacionarios del ´too a mo. Su razonamiento era, aproximadamente el siguiente: Una carga en movimiento con una determinada frecuencia deb´ emiıa tir radiaci´n con dicha frecuencia –como en la teor´ cl´sica–. o ıa a Este hecho era una consecuencia matem´tica del an´lisis de a a Fourier que Heisenberg aplicaba al mundo cu´ntico. Como frea cuencias del espectro depend´ de dos ´ ıan ındices ωn,m (v´ase la e f´rmula de Balmer), Heisenberg postulaba que deb´ haber tano ıa tos ´ ındices como estados estacionarios –no s´lo como niveles de o Werner Heisenberg energ´ pues se sab´ que las series espectrales se modificaban ıa, ıa al introducir los ´tomos en fuertes campos magn´ticos–. A cona e tinuaci´n da un salto cualitativo al afirmar que toda magnitud f´ o ısica cl´sica a(t) debe a transformarse en el conjunto Anm (t). As´ por ejemplo la posici´n del electr´n x(t) deb´ ı, o o ıa ser sustituida por una tabla Xnm (t). A continuaci´n Heisenberg razona como habr´ de o ıa 2 calcularse Xnm (t) hasta obtener la f´rmula o
2 Xnm (t) = k

Xnk (t)Xkm (t),

es decir, las cantidades Xnm eran matrices. Finalmente, deduce, siempre razonando sobre el principio de correspondencia de Bohr que la din´mica que rige las magnitudes cu´nticas a a ha de ser: √ dX i i (2.4.1) = (HX − XH) = [H, X], i = −1, dt donde H representaba la matriz del Hamiltoniano del sistema. Como H, representa el Hamiltoniano, es decir la energ´ y obviamente [H, H] = 0, entonces, de (2.4.1) se ten´ ıa, ıa la conservaci´n de la energ´ En particular Heisenberg, junto a dos colegas alemanes de o ıa. Gotinga, M. Born y P. Jordan, desarrollan toda una Mec´nica matricial que se ajustaba a muy bien a las observaciones –pocas, por cierto– de la ´poca. Aparte de sus “aberrantes” e matrices –como les llamaban los f´ ısicos de la ´poca, especialmente Schr¨dinger– Heisene o berg descubri´, o m´s bien postul´, un principio tremendamente pol´mico: el principio o a o e de incertidumbre de Heisenberg. De hecho en sus primeros razonamientos para construir la mec´nica matricial Heisenberg descubre la imposibilidad de conocer al mismo tiempo a y con una precisi´n arbitraria la posici´n y la velocidad del electr´n. o o o Obviamente ese cambio radical no fue bien recibido por la mayor´ de los f´ ıa ısicos. En primer lugar representaba un cambio dr´stico de pensamiento –esas “aberrantes” a matrices–, en segundo, su aparato matem´tico era lo suficientemente complicado para a que no estuviera al alcance de cualquiera. Por eso no es de extra˜ ar que pronto apareciera n un competidor.

2.4.3.

La Mec´nica ondulatoria de Schr¨dinger a o

En efecto, en 1926, Erwin Schr¨dinger andaba buscando una teor´ que acabase o ıa con esa “aberraci´n” de las matrices que Heisenberg intentaba introducir en la f´ o ısica, cuando, a sugerencia de P. Debije, estudia el trabajo de De Broglie publicado 1924.

24

´ ´ ´ ´ Cap´ ıtulo 2. ¿Como se gesto la Mecanica cuantica?

Seg´ n el mismo Schr¨dinger, un simple vistazo le fue suficiente para dar con la idea: u o asociar a cada part´ ıcula una onda y construir la ecuaci´n diferencial que gobierna dicha o onda. Al principio Schr¨dinger intent´ construir una teor´ ondulatoria para un electr´n o o ıa o atrapado en un ´tomo. Comienza con un modelo relativista pero no le sale bien y decide a ver qu´ ocurre en el caso no relativista. e La idea de Schr¨dinger era muy simple: Supongamos que o tenemos una onda Ψ(x, t) asociada a un sistema cl´sico cuya a energ´ viene dada por la funci´n de Hamilton, el Hamiltoniano, ıa o H(x, p), siendo x la coordenada y p el impulso. Entonces, despu´s de un “largo” proceso de prueba y error, y usando el prine cipio de correspondencia de Bohr as´ como distintos elementos ı de la mec´nica cl´sica “superior” –las ecuaciones de Hamiltona a Jacobi, por ejemplo–, Schr¨dinger postul´ que la ecuaci´n pao o o ra una onda Ψ(x, t) deb´ ser, en el caso estacionario, es decir ıa cuando no hay dependencia del tiempo, H (x, p) Ψ(x, t) = EΨ(x, t), ˆ Erwin Schr¨dinger o p = −i ˆ ∂ , ∂x

donde E era la energ´ del sistema asociado a la onda Ψ. Es ıa decir, en el caso cuando tenemos un Hamiltoniano est´ndar, a H(x, p) = p2 + V (x), 2m

siendo V (x) la funci´n potencial (energ´ potencial), se tiene la ecuaci´n de diferencial o ıa o − ∂2 Ψ + V (x)Ψ(x, t) = EΨ(x, t). 2m ∂x2
2

(2.4.2)

Una de las pruebas de fuego de su ecuaci´n fue el caso V (x) = 0, es decir cuando se ten´ o ıa el movimiento de una part´ ıcula libre. Si consideramos el caso unidimensional, y hacemos V (x) = 0, la soluci´n deb´ ser una onda plana del tipo o ıa Ψ(x, t) = A cos(kx + ωt), k= 2π . λ

Si sustituimos este valor en la ecuaci´n de Schr¨dinger tenemos el valor o o E= k , 2m
2 2

que igualado con el valor de la energ´ cin´tica –recordemos que V (x) = 0– nos da ıa e p= k= 2π , λ

que justamente era la f´rmula que hab´ postulado De Broglie. o ıa Pero su mayor ´xito estaba por llegar. Schr¨dinger decidi´ aplicar su ecuaci´n al e o o o a ´tomo de hidr´geno. Como en este caso el potencial era o V (r) = − e2 , r r= x2 + y 2 + z 2 ,

´ ´ 2.4. El nacimiento de la Mecanica Cuantica obtuvo la ecuaci´n o
2

25

2m

∂2 ∂2 ∂2 + 2+ 2 ∂x2 ∂y ∂z

Ψ(x, y, z) −

e2 Ψ(x, y, z) = EΨ(x, y, z). r

(2.4.3)

A esta ecuaci´n volveremos m´s adelante. Lo importante era que Schr¨dinger sab´ como o a o ıa tratar este tipo de ecuaciones y la resolvi´. Primero la escribi´ en coordenadas esf´ricas o o e ∂2 y luego aplic´ la separaci´n de variables. La parte angular del laplaciano, ∆ := ∂x2 + o o ∂2 ∂2 e ∂y 2 + ∂z 2 , en coordenadas esf´ricas era muy sencilla de resolver apareciendo las funciones o arm´nicos esf´ricos de Laplace. En particular Schr¨dinger obtuvo para los valores de o e o la energ´ en el estado estacionario del ´tomo de hidr´geno la f´rmula ıa a o o En = − que era la misma de Bohr (2.3.1). Finalmente Schr¨dinger, igual que hizo Heisenberg, “dedujo” una ecuaci´n para la o o din´mica de un sistema, que en el caso unidimensional tiene la forma a H x, −i ∂ ∂x Ψ(x, t) = i ∂ Ψ(x, t). ∂t me4 1 , 2 2 n2

Si tenemos un Hamiltoniano est´ndar, ´sta se transforma en a e − ∂2 ∂ Ψ(x, t) + V (x)Ψ(x, t) = i Ψ(x, t). 2m ∂x2 ∂t
2

(2.4.4)

En particular, de (2.4.4) se pod´ deducir f´cilmente la ecuaci´n (2.4.2), para los sistemas ıa a o estacionarios, introduciendo la factorizaci´n o Ψ(x, t) = Ψ(x) exp − iEt .

2.4.4.

Una “deducci´n” de la ecuaci´n de Schr¨dinger o o o

La ecuaci´n de Schr¨dinger no se puede deducir, es sencillamente un postulado o o impuesto, o mejor, descubierto. No obstante, existe un razonamiento muy sencillo que permite dar con la forma de esta ecuaci´n. o Supongamos que tenemos una part´ ıcula libre y le asociamos cierta onda plana Ψ(x, t) = Aei(kx−ωt) , k= 2π . λ

Seg´ n De Broglie p = 2π /λ, as´ que k = p/ , y adem´s, usando la f´rmula de Planck u ı a o ω = E/ , i Ψ(x, t) = Ae (px−Et) . Ahora hacemos, p2 ∂2 Ψ(x, t) = − 2 Ψ(x, t), 2 ∂x por tanto p2 = − ∂2 Ψ(x, t), Ψ(x, t) ∂x2
2

26 pero E=

´ ´ ´ ´ Cap´ ıtulo 2. ¿Como se gesto la Mecanica cuantica?

2 ∂2 p2 Ψ(x, t), ⇒ E=− 2m 2mΨ(x, t) ∂x2

o

∂2 Ψ(x, t) = EΨ(x, t). 2m ∂x2
2

Si en vez de una part´ ıcula libre tenemos una ligada mediante un potencial V (x), entonces E= o, equivalentemente, − ∂2 Ψ(x, t) + V (x)Ψ(x, t) = EΨ(x, t). 2m ∂x2
2

p2 + V (x), 2m

E=−

∂2 Ψ(x, t) + V (x), 2mΨ(x, t) ∂x2
2

Del razonamiento anterior en particular se deduce que al momento p de una part´ ıcula le corresponde el operador ∂ . p = −i ˆ ∂x

2.5.

La interpretaci´n de la Mec´nica cu´ntica o a a
Los trabajos de Schr¨dinger calaron muy hondo en los o f´ ısicos de la ´poca. En particular aparentemente se perd´ la e ıa cualidad discreta del modelo de Bohr al aparecer nuevamente las “ondas”, en este caso la onda Ψ. El mismo Schr¨dinger o intent´ darle un significado a la onda Ψ de su ecuaci´n usano o do ciertas analog´ con la mec´nica de fluidos –ecuaci´n de ıas a o continuidad para el “fluido electr´nico”–, pero no tuvo ´xito o e en su intento.

Fue Max Born, colega y amigo de Heisenberg –´l mismo e ayud´ a Heisenberg a construir la Mec´nica matricial–, qui´n o a e r´pidamente intuy´ una interpretaci´n plausible. Bas´ndose a o o a en los resultados experimentales sobre la dispersi´n de ono das planas –recordemos que el electr´n libre se consideraba o Max Born como tal en la mec´nica ondulatoria de Schr¨dinger– Born a o asegur´ que la funci´n de onda Ψ(x) daba la probabilidad o o de que una part´ ıcula fuese detectada en la posici´n x y que dicha probabilidad era proo porcional a |Ψ(x)|2 , es decir la Mec´nica ondulatoria, al igual que la matricial como se a ver´ m´s tarde, era una teor´ estad´ ıa a ıa ıstica incluso para describir una unica part´ ´ ıcula. Este trabajo publicado en julio de 1926, apenas un mes despu´s del art´ e ıculo de Schr¨dinger sobre la ecuaci´n no estacionaria abri´ una de las pol´micas m´s grandes de o o o e a la historia de la ciencia en los ultimos 100 a˜ os: La f´ ´ n ısica cu´ntica es, por principio, no a determinista. El mismo Born escribi´ al final de su art´ o ıculo: Aunque el problema del determinismo ha aparecido [. . . ] yo mismo me inclino a dejar a un lado el determinismo en el mundo de los atomos. Pero esto es ´ una cuesti´n filos´fica para la cual los argumentos f´sicos no son concluyentes. o o ı

´ ´ ´ 2.5. La interpretacion de la Mecanica cuantica

27

El problema filos´fico de Born se agudiz´ todav´ m´s cuando Dirac por un lado, o o ıa a y el mismo Schr¨dinger por el otro probaban que las dos formulaciones de la Mec´nica o a cu´ntica, la matricial y la ondulatoria, eran equivalentes: a A cada funci´n de la posici´n y el momento [en la mec´nica ondulatoria] se le o o a puede hacer corresponder una matriz de forma que en cada caso dichas matrices satisfacen las reglas formales de c´lculo de Born y Heisenberg [. . . ]. La a soluci´n del problema de contorno de la ecuaci´n diferencial [en la mec´nica o o a ondulatoria] es completamente equivalente a la soluci´n del problema algeo braico de Heisenberg escribi´ Schr¨dinger en 1926. o o El problema de la interpretaci´n de la Mec´nica Cu´ntica termin´ en una “pelea” o a a o abierta entre los que la defend´ y la consideraban una teor´ completa –Bohr, Heisenıan ıa berg, Born, Pauli, etc– y la que la consideraban incompleta –Schr¨dinger, Einstein, etc–. o Como ejemplo de esta pol´mica es representativa la carta que escribe Einstein a Born el e 7 de septiembre de 1944: Nuestras expectativas cient´ficas nos han conducido a cada uno a las ant´podas ı ı del otro. T´ crees en un Dios que juega a los dados, y yo en el valor unico u ´ de las leyes en un universo en el que cada cosa existe objetivamente [. . . ]. El gran ´xito de la teor´a de los quanta desde sus comienzos no puede hacerme e ı creer en el car´cter fundamental de ese juego de dados [. . . ]. Alg´n d´a se a u ı descubrir´ cual de estas dos actitudes instintivas es la buena. a Parte importante para entender esta pol´mica viene del hecho de ambas teor´ la e ıas, mec´nica matricial y la ondulatoria, describ´ rigurosamente muchos de los fen´menos a ıan o del micromundo, pero ambas ten´ un gran problema ¿C´mo definir si una part´ ıan o ıcula cu´ntica estaba en un estado determinado o en otro? a Un sencillo ejemplo de lo que ocurre es lo siguiente. Imaginemos que definimos los estados mediante la funci´n Ψ usando la ecuaci´n de Schr¨dinger y supongamos que o o o nuestro sistema puede encontrarse en dos estados A y B definidos por la funci´n Ψ1 y o Ψ2 , respectivamente, y que al primero le corresponde una energ´ E1 y al segundo E2 , ıa entonces siempre tenemos que un estado posible es el estado Ψ = a1 Ψ1 + a2 Ψ2 (pues la ecuaci´n de Schr¨dinger es lineal). Resulta entonces que si tenemos un instrumento que o o nos mide la energ´ de nuestro sistema ´ste nos dar´ unas veces E1 y otras E2 , y justo la ıa e a probabilidad de que nos d´ una u otra es proporcional a |a1 |2 y |a2 |2 , respectivamente. e Esta era la interpretaci´n probabil´ o ıstica que tan poco gustaba a Einstein. Todo ello se agudiz´ todav´ m´s cuando Heisenberg descubre su principio de incero ıa a tidumbre en 1926.

2.5.1.

El principio de incertidumbre de Heisenberg

Usando el formalismo ondulatorio, Heisenberg comprob´ que deb´ existir un prino ıa cipio de incertidumbre al medir ciertas cantidades f´ ısicas como la posici´n y el momento. o En 1926, Heisenberg consider´ una onda “gaussiana” normalizada del tipo o Ψ(x, 0) = Ψ
−1 −

e

(x−x0 )2 2b2

e

i

p0 x

,

Ψ

2

=
R

e−

(x−x0 )2 b2

dx,

28 es decir4

´ ´ ´ ´ Cap´ ıtulo 2. ¿Como se gesto la Mecanica cuantica?

Ψ(x, 0)Ψ(x, 0)dx =
R R

|Ψ(x, 0)|2 dx = 1.

Si una part´ ıcula ven´ descrita por dicha onda, entonces usando la idea de Born, el ıa valor medio para la posici´n de la part´ o ıcula era x =
R

Ψ(x, 0)xΨ(x, 0) =
R

x|Ψ(x, 0)|2 dx = x0 ,

∂ , y para la posici´n, usando que el operador correspondiente al momento era p = −i o ˆ ∂x tenemos Ψ(x, 0)ˆΨ(x, 0) = p0 , p p =
R

es decir que nuestra part´ ıcula tiene un momento p0 y est´ en la posici´n x0 . Si ahora a o intentamos determinar con que precisi´n estamos calculando los valores de estas dos o magnitudes tenemos que calcular las varianzas σx y σp , σx =
R

Ψ(x, 0)(x − x0 )2 Ψ(x, 0) =
2

b2 , 2

σp =
R

Ψ(x, 0)(ˆ − p0 )2 Ψ(x, 0) = p

2

2b2

,

de forma que , o, equivalentemente, △x△p = , 4 2 √ √ con △x = σx y △p = σp . Es decir, no podemos nunca medir con una precisi´n o tan grande como se quiera las dos magnitudes △x y △p. De hecho, resulta ser que σx σp =

o △x△p ≥ , es decir, Heisenberg descubri´ justo la onda que minimizaba el principio que 2 lleva su nombre. ¿De d´nde sale esta incertidumbre que no existe en la mec´nica cl´sica? o a a

2.6.

El experimento de difracci´n y el principio de o incertidumbre

Veamos un experimento imaginario. Supongamos que tenemos una pared con un agujero en el centro de di´metro d y lanzamos un electr´n cuya trayectoria es perpendicular a o a la pared y que pasa por dicho orificio. Supongamos que el electr´n se comporta como una onda monocrom´tica de con o a longitud de λ. Entonces obtenemos la bien conocida figura de difracci´n5 , con forma de o c´ ırculos conc´ntricos alrededor del punto O (ver figura 2.5). e Para describirla representamos el experimento en la figura 2.6. En este caso para describir la difracci´n se suele dividir la rendija en 2N partes iguales. Nos interesa coo nocer donde aparece el primer m´ ınimo por lo que escogerenos N = 1, i.e., dividiremos
operaci´n a denota el complejo conjugado de a. o a asumir que tanto la fuente de electrones como el plano donde aparece la figura de difracci´n o est´n lo suficientemente alejados del agujero y de esta forma usaremos el m´todo de Fraunhofer a e
5 Vamos 4 La

´ 2.6. El experimento de difraccion y el principio de incertidumbre

29

Figura 2.5: Esquema de difracci´n de rayos X y electrones (izquierda) y de luz monoo crom´tica (derecha) a

d

11 00 111111111111111111111111 000000000000000000000000 A 11 00 111111111111111111111111 000000000000000000000000 11 00 111111111111111111111111 000000000000000000000000 11 00 111111111111111111111111 000000000000000000000000 11 00 111111111111111111111111 000000000000000000000000 11 00 111111111111111111111111 000000000000000000000000 11 00 111111111111111111111111 000000000000000000000000 11 00 111111111111111111111111 000000000000000000000000 11 00 111111111111111111111111 000000000000000000000000 11 00 111111111111111111111111 000000000000000000000000 Θ 11 00 111111111111111111111111 000000000000000000000000 O 111111111111111111111111 000000000000000000000000 11 00 d 11 00 11 00 2 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00

111 000 111 000 111 000 111 000 111 000 111 000 111 000 1111 0000 1 0 Θ 1111 0000 1 d 0 1111 0000 1 0 1111 0000 1111 0000 1 2 0 1111 0000 1111 0000 1 0 d 1111 0000 1 0 2 sen Θ 111 000 111 000 111 000 111 000 111 000 111 000 111 000

Figura 2.6: Esquema de difracci´n (izquierda) y detalle del mismo (derecha) o

el agujero a la mitad y consideraremos los rayos que salen del centro y los extremos, respectivamente, tal y como se representan en la figura 2.6. De la figura 2.6 se deduce adem´s que en el punto A habr´ un m´ a a ınimo si la diferencia del camino recorrido por ambos rayos (el que sale del extremo superior y el del medio del agujero) es un n´ mero u entero m de veces la mitad de la longitud de onda de la misma d λ sen Θ = m 2 2 =⇒ d sen Θ = mλ,

y por tanto el primer m´ ınimo se obtendr´ cuando d sen Θ = λ. a Obviamente para nuestro electr´n △py es cero ya que ´l se mueve en el eje de o e las x. Ahora bien, cuando pasa por la ranura sabemos que se difracta, es decir que puede cambiar su trayectoria inicial ya que vemos su gr´fica de dispersi´n. Por tanto, a o la indeterminaci´n △y del electr´n en el momento de pasar por el orificio es del orden o o △y = d (pues sabemos que el electr´n ha pasado). Ahora bien, como tenemos una o gr´fica de dispersi´n, resulta que el electr´n tiene que haber ganado cierto impulso py a o o en la direcci´n perpendicular a su eje, eso nos da una cierta indeterminaci´n del orden o o

30

´ ´ ´ ´ Cap´ ıtulo 2. ¿Como se gesto la Mecanica cuantica?

△py . Para calcularla usamos la teor´ ondulatoria de de Broglie para el electr´n, △py = ıa o px sen θ, px = 2π /λ. Para calcular θ asumiremos que el electr´n va a parar dentro del c´ o ırculo que marca en primer m´ximo en la gr´fica de dispersi´n –los otros los despreciamos al ser ´stos a a o e bastante menores que el primero–. Ahora bien, como sabemos, el primer m´ ınimo tiene lugar cuando d sen θ = λ, de donde se deduce sen θ = λ/d, y por tanto △py △y = px λ d △y = 2π λ d = 2π ≥ > 0. λ d 2

El principio de incertidumbre como ya hemos dicho es un pilar de la Mec´nica a cu´ntica. Por ejemplo, es el el causante de que los electrones no caigan al n´ cleo pues en a u ese caso tanto p como x valdr´ cero. Otra consecuencia del principio de incertidumbre ıan es la desaparici´n del concepto cl´sico de trayectoria. o a

2.7.

Las matem´ticas de la Mec´nica Cu´ntica a a a

Las matem´ticas de la Mec´nica Cu´ntica est´n estrechamente ligadas al problema a a a a de la interpretaci´n. La principal raz´n se debe a que una misma teor´ no puede contener o o ıa dos tipos de postulados, principios o axiomas: los cl´sicos y los cu´nticos. Por tanto los a a principios de la f´ ısica cl´sica deben obtenerse de los axiomas de la Mec´nica cu´ntica al a a a pasar al mundo macrosc´pico donde la f´ o ısica cl´sica es aplicable. a La construcci´n matem´tica impuso el “orden” en el aparente caos de la interpretao a ci´n. Los principales axiomas o postulados de la Mec´nica Cu´ntica se pueden resumir o a a en los siguientes: I. Cualquier magnitud f´ ısica se describe a trav´s de un operador lineal “herm´ e ıtico” A definido sobre un espacio de Hilbert H, cuyos vectores Ψ definen los posibles estados del sistema f´ ısico, II. Los valores f (a′ ) que puede tomar una magnitud f´ ısica son aquellos que corresponden al espectro del operador lineal herm´ ıtico A que caracteriza dicha magnitud, III. El valor esperado de una magnitud f´ ısica x cualquiera de un sistema en el estado Ψ, es Ψ|xΨ , donde ·|· representa el producto escalar en el espacio de Hilbert. IV. La funci´n de onda Ψ del sistema est´ gobernada por la ecuaci´n de Schr¨dinger o a o o ∂Ψ , donde H es el operador de Hamilton del sistema. HΨ = i ∂t Un espacio de Hilbert –que denotaremos aqu´ por H– es un espacio lineal donde ı est´ definido un producto escalar a|b , cualesquiera sean los vectores a, b ∈ H y que es a x|x . Los completo6 respecto a la norma x inducida por el producto escalar7 x = operadores lineales definidos sobre H se pueden representar mediante matrices –finitas o infinitas– de forma que las matrices de Heisenberg, Born y Jordan se pueden identificar
6 Es 7 Para

decir que toda sucesi´n de Cauchy en H es convergente. o el que usaremos la notaci´n de Dirac: el producto escalar de x e y se denotar´ por x|y . o a

´ ´ ´ 2.7. Las matematicas de la Mecanica Cuantica
A Ψ1 B Ψ2 A B

31

A+B Ψ = a1 Ψ1 + a2 Ψ2

A+B Ψ = a1 Ψ1 + a2 Ψ2

A

Figura 2.7: Las mediciones selectivas.. Un sistema que originalmente puede estar en dos estados A y B (izquierda), se decanta por uno de ellos al realizar la medici´n (derecha). o El aparato de medici´n interfiere en el sistema acabando con la incertidumbre del mismo. o como ciertos operadores lineales sobre H. Adem´s, las funciones de onda de Schr¨dinger a o pertenecen al espacio de Hilbert L2 , el espacio de las funciones de cuadrado integrable. Un operador A se dice herm´ ıtico si a|Ab = Aa|b . Una propiedad fundamental de estos operadores herm´ ıticos era que para ellos exist´ una base ortonormal de autovectores y ıa adem´s los correspondientes autovalores eran reales. En especial esta ultima propiedad a ´ era decisiva a la hora de identificar los operadores con las magnitudes f´ ısicas medibles, que son cantidades reales. Es decir, la matem´tica de la Mec´nica Cu´ntica, es la matem´tica de los operadores a a a a en los espacios de Hilbert. Parte de esa teor´ era conocida a principios del siglo XX pero ıa gran parte de la misma se desarroll´ en Gotinga impulsada por David Hilbert pero o fundamentalmente desarrollada por John Von Neumann cuya obra quedar´ plasmada ıa en el magn´ ıfico libro Fundamentos Matem´ticos de la Mec´nica Cu´ntica publicado en a a a 1932.

2.7.1.

El gato de Schr¨dinger o

Von Neumann intent´ dar una construcci´n l´gica a la Mec´nica Cu´ntica introduo o o a a ciendo una teor´ de mediciones. Como ejemplo, supongamos que tenemos dos posibles ıa estados A y B de un sistema definidos por las funciones de onda Ψ1 y Ψ2 , respectivamente. ¿C´mo saber en cual de los estados est´ el sistema? Este dilema se resolv´ al hacer o a ıa el experimento. De la interacci´n del aparato de medici´n con el sistema se conclu´ en o o ıa que estado estaba (o m´s bien, se quedaba) el sistema (ver figura 2.7)8 . a Esta teor´ estaba plagada de efectos “curiosos”. Uno de los m´s famosos es el hecho ıa a de que al medir una cantidad f´ ısica f (a) de un sistema f´ ısico microsc´pico (cu´ntico) A o a debemos usar un instrumento que es, en s´ mismo otro sistema f´ ı ısico M y que obviamente es cl´sico, es decir, su comportamiento se puede explicar con las leyes de la f´ a ısica cl´sica. a Pero entonces puede ocurrir que la interacci´n entre A y M , necesaria para poder saber o el valor de f (a) cree una interferencia que se transfiera al mundo macrosc´pico. Es decir, o si tenemos un sistema en el estado Ψ = c1 Ψ 1 + c2 Ψ 2 ,
8 Este

efecto se denomina com´nmente el colapso de la funci´n de onda. u o

32

´ ´ ´ ´ Cap´ ıtulo 2. ¿Como se gesto la Mecanica cuantica?

entonces, al realizar la medici´n en vez de tener el sistema A + M en un estado Ψ ⊗ Φ o donde no se mezcle el estado Ψ de nuestro sistema cu´ntico con el estado Φ de nuestro a instrumento cl´sico, tendremos una superposici´n m´s complicada a o a ΨA+M = c1 Ψ1 ⊗ Φ1 + c2 Ψ2 ⊗ Φ2 , donde se han mezclado estados cu´nticos y cl´sicos. Esto no est´ de acuerdo con el a a a principio de correspondencia de Bohr, ya que ´ste insist´ que la f´ e ıa ısica cu´ntica deb´ a ıa estar aparte de la cl´sica. Obviamente podemos pensar que para resolverlo basta con usar a otro aparato M ′ que mida lo que mide M , pero entonces la interferencia pasa a M ′ y as´ sucesivamente terminamos en una cadena infinita. Von Neumann intent´ resolver esta ı o paradoja introduciendo en la cadena al observador humano que “no se deja interferir ” por el sistema cu´ntico. a

Figura 2.8: La paradoja del Gato de Schr¨dinger. Arriba se muestra lo que ocurre a o puerda cerrada: una dualidad gato vivo-gato muerto que s´lo se resuelva al abrir la caja o cuando el observador descubre o que el gato est´ vivo (1), o que est´ muerto (2). a a

Esto llev´ Schr¨dinger en 1935 a construir su famosa paradoja del gato (ver figuo o ra 2.8), conocida hoy d´ como el Gato de Schr¨dinger. En ella Schr¨dinger usa como ıa o o experimento la desintegraci´n radioactiva. Las posibilidades son dos: tiene lugar la deo sintegraci´n del ´tomo o no tiene lugar. El instrumento de medici´n es un detector que o a o activa un diab´lico martillo que, en caso de que ocurra la desintegraci´n, golpea un recio o piente de cristal con veneno y lo rompe. Y ahora Schr¨dinger mete su instrumento dentro o de una caja negra sin ventanas ni puertas, junto con . . . un pobre gato. La funci´n de o onda ΨA+M representar´ entonces el estado gato vivo—gato muerto. S´lo un observador a o “humano” sobre el cual no interferir´ el estado cu´ntico del ´tomo ser´ capaz de resolver a a a a esa paradoja de gato vivo-muerto pues al abrir la caja se encontrar´ con una apacible o a cruda realidad –en funci´n del amor que profese a los gatos el susodicho observador–. Heo mos traspasado una propiedad microsc´pica, cu´ntica, al mundo macrosc´pico, cl´sico, o a o a lo cual est´ en abierta contradicci´n con el principio de correspondencia del que ya hemos a o hablado. Aunque Bohr dio su versi´n a la interpretaci´n de Schr¨dinger no vamos a ino o o cluirla y vamos a considerar esta parte concluida. La resoluci´n formal de esta paradoja o

´ ´ ´ 2.7. Las matematicas de la Mecanica Cuantica

33

se traducir´ en un axioma concreto de la Mec´nica Cu´ntica como veremos m´s adelante. a a a a Lo que est´ claro de todo lo anterior es que la interpretaci´n9 de la Mec´nica Cu´ntica a o a a es algo para meditar y pensar: “es una cuesti´n filos´fica para la cual los argumentos o o f´sicos no son concluyentes”, como dijo Born en su ya mencionado art´ ı ıculo. Sobre la bibliograf´ ıa M´s detalles hist´ricos los puedes encontrar en [2, 5, 9, 12, 15, 20]. a o Como introducci´n a nivel elemental de f´ o ısica cu´ntica se pueden consultar [7, 16, 21]. a Textos m´s avanzados lo constituyen [3, 6, 12, 14, 17, 19]. Una magn´ a ıfica introducci´n o de lo que pretende la f´ ısica y de su interacci´n con las matem´ticas se tiene en [8]. o a

9 Hoy d´ no hay unanimidad en como interpretar la teor´ cu´ntica. Un magn´ ıa ıa a ıfico libro sobre el tema es Lo decible y lo indecible en mec´nica cu´ntica de John S. Bell (Alianza Universidad, 1990). a a

34

´ ´ ´ ´ Cap´ ıtulo 2. ¿Como se gesto la Mecanica cuantica?

Cap´ ıtulo 3

Mec´nica Cu´ntica I: a a “Movimiento” de una part´ ıcula material
Vamos a comenzar describiendo el sistema cu´ntico m´s sencillo: una unica part´ a a ´ ıcula sometida a un potencial externo V (r). Comenzaremos describiendo los principales postulados. Una magn´ ıfica introducci´n se puede consultar en [3]. o

3.1.

Los postulados de la Mec´nica Cu´ntica a a

Postulado 3.1.1 El estado de una part´cula de masa m en el instante de tiempo t viene ı biun´vocamente determinado por la funci´n de onda Ψ(r, t). La densidad de probabilidad ı o de encontrar la part´cula en el instante t en la regi´n del espacio de volumen d3 r alrededor ı o del punto r es d3 P (r) = |Ψ(r, t)|2 d3 r. Proceden algunos comentarios. 1. Para que el postulado 3.1.1 tenga sentido debe ocurrir que para cada t fijo |Ψ(r, t)|2 d3 r = 1,

donde Ω es aquella regi´n accesible a la part´ o ıcula, es decir, la regi´n donde con certeza o absoluta puede estar la part´ ıcula (en general dicha regi´n ser´ R3 ). Lo anterior indica o a que, para cada t, la funci´n Ψ es de cuadrado integrable y esta normalizada a la unidad. o Al espacio vectorial de las funciones de cuadrado integrable lo denotaremos por L2 (Ω) o simplemente L2 . M´s a´ n, como veremos m´s adelante, Ψ ha de satisfacer una ecuaci´n din´mica, a u a o a as´ que es natural que Ψ(r, t) sea una funci´n continua y diferenciable (al menos). Luego, ı o Ψ ha de ser tal que Ψ(r, t) tiende a cero si r → ∞ en caso contrario Ψ no ser´ de ıa cuadrado integrable en R3 . Obviamente si Ω es finito, del postulado 3.1.1 se sigue que 35

36

´ ´ Cap´ ıtulo 3. Mecanica Cuantica I: part´ ıcula material

Ψ(r, t) = 0 en la frontera y fuera de Ω, ya que en caso contrario existir´ una probabilidad ıa finita de que la part´ ıcula estuviese en el exterior de Ω lo cual ser´ una contradicci´n. ıa o 2. Obviamente el estado de una part´ ıcula en cada instante t queda determinado a excepci´n de una fase eiα , α ∈ R. Es decir, las funciones de onda Ψ(r, t) y Ψ(r, t)eiα o describen el mismo estado del sistema. De lo anterior se sigue adem´s que la fase α no a es un observable. Una cuesti´n f´ o ısica de vital importante que surge inmediatamente es: ¿C´mo vamos o a medir nuestros observables? Supongamos que vamos a medir la posici´n r de la part´ o ıcula. Para ello asumimos que 1. La medici´n se hace con un aparato cl´sico, i.e., el aparato no precisa una descripo a ci´n cu´ntica (por ejemplo una regla o un metro). o a 2. La precisi´n del aparato es, en principio, tan alta como se quiera. o 3. El resultado de la medici´n es: En el instante t la part´cula estaba en la posici´n o ı o r ± δr donde δr es el error del aparato. ¿C´mo entender entonces la descripci´n probabil´ o o ıstica del postulado 3.1.1? Para ello imaginemos que tenemos N cajas id´nticas y N part´ e ıculas id´nticas de fore ma que en cada caja hay una unica part´ ´ ıcula. Asumamos adem´s que todas las part´ a ıculas est´n en el mismo estado, i.e., Ψ(r, t) es la misma para cada una de ellas en el instante a de la medici´n. Si medimos las posiciones de cada part´ o ıcula independientemente obtendremos los valores r1 , r2 , . . . , rN , no necesariamente iguales, que estar´n distribuidos de a acuerdo a la ley de probabilidad |Ψ(r, t)|2 d3 r. El valor esperado de r es, por tanto r =

r|Ψ(r, t)|2 d3 r,

xi =

xi |Ψ(r, t)|2 d3 r,

xi = x, y, z para i = 1, 2, 3, respectivamente. Su dispersi´n es o △xi = x2 − xi i
2

=

(xi − xi )2 |Ψ(r, t)|2 d3 r.

La dispersi´n △x tiene un significado muy preciso: si △x es peque˜ o, entonces |Ψ(r, t)|2 o n est´ muy concentrada alrededor de su valor medio x , lo que indica que la part´ a ıcula se encuentra con probabilidad alta muy cerca de la posici´n x . Por el contrario, si △x, o entonces |Ψ(r, t)|2 est´ muy dispersa y la part´ a ıcula tiene una probabilidad baja de estar cerca de x .1 Para explicar los fen´menos de interferencia y difracci´n de electrones que mencioo o namos en el apartado anterior se ha de introducir un segundo postulado fundamental.
1 Un ejemplo muy ilustrativo es el siguiente. Supongamos que Ψ(r, t) = χ [a,b] (x)/(b − a), donde χ[a,b] (x) es la funci´n caracter´ o ıstica del intervalo [a, b], i.e., vale 1 si x ∈ [a, b] y 0 en otro caso. Entonces, x = a+b y △x = (b − a)2 /12. Como vemos si a y b est´n cercanos entonces la dispersi´n es peque˜a y a o n 2 tenemos que la part´ ıcula est´ muy cerca de la posici´n media. Por el contrario si a y b difieren mucho la a o part´ ıcula est´ equiprobablemente dispersa en el intervalo [a, b] (muy grande). Este ejemplo se lo debo a a de Francisco J. (Pacho) Ruiz Blasco de la Universidad de Zaragoza.

´ ´ 3.1. Los postulados de la Mecanica Cuantica

37

Postulado 3.1.2 Para cada t el espacio de las funciones de estado es un subespacio vectorial del espacio L2 (Ω). Es decir, para cada t, si Ψ1 y Ψ2 son funciones de onda, entonces ∀α1 , α2 ∈ C, Ψ = α1 Ψ1 + α2 Ψ2 , es una posible funci´n de onda, es decir, Ψ puede representar un posible estado del siso tema.2 Lo anterior indica que, para cada t, cualquier combinaci´n lineal de funciones es una o (posible) funci´n de onda. Ello implica adem´s que la ecuaci´n de evoluci´n que gobierne o a o o o determine las funciones de onda ha de ser lineal. Postulado 3.1.3 (Ecuaci´n din´mica) La funci´n de onda viene determinada por la o a o ecuaci´n de Schr¨dinger o o i
2 ∂Ψ(r, t) =− ∆Ψ(r, t) + V (r, t)Ψ(r, t), ∂t 2m

(3.1.1)

donde ∆ es el laplaciano3 en R3 , y V es el potencial al que esta sometida la part´cula. ı La ecuaci´n anterior se suele escribir de la forma o i ∂Ψ(r, t) = HΨ(r, t), ∂t (3.1.2)

donde H es el operador correspondiente al hamiltoniano del sistema. En nuestro caso est´ claro que es a
2

∆ + V (r, t)I. 2m Antes de continuar debemos destacar que aqu´ s´lo trataremos el caso cuando el potencial ı o V es independiente del tiempo. H := − Nuevamente proceden una serie de comentarios. En primer lugar si V := 0 (part´ ıcula libre) una soluci´n de la ecuaci´n viene dada o o mediante una onda viajera Ψ(r, t) = Ψ0 ei(kr−ωt) , donde k es el vector de onda. Sustituyendo dicha onda en (3.1.1) y usando que la energ´ ıa de una onda es, seg´ n ya vimos, E = ω, obtenemos u ω= k 2m
2 2

=⇒

E=

k , 2m

2 2

de donde, al no haber (energ´ potencial E = T = p2 /2m, por tanto se sigue que p = k, ıa) que es precisamente la f´rmula de De Broglie para expresar la dualidad onda-part´ o ıcula.
2 N´tese que si α = α = 0, se tiene Ψ ≡ 0, es decir la part´ o ıcula no est´ en ning´n sitio. Aunque a u 1 2 formalmente esta es una posibilidad en la pr´ctica se asume que Ψ = 0 en todo Ω (Ω es la regi´n donde a o podr´ estar la part´ ıa ıcula, luego en alg´n punto de Ω la funci´n Ψ ha de ser distinta de cero). Si Ψ1 y Ψ2 u o est´n normalizadas a la unidad, entonces para que Ψ lo est´ basta que |α1 |2 + |α2 |2 = 1. a e 2 ∂2 ∂2 3 En coordenadas cartesianas es ∆ = ∂ + + . ∂x2 ∂y 2 ∂z 2

38

´ ´ Cap´ ıtulo 3. Mecanica Cuantica I: part´ ıcula material

Es decir, la ecuaci´n de Schr¨dinger tiene como soluci´n posible la onda de materia de o o o De Broglie. Un simple vistazo a la expresi´n para la onda de De Broglie nos revela un problema: o esta funci´n no es de cuadrado integrable y por tanto no puede describir de acuerdo o con el postulado 3.1.1 ning´ n estado real de una part´ u ıcula. Para resolver esta aparente contradicci´n se introducen los paquetes de ondas. o Formalmente un paquete de ondas es un conjunto de ondas planas monocrom´ticas a superpuestas. Usando que p = k y E = ω tenemos, para cada onda la ecuaci´n o Ψp (r, t) = Φ(p)e luego la superposici´n de todas ser´ o a Ψ(r, t) =
R3
i i

(pr−Et)

,

Φ(p)e

i

(pr−Et)

d3 p = (2π )3/2

Ψ(p, t)e
R3

i

pr

d3 p , (2π )3/2

(3.1.3)

donde Ψ(p, t) = Φ(p)e− Et . Es decir, Ψ es la transformada de Fourier de Ψ. Adem´s, a para que lo anterior tenga sentido Φ ha de ser tal que Ψ sea de cuadrado integrable. Lo anterior implica que ambas Ψ(r, t) y Ψ(p, t) son funciones de cuadrado integrable para todo t. La relaci´n de Ψ(r, t) y Ψ(p, t) como transformada de Fourier una de la otra tiene o una implicaci´n interesante: o Ψ(p, t) =
R3

Ψ(r, t)e−

i

pr

d3 r , (2π )3/2

y
R3

|Ψ(r, t)|2 d3 r =

R3

|Ψ(p, t)|2 d3 p.

Es decir, en principio tanto Ψ(r, t) como Ψ(p, t) valdr´ para describir el estado de ıan nuestro sistema. Adem´s, de la teor´ de las transformadas de Fourier tenemos que, si definimos la a ıa media y varianza de las componentes del vector de impulso (pi = px , py , pz para i = 1, 2, 3, respectivamente) pi =
R3

pi |Ψ(p, t)|2 d3 p,

△pi =

p2 − pi , i

2

(3.1.4)

entonces △xi △pi ≥ /2, y la igualdad s´lo tiene lugar cuando Ψ(r, t) es proporcional a o una gaussiana en r, es decir el principio de incertidumbre de Heisenberg. Para nuestro caso de la part´ ıcula libre ello implica que si Ψ(r, t) est´ muy dispersa a en el espacio, entonces el valor del impulso p est´ muy concentrado y si Ψ(r, t) est´ muy a a dispersa entonces p est´ muy disperso. a En la figura 3.1 se muestra lo que ocurre para el caso unidimensional cuando tomamos en (3.1.3) (p−p0 )2 1 − Φ(p) = √ e 2( σ)2 1 σπ4

´ ´ 3.1. Los postulados de la Mecanica Cuantica
|Ψ(x, t)|
0.5 0.4 0.3 0.2 0.1 -20 -10 10 20

39
e |Ψ(p, t)|

0.5

0.4 0.3 0.2 0.1

x

-2

-1

1

2

3

4

p

|Ψ(x, t)|
0.05 0.04

2 1.5

e |Ψ(p, t)|

0.03 0.02 0.01 -20 -10 10 20 1 0.5

x

-2

-1

1

2

3

4

p

Figura 3.1: Distribuci´n de Ψ(x, t) y Ψ(p, t) ( σ = 1) o

para los valores σ = p0 /2 (p disperso, figura superior) y σ = p0 /10 (p concentrado, figura inferior). Antes de continuar debemos destacar la media y la varianza definidas en (3.1.4) no tienen por que corresponder con la media y varianza del impulso real p de nuestra part´ ıcula. Para poder hablar de la cantidad observable p necesitaremos introducir otro postulado, pero antes de ello vamos a probar que los postulados hasta ahora introducidos son consistentes.

Test de consistencia Un test de consistencia de la teor´ hasta ahora descrita consiste en probar que la ıa norma de Ψ(r, t) es independiente del tiempo (en otro caso no podr´ definir una densidad ıa de probabilidad). Para ello escribimos la ecuaci´n de Schr¨dinger (3.1.1) para Ψ o o i
2 ∂Ψ(r, t) =− ∆Ψ(r, t) + V (r, t)Ψ(r, t) ∂t 2m

y su complejo conjugado4 . Ψ (se entiende que V es un potencial real) −i
4 Como

2 ∂Ψ(r, t) =− ∆Ψ(r, t) + V (r, t)Ψ(r, t), ∂t 2m

antes denotaremos por z al complejo conjugado del n´mero complejo z u

40

´ ´ Cap´ ıtulo 3. Mecanica Cuantica I: part´ ıcula material

multiplicamos la primera por Ψ, la segunda por Ψ, las restamos y tomamos la integral en toda la regi´n Ω (ver postulado 3.1.1) o i ∂ ∂t |Ψ(r, t)|2 d3 r = =i
Ω 2

Ψ(r, t)

∂Ψ(r, t) ∂Ψ(r, t) + Ψ(r, t) ∂t ∂t

d3 r

=−

2m

Ψ(r, t)∆Ψ(r, t) − Ψ(r, t)∆Ψ(r, t) d3 r.

Si ahora en la ultima de las integrales usamos la f´rmula de Green obtenemos ´ o
2

− =−

2m
2

Ψ(r, t)∆Ψ(r, t) − Ψ(r, t)∆Ψ(r, t) d3 r Ψ(r, t) ∂Ψ(r, t) ∂Ψ(r, t) − Ψ(r, t) ∂n ∂n dS,

2m

∂Ω

donde dS es el elemento de ´rea de la superficie y ∂f (r) denota la derivada direccional a ∂n de f en la direcci´n del vector normal al elemento de superficie dS.5 Si ahora hacemos o r → ∞ la ultima integral se anula pues Ψ(r, t) (y por consiguiente Ψ(r, t)) se anulan ´ cuando r → ∞ (ver comentario 1 del postulado 3.1.1). Luego ∂ ∂t

|Ψ(r, t)|2 d3 r = 0.

Esto tiene una implicaci´n f´ o ısica inmediata: Dado un estado inicial Ψ(r, t0 ) ∈ L2 (Ω), este evoluciona seg´ n la ecuaci´n de Schr¨dinger, i.e., en cada momento de tiempo viene u o o descrito por la funci´n Ψ(r, t) soluci´n de (3.1.1) y adem´s, o o a |Ψ(r, t)|2 d3 r = |Ψ(r, t0 )|2 d3 r = 1,

es decir, Ψ(r, t) es normalizada a la unidad. Luego la ecuaci´n de Schr¨dinger es consiso o tente con los postulados 3.1.1 y 3.1.2. Vamos ahora a intentar convencernos de que para los momentos p se tienen las f´rmulas (3.1.4). Para ello, como ya comentamos, necesitamos varios postulados que o complementen a los anteriores. Postulado 3.1.4 A cualquier cantidad f´sica medible A le asociaremos un operador ı herm´tico A que act´a sobre el espacio de las funciones de cuadrado integrable L2 (Ω) ı u a las que pertenecen las funciones de estado Ψ(r, t). i.e., A : L2 (Ω) → L2 (Ω). Adem´s, a dado un estado definido por una funci´n de onda Ψ(r, t) que define cierto estado del o sistema, el valor medio de las medidas de A viene dado por6 A (t) =

5 En 6 Aunque

Ψ(r, t) AΨ(r, t) d3 r

una dimensi´n vale simplemente la integraci´n por partes. o o el valor A (t) depende de la funci´n de onda Ψ, no lo vamos a reflejar en la notaci´n para o o hacer esta lo menos engorrosa posible.

´ ´ 3.1. Los postulados de la Mecanica Cuantica Un operador A : L2 (Ω) → L2 (Ω) es herm´ ıtico7 si Ψ1 (r, t) AΨ2 (r, t) d3 r =
Ω Ω

41

AΨ1 (r, t) Ψ2 (r, t)d3 r.

N´tese que si A es herm´ o ıtico entonces Ψ(r, t) AΨ(r, t) d3 r =
Ω Ω

AΨ(r, t) Ψ(r, t)d3 r AΨ(r, t) Ψ(r, t)d3 r,

= i.e., A (t) ∈ R.

Vamos a definir el operador r por ˆ ˆ r := r I, (3.1.5)

donde I es el operador identidad. Entonces r (t) =

Ψ(r, t)r Ψ(r, t)d3 r =

r|Ψ(r, t)|2 d3 r,

que est´ en concordancia con el postulado 3.1.1. a ˆ Definiremos el operador impulso p por la expresi´n o ˆ p := −i ∇, donde ∇ denota al operador gradiente8 de R3 . Otros operadores importantes son 1. El operador energ´ cin´tica T := − 2m ∆, donde ∆ es, como antes, el laplaciano en ıa e R3 . 2. El operador energ´ potencial V (r) := V (r)I. ıa 3. El operador energ´ total E := T + V (r). Este adem´s constituye el operador de ıa a Hamilton o hamiltoniano del sistema. 4. El operador momento angular L = r × p := −i rot, donde rot denota el vector rotor en R3 . Postulado 3.1.5 El resultado de cualquier medici´n de una cantidad f´sica medible A o ı debe ser un autovalor del operador asociado A y el estado correspondiente a dicha medici´n estar´ definido por su correspondiente autofunci´n. o a o
7 Sobre estos operadores hablaremos con m´s detalle en el pr´ximo apartado dedicado a la Mec´nica a o a cu´ntica en espacios de Hilbert. a 8 En coordenadas cartesianas es el operador ∇f (r) = ∂f (r) i + ∂f (r) j + ∂f (r) k. ∂x ∂y ∂z
2

(3.1.6)

Es f´cil comprobar que ambos operadores son herm´ a ıticos.

42

´ ´ Cap´ ıtulo 3. Mecanica Cuantica I: part´ ıcula material Es decir, tenemos la ecuaci´n o AΨ(r, t) = aΨ(r, t).

Entonces, por el postulado 3.1.4, A =

Ψ(r, t) AΨ(r, t) d3 r = a

|Ψ(r, t)|2 d3 r = a,

que, como ya hemos visto, es real9 Adem´s, a A2 =
Ω 2

Ψ(r, t) A(AΨ(r, t)) d3 r = a2

=⇒

A2 − A = 0, es decir, el resultado de la medici´n, en caso de que el o △A2 := sistema se encuentre en el estado Ψa (r, t) correspondiente al autovalor a, es exacto. Este resultado lo discutiremos con m´s detalle en el marco de los espacios de Hilbert. a

3.2.

El principio de incertidumbre

ˆ ˆ N´tese que los operadores r y p cumplen con las siguientes relaciones: o [xi , xj ] = 0 = [pi , pj ], [xi , pj ] = i δi,j I,

Lo curioso es que a partir de esta relaci´n de conmutaci´n se puede probar que si o o definimos las varianzas de xi y pi mediante las expresiones (acordes con los postulados descritos), i.e., △xi = entonces , 2 es decir, obtenemos el principio de incertidumbre de Heisenberg que ya vimos antes. Demostremos la f´rmula anterior. Por simplicidad escogeremos el caso unidimensioo nal (o equivalentemente nos restringiremos a probar el principio para las componentes en el eje x, por ejemplo). Definamos los operadores △x := x − x I y △p := p − p I. Dichos operadores cumplen con la propiedad [△x, △p] = [x, p] = i I.
9 Esta

donde [A, B] es el conmutador de los operadores A y B definido por [A, B] = AB − BA.

(xi − xi I)2 ,

△pi =

(pi − pi I)2 ,

△xi △pi ≥

b propiedad es en realidad una consecuencia de la hermiticidad de A, como veremos m´s adelante. a

3.2. El principio de incertidumbre Obviamente △x = Cauchy-Schwarz (△x)2 y △p =

43 (△p)2 , ahora bien, por la desigualdad de

|△xΨ(x)|2 dx

|△pΨ(x)|2 dx ≥

△xΨ(x) △pΨ(x)dx

y

△xΨ(x) △pΨ(x)dx ≥ ℑ

△xΨ(x) △pΨ(x)dx

= Ixp ,

i.e., △xi △pi ≥ Ixp . Pero Ixp = 1 2i 1 = 2i 1 = 2i 1 = 2i (△xΨ(x))(△pΨ(x))dx − (△xΨ(x))(△pΨ(x))dx − (Ψ(x))(△x△pΨ(x))dx − (△xΨ(x))(△pΨ(x))dx

(△xΨ(x))(△pΨ(x))dx

(Ψ(x))(△p△xΨ(x))dx

(Ψ(x))([△x, △p]Ψ(x))dx =

1 2i

(Ψ(x))(i IΨ(x))dx =

2

.

Luego △x △p ≥ que es justo lo que quer´ ıamos probar. 2 ,

3.2.1.

Los estados estacionarios de la ecuaci´n de Schr¨dinger o o

Supongamos que V no depende del tiempo. Entonces si hacemos el cambio Ψ(r, t) = Ψα (r)e− lo sustituimos en (3.1.2) obtenemos la ecuaci´n o HΨα (r) = Eα Ψα (r). (3.2.2)
i

Eα t

(3.2.1)

Es decir, Ψα son las autofunciones de H correspondientes a los autovalores Eα , que por el postulado 3.1.5 corresponden a los posibles valores de energ´ del sistema. ıa N´tese que los estados definidos por (3.2.1) son estados con una energ´ constante o ıa (conservada) en el tiempo, adem´s, la funci´n Ψ(r, t) es peri´dica en el tiempo con a o o una frecuencia ωα = Eα / . Los estados con estas caracter´ ısticas se denominan estados estacionarios. Los estados estacionarios cumplen dos propiedades muy importantes (que los hacen de especial relevancia): 1. La densidad de probabilidad es independiente del tiempo: |Ψ(r, t)|2 = |Ψα (r)|2 .

44

´ ´ Cap´ ıtulo 3. Mecanica Cuantica I: part´ ıcula material 2. Si cierto observable A no depende el tiempo, entonces su media A =

Ψ(r, t) AΨ(r, t) d3 r =

Ψα (r) AΨα (r) d3 r,

tampoco depende del tiempo. Es decir, los estados estacionarios tienen la energ´ prefijada y adem´s no evolucionan ıa a en el tiempo. Lo anterior es muy util para resolver la ecuaci´n de Schr¨dinger general. ´ o o Supongamos que Ψ(r, t = 0) =
α

cα Ψα (r),

(3.2.3)

entonces, la funci´n de onda (estado) se escribe como o Ψ(r, t) =
α

cα e −

i

Eα t

Ψα (r).

La pregunta de cu´ndo el desarrollo (3.2.3) tiene lugar y como calcular los coeficientes a cα lo vamos a dejar para m´s adelante. En realidad lo que tiene que ocurrir es que las a autofunciones del hamiltoniano H constituyan un conjunto completo (y a ser posible ortonormal) de L2 (Ω).

3.3.

Ejemplos

Vamos a estudiar dos ejemplos representativos unidimensionales.

3.3.1.

Una part´ ıcula en un pozo de potencial

Sea una part´ ıcula que se encuentra en un pozo potencial como el que se muestra en la figura 3.2.
V (x)

U0

0

L

x

Figura 3.2: Pozo potencial.

3.3. Ejemplos La soluci´n de la ecuaci´n de Schr¨dinger estacionaria o o o   U0 , x < 0, 2 ∂2 Ψ(x) + V (x)Ψ(x) = EΨ(x), V (x) = 0, 0 < x < L, −  2m ∂x2 U0 , x > L,

45

donde k =

para E < U0 la buscamos de la forma   Ψ1 (x) = A1 ekx + A2 e−kx , x < 0, Ψ2 (x) = B1 eiqx + B2 e−iqx , 0 < x < L, Ψ(x) =  Ψ3 (x) = C1 e−kx + C2 ekx , x > L,
1

Como Ψ ha de ser de cuadrado integrable, entonces A2 = C2 = 0. Adem´s, Ψ y Ψ′ han de ser continuas en R as´ que tenemos las siguientes condiciones a ı Ψ1 (0) = Ψ2 (0), Ψ′ (0) = Ψ′ (0), 1 2 Ψ2 (L) = Ψ3 (L), Ψ′ (L) = Ψ′ (L), 2 3

2m(U0 − E), q =

1

√ 2mE.

que nos conducen al sistema           

A1 = B1 + B2 , B1 eiqL + B2 e−iqL = C1 e−kL , kA1 = iq(B1 − B2 ),

iq(B1 eiqL − B2 e−iqL ) = −kC1 e−kL .

De las dos primeras ecuaciones eliminamos A1 y de las dos segundas C1 , as´ ı (k − iq)B1 + (k + iq)B2 = 0, (k + iq)eiqL B1 + (k − iq)e−iqL B2 = 0.

Para que este sistema homog´neo tenga soluci´n su determinante ha de anularse e o det Como k − iq (k + iq)eiqL k + iq (k − iq)e−iqL k − iq = 1, k + iq cos φ = =0 =⇒ e2iqL = k − iq k + iq
2

.

(3.3.1)

eiφ =

k − iq k + iq

=⇒ 2kq . k2 + q2

k2 − q2 , k2 + q2

sen φ = −

Combinando lo anterior con (3.3.1) se tiene φ = qL, de donde se sigue que los valores de energ´ E permitidos corresponden a la soluci´n de la ecuaci´n trascendental ıa o o cos qL = o, equivalentemente, tan qL = − 2kq . k2 − q2 (3.3.2) k2 − q2 k2 + q2 o sen qL = − 2kq , k2 + q2

46 Sea x = E/U0 y α =

´ ´ Cap´ ıtulo 3. Mecanica Cuantica I: part´ ıcula material √ 2mU0 L/ , entonces la ecuaci´n anterior se escribe como o tan αx = −2 x(1 − x) . 1 − 2x (3.3.3)

Es f´cil comprobar que para todo α esta ecuaci´n tiene al menos una ra´ real en (0, 1) a o ız por lo que nuestro sistema tiene al menos un estado estacionario. A medida que α es m´s a grande el n´ mero de estados aumenta (v´ase la figura 3.3). u e
6 6 3 0,2 −3 −6 −9 0,4 0,6 0,8 1 −3 −6 −9 6 6 3 0,2 0,4 0,6 0,8 1

Figura 3.3: Soluciones de la ecuaci´n (3.3.3) para α = 1 (derecha) y α = 10 (izquierda). o N´tese que si tomamos el l´ o ımite U0 → ∞ en (3.3.2) obtenemos los valores de energ´ ıa E= π n2 , 2mL2
2 2

(3.3.4)

que coinciden con los valores de energ´ para un pozo infinito (ver problema 3.3.1). ıa

3.3.2.

El efecto t´nel u

Consideremos ahora el movimiento de una part´ ıcula en un potencial del tipo de la figura 3.4
V (x)

U0

0

L

x

Figura 3.4: Pozo potencial.

3.3. Ejemplos La soluci´n de la ecuaci´n de Schr¨dinger estacionaria o o o  x < 0,  0, 2 ∂2 U0 , 0 < x < L, Ψ(x) + V (x)Ψ(x) = EΨ(x), V (x) = −  2m ∂x2 0, x > L.

47

(3.3.5)

donde q =

Vamos a comenzar considerando el caso E > U0 . La soluci´n tiene la forma o   Ψ1 (x) = A1 eikx + A2 e−ikx , x < 0, Ψ2 (x) = B1 eiqx + B2 e−iqx , 0 < x < L, Ψ(x) =  Ψ3 (x) = C1 eikx + C2 e−ikx , x > L,
1

2m(E − U0 ) y k =

1

2mE.

Los valores R(E) = |A|2 y T (E) = |C|2 definen los coeficientes de reflexi´n y transporte o (o paso) de la onda. Usando la continuidad de Ψ y Ψ′ obtenemos las siguientes condiciones Ψ1 (0) = Ψ2 (0), Ψ′ (0) = Ψ′ (0), 1 2 Ψ2 (L) = Ψ3 (L), Ψ′ (L) = Ψ′ (L), 3 2

Ante todo notemos que esta soluci´n es de tipo onda viajera, similar a la de una o part´ ıcula libre, por lo que no es de cuadrado integrable y por tanto no puede describir ning´ n estado real (v´ase la discusi´n del postulado 3.1.3) por lo que habr´ que definir los u e o ıa correspondientes paquetes de ondas. No obstante podemos considerar nuestra part´ ıcula como una onda descrita por la ecuaci´n (3.3.5) y determinar su comportamiento en o funci´n de las amplitudes A1 , . . . , C2 de las mismas. Ante todo notemos que si Ψ es o una soluci´n correspondiente a la energ´ E, Ψ tambi´n lo es. Dado un valor de energ´ o ıa e ıa podemos considerar dos tipos de soluciones: una Ψ+ cuando C2 = 0 (la onda incidente va de izquierda a derecha) y la otra Ψ− cuando A1 = 0 (la onda incidente va de derecha a izquierda). La soluci´n general ser´ una combinaci´n lineal de ambas. As´ pues nos o a o ı centraremos en la soluci´n10 o  x < 0,  Ψ1 (x) = eikx + Ae−ikx , Ψ2 (x) = B1 eiqx + B2 e−iqx , 0 < x < L, Ψ+ (x) =  Ψ3 (x) = Ceikx , x > L.

que nos conducen al sistema           

1 + A = B1 + B2 , B1 e
iqL

+ B2 e−iqL = C1 eikL ,

k(1 − A) = q(B1 − B2 ),

(3.3.6)

q(B1 eiqL − B2 e−iqL ) = −kC1 eikL .

Multiplicando por k la tercera y sum´ndole y rest´ndole la cuarta se obtienen, respectia a vamente, las ecuaciones B1 =
10 Por

(k + q)eiL(k−q) C, 2q

B2 =

(q − k)eiL(k+q) C. 2q

la linealidad podemos tomar sin p´rdida de generalidad A1 = 1. e

48

´ ´ Cap´ ıtulo 3. Mecanica Cuantica I: part´ ıcula material

Multiplicando por k la primera ecuaci´n de (3.3.6) y sum´ndole y rest´ndole la segunda o a a obtenemos (k + q)B1 + (k − q)B2 = 2k, (k − q)B1 + (k + q)B2 = 2kA. Si sustituimos en la primera de estas ecuaciones los valores de B1 y B2 anteriores obtenemos para C el valor C= 4kqe−ikL 4kqe−ikL = 2 . (k + q)2 e−iqL − (k − q)2 eiqL (k + q 2 ) sen(qL) + 2kqi cos(qL) A= De lo anterior se deduce que T (E) = (k 2 + q 2 )2 sen2 (qL) 4k 2 q 2 = + 4k 2 q 2 cos2 (qL) 1 1+ (k − q 2 ) sen(qL) 2kq
2 2,

(3.3.7)

Resolviendo respecto a A obtenemos (k 2

(k 2 − q 2 ) sen(qL) . + + 2kqi cos(qL) q 2 ) sen(qL)

(3.3.8)

De la expresi´n anterior se deduce que T (E) ≥ 0. Adem´s, si sen(qL) = 0, entonces o a T (E) = 1 y R(E) = 0, es decir, la part´ ıcula pasa como si no existiese la barrera: la barrera es transparente. Esto ocurre para los valores de qL = nπ, por tanto como q = 1 2m(E − U0 ) =⇒ 2 2 2 π n . E = U0 + 2mL2 Supongamos ahora que E < U0 . Para obtener el resultado basta hacer el cambio q → iκ. As´ obtenemos ı, 1 T (E) = 2, 2 2 (k + κ ) senh(κL) 1+ 2kκ N´tese que T (E) ≥ 0, es decir, ¡la part´ o ıcula siempre traspasa la barrera!

y R(E) = 1 − T (E).

Este efecto, imposible en la mec´nica cl´sica, se conoce como efecto t´ nel. Su gran a a u importancia qued´ reflejada en el hecho de que en 1973 L. Esaki, I. Giaever y B.D. o Josephson recibieron el premio nobel de f´ ısica por sus descubrimientos relacionados con este efecto y m´s trade en 1986 G. Binnig y H. Rohrer por su dise˜ o de un microscopio a n electr´nico basado en el efecto t´ nel. o u Para terminar este apartado notemos que, para E < U0 , en el l´ ımite κL ≫ 1 T (E) ∼ 16k 2 q 2 −κL e , (k 2 + q 2 )2

es decir, el coeficiente de transporte decae exponencialmente a cero con L. Este l´ ımite corresponde al caso 2m(U0 − E)/ ≫ 1, i.e., 2. L2 ≫ 1. m ≫
2 2

/(2(U0 − E)L2 ), masas muy grandes (l´ ımite de la mec´nica cl´sica), a a /(2(U0 − E)m), barrera muy ancha,
2

3. U0 − E ≫

/(2mL2 ), barrera muy alta.

3.3. Ejemplos

49

3.3.3.

Problemas
de la ecuaci´n de Schr¨dinger estacionaria o o x < 0, 0 < x < L, x > L,

Problema 3.3.1 Encuentra los autoestados para un pozo potencial infinito   ∞, 0, V (x) =  ∞,

y compara el resultado con los valores obtenidos en (3.3.4). Problema 3.3.2 Resuelve la ecuaci´n de Schr¨dinger estacionaria para el potencial eso o cal´n o 0, x < 0, V (x) = U0 , x > L.

Compara el resultado con el del caso de la barrera potencial de anchura infinita.

50

´ ´ Cap´ ıtulo 3. Mecanica Cuantica I: part´ ıcula material

Cap´ ıtulo 4

Mec´nica Cu´ntica II: Espacios a a de Hilbert
En este cap´ ıtulo desarrollaremos la Mec´nica Cu´ntica sobre un espacio de Hilbert a a general. Aunque el cap´ ıtulo es autocontenido, es recomendable consultar el Anexo A donde se da una breve introducci´n a la teor´ de espacios funcionales (m´tricos y noro ıa e mados), as´ como se desarrolla con m´s detalles las propiedades de los espacios de Hilbert ı a separables.

4.1.

Espacios eucl´ ıdeos y espacios normados

Comenzaremos este apartado recordando algunas definiciones generales. En adelante asumiremos que E es un espacio vectorial complejo1 . Definici´n 4.1.1 Se dice que un espacio vectorial E es un espacio eucl´deo si dados dos o ı elementos cualesquiera x, y ∈ E existe un n´mero denominado producto escalar y que u denotaremos por x, y tal que 1. Para todo x, y ∈ E, x, y = y, x . 2. Para todo x, y, z ∈ E, x, y + z = x, y + x, z . 3. Para todo x, y ∈ E y λ ∈ C, x, λy = λ x, y 4. Para todo x ∈ E, x = 0, x, x > 0 y si x, x = 0, entonces x = 0. Una consecuencia de la definici´n anterior es que o 1. Para todos x, y, z ∈ E, x + y, z = x, z + y, z .
1 En

adelante denotaremos por z al complejo conjugado del n´mero complejo z u

51

52

´ ´ Cap´ ıtulo 4. Mecanica Cuantica II: Espacios de Hilbert 2. Para todos x, y ∈ E y λ ∈ C, λx, y = λ x, y

El ejemplo m´s sencillo de espacio eucl´ a ıdeo es el espacio Cn con el producto escalar est´ndar. Otro ejemplo sencillo es el espacio C[a, b] de las funciones continuas en [a, b] a cerrado y acotado con el siguiente producto escalar
b

f, g =
a

f (x)g(x)dx.

(4.1.1)

Una propiedad importante de los espacios eucl´ ıdeos es la desigualdad de CauchySchwarz | f, g |2 ≤ f, f g, g . (4.1.2) Para demostrarla basta usar que para todo λ ∈ C y f, g ∈ E, λf + g, λf + g ≥ 0, o equivalentemente, |λ|2 f, f + λ f, g + λ g, f + g, g = |λ|2 f, f + 2ℜ(λ f, g ) + g, g ≥ 0. Escojamos λ = α f, g /| g, f |, α ∈ R. Entonces, como 0 ≤ |λ|2 f, f + 2ℜ(λ f, g ) + g, g = |α|2 f, f + 2|α|| f, g | + g, g , el discriminante de la ecuaci´n cuadr´tica en α, |α|2 f, f + 2|α|| f, g | + g, g = 0, ha o a de ser negativo, luego se tiene | f, g |2 − f, f g, g ≤ 0, de donde se sigue (4.1.2). Definici´n 4.1.2 Un espacio vectorial X se denomina espacio normado si para todo o x ∈ X existe un n´mero real denominado norma, que denotaremos por x , que cumple u con las condiciones 1. Para todo x ∈ X, x ≥ 0 y si x = 0 entonces x = 0. 2. Para todo x ∈ X y λ ∈ C, λx = |λ| x . 3. Para todo x, y ∈ X se tiene la desigualdad triangular x+y ≤ x + y . (4.1.3)

Teorema 4.1.3 Todo espacio eucl´deo E es normado si en ´l definimos la norma meı e f, f . Adem´s, f · g ≥ | f, g |. a diante la f´rmula x = o La demostraci´n se deja como ejercicio.2 Por ejemplo, en el espacio C[a, b] podemos o definir la norma por
b

f =
a

|f (x)|2 dx.

Definici´n 4.1.4 Un espacio eucl´deo E completo3 respecto a la norma inducida por un o ı producto escalar se denomina espacio de Hilbert y lo denotaremos por H.
p p g, g + g, g suficiente ver que f +g 2 = f +g, f +g = f, f +2 f, g + g, g ≤ f, f +2 f, f 2 = ( f + g )2 . El resto de los axiomas es inmediato. = ( f, f + g, g ) 3 Un espacio E es completo si cualquier sucesi´n de Cauchy en E converge a un vector de E. o
2 Es

4.1. Espacios eucl´ ıdeos y espacios normados

53

En adelante nos interesar´n los espacios de Hilbert H separables, es decir, aquellos a espacios de Hilbert que contienen un subconjunto numerable denso. Definici´n 4.1.5 Sea el sistema de vectores {φn }∞ de H linealmente independiente o n=1 –es decir, que cualquier subsistema finito es linealmente independiente–. Diremos que {φn }∞ es un sistema ortogonal dos a dos si n=1 φn , φm = δn,m φn 2 , ∀n, m ∈ N. (4.1.4)

Por ejemplo, el sistema de funciones {1} ∪ {sen nx, cos nx}∞ es un sistema ortogonal n=1 dos a dos respecto al producto escalar
π

f, g =
−π

f (x)g(x)dx.

Definici´n 4.1.6 Dado un vector x ∈ H definiremos la serie de Fourier respecto al o ∞ sistema {φn }∞ a la serie s := n=1 cn φn , donde los coeficientes vienen dados por las n=1 expresiones cn = x,φn2 , para todo n ≥ 1. φn Definici´n 4.1.7 Dada f ∈ H y una sucesi´n sn , se dice que sn converge en norma a o o f si l´ ım f − sn = 0.
n→∞

Es f´cil ver que si los vectores (no nulos) x1 , . . . , xn de un espacio eucl´ a ıdeo son ortogonales, entonces son linealmente independientes. Este hecho Teorema 4.1.8 En un espacio de Hilbert H de cualquier conjunto de vectores linealmente independiente se puede construir un conjunto de vectores ortogonales (ortonormales). Demostraci´n: Para probar el teorema tomamos un sistema de vectores linealmente ino dependiente (φn )n de H cualquiera y definimos un nuevo sistema de vectores (ψn )∞ de n=1 la siguiente forma: 1. Tomamos ψ1 = φ1 / φ1 . ˜ 2. A continuaci´n escogemos ψ2 de la forma o ˜ ψ2 = φ2 + α2,1 ψ1 , ˜ donde α2,1 es tal que ψ2 sea ortogonal al vector φ1 , i.e. ψ1 , ψ2 = 0, de donde se deduce ˜ ˜ que α2,1 = − ψ1 , φ2 . Entonces ψ2 = ψ2 / ψ2 es ortonormal a φ1 . ˜ 3. Paso n. Escogemos ψk , k ≥ 3, de la forma ˜ ψn = φn +
k=1 n−1

αn,k ψk ,

˜ donde los coeficientes αn,k , n ∈ N, k = 1, . . . , n − 1 son tales que ψn sea ortogonal a todos los vectores φk , k = 1, 2, . . . , n − 1, anteriores. Usando la ortogonalidad es f´cil comproa ˜ ˜ bar que αn,k = − ψk , φn , k = 1, 2, . . . , n − 1. Finalmente definimos ψn = ψn / ψn que

54

´ ´ Cap´ ıtulo 4. Mecanica Cuantica II: Espacios de Hilbert

es ortonormal a todos los vectores anteriores φk , k = 1, 2, . . . , n−1. Y as´ sucesivamente.2 ı El proceso anterior se denomina proceso de ortogonalizaci´n de Gram-Schmidt. o N´tese que del proceso anterior se sigue adem´s que, para cada n ≥ 1, o a
n−1 n−1

˜ ψn = φn +
k=1

˜ ˜ αn,k ψk =⇒ φn = ψn +
k=1

˜ βn,k ψk .

Luego, ˜ ˜ ψk , ψn = 0, ∀k = 0, 1, . . . n − 1 ⇔ ˜ φk , ψn = 0, ∀k = 0, 1, . . . n − 1.

˜ Usando lo anterior es f´cil ver que ψn admite la siguiente expresi´n expl´ a o ıcita: φ1 , φ1 φ2 , φ1 . . . φn , φ1 φ1 , φ2 φ2 , φ2 . . . φn , φ2 ··· ··· .. . ··· φ1 , φn−1 φ2 , φn−1 . . . φn , φn−1 φ1 φ2 . . . φn

˜ ψn =

.

(4.1.5)

˜ Para ello basta notar que el producto escalar φk , ψn = 0, k = 1, 2, . . . , n − 1, ya que el determinante resultante tiene dos columnas iguales. N´tese adem´s que o a ˜ ˜ ψn , ψn = ∆n , donde ∆n son los determinantes de Gram φ1 , φ1 φ2 , φ1 . . . φn , φ1 φ1 , φ2 φ2 , φ2 . . . φn , φ2 ··· ··· .. . ··· φ1 , φn−1 φ2 , φn−1 . . . φn , φn−1 φ1 , φn φ2 , φn . . . φn , φn

∆n =

.

De lo anterior deducimos tambi´n que los ψn son un conjunto linealmente independiente e de H si y s´lo si los ∆n = 0 (en nuestro caso ∆n > 0), para todo n ∈ N. o N´tese que los subespacios generados por los vectores (φn )n y (ψn )n coinciden. o Teorema 4.1.9 Si el espacio eucl´deo E es separable, entonces cualquier sistema ortoı gonal (ortonormal) de E es numerable. e Demostraci´n: Asumamos sin p´rdida de generalidad que el sistema (ψn )n es ortonormal. o √ Entonces ψn − ψm = 2 si n = m. Sea el conjunto de las bolas de radio 1/2 y centro en cada ψn , B(ψn , 1/2). Estas bolas no se interceptan, luego en casa bola hay un unico ´ vector ψn de nuestro sistema ortonormal. Sea ahora (φk )k un conjunto numerable denso en E (pues ´ste es separable). Entonces, en cada bola B(ψn , 1/2) habr´ al menos un φk , e a luego el n´ mero de bolas y por tanto de elementos ψn es numerable. u 2

4.2. Operadores en H

55

4.2.

Operadores en H

Definici´n 4.2.1 Un operador L es una aplicaci´n de H en H1 , dos espacios de Hilbert, o o L : H → H1 . En adelante asumiremos que H1 ⊂ H. Definici´n 4.2.2 Un operador L es lineal si ∀α1 , α2 ∈ C, y Ψ1 , Ψ2 ∈ H, o L(α1 Ψ1 + α2 Ψ2 ) = α1 LΨ1 + α2 LΨ2 . Definici´n 4.2.3 Definiremos el producto L = AB de dos operadores A y B al operador o L que obtiene al actuar consecutivamente los operadores B y luego A, i.e., Φ = BΨ, LΨ = AΦ =⇒ LΨ = A(BΨ).

En general AB = B A, i.e., la multiplicaci´n de operadores no es conmutativa. o Definici´n 4.2.4 Llamaremos conmutador de dos operadores A y B al operador o [A, B] := AB − B A. As´ pues, dos operadores conmutan si y s´lo si su conmutador es el operador nulo. ı o Definici´n 4.2.5 El operador I se denomina operador identidad si o ∀Ψ ∈ H, IΨ = Ψ.

Definici´n 4.2.6 El operador L−1 se denomina operador inverso de L si o LL−1 = L−1 L = I. En adelante vamos a usar la notaci´n de Dirac para los vectores, los operadores y o los productos escalares. As´ un vector de H lo denotaremos por |Ψ (ket vector) y su correspondiente conjuı, gado Ψ| (brac vector)4 . As´ denotaremos el producto escalar Ψ, Φ por Ψ|Φ y adem´s ı, a Ψ|L|Φ := Ψ|LΦ . A los productos anteriores les denominaremos elementos matriciales del operador L. En adelante, an no ser que se especifique, asumiremos que los vectores Ψ est´n normalizados a a la unidad, i.e., Ψ = 1. Definici´n 4.2.7 El operador L+ se denomina conjugado o adjunto de L si, o Ψ|L|Φ = Φ|L+ |Ψ , i.e., Ψ|LΦ = L+ Ψ|Φ = Φ|L+ Ψ
4 Estos

(4.2.1)

nombres vienen de la palabra inglesa bracket.

56

´ ´ Cap´ ıtulo 4. Mecanica Cuantica II: Espacios de Hilbert De la definici´n anterior se deduce f´cilmente que o a 1. (L+ )+ = L, 2. (αL)+ = αL+ , ∀α ∈ C, 3. (LN )+ = N + L+ y 4. Ψ|LN |Φ = L+ Ψ|N Φ , ∀Ψ, Φ ∈ H.

Un ejemplo especialmente importante es el caso cuando H es de dimensi´n finita. o En este caso si (φn )N es una base (en particular, una base ortogonal) de H, entonces n=1
N

Lφn =
k=1

Ln,k φk ,

y por tanto a L se le puede hacer corresponder una matriz (Li,j )N . Si denotamos por i,j=1 L+ la matriz asociada al operador L+ , entonces L+ = Lj,i . i,j i,j Otro ejemplo son los L que admiten una representaci´n integral. Por ejemplo, suo pongamos que H = L2 (R) y LΨ(x) =
R

L(x, y)Ψ(y)dy,

donde L(x, y) es el n´cleo del operador, entonces, si denotamos por L+ (x, y) al n´ cleo u u de L, L+ (x, y) = L(y, x). Definici´n 4.2.8 Si L = L+ , se dice que el operador es herm´tico o autoadjunto. o ı Por ejemplo, si H es de dimensi´n finita, L es herm´ o ıtico si su correspondiente matriz satisface Li,j = Lj,i . Si H = L2 (R), los operadores definidos por xΨ(x) = xΨ(x), pΨ(x) = −i dΨ(x) , dx P Ψ(x) = Ψ(−x),

son herm´ ıticos. En el caso de operadores con representaci´n integral, ´stos ser´n herm´ o e a ıticos si su n´ cleo es tal que L(x, y) = L(y, x). u Proposici´n 4.2.9 El producto L = AB de dos operadores A y B herm´ticos es herm´tio ı ı co si y s´lo si A y B conmutan, i.e., [A, B] = 0. o Demostraci´n: Sea L = AB. Entonces L+ = B + A+ = B A, luego L = L+ si y s´lo si o o AB = B A, i.e., [A, B] = 0. 2 Proposici´n 4.2.10 El conmutador [A, B] de dos operadores herm´ticos A y B es tal o ı que [A, B] = iL, con L herm´tico. ı

4.2. Operadores en H Demostraci´n: Supongamos que [A, B] = N . Entonces o N + = ([A, B])+ = −[A, B] = −N con L herm´ ıtico ((iL)+ = −iL+ = −iL). Definici´n 4.2.11 Sea |Ψ ∈ H con |Ψ o = 0. Si existe λ ∈ C tal que =⇒ N = iL,

57

2

L|Ψ = λ|Ψ , entonces se dice que |Ψ es un autovector de L y λ es su correspondiente autovalor. Nota: En ocasiones es c´modo denotar a un autovector asociado a λ por |Ψλ (supoo niendo que λ es un autovalor simple). Si adem´s el conjunto de autovalores es numerable a entonces se suele simplificar a´ n m´s la notaci´n: |n := |Ψλn . u a o Proposici´n 4.2.12 Si L es herm´tico, entonces sus autovalores son reales. o ı Demostraci´n: o L|Ψ = λ|Ψ Por otro lado de (4.2.1) se sigue que Ψ|L+ |Ψ = Ψ|L|Ψ = λ Ψ|Ψ = λ, luego, como L es herm´ ıtico L = L+ por tanto λ = λ. 2 =⇒ Ψ|L|Ψ = λ Ψ|Ψ = λ.

Proposici´n 4.2.13 Si L es herm´tico, entonces los autovectores correspondientes a o ı autovalores distintos son ortogonales. Demostraci´n: Sea L|Ψ1 = λ1 |Ψ1 , L|Ψ2 = λ2 |Ψ2 , entonces o Ψ2 |L|Ψ1 =λ1 Ψ2 |Ψ1 = Ψ2 |L+ |Ψ1 = Ψ1 |L|Ψ2 = λ2 Ψ1 |Ψ2 = λ2 Ψ2 |Ψ1 , i.e. (λ1 − λ2 ) Ψ2 |Ψ1 = 0, luego como λ1 = λ2 , Ψ2 |Ψ1 = 0. Definici´n 4.2.14 Un operador U se denomina unitario si o U U + = U + U = I. Proposici´n 4.2.15 Si U es unitario, entonces todos sus autovalores son tales que o |λ| = 1. Demostraci´n: Sea U |Ψ = λ|Ψ , entonces o 1 = Ψ|U + U |Ψ = λ Ψ|U + |Ψ = λ Ψ|U |Ψ = λλ Ψ|Ψ = |λ|2 2 2

58

´ ´ Cap´ ıtulo 4. Mecanica Cuantica II: Espacios de Hilbert

Definici´n 4.2.16 Sea U un operador unitario. La transformaci´n o o |Ψ → |ψ = U + |Ψ , L → l = U + LU ,

la denominaremos transformaci´n unitaria de |Ψ y L y la denotaremos por {U }. o Proposici´n 4.2.17 Las transformaciones unitarias conservan o 1. Las relaciones de conmutaci´n de los operadores. o 2. La propiedad de hermiticidad de un operador. 3. Los autovalores. 4. Los productos escalares y elementos matriciales de un operador. Demostraci´n: 1. Sean A, B y L tres operadores tales que [A, B] = L y sea {U } una o transformaci´n unitaria. Denotemos por a, b y l los operadores correspondientes a A, B o y L despu´s de la transformaci´n. Entonces como [A, B] = L =⇒ e o AB − B A = L pero (U + AU )(U + B U) − (U + B U )(U + AU ) = ab − ba 2. Sea L = L+ . Sea l = U + LU, entonces l+ = (U + LU )+ = U + L+ U = U + LU = l. 3. Sea L|Ψ = λ|Ψ , entonces (U + LU)(U + )|Ψ = λ(U + |Ψ ) 4. Ψ1 |L|Ψ2 = Ψ1 |U U + LU U + |Ψ2 = U + Ψ1 |U + LU|U + Ψ2 = ψ1 |l|ψ2 . 2 Los operadores que nos van a interesar son aquellos operadores herm´ ıticos cuyo conjunto de autovectores constituyan un sistema completo de H, es decir que todo vector |Ψ ∈ H se puede expresar biun´ ıvocamente en funci´n de dicho sistema. Este problema o (de encontrar dichos operadores y el conjunto de sus autovalores y autovectores y comprobar que constituyen un sistema completo) es muy complicado y requiere de la potente maquinaria de la teor´ de operadores en espacio de Hilbert, el teorema espectral de Riesz, ıa etc. Basta mencionar que si H es separable, entonces en H existe una base ortonormal y si L es un operador autoadjunto (herm´ ıtico) y compacto, entonces sus autovectores constituyen un sistema ortogonal completo. Para m´s detalles v´ase el Ap´ndice A. a e e =⇒ l|ψ = λ|ψ . =⇒ [a, b] = l. =⇒ U + AB U − U + B AU = U + LU = l,

4.2. Operadores en H

59

En adelante, por sencillez, nos vamos a restringir a considerar aquellos operadores que tengan asociados un conjunto numerable de autovectores y que dicho conjunto sea un sistema completo. Supongamos que L es uno de tales operadores y denotemos por (|Ψn )n su conjunto completo de autovectores. Si todos los autovalores son simples entonces, como ya hemos visto, los correspondientes autovectores son ortogonales. En el caso de que tengamos autovalores m´ ltiples sus correspondientes autovectores se pueden ortogonalizar usando u el m´todo de Gram-Schmidt que describimos antes. As´ pues asumiremos que (|Ψn )n es e ı un sistema ortonormal (ortogonal con |Ψn = 1). Sea |Φ un vector cualquiera de H, entonces |Φ se puede desarrollar en serie de Fourier respecto (|Ψn )n |Φ = fn |Ψn , fn = Ψn |Φ .

n

En otras palabras, (|Ψn )n es una base ortonormal completa de H. Las bases juegan un papel fundamental. En particular el de aquellas bases asociadas a operadores herm´ ıticos. Sea (|Ψn )n una base ortonormal completa de H y sea A un operador lineal, entonces A|Ψn ∈ H =⇒ A|Ψn = Am,n |Ψm =⇒ Am,n = Ψm |A|Ψn .

m

A la cantidad Ψm |A|Ψn la denominaremos elemento matricial del operador A en la base (|Ψn )n . Si (|Ψn )n es la base asociada a cierto operador herm´ ıtico L se dice que la matriz A = (Am,n ) es la matriz del operador A en la L-representaci´n. N´tese que la matriz del o o operador L en su propia representaci´n (la L-representaci´n) es una matriz diagonal con o o los autovalores en la diagonal. M´s a´ n, as´ como el conjunto de n´ meros (fn )n define biun´ a u ı u ıvocamente el vector |Φ , la matriz A define biun´ ıvocamente al operador A (en la base correspondiente se sobrentiende). As´ pues, el operador A ser´ herm´ ı a ıtico si su matriz A es autoconjugada, a i.e., Am,n = An,m , A ser´ unitario si su matriz A es unitaria, i.e., k Am,k An,k = δm,n , etc. Nota: N´tese que si H es de dimensi´n finita, las correspondientes matrices son matrices o o cuadradas N × N donde N es la dimensi´n de H, pero si H es de dimension infinita, o entonces las correspondientes matrices son infinitas. Proposici´n 4.2.18 Si dos operadores L y N tienen un sistema completo de autoveco tores (|Ψn )n com´n, entonces [L, N ] = 0. u Demostraci´n: Sean λn los autovalores de L correspondientes a los autovectores |Ψn o y νn los del operador N correspondientes al mismo autovector (son comunes). En las premisas del teorema tenemos LN |Ψn = νn L|Ψn = λn νn |Ψn = λn N |Ψn = N (λn |Ψn ) = N L|Ψn .

60

´ ´ Cap´ ıtulo 4. Mecanica Cuantica II: Espacios de Hilbert

Sea |Φ ∈ H cualquiera. Entonces LN |Φ =LN =N L
n n

fn |Ψn =

n

fn LN |Ψn =

fn N L|Ψn
n

fn |Ψn = N L|Φ =⇒ [L, N ] = 0. 2

El rec´ ıproco tambi´n es cierto: e Proposici´n 4.2.19 Si dos operadores L y N con sistemas completos de autovectores o conmutan ([L, N ] = 0), entonces tienen un sistema completo de autovectores (|Ψn )n com´n. u Demostraci´n: Para demostrarlo vamos a probar que ambos se pueden diagonalizar al o mismo tiempo. Supongamos que conocemos el conjunto (|Ψn )n de los autovectores de L. En esa base la matriz de L es diagonal: Lm,n = λn δm,n . Como [L, N ] = 0 entonces las matrices correspondientes a LN y N L son iguales (LN )m,n = (N L)m,n λm δm,k Nk,n =
k k

=⇒
k

Lm,k Nk,n =
k

Nm,k Lk,n

=⇒

Nm,k λn δk,n

=⇒

Nm,n (λn − λm ) = 0.

Si todos los autovalores son distintos, entonces Nm,n = 0 si m = n, es decir la matriz de N es diagonal. Resta probar qu´ ocurre si hay autovalores m´ltiples. Lo que dejaremos e u como ejercicio al lector5 . 2 Definici´n 4.2.20 Sea F (z) una funci´n anal´tica en un entorno de z = 0 y sea F (z) = o o ı fn z n su desarrollo en serie de potencias. Definiremos al operador F (L) mediante n≥0 la serie F (L) = fn L n .
n≥0

Definici´n 4.2.21 La derivada operacional ∂F (L)/∂ L es el operador que se obtiene o mediante la formula ∂F (L) F (L + εI) − F (L) = l´ ım . (4.2.2) ε→0 ε ∂L Por ejemplo ∂ Ln ∂L = nLn−1 .

Sean A y A+ tales que [A, A+ ] = I. Entonces es f´cil comprobar que a [A, (A+ )k ] = k(A+ )k−1 ,
5 Supongamos

k ≥ 1.

(4.2.3)

que la multiplicidad de cierto autovalor λk es g y sean Ψk,j , j = 1, 2, . . . , g, los correspondientes autovectores asociados. Entonces, como mucho hay g(g − 1) elementos matriciales Nm,n no b diagonales distintos de cero, los correspondientes a Ψk,i |N|Ψk,j , donde i = j, i, j = 1, 2, . . . , g. Basta probar que existen ciertas combinaciones lineales Φk,j de los correspondientes autovectores |Ψk,j , b j = 1, 2, . . . , g, tales que Φk,i |N |Φk,j = 0.

´ ´ 4.3. Los axiomas de la Mecanica Cuantica

61

Proposici´n 4.2.22 Si F (z) es una funci´n anal´tica en un entorno de z = 0 y sean A o o ı y A+ tales que [A, A+ ] = I. Entonces [A, F (A+ )] = dF (A+ ) dA+ . 2

Demostraci´n: Basta escribir la serie de potencias de F y usar la propiedad (4.2.3). o Nota: Si F admite un desarrollo en serie de Laurent el resultado tambi´n es v´lido. e a

En adelante asumiremos que el espacio de Hilbert H es separable (si en H existe un subconjunto contable de vectores denso en H).

4.3.

Los axiomas de la Mec´nica Cu´ntica a a

Postulado 4.3.1 A cada sistema f´sico se le hace corresponder un espacio de Hilbert ı H apropiado. Adem´s, para cada t ∈ R (par´metro correspondiente al tiempo) el estado a a queda completamente caracterizado por un vector |Ψ normalizado a la unidad de H. Es decir, para cada t el estado est´ determinado por un vector de H tal que Ψ = 1. a De aqu´ tambi´n se sigue que, dados los estados |Ψ1 , . . . , |Ψk , la combinaci´n lineal ı e o |Φ = n αk |Ψk tambi´n es un (posible) estado6 . e k=1 Postulado 4.3.2 A cada magnitud f´sica medible (observable) L se le hace corresponder ı un operador linear herm´tico L que act´a en H. ı u Postulado 4.3.3 Sea |Ψ el estado del sistema en el momento t justo antes de la medici´n de la magnitud (observable) L (asociada al operador L). Independientemente de o cu´l sea el estado original |Ψ , el resultado de la medici´n s´lo puede ser un autovalor a o o de L. Este postulado requiere una aclaraci´n y es que al hacer una medici´n de L el sistema o o cambia (las mediciones interfieren en el sistema). As´ pues, antes de medir L el sistema ı puede estar en cualquier estado Ψ, pero al realizar la medici´n, ´sta cambia al sistema o e y lo deja en el estado determinado por el vector |Ψλ que es un autovector de L correspondiente a al autovalor λ.7 N´tese que este axioma elimina formalmente la paradoja del o gato de Schr¨dinger que discutimos en la introducci´n. o o Postulado 4.3.4 El valor esperado L de una cantidad f´sica L cuando el sistema se ı encuentra en el estado |Ψ viene dado por el elemento matricial L = Ψ|L|Ψ .
cada t ∈ R el vector |Ψ siempre se puede normalizar a la unidad (a no ser |Ψ = 0). operadores cu´nticos se postulan en la teor´ En el cap´ a ıa. ıtulo 3 vimos varios ejemplos de los mismos. Tres operadores esenciales son el operador posici´n o coordenadas xk , impulso pk , y el hamiltoniano o b b b del sistema H.
7 Los 6 Para

62

´ ´ Cap´ ıtulo 4. Mecanica Cuantica II: Espacios de Hilbert N´tese que, como L es herm´ o ıtico, entonces Ψ|L|Ψ = Ψ|L+ |Ψ = Ψ|L|Ψ =⇒ L ∈ R.

Postulado 4.3.5 Los elementos matriciales de los operadores xi de la posici´n (coordeo nadas) xi y pi de los momentos pi , i = 1, 2, 3, donde los ´ndices i = 1, 2, 3 corresponden a ı las proyecciones en los ejes x, y y z, respectivamente, definidos por Φ|xi |Ψ y Φ|pi |Ψ , cualquiera sean |Φ y |Ψ de H satisfacen las ecuaciones de evoluci´n o d Φ|xi |Ψ = dt Φ ∂H Ψ , ∂ pi d ∂H Ψ , Φ|pi |Ψ = − Φ dt ∂xi (4.3.1)

donde H es el operador asociado a la funci´n de Hamilton del correspondiente sistema o cl´sico (si es que lo hay). a Este postulado tiene un significado f´ ısico evidente pues nos indica que el promedio de las cantidades medibles posici´n, impulso y energ´ (hamiltoniano) satisfacen las ecuaciones o ıa din´micas de la mec´nica hamiltoniana (1.1.1), i.e, en el l´ a a ımite apropiado ( → 0) la Mec´nica cu´ntica se transforma en la cl´sica (principio de correspondencia de Bohr). a a a Proceden unas aclaraciones. En general el Hamiltoniano H de un sistema cl´sico a depende de las coordenadas xi y los impulsos pi , i = 1, 2, 3, por lo que el operador H se obtiene cambiando las xi por los correspondientes operadores xi y pi por pi . Esto, aunque en apariencia es trivial, en general no lo es pues H debe ser herm´ ıtico (ya que corresponde a la magnitud f´ ısica energ´ A esto regresaremos en breve, pero antes introduciremos ıa). nuestro ultimo postulado. ´ Postulado 4.3.6 Los operadores posici´n xi e impulso pi , i = 1, 2, 3, satisfacen las o relaciones de conmutaci´n o [xk , xj ] = 0 = [pk , pj ], √ es una constante e i = −1. [xk , pj ] = i δk,j I, (4.3.2)

donde

En particular, de lo anterior se sigue que los operadores xk y pk no pueden tener un conjunto completo de autovectores comunes. Este postulado es el an´logo de las relaciones a (1.1.4) (llaves de Poisson).

4.4.

Discusi´n e implicaciones de los postulados o

1. Supongamos que tenemos una magnitud f´ ısica cl´sica L que depende en general de a xi y pi . Para construir el operador mecano-cu´ntico correspondiente s´lo tenemos que a o cambiar los xi por los correspondientes operadores xi y pi por pi . Por ejemplo, la energ´ ıa cin´tica viene dada por e T = p2 + p2 + p2 1 2 3 2m =⇒ T = p1 2 + p2 2 + p3 2 , 2m

´ 4.5. Representacion de los operadores xi y pi

63

y la potencial V (x1 , x2 , x3 ) por V = V (x1 , x2 , x3 ), donde en ambos casos los operadores son herm´ ıticos. Esto no siempre ocurre. Por ejemplo imaginemos que el hamiltoniano cl´sico contiene el t´rmino Wi = xi pi . Entonces, el operador Wi = xi pi no puede rea e presentar al correspondiente operador cu´ntico ya que no es herm´ a ıtico (ver Proposici´n o 4.2.9) pues xi y pi no conmutan. En este caso hay que definir Wi por Wi = 1 (xi pi + pi xi ). 2

2. Supongamos el sistema f´ ısico se encuentra en el estado definido por |Ψn , autovector correspondiente al autovalor λn de cierto operador L asociado a la magnitud f´ ısica L. Entonces8 Ψn |L|Ψn = λn , Ψn |Lk |Ψn = λk , n Supongamos ahora que el sistema se encuentra en el estado |Φ que es en una superposici´n de los estados |Ψk , k = 1, 2, . . . , N , entonces como |Φ = k fk |Ψk tenemos o Φ|L|Φ =
k

|fk |2 λk .

Lo anterior indica, en virtud de postulado 4.3.4 que la cantidad |fk |2 es la probabilidad con que se observa el valor λk al hacer una medici´n. o 3. Dada cualquier cantidad f´ ısica cl´sica L le podemos adicionar la cantidad xi pj − pj xi a sin cambiarla. Si transformamos L en su operador L ya no le podemos adicionar el correspondiente operador xi pj − pj xi pues ´ste no es nulo (ver postulado 4.3.6). e Ahora bien, tomando las derivadas funcionales ∂ ∂ (xi pj − pj xi ) = (xi pj − pj xi ) = 0, ∂xi ∂ pi i.e., xi pj − pj xi es proporcional al operador identidad xi pj − pj xi = αI. Si adem´s xi a y pj son herm´ ıticos entonces, necesariamente, α = i (ver la Proposici´n 4.2.10) donde o ∈ R que no es m´s que la relaci´n de conmutaci´n del postulado 4.3.6. a o o

4.5.

Representaci´n de los operadores xi y pi o

Escojamos como espacio de Hilbert de nuestro sistema el conjunto de las funciones de cuadrado integrable H = L2 (Ω), |Ψ = Ψ(x). Definiremos el operador xi en L2 (Ω) como el operador xi := xi I. Luego xk Ψ(x) = xk Ψ(x). ¿Qui´n es pj ? Por simplicidad vamos a trabajar solamente en dimensi´n 1 (s´lo la e o o proyecci´n en el eje de las x). Nuestro objetivo es encontrar un operador p tal que cumpla o las relaciones de conmutaci´n (4.3.2). o Del postulado 4.3.6 se sigue que 1. [p, x] = px − xp = −i I,
8 Recu´rdese e

que los estados est´n normalizados a la unidad. a

64

´ ´ Cap´ ıtulo 4. Mecanica Cuantica II: Espacios de Hilbert 2. [p, x2 ] = px2 − x2 p = −2i x, . . . 3. [p, xn ] = pxn − xn p = −ni xn−1 = −i ∂xn . ∂x

Luego, para cualquier funci´n anal´ o ıtica F (z) tenemos [p, F (x)] = −i ∂F (x) , ∂x ∂F (x) Ψ(x), ∂x (4.5.1)

que en nuestra representaci´n se puede reescribir como o pF (x)Ψ(x) − F (x)pΨ(x) = −i o equivalentemente, usando que xk Ψ(x) = xk Ψ(x), p[F (x)Ψ(x)] − F (x)pΨ(x) = −i ∂F (x) Ψ(x), ∂x

de donde escogiendo9 Ψ(x) = 1 obtenemos, sustituyendo p1 = φ(x) la expresi´n o pF (x) = −i En general pk F (x1 , x2 , x3 ) = −i ∂F (x1 , x2 , x3 ) + F (x1 , x2 , x3 )φk (x1 , x2 , x3 ). ∂xk ∂F (x) + F (x)φ(x). ∂x

Pero [pk , pj ] = 0, k = 1, 2, 3, luego ∂φ1 ∂φ3 ∂φ2 ∂φ1 ∂φ3 ∂φ2 − = − = − = 0. ∂x1 ∂x2 ∂x2 ∂x3 ∂x3 ∂x1 Las ecuaciones anteriores son ciertas si φk = suficientemente buena.
∂Φ ∂xk ,

k = 1, 2, 3, siendo Φ una funci´n lo o

As´ pues, los operadores pk deben tener la forma ı pk = −i ∂ ∂Φ + I. ∂xk ∂xk U + = exp(iΦ(x1 , x2 , x3 )/ )I

Hagamos ahora la transformaci´n unitaria o pk → U + pk U , U = exp(−iΦ(x1 , x2 , x3 )/ )I,

que, como sabemos, no cambia ni los elementos matriciales, ni las relaciones de conmutaci´n, ni los autovalores, ni la hermiticidad de los operadores (i.e., ´stos mantendr´n el o e a mismo significado f´ ısico de antes): pk = eiΦ/ −i ∂ ∂Φ ∂ + I e−iΦ/ I = −i . ∂xk ∂xk ∂xk

9 Por el momento s´lo nos interesa encontrar la expresi´n del operador independientemente de que o o luego ´ste vaya actuar en el espacio L2 (Ω). e

¨ 4.6. Las ecuaciones de Heisenberg y de Schrodinger Como ejercicio al lector dejamos que pruebe la identidad [x, F (p)] = i ∂F (p) . ∂p

65

(4.5.2)

4.6.

Las ecuaciones de Heisenberg y de Schr¨dinger o

En adelante asumiremos que el Hamiltoniano del sistema se expresa mediante la f´rmula o 3 p2 k , H =T +V, T = 2m i=1 y V = V (x1 , x2 , x3 ) = V (x1 , x2 , x3 )I s´lo depende de las coordenadas x, y, z.10 o Por simplicidad trabajaremos s´lo con la proyecci´n en el eje OX. o o Como [p, T ] = 0, tenemos, usando (4.5.1) que [p, H] = [p, V (x)] = −i ∂V (x) ∂H = −i ∂x ∂x (4.6.1)

Supongamos ahora que los vectores de estado no dependen del tiempo (los operadores s´ que pueden, en principio, depender del tiempo). Entonces del postulado 4.3.5 se tiene ı que dp ∂H =− , dt ∂x de donde se sigue que i dp = − [p, H]. (4.6.2) dt De forma an´loga, pero usando (4.5.2), se deduce la segunda ecuaci´n de Heisenberg a o dx i = − [x, H]. dt (4.6.3)

Las ecuaciones anteriores se conocen como ecuaciones din´micas de la Mec´nica a a cu´ntica en la representaci´n de Heisenberg: es decir, cuando las funciones de onda son a o vectores independientes del tiempo pero los operadores no lo son. Obviamente hay otra posibilidad y es que los operadores no dependan del tiempo y las funciones de onda s´ En este caso usando el postulado 4.3.5 y la f´rmula (4.6.1) ı. o b ( ∂ H = i/ [p, H]), obtenemos ∂b x ∂H d Φ|p|Ψ = − Φ Ψ dt ∂x Luego, por un lado, ∂Φ ∂Ψ pΨ + Φp ∂t ∂t = ∂Φ ∂Ψ pΨ + pΦ ∂t ∂t =− i Φ|[p, H]|Ψ .

10 Recordemos que estamos usando indistintamente la notaci´n x , x , x y x, y, z para denotar las o 1 2 3 coordenadas espaciales.

66 y, por otro, i Φ|[p, H]|Ψ =

´ ´ Cap´ ıtulo 4. Mecanica Cuantica II: Espacios de Hilbert

i

Φ|pH|Ψ − Φ|H p|Ψ

=

i

HΨ +

i

HΦ pΨ ,

de donde se sigue que pΦ ∂Ψ i + HΨ + ∂t i ∂Φ + HΦ pΨ ∂t = 0,

cualquiera sean los vectores Φ y Ψ. Por tanto, necesariamente tenemos la ecuaci´n o i ∂|Ψ = H|Ψ . ∂t (4.6.4)

La ecuaci´n anterior se denomina ecuaci´n de Schr¨dinger y es la ecuaci´n de evoluci´n o o o o o de la Mec´nica cu´ntica cuando los operadores no dependen del tiempo. a a El test de consistencia Probemos que tambi´n tenemos aqu´ el test de consistencia d/dt( |Ψ e ı la ecuaci´n de Schr¨dinger (4.6.4) y sea su conjugada o o −i ∂ Ψ| = Ψ|H + . ∂t
2

) = 0. Sea

Tomando el producto escalar de esta ultima por |Ψ (por la derecha) y de (4.6.4) por Ψ| ´ (por la izquierda) obtenemos, respectivamente Ψ|H + |Ψ = −i ∂Ψ Ψ , ∂t Ψ|H|Ψ = i Ψ ∂Ψ ∂t ,

de donde, restando ambas y usando la hermiticidad de H tenemos 0= ∂Ψ ∂Ψ Ψ + Ψ ∂t ∂t = ∂ ∂ |Ψ Ψ|Ψ = ∂t ∂t
2

.

4.6.1.

Equivalencia de las representaciones de Heisenberg y de Schr¨dinger o

Las ecuaciones din´micas del postulado 4.3.5 han de cumplirse independientemente a de que escojamos la representaci´n de Schr¨dinger (S) o la de Heisenberg (H). Adem´s, o o a los observables que medimos deben tener los mismos valores medios en ambas representaciones. Eso implica que ha de existir una transformaci´n unitaria {U } que pase de S a o H y viceversa. Sean |ψ y L la funci´n de estado y el observable en la representaci´n de Heisenberg o o y |Ψ y l en la de Schr¨dinger. Entonces entre ambas existe la relaci´n: o o |Ψ = U + |ψ , l = U + LU , U + = e−iHt/ ,
b

¨ 4.6. Las ecuaciones de Heisenberg y de Schrodinger

67

donde H es el operador hamiltoniano del sistema que se asume independiente del tiempo. En efecto, si |ψ no depende del tiempo, entonces ∂|Ψ i ∂U + i b = |ψ = − He−iHt/ |ψ = − H|Ψ , ∂t ∂t i.e., la ecuaci´n de Schr¨dinger (4.6.4). o o Supongamos que ahora l no depende de t. Entonces, ∂l ∂U + ∂U + i i ∂L lU + U U + + U l = = (H L − LH) = [H, L]. ∂t ∂t ∂t ∂t (4.6.5)

De lo anterior se sigue que en la representaci´n de Heisenberg una cantidad f´ o ısica es independiente del tiempo si el operador asociado a dicha magnitud conmuta con el Hamiltoniano. Esta propiedad es adem´s muy significativa desde el punto de vista f´ a ısico como veremos a continuaci´n. o Definici´n 4.6.1 Se dice que una cantidad observable L es una integral de movimiento o si d d L = Ψ|L|Ψ = 0. dt dt Es decir, una magnitud es una integral de movimiento si dicha magnitud se conserva en media. Calculamos la derivada del elemento matricial d Ψ|L|Ψ = dt ∂L ∂Ψ ∂Ψ LΨ + Ψ Ψ + ΨL ∂t ∂t ∂t .

Usando la ecuaci´n de Schr¨dinger (4.6.4) tenemos o o d Ψ|L|Ψ = dt Si L no depende del tiempo, entonces,
d dt

Ψ

i ∂L − [L, H] Ψ . ∂t

(4.6.6)

Ψ|L|Ψ = 0 si y s´lo si [L, H] = 0. o

Si ahora escogemos la representaci´n de Heisenberg entonces (|Ψ no depende del o tiempo) ∂L i d Ψ|L|Ψ = Ψ Ψ = Ψ|[H, L]|Ψ , dt ∂t donde hemos usado la ecuaci´n (4.6.5). Es decir, tambi´n en la representaci´n de Heio e o d o senberg dt Ψ|L|Ψ = 0 si y s´lo si [L, H] = 0.

4.6.2.

Los estados estacionarios del sistema

Toda la discusi´n anterior nos conduce a que el estado de un sistema viene dado o por un vector de estado |Ψ que evoluciona seg´ n la ecuaci´n de Schr¨dinger. Vamos a u o o

68

´ ´ Cap´ ıtulo 4. Mecanica Cuantica II: Espacios de Hilbert

suponer que el operador hamiltoniano (que es herm´ ıtico) H es independiente del tiempo y tiene un conjunto de autovectores |Φn (independientes de t) completo en H, i.e., H|Φn = En |Φn , donde los autovalores En del hamiltoniano H representan los posibles valores de la energ´ ıa del sistema. Supongamos ahora que tenemos un estado del sistema correspondiente a la energ´ ıa En , que tiene la forma |Ψn = α(t)|Φn . N´tese que H|Ψn = En |Ψn . Como los |Ψn o son estados del sistema, entonces han de satisfacer la ecuaci´n de Schr¨dinger, i.e., o o ∂|Ψn = H|Ψn = En |Ψn . ∂t Resolviendo con respecto al tiempo la ecuaci´n anterior tenemos o i |Ψn = e−iEn t/ |Φn , donde |Φn no depende expl´ ıcitamente del tiempo. Com´ nmente a los estados |Ψn anteriores se les denominan estados estacionarios u del sistema. Adem´s, de lo anterior se deduce que la unica dependencia del tiempo de a ´ los estados estacionarios es el factor e−iEn t/ .

4.7.

El principio de incertidumbre
△A = A − A I, △B = B − B I,

Sean dos operadores herm´ ıticos A y B. Definamos los operadores

donde A y B son los valores medios de A y B en el estado |Ψ . Entonces, como [A, B] = iL, con L herm´ ıtico, se sigue que [△A, △B] = iL. Las dispersiones de las cantidades A y B en el estado |Ψ vendr´n dadas por a △A := Ψ|(△A)2 |Ψ = △AΨ , △B := Ψ|(△B)2 |Ψ = △BΨ .

Si usamos la desigualdad de Cauchy-Schwarz (4.1.2) △AΨ| △BΨ ≥ | △AΨ|△BΨ | ≥ |ℑ △AΨ|△BΨ | Calculemos la parte imaginaria de △AΨ|△BΨ = Ψ|△A△B|Ψ –recordemos que A es herm´ ıtico, luego △A tambi´n lo es pues A es real–. Obtenemos e ℑ Ψ|△A△B|Ψ = 1 Ψ|△A△B|Ψ 2i 1 Ψ|△A△B|Ψ = 2i 1 = Ψ|△A△B|Ψ 2i 1 = Ψ|[△A, △B]|Ψ 2i − Ψ|△A△B|Ψ − Ψ|△B + △A+ |Ψ − Ψ|△B△A|Ψ = 1 Ψ|L|Ψ . 2

´ 4.8. La mecanica matricial Como L es herm´ ıtico, Ψ|L|Ψ es un n´ mero real que denotaremos por l; as´ u ı, △A△B ≥ |l| . 2

69

Lo anterior aplicado a los operadores p y x (ver postulado 4.3.6) nos conduce al principio de incertidumbre de Heisenberg △x△p ≥ 2 .

4.8.

La mec´nica matricial a

Supongamos que tenemos una base (|Ψn )n completa de vectores de H. Entonces, todo vector |Ψ de H lo podemos escribir, como ya hemos visto, de la forma |Ψ =
n

fn |Ψn ,

fn = Ψn |Ψ .

Es decir, a cada vector de H le podemos hacer corresponder su vector f = (f1 , f2 , . . . )T . An´logamente, a cada operador L le podemos hacer corresponder una matriz L con a entradas Lm,n = Ψm |L|Ψn . Luego la ecuaci´n (4.6.5) se puede escribir en la forma o i ∂L = [H, L]. ∂t donde H es la matriz correspondiente al hamiltoniano del sistema, i.e., recuperamos la tambi´n antes mencionada mec´nica matricial de Heisenberg. e a

4.9.

La ecuaci´n de Schr¨dinger y el postulado 4.3.5 o o

Supongamos que la cantidad observable L es independiente del tiempo y |Ψ es la soluci´n de la ecuaci´n de Schr¨dinger (4.6.4), donde H es el operador hamiltoniano o o o H= p2 + p2 + p2 1 2 3 + V (x1 , x2 , x3 ) = T + V . 2m

Entonces, la ecuaci´n (4.6.6) nos da o i d L = [H, L] . dt Sea L = xk . Entonces, usando (4.5.2) tenemos [H, xk ] = [T , xk ] = −i Sustituyendo lo anterior en (4.9.1) obtenemos d xk = dt ∂H ∂ pk . ∂H . ∂ pk (4.9.1)

70

´ ´ Cap´ ıtulo 4. Mecanica Cuantica II: Espacios de Hilbert Sea L = pk . Entonces, usando (4.5.1) tenemos [H, pk ] = [V , xk ] = i ∂H , ∂xk

de donde, usando (4.9.1), se sigue que d pk = − dt ∂H ∂xk .

Es decir, si la funci´n de estado evoluciona seg´ n la ecuaci´n de Schr¨dinger (4.6.4), o u o o entonces las medias de las coordenadas e impulsos se comportan como en la mec´nica a hamiltoniana cl´sica. a En las mismas condiciones de antes se puede probar (de forma totalmente an´loga) a que, partiendo de la cantidad d Φ|L|Ψ , dt se obtienen las f´rmulas de evoluci´n del postulado 4.3.5. o o

4.10.

Problemas

Problema 4.10.1 Dado tres operadores p, q y r, prueba la identidad de Jacobi [[p, q], r] + [[q, r], p] + [[r, p], q] = 0. Problema 4.10.2 Probar que eL ae−L = a +
b b

1 1 [L, a] + [L, [L, a]] + · · · 1! 2!
b b

Problema 4.10.3 Para el caso unidimensional encuentra los operadores herm´ticos conı jugados a los siguientes operadores: d , dx x d , dx px d , dx x d . dx
b

Ayuda: Encuentra la EDO que satisface el operador a(t) definido por b(t) = etL be−tL , donde b a a a no depende del tiempo y desarrolla la funci´n b(t) en potencias de t. o a

Problema 4.10.4 Prueba que si L es herm´tico, entonces eiL es unitario. ı Problema 4.10.5 Prueba que el producto de dos operadores herm´ticos L y M siempre ı se puede escribir como LM = A + B, donde A es herm´tico y B es antiherm´tico: B + = −B. ı ı

Cap´ ıtulo 5

Resolviendo la ecuaci´n de o Schr¨dinger o
5.1.
5.1.1.

El m´todo de Nikiforov-Uvarov e
La ecuaci´n hipergeom´trica generalizada o e

La ecuaci´n hipergeom´trica generalizada es una ecuaci´n lineal de segundo orden o e o de la forma τ (z) ′ σ(z) u′′ (z) + u (z) + 2 u(z) = 0, (5.1.1) σ(z) σ (z) siendo τ (z) un polinomio de grado a lo m´s uno y σ(z) y σ(z) polinomios de grado a lo a m´s dos. a Hagamos el cambio u(z) = φ(z)y(z), y ′′ (z) + 2 φ′ (z) τ (z) + φ(z) σ(z) y ′ (z) + φ′′ (z) φ′ (z)τ (z) σ(z) + + 2 φ(z) φ(z)σ(z) σ (z) y(z) = 0.

El objetivo del cambio es convertir la ecuaci´n anterior en una m´s sencilla –o por lo o a menos menos complicada– que (5.1.1), as´ que al menos debemos tener ı 2 φ′ (z) τ (z) τ (z) + = , φ(z) σ(z) σ(z) o φ′ (z) τ (z) − τ (z) π(z) = = , φ(z) 2σ(z) σ(z) (5.1.2)

siendo τ un polinomio de grado a lo m´s uno y, por tanto, π polinomio de grado a lo m´s a a uno. Lo anterior transforma nuestra ecuaci´n original (5.1.1) en la siguiente o y ′′ (z) + τ (z) ′ σ(z) y (z) + 2 y(z) = 0, σ(z) σ (z) (5.1.3)

τ (z) = τ (z) + 2π(z), σ(z) = σ(z) + π 2 (z) + π(z)[τ (z) − σ ′ (z)] + π ′ (z)σ(z). 71

72

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

Como σ es un polinomio de grado dos a lo sumo, impongamos que sea proporcional al propio σ, es decir que σ(z) = λσ(z). Ello es posible pues σ tiene dos coeficientes indeterminados –los coeficientes del polinomio π– y λ es una constante a determinar, lo que nos conduce a tres ecuaciones –al igualar los coeficientes de σ y σ– con tres inc´gnitas. o Hecho esto, nuestra ecuaci´n se transforma en la ecuaci´n hipergeom´trica o o e σ(z)y ′′ + τ (z)y ′ + λy = 0. Pasemos a calcular π y λ. Como σ = λσ(z), entonces σ(z) + π 2 (z) + π(z)[τ (z) − σ ′ (z)] + π ′ (z)σ(z) = λσ(z), o, equivalentemente, π 2 (z) + [τ (z) − σ ′ (z)]π(z) + {σ(z) − [λ − π ′ (z)]σ(z)} = 0. Supongamos que k = λ − π ′ (z) es conocido, entonces tenemos una ecuaci´n de segundo o orden para π(z), luego π(z) = σ ′ (z) − τ (z) ± 2 σ ′ (z) − τ (z) 2
2

(5.1.4)

− σ(z) + kσ(z),

(5.1.5)

pero π(z) ha de ser un polinomio de grado a lo sumo uno, por tanto el polinomio Υ(z) = σ ′ (z) − τ (z) 2
2

− σ(z) + kσ(z)

(5.1.6)

ha de ser un cuadrado perfecto, es decir su discriminante debe ser cero, lo que nos conduce a una ecuaci´n para encontrar k. El k encontrado lo sustituimos en (5.1.5) y obtenemos o π(z), el cual nos conduce directamente a λ = π ′ (z) + k. Obviamente el m´todo anterior da distintas soluciones en funci´n del k que escojamos e o y del convenio de signos en (5.1.5).

5.1.2.

La ecuaci´n diferencial hipergeom´trica o e

Como hemos visto en el apartado anterior el estudio de la ecuaci´n (5.1.1) se puede o reducir al de la ecuaci´n hipergeom´trica (5.1.4) por lo que nos centraremos en el estudio o e de ´sta ultima. Aqu´ nos restringiremos a estudiar las soluciones polin´micas de (5.1.4). e ´ ı o Para el caso general remitimos al lector [13]. La propiedad de hipergeometricidad y la f´rmula de Rodrigues o Pasemos a continuaci´n a estudiar la ecuaci´n diferencial o o σ(x)y ′′ + τ (x)y ′ + λy = 0, donde σ y τ son polinomios de grados a lo sumo 2 y 1, respectivamente. La ecuaci´n (5.1.7) usualmente se denomina ecuaci´n diferencial hipergeom´trica. o o e La raz´n fundamental de esta denominaci´n est´ en la denominada propiedad de hipero o a geometricidad que consiste en que las soluciones y de la ecuaci´n (5.1.7) son tales que o (5.1.7)

5.1. El m´todo de Nikiforov-Uvarov e

73

sus m-´simas derivadas y (m) := ym satisfacen una ecuaci´n del mismo tipo. En efecto, si e o derivamos (5.1.7) m veces obtenemos que ym satisface una ecuaci´n de la forma o
′′ ′ σ(x)ym + τm (x)ym + µm ym = 0,

τm (x) = τ (x) + mσ ′ (x),
m−1

(5.1.8) σ ′′ (x) . 2

µm = λ +
i=0

τi′ (x) = λ + mτ ′ (x) + m(m − 1)

Es evidente que grado τm ≤ 1 y que µm es una constante. Adem´s, toda soluci´n de (5.1.8) a o es necesariamente de la forma ym = y (m) siendo y soluci´n de (5.1.7). La demostraci´n o o es por inducci´n y la omitiremos. o Vamos a intentar encontrar las soluciones polin´micas de (5.1.7). Para encontrarlas o comenzaremos escribiendo (5.1.7) y (5.1.8) en su forma sim´trica o autoconjugada e [σ(x)ρ(x)y ′ ]′ + λρ(x)y = 0, ′ [σ(x)ρm (x)ym ]′ + µm ρm (x)ym = 0, (5.1.9)

donde ρ y ρm son funciones de simetrizaci´n que satisfacen las ecuaciones diferenciales o de primer orden (conocidas como ecuaciones de Pearson) [σ(x)ρ(x)]′ = τ (x)ρ(x), [σ(x)ρm (x)]′ = τm (x)ρm (x). (5.1.10)

Si ρ es conocida entonces, utilizando las ecuaciones anteriores, obtenemos para ρm la expresi´n o ρm (x) = σ m (x)ρ(x). (5.1.11) Teorema 5.1.1 Las soluciones polin´micas de la ecuaci´n (5.1.8) se expresan mediante o o la f´rmula de Rodrigues o
(m) Pn (x) = (n) donde Bn = Pn /Ann y

Anm Bn dn−m [ρn (x)], ρm (x) dxn−m

(5.1.12)

Anm = Am (λ)

λ=λn

=

n! (n − m)!

m−1

k=0

[τ ′ + 1 (n + k − 1)σ ′′ ]. 2

(5.1.13)

Adem´s, el autovalor µm de (5.1.8) es a
1 µm = µm (λn ) = −(n − m)[τ ′ + 2 (n + m − 1)σ ′′ ].

(5.1.14)

o Demostraci´n: Para demostrar el teorema vamos a escribir la ecuaci´n autoconjugada o para las derivadas de la siguiente forma ρm (x)ym = − 1 [ρm+1 (x)ym+1 ]′ , µm

74 luego ρm (x)ym =

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

Am dn−m [ρn (x)yn ] , An dxn−m

m−1

Am = (−1)m
k=0

µk ,

A0 = 1.
(n)

Como estamos buscando soluciones polin´micas, y := Pn , tenemos que Pn es una o (m) constante; por tanto, para las derivadas de orden m, Pn , obtenemos la expresi´n o
(m) Pn (x) =

Anm Bn dn−m [ρn (x)], ρm (x) dxn−m
(n)

donde Anm = Am (λ)

λ=λn

(n) y Bn = Pn /Ann . Como Pn

es una constante, de (5.1.8)

obtenemos que µn = 0, luego, usando la expresi´n (5.1.8) o µn = λn + nτ ′ (x) + n(n − 1)σ ′′ (x)/2 = 0, deducimos que el valor de λn en (5.1.7) se expresa mediante la f´rmula1 o λ := λn = −nτ ′ − n(n − 1) ′′ σ . 2 (5.1.15)

Sustituyendo (5.1.15) en (5.1.8) obtenemos el valor de µnm = µm (λn )
1 µnm = µm (λn ) = −(n − m)[τ ′ + 2 (n + m − 1)σ ′′ ],

(5.1.16)

de donde, usando que Anm = Am (λn ) = (−1)m constante Anm .

m−1 k=0

µnk , deducimos el valor de la 2

En la prueba hemos asumido que µnk = 0 para k = 0, 1, . . . , n − 1. De la expresi´n o expl´ ıcita (5.1.16) deducimos que para que ello ocurra es suficiente que τ ′ + nσ ′′ /2 = 0 para todo n = 0, 1, 2, . . . . N´tese que esta condici´n es equivalente a λn = 0 para todo o o ′ n ∈ N. Adem´s, de ella se deduce que τn = 0 para todo n ∈ N. Esta condici´n se conoce a o como condici´n de regularidad o de admisibilidad. N´tese adem´s que µnk = λn − λk , o o a luego µnk = 0 para k = 0, 1, . . . , n − 1 implica que λn = λk si n = k. Cuando m = 0 la f´rmula (5.1.12) se convierte en la conocida f´rmula de Rodrigues o o para los polinomios cl´sicos a Pn (x) = Bn dn n [σ (x)ρ(x)], ρ(x) dxn n = 0, 1, 2, . . .

(5.1.17)

La f´rmula (5.1.15) determina los autovalores λn de (5.1.7) y es conocida como condici´n o o de hipergeometricidad. Ortogonalidad y relaci´n de recurrencia o Veamos ahora c´mo a partir de las ecuaciones diferenciales simetrizadas (5.1.9) poo demos demostrar la ortogonalidad de las soluciones polin´micas respecto a la funci´n o o peso ρ.
1 Usando la expresi´n o Q λn+k (−n)m m−1 (n+k) . k=0

(5.1.15)

podemos

obtener

una

expresi´n o

alternativa

Anm

=

5.1. El m´todo de Nikiforov-Uvarov e Teorema 5.1.2 Supongamos que xk σ(x)ρ(x)
b a

75

= 0,

para todo k ≥ 0.

(5.1.18)

Entonces las soluciones polin´micas Pn de la ecuaci´n (5.1.7) constituyen una sucesi´n o o o de polinomios ortogonales (SPO) respecto a la funci´n peso ρ definida por la ecuaci´n o o [σ(x)ρ(x)]′ = τ (x)ρ(x), o sea, se cumple que
b a

Pn (x)Pm (x)ρ(x)dx = δn,m d2 , n

(5.1.19)

donde δn,m es el s´mbolo de Kronecker y dn denota la norma de los polinomios Pn . ı Demostraci´n: Sean Pn y Pm dos de las soluciones polin´micas de (5.1.7). Partiremos de o o las ecuaciones simetrizadas para Pn y Pm ,
′ [σ(x)ρ(x)Pn (x)]′ + λn ρ(x)Pn (x) = 0, ′ [σ(x)ρ(x)Pm (x)]′ + λm ρ(x)Pm (x) = 0.

Multiplicando la primera por Pm y la segunda por Pn , restando ambas e integrando en [a, b] obtenemos
b

(λn − λm )
b

Pn (x)Pm (x)ρ(x)dx =
a

=
a

′ ′ [σ(x)ρ(x)Pm (x)]′ Pn (x) − [σ(x)ρ(x)Pn (x)]′ Pm (x) dx b a

′ ′ ′ = σ(x)ρ(x)[Pn (x)Pm (x) − Pn (x)Pm (x)]

= σ(x)ρ(x)W [Pn (x), Pm (x)]

b

a

.

Pero el Wronskiano W (Pn , Pm ) es un polinomio en x; por tanto, si imponemos la condici´n (5.1.18) obtendremos (λn = λm ) que los polinomios Pn y Pm son ortogonales o respecto a la funci´n peso ρ. Usualmente los valores de a y b se escogen de forma que ρ o sea positiva en el intervalo [a, b]. Una elecci´n puede ser tomar a y b como las ra´ o ıces de σ(x) = 0, si ´stas existen. e 2 De forma an´loga, utilizando la ecuaci´n (5.1.9) para las derivadas yk := Pn , se a o puede demostrar que las k−´simas derivadas de los polinomios hipergeom´tricos tambi´n e e e son ortogonales, es decir, que
b a (k) (k) Pn (x)Pm (x)ρk (x)dx = δn,m d2 . kn (k)

(5.1.20)

Finalmente, para calcular la norma dn de los polinomios podemos utilizar la f´rmula o de Rodrigues. En efecto, sustituyendo (5.1.17) en (5.1.19) tenemos d2 = Bn n
b

Pn (x)
a

dn n [σ (x)ρ(x)]dx, dxn

76

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger
(n)

de donde integrando por partes y usando que Pn d2 = Bn (−1)n n!an n
b a

= n!an concluimos que (5.1.21)

σ n (x)ρ(x)dx.

Teorema 5.1.3 Los polinomios ortogonales satisfacen una relaci´n de recurrencia a tres o t´rminos de la forma e xPn (x) = αn Pn+1 (x) + βn Pn (x) + γn Pn−1 (x), donde αn = an , an+1 βn = bn bn+1 − , an an+1 γn = cn − αn cn+1 bn an−1 d2 n − βn = , (5.1.23) an−1 an−1 an d2 n−1 (5.1.22)

donde an , bn y cn son los coeficientes del desarrollo Pn (x) = an xn +bn xn−1 +cn xn−2 +· · · , y dn es la norma de los polinomios. Generalmente se impone que P−1 (x) = 0 y P0 (x) = 1, con lo que la sucesi´n de polinomios o ortogonales queda determinada de forma unica conocidas las sucesiones (αn )n , (βn )n y ´ (γn )n . o Demostraci´n: Utilizando que la sucesi´n (Pn )n es una base del espacio de los polinomios, o tenemos que el polinomio xPn (x) de grado n + 1 se puede desarrollar en la base (Pn )n
n+1

xPn (x) =
k=0

cnk Pk (x),

cnk =

b a

Pn (x) [xPk (x)] ρ(x)dx . d2 n

Pero como el grado de xPk (x) es k + 1, entonces cnk = 0 para todo 0 ≤ k < n − 1, de donde se concluye que la SPO satisface una relaci´n (5.1.22). Adem´s, los coeficientes o a αn , βn , y γn se expresan mediante las f´rmulas: o αn = γn = 1 d2 n+1 1 d2 n−1
a a b b

xPn (x)Pn+1 (x)ρ(x)dx, xPn (x)Pn−1 (x)ρ(x)dx.

βn =

1 d2 n

b

xPn (x)Pn (x)ρ(x)dx,
a

(5.1.24)

Para probar (5.1.23) basta sustituir la expresi´n Pn (x) = an xn + bn xn−1 + cn xn−2 + · · · o en (5.1.22) e igualar las potencias xn+1 , xn y xn−1 . Finalmente como xPn−1 = αn−1 Pn + βn−1 Pn−1 + γn−1 Pn−2 , γn = 1 d2 n−1
a b

Pn (x)[xPn−1 (x)]ρ(x)dx =

1 d2 n−1

b

αn−1
a

2 Pn (x)ρ(x)dx,

de donde se sigue el resultado. N´tese que del resultado anterior se deduce que αn = 0 para todo nN ∪ {0} as´ como o ı que γn = para todo ∈ N. Adem´s, si ρ(x) ≥ 0 en (a, b), entonces αn−1 γn > 0 para todo a n ∈ N. Resulta que el rec´ ıproco tambi´n es cierto. e

5.1. El m´todo de Nikiforov-Uvarov e

77

Teorema 5.1.4 Sea (βn )∞ y (γn )∞ dos sucesiones cualesquiera de n´meros reales u n=0 n=0 con γn > 0 para todo n ∈ N y sea (Pn )∞ una sucesi´n de polinomios m´nicos definidos o o n=0 mediante la relaci´n o Pn (x) = (x − βn )Pn (x) − γn Pn (x), n =∈ N, (5.1.25)

donde P−1 = 0 y P0 (x) = 1. Entonces, dichos polinomios Pn son ortonormales para cierta medida positiva sobre la recta real. El teorema anterior se conoce como Teorema de Favard, aunque hab´ sido demostrado ıa antes por O. Perron (1929), A. Wintner (1929) y M. H. Stone (1932), J. Sherman (1935) y I. P. Natanson (1935) indistintamente. Una consecuencia inmediata de la RRTT es el siguiente teorema cuya prueba dejamos como ejercicio al lector Teorema 5.1.5 Si (Pn )n es una sucesi´n de polinomios ortogonales que satisface la o relaci´n de recurrencia a tres t´rminos (5.1.22). Entonces se cumple que o e Kern (x, y) ≡ αn Pn+1 (x)Pn (y) − Pn+1 (y)Pn (x) Pm (x)Pm (y) = 2 , d2 dn x−y m m=0
n

n ≥ 1. (5.1.26)

Si hacemos tender y → x en la f´rmula anterior obtenemos la f´rmula confluente de o o Christoffel-Darboux: Ker(x, x) ≡
n 2 Pm (x) αn ′ ′ = 2 [Pn+1 (x)Pn (x) − Pn+1 (x)Pn (x)] 2 dm dn m=0 n

n ≥ 1.

(5.1.27)

Una propiedad muy importante de los polinomios ortogonales est´ relacionada con a los ceros de los mismos. As´ se tiene el siguiente teorema fundamental cuya demostraci´n ı, o omitiremos (ver e.g. [1]): Teorema 5.1.6 Supongamos que ρ(x) es positiva en el interior del intervalo (a, b). Entonces: 1. Todos los ceros de Pn son reales, simples y est´n localizados en (a, b). a 2. Dos polinomios consecutivos Pn y Pn+1 no pueden tener ning´n cero en com´n. u u 3. Denotemos por xn,j a los ceros del polinomio Pn , (consideraremos en adelante que xn,1 < xn,2 < · · · < xn,n ). Entonces: xn+1,j < xn,j < xn+1,j+1 , es decir, los ceros de Pn y Pn+1 entrelazan unos con otros. Calculemos ahora la relaci´n de recurrencia (5.1.22) a tres que satisfacen los polio nomios cl´sicos. Para calcular los coeficientes usando las expresiones de (5.1.23) tenemos a antes que encontrar una expresi´n general para los coeficientes principales an y bn del o polinomio Pn .

78

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger
(n)

Para calcular an usamos que, por un lado Pn (x) = n!an y por el otro, utilizando (n) la f´rmula de Rodrigues (5.1.12) Pn (x) = Bn Ann , por tanto, o an = Bn Ann = Bn n!
n−1 k=0
1 [τ ′ + 2 (n + k − 1)σ ′′ ].

(5.1.28)

Para calcular bn utilizaremos la f´rmula de Rodrigues para la n − 1-´sima derivada de o e (n−1) Pn : Pn (x) = Ann−1 Bn τn−1 (x), de donde obtenemos la igualdad
(n−1) Pn (x) = n!an x + (n − 1)!bn = Ann−1 Bn τn−1 (x).

Luego, bn = nτn−1 (0) an . ′ τn−1 (5.1.29)

′ Obs´rvese que, al ser τn = 0, bn est´ definido para cualquier n. e a

Usando las expresiones (5.1.23) as´ como (5.1.29) deducimos ı αn = τ ′ + (n − 1) σ2 Bn Bn λn 2n 2n + 1 an = = ′ + (2n − 1) σ′′ )(τ ′ + (2n) σ′′ ) an+1 Bn+1 (τ Bn+1 n λ2n λ2n+1 2 2 βn = nτn−1 (0) (n + 1)τn (0) − . ′ ′ τn−1 τn
′′

Vamos a dar una expresi´n alternativa para γn sin usar la norma de los polinomios. o Para ello igualamos los coeficientes de xn−2 en la ecuaci´n diferencial (5.1.7). Ello nos o conduce a la expresi´n o cn = − (n − 1)[τ (0) + (n − 2)σ ′ (0)]bn + n(n − 1)σ(0)an ′′ (n − 2)[τ ′ + (n − 3) σ2 ] + λn

′ n(n − 1)[τn−2 (0)τn−1 (0) + σ(0)τn−1 ] =− an . ′ τn−1 (λn − λn−2 )

(5.1.30)

Luego nos resta sustituir la expresi´n anterior en la f´rmula2 (5.1.24) o o γn = cn − αn cn+1 bn − βn . an−1 an−1

Consecuencias de la f´rmula de Rodrigues o La primera consecuencia inmediata de la f´rmula de Rodrigues es que τ (x) debe o ser necesariamente un polinomio de grado exactamente uno. En efecto, si calculamos el polinomio de grado 1 utilizando la f´rmula de Rodrigues (5.1.17) obtenemos o P1 (x) =
2 Recordar

B1 [σ(x)ρ(x)]′ = B1 τ (x), ρ(x)

(5.1.31)

que Pn (x) = an xn + bn xn−1 + cn xn−2 + · · · .

5.1. El m´todo de Nikiforov-Uvarov e

79

y por tanto τ es un polinomio de grado exactamente uno. N´tese que esta f´rmula es o o equivalente a la f´rmula de Pearson (5.1.10). o Si escribimos la f´rmula de Rodrigues (5.1.12) para las derivadas3 Pn+m con n = 1 o tenemos P1+m (x) =
(m) (m)

Am+1 m Am+1 m [ρm+1 (x)]′ = [σ(x)ρm (x)]′ = Am+1 m τm (x), ρm (x) ρm (x)
(m)

es decir, τm es de grado exactamente uno (pues los polinomios Pn+m son ortogonales). ′ Por tanto τm = 0 para todos m ∈ N lo cual es la condici´n de regularidad (existencia de o la SPO) que ya mencionamos. Tomemos ahora m = 1 en la f´rmula (5.1.12). Realizando unos c´lculos directos o a deducimos que
′ Pn (x)

=

An1 Bn dn−1 −λn Bn dn−1 [ρn (x)] = [ρ1 (x)]. ρ1 (x) dxn−1 ρ1 (x) dxn−1 n−1
′ Pn (x) =

Luego

−λn Bn ¯ Pn−1 (x), ¯ Bn−1

(5.1.32)

¯ donde Pn−1 denota al polinomio ortogonal respecto a la funci´n peso ρ1 (x) = σ(x)ρ(x). o ′ O sea, si Pn es ortogonal Pn (x) tambi´n lo ser´. e a Si escribimos la f´rmula de Rodrigues (5.1.12) para el polinomio de grado n + 1, o utilizando la ecuaci´n de Pearson [σ(x)ρn (x)]′ = τn (x)ρn (x) vemos que o Pn+1 (x) = Bn+1 dn Bn+1 dn+1 n+1 [σ (x)ρ(x)] = [τn (x)ρn (x)] n+1 ρ(x) dx ρ(x) dxn =
n−1 dn ρn (x) ρn (x) Bn+1 ′ d τn (x) . + nτn n ρ(x) dx dxn−1

′ Utilizando ahora que Pn (x) =

−λn Bn dn−1 ρn (x) , obtenemos la f´rmula de diferenciao σ(x)ρ(x) dxn−1 ci´n, com´ nmente denominada caracterizaci´n de Al-Salam & Chihara, o u o
′ σ(x)Pn (x) =

λn Bn τn (x)Pn (x) − Pn+1 (x) , ′ nτn Bn+1

(5.1.33)

o, equivalentemente, λn λ2n I − σ(x)D Pn (x) = αn Pn+1 (x). ′ nτn 2n Sustituyendo (5.1.22) en (5.1.34) obtenemos − λ2n λ2n λn + (x − βn I + σ(x)D Pn (x) = γn Pn−1 (x). ′ nτn 2n 2n
(m) (m)

(5.1.34)

(5.1.35)

3 Hemos usado P pues estos son polinomios de grado exactamente n en x mientras n+m en vez de Pn que los ultimos no. Obviamente ellos tambi´n son soluci´n de la ecuaci´n (5.1.8) y satisfacen la f´rmula ´ e o o o de Rodrigues (5.1.12) cambiando n por n + m.

80

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

Si ahora en la f´rmula (5.1.33) desarrollamos τn y utilizamos la relaci´n de recuo o rrencia (5.1.22) para descomponer los sumandos de la forma xPn obtenemos el siguiente teorema Teorema 5.1.7 Los polinomios ortogonales Pn (x), soluciones de la ecuaci´n (5.1.7), o satisfacen la siguiente relaci´n de estructura o
′ σ(x)Pn (x) = αn Pn+1 (x) + βn Pn (x) + γn Pn−1 (x),

n ≥ 0, λn γn = 0. n

(5.1.36)

donde αn = Bn λn ′ αn τn − , ′ nτn Bn+1 βn = λn ′ [βn τn + τn (0)] , ′ nτn γn = (5.1.37)

Las expresiones (5.1.37) anteriores para los coeficientes de la relaci´n de estructura o pueden reescribirse usando las f´rmulas expl´ o ıcitas para los coeficientes de la relaci´n de o recurrencia de la siguiente forma αn = n σ ′′ αn , 2 βn = λn [τ (0)σ ′′ ′ τ′ τn n−1 − τ ′ σ ′ (0)] = λn τ (β ), ′ n n nτn γn = λn γn . n (5.1.38)

Finalmente enunciaremos un teorema de gran importancia en lo que sigue. Teorema 5.1.8 Los polinomios de tipo hipergeom´tricos (cl´sicos) pn (x) son las unicas e a ´ soluciones de la ecuaci´n hipergeom´trica σ(z)y ′′ +τ (z)y ′ +λy = 0, tales que las funciones o e ψn (x) = ρ(x)pn (x), donde ρ(x) es la funci´n peso con respecto a la cual los pn son o ortogonales, son acotadas y de cuadrado integrable en (a, b), siendo (a, b) el soporte de la funci´n peso. o Nota 5.1.9 Si queremos que la funci´n peso sea positiva e integrable en el interior del o intervalo de ortogonalidad y suponemos que σ(x) > 0 en dicho intervalo se puede comprobar que el polinomio τ ha de cumplir dos propiedades importantes: 1. En primer lugar la derivada de τ ha de ser negativa. Esto es particularmente importante en los casos cuando σ = 1 y σ = x, que corresponden a intervalos de ortogonalidad no acotados —v´ase el pr´ximo apartado—, e o 2. τ ha de anularse en el interior del intervalo de ortogonalidad. Ello es consecuencia de (5.1.31) y del teorema 5.1.6 que asegura que P1 ha de anularse en el interior del intervalo de ortogonalidad.

5.1.3.

Los polinomios de Hermite, Laguerre y Jacobi

Par´metros principales a Comenzaremos escribiendo los principales par´metros de las sucesiones de polinoa mios ortogonales m´nicos cl´sicos (SPOMC). Como ya hemos visto los polinomios ortoo a gonales en la recta real, soluci´n de una ecuaci´n del tipo (5.1.7), se pueden clasificar en o o tres grandes familias en funci´n del grado del polinomio σ (τ siempre es un polinomio o

5.1. El m´todo de Nikiforov-Uvarov e

81

de grado 1). Cuando σ es un polinomio de grado cero los polinomios correspondientes se denominan polinomios de Hermite Hn (x), cuando σ es de grado 1, polinomios de Lagueα,β rre Lα (x) y cuando σ es de grado 2 con dos ra´ simples, polinomios de Jacobi Pn (x), ıces n respectivamente. En las tablas 5.1 y 5.2 est´n representados los principales par´metros a a de dichas familias, en las cuales (a)n denota al s´ ımbolo s´ ımbolo de Pochhammer (a)0 = 1, (a)k = a(a + 1) · · · (a + k − 1), k = 1, 2, 3, ... . Para los polinomios σ se han escogido las llamadas formas can´nicas. o Cuadro 5.1: Clasificaci´n de las SPO Cl´sicas. o a Pn (x) σ(x) τ (x) λn ρ(x) Hn (x) 1 −2x 2n e−x
2

(5.1.39)

Lα (x) n x −x + α + 1 n xα e−x α > −1

α,β Pn (x)

1 − x2 −(α + β + 2)x + β − α n(n + α + β + 1) (1 − x)α (1 + x)β α, β > −1 (1 − x)n+α (1 + x)n+β

ρn (x)

e−x

2

xn+α e−x

Representaci´n hipergeom´trica o e De la f´rmula de Rodrigues4 (5.1.12) se puede obtener la representaci´n de los poo o linomios de Hermite, Laguerre y Jacobi en t´rminos de la funci´n hipergeom´trica de e o e Gauss 2 F1 definida en el caso m´s general de forma a
p Fq

a1 , a2 , . . . , ap x b1 , b2 , . . . , bq

=

∞ k=0

(a1 )k (a2 )k · · · (ap )k xk . (b1 )k (b2 )k · · · (bq )k k!

(5.1.40)

4 Para (n) e Pn ello basta usar la regla de Leibnitz para calcular la n-´sima derivada de un producto (f · g) e = p t nkf (k) · g (n−k) . Otra posibilidad es usar series de potencias y el m´todo de coeficientes k=0 indeterminados de Euler (ver e.g. [4, 18]).

De esta manera encontramos que  −m 2  (−1)m 1  n = 2m x , 1 F1  1  2 m 2 Hn (x) =   −m 2  (−1)m 3  x 1 F1 x , n = 2m + 1 3 2 m 2

(5.1.41)

82

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

Cuadro 5.2: Par´metros de las SPO M´nicas (an = 1). a o
Pn (x) Bn Hn (x) (−1)n 2n 0
√ n! π 2n

Lα (x) n (−1)n

α,β Pn (x)

(−1)n (n + α + β + 1)n n(α − β) 2n + α + β
2α+β+2n+1 n!Γ(n+α+1)Γ(n+β+1) Γ(n+α+β+1)(2n+α+β+1)(n+α+β+1)2 n

bn d2 n αn βn γn αn e e βn γn e

−n(n + α) Γ(n + α + 1)n! 1 2n + α + 1 n(n + α) 0 n n(n + α)

1 0
n 2

1
β −α2 (2n+α+β)(2n+2+α+β) 4n(n+α)(n+β)(n+α+β) (2n+α+β−1)(2n+α+β)2 (2n+α+β+1)
2

0 0 n

−n 2(α − β)n(n + α + β + 1) (2n + α + β)(2n + 2 + α + β) 4n(n + α)(n + β)(n + α + β)(n + α + β + 1) (2n + α + β − 1)(2n + α + β)2 (2n + α + β + 1)

Lα (x) n
α,β Pn (x)

=

(−1)n Γ(n + α + 1) 1 F1 Γ(α + 1)

−n x , α+1

(5.1.42)

=

2n (α + 1)n 2 F1 (n + α + β + 1)n

−n, n + α + β + 1 1 − x . α+1 2

(5.1.43)

Como consecuencia de las f´rmulas anteriores podemos obtener los valores de los polinoo mios en los extremos del intervalo de ortogonalidad. Estos valores pueden ser obtenidos tambi´n a partir de la f´rmula de Rodrigues (5.1.12) aplicando la regla de Leibniz para e o calcular la n-´sima derivada de un producto de funciones. e  m  (−1) (2m)! , n = 2m  22m m! Hn (0) =   0, n = 2m + 1
α,β Pn (1) =

,

Lα (0) = n

(−1)n Γ(n + α + 1) , Γ(α + 1)

2n (α + 1)n , (n + α + β + 1)n

α,β Pn (−1) =

(−1)n 2n (β + 1)n . (n + α + β + 1)n (5.1.44)

Casos particulares
0,0 1. Los polinomios de Legendre Pn (x) = Pn (x).

´ ´ ¨ 5.2. Resolucion de la ecuacion de Schrodinger 2. Los polinomios de Chebyshev de primera especie Tn (x) Tn (x) = Pn
1 − 2 ,− 1 2

83

(x) =

1 cos[n arc cos(x)]. 2n−1

3. Los polinomios de Chebyshev de segunda especie Un (x)
2 Un (x) = Pn 2 (x) = 1 1

,

1 sen[(n + 1) arc cos(x)] . 2n sen[arc cos(x)]
1 1 λ− 2 ,λ− 2 1 (x), λ > − 2 .

4. Los polinomios de Gegenbauer Gλ (x) = Pn n

Utilizando la f´rmula (5.1.32) se obtienen las ecuaciones (ν = 1, 2, 3, ..., n = 0, 1, 2, ...): o (Hn (x))(ν) = (Lα (x))(ν) = n
α,β (Pn (x))(ν) =

n! Hn−ν (x), (n − ν)! n! Lα+ν (x), (n − ν)! n−ν

(5.1.45) (5.1.46) (5.1.47)

donde (Pn (x))(ν) denota la ν−´sima derivada de Pn (x). e

n! P α+ν,β+ν (x), (n − ν)! n−ν

5.2.

Resoluci´n de la ecuaci´n de Schr¨dinger o o o

Veamos ahora algunos ejemplos sencillos de c´mo se usa el m´todo de Nikiforov y o e Uvarov para resolver algunas ecuaciones de la Mec´nica cu´ntica. a a

5.2.1.

El oscilador arm´nico cu´ntico unidimensional o a

Como ejemplo apliquemos la t´cnica anterior al caso del oscilador arm´nico cu´ntico. e o a Partimos de la ecuaci´n de Schr¨dinger para el oscilador arm´nico o o o 1 Ψ′′ (x) + mω 2 x2 Ψ(x) = EΨ(x), x ∈ R. 2m 2 /(mω), E = ωε/2, se transforma en la ecuaci´n o Haciendo el cambio x = x0 ξ, x0 = − Ψ′′ (ξ) + (ε − ξ 2 )Ψ(ξ) = 0, que obviamente es del tipo (5.1.1) con τ (ξ) = 0, σ(ξ) = 1 y σ(ξ) = ε − ξ 2 . Para π(ξ), (5.1.5) nos da π(ξ) = ± ξ 2 + (k − ε).
2

Como el polinomio ξ 2 + (k − ε) ha de ser un cuadrado perfecto, entonces k = ε y, por tanto, π(ξ) = ±ξ, luego π(ξ) = ξ, π(ξ) = −ξ, π ′ (ξ) = 1, π ′ (ξ) = −1, λ = ε + 1, λ = ε − 1, τ (ξ) = 2ξ, τ (ξ) = −2ξ,

84

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

que nos conducen a las ecuaciones y ′′ (ξ) + 2ξy ′ (ξ) + (ε + 1)y(ξ) = 0, y ′′ (ξ) − 2ξy ′ (ξ) + (ε − 1)y(ξ) = 0,

respectivamente. En cada caso la funci´n φ(ξ) es la soluci´n de las ecuaciones φ′ /φ = ξ o o y φ′ /φ = −ξ, que conducen a las funciones φ(ξ) = eξ
2

/2

,

y

φ(ξ) = e−ξ

2

/2

,

respectivamente. Finalmente, la ecuaci´n y ′′ (ξ) − 2ξy ′ (ξ) + (ε − 1)y(ξ) = 0 corresponde a o la ecuaci´n hipergeom´trica de los polinomios de Hermite, por tanto tenemos ε − 1 = 2n, o e n = 0, 1, 2, . . . y las soluciones normalizadas de nuestra ecuaci´n original ser´n o a Ψ(ξ) = Nn e−ξ
∞ −∞
2

/2

Hn (ξ),
∞ −∞

ε = 2n + 1,

n = 0, 1, 2, . . . . √ πn! . = 2n

(5.2.1)

Para calcular Nn notamos que Ψ(ξ)Ψ(ξ)dξ =
2 Nn
2 2 Hn (ξ)e−ξ

dξ =

2 Nn d2 , n

d2 n

Entonces de la condici´n de normalizaci´n o o 1= 2n √ , x0 = x0 πn!
∞ −∞

|Ψ(x)|2 dx = x0 /(mω).

∞ −∞

Ψ(ξ)Ψ(ξ)dξ,

luego Nn =

Es f´cil ver que la otra ecuaci´n tiene como soluciones los polinomios Hn (−ξ), por a o ξ 2 /2 lo que sus soluciones Ψ(ξ) = e Hn (−ξ) no son de cuadrado integrable en R, y por tanto no tienen sentido f´ ısico (esto se pod´ predecir si tenemos en cuenta la nota 5.1.9 ıa del apartado anterior). De esta forma las unicas soluciones estacionarias del oscilador ´ arm´nico son las funciones (5.2.1) anteriores. o As´ pues, a diferencia del oscilador cl´sico, el oscilador cu´ntico tiene una energ´ ı a a ıa discreta definida por la expresi´n En = ω(n + 1/2), n = 0, 1, 2, . . . correspondiente al o estado Ψ(x) = 2n −1 √ e 2 x0 πn!

x x0

”2

Hn

x x0

,

n = 0, 1, 2, . . . ,

x0 =

/(mω).

Finalmente, mencionemos que las autofunciones del oscilador definen una base ortogonal completa en el espacio de las funciones de cuadrado integrable y por tanto las podemos usar para desarrollar en la misma cualquier funci´n de este espacio. o

5.2.2.

La ecuaci´n de Schr¨dinger en un potencial central o o

Partiremos de la ecuaci´n de Schr¨dinger estacionaria para el ´tomo de hidr´geno o o a o en coordenadas esf´ricas5 e
2

2m

∆Ψ(r, θ, φ) + V (r)Ψ(r, θ, φ) = EΨ(r, θ, φ),

(5.2.2)

5 Al ser el potencial de interacci´n V (r) un potencial central, i.e., s´lo depende del radio, es m´s o o a sencillo resolver la ecuaci´n en coordenadas esf´ricas r, θ, φ. o e

´ ´ ¨ 5.2. Resolucion de la ecuacion de Schrodinger |Ψ0 |2
0,5 0,4 0,3 0,2 0,1 −6 −4 −2 2 4 6

85 |Ψ1 |2
0,5 0,4 0,3 0,2 0,1

x

|Ψ2 |
0,5 0,4 0,3 0,2 0,1

2

−6

−4

−2

2

4

6

x

|Ψ10 |
0,5 0,4 0,3 0,2 0,1

2

−6

−4

−2

2

4

6

x

−6

−4

−2

2

4

6

x

Figura 5.1: Estado fundamental Ψ0 y excitados Ψn , n = 1, 2 y 10 del oscilador arm´nico. o

donde m es la masa del electr´n (que se supone despreciable respecto a la masa del o n´ cleo), φ ∈ [0, 2π), θ ∈ [0, π], y el laplaciano en coordenadas esf´ricas tiene la forma u e ∆= o bien ∆ = ∆r + donde ∆r = 1 ∂ r2 ∂r r2 ∂ ∂r + 1 r2 1 ∂ sen θ ∂θ sen θ ∂ ∂θ + 1 ∂2 2 θ ∂φ2 sen , (5.2.3)

1 ∆ , r2 ∢ + 1 ∂2 2 θ ∂φ2 sen

1 ∂ ∂ 1 ∂ ∂ r2 , ∆∢ = sen θ r2 ∂r ∂r sen θ ∂θ ∂θ denotan a los laplacianos radial y angular respectivamente.

Por simplicidad vamos a reescribir la ecuaci´n anterior en la forma o ∆r + 1 ∆ Ψ(r, θ, φ) + [ε − v(r)]Ψ(r, θ, φ) = 0, r2 ∢ (5.2.4)

donde v(r) = 2m/ 2 V (r) y ε = −2m/ 2 E.

Separando las variables Ψ(r, θ, φ) = F (r)Y (θ, φ) obtenemos las ecuaciones (5.2.5)

∆∢ Y (θ, φ) + µY (θ, φ) = 0, µ ∆r F (r) + ε − v(r) − 2 F (r) = 0, r donde µ es cierta constante a determinar. N´tese adem´s que la condici´n de normalizaci´n o a o o
∞ 0 0 2π 0 π

|Ψ(r, θ, φ)|2 r2 sen θdθdφdr = 1,

86 se transforma en
2π 0 0 π

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

|Y (θ, φ)|2 sen θdθdφ = 1

y
0

|F (r)|2 r2 dr = 1.

(5.2.6)

5.2.3.

Los arm´nicos esf´ricos o e

Comencemos por la primera de las dos ecuaciones anteriores. Separando variables Y (θ, φ) = Θ(θ)Φ(φ) obtenemos las siguientes dos ecuaciones Φ′′ (φ) + νΦ(φ) = 0, sen θ ∂ ∂θ sen θ ∂Θ(θ) ∂θ + [µ sen2 θ − ν]Θ(θ) = 0, (5.2.7)

donde ν es cierta constante. Asumamos que la funci´n Φ es univalente, entonces, de la condici´n de periodicidad o o Φ(φ + 2π) = Φ(φ) se sigue que ν = m2 , m ∈ Z. Luego Φm (φ) = Cm eimφ , N´tese que las funciones Φm (φ) son ortogonales o

m ∈ Z.

Φm (φ)Φm′ (φ)dφ = Ξn δmm′ ,
0

√ 2 con Ξn = 2πCm . Si queremos que sean normalizadas a la unidad entonces Cm = 1/ 2π. As´ tenemos las soluciones ı 1 Φm (φ) = √ eimφ , 2π m ∈ Z. (5.2.8)

La segunda ecuaci´n en (5.2.7) se transforma entonces en o sen θ ∂ ∂θ sen θ ∂Θ(θ) ∂θ + [µ sen2 θ − m2 ]Θ(θ) = 0,

Haciendo el cambio x = cos θ obtenemos6 (1 − x2 ) o, equivalentemente, d dx (1 − x2 ) Θ′′ (x) −
6 N´tese o

d dx

(1 − x2 )

∂Θ(x) ∂x

+ [µ(1 − x2 ) − m2 ]Θ(x) = 0,

(5.2.9)

∂Θ(x) ∂x

+ µ−

m2 Θ(x) = 0 1 − x2

=⇒

µ(1 − x2 ) − m2 2x Θ′ (x) + Θ(x) = 0. 1 − x2 (1 − x2 )2

que si x = cos θ, entonces d/dθ = dx/dθ · d/dx = − sen θd/dx, y sen θ =

1 − x2 .

´ ´ ¨ 5.2. Resolucion de la ecuacion de Schrodinger Esta ecuaci´n del tipo (5.1.1) con o τ (x) = −2x, luego el polinomio (5.1.6) Υ(x) = (µ − k)x2 + (k − µ) + m2 es un cuadrado perfecto si: 1. k = µ =⇒ π(x) = ±m =⇒ =⇒ τ (x) = −2(x ∓ m), m = 0, 1, 2, . . . , =⇒ σ(x) = µ(1 − x2 ) − m2 , σ = 1 − x2 ,

87

2. k = µ − m2

π(x) = ±mx

τ (x) = −2(∓m + 1)x, m = 0, 1, 2, . . . .

Si ahora tenemos en cuenta la nota 5.1.9 tenemos que de las cuatro opciones debemos escoger τ (x) = −2(m + 1)x correspondiente a π(x) = −mx, k = µ − m2 , λ = k + π ′ = µ − m(m + 1). Para calcular7 φ usamos (5.1.2) que nos da mx φ′ =− φ 1 − x2 =⇒ φ(x) = (1 − x2 )m/2 .

La ecuaci´n de tipo hipergeom´trico que obtenemos es, por tanto, o e (1 − x2 )y ′′ − 2(m + 1)xy ′ + λy = 0, que tiene soluciones polin´micas seg´ n (5.1.15) cuando λ = n(2m + n + 1), luego o u µ = (m + n)(n + m + 1), n, m = 0, 1, 2, . . . .

En adelante definiremos l = m + n, l = 0, 1, 2, . . . . Entonces, n = l − m ≥ 0, y por tanto8
m,m y(x) = Pl−m (x), m,m donde Pl−m son los correspondientes polinomios de Jacobi. As´ para m ≥ 0 la soluci´n ı. o de (5.2.9) tiene la forma m,m Θl m (x) = Clm (1 − x2 )m/2 Pl−m (x).

N´tese que o
1 1

Θl m (x)Θl′ m (x)dx = Clm Cl′ m
−1 −1

m,m Pl−m (x)Plm,m (x)(1 − x2 )m dx = 0, ′ −m

l = l′ ,

adem´s, si l = l′ , y haciendo n = l − m a
1 −1

[Θl m (x)]2 dx =

1 −1

m,m [Pn (x)]2 (1 − x2 )m dx =

22l+1 (l − m)!(l + m)!(l!)2 , (2l + 1)!(2l)!

7 No confundir la funci´n φ(x) con el angulo φ en coordenadas esf´ricas. Abusando de la paciencia del o ´ e lector y para no introducir otra notaci´n diferente hemos optado por mantener la notaci´n original de o o [13]. 8 N´tese que l ≥ m ≥ 0. Es decir, si fijamos l, entonces m = 0, 1, 2, . . . l. o

88

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

luego si queremos que Θl m (x) sean ortonormales, es decir que se cumpla la segunda condici´n de (5.2.6) basta definir o Clm = As´ ı Θl m (x) = (2l)! l! 2l + 1 m,m (1 − x2 )m/2 Pl−m (x), 22l+1 (l − m)!(l + m)! l ≥ 0, m = 0, 1, . . . l. (5.2.10) (2l)! l! 2l + 1 . − m)!(l + m)!

22l+1 (l

S´lo nos queda pendiente analizar qu´ ocurre si m < 0 (ver (5.2.8)). Para ello o e (m,m) escribiremos (5.2.10) usando la expresi´n anal´ o ıtica de Pl−m (x) mediante la f´rmula de o Rodrigues (5.1.17) Θl m (x) = (−1)l−m l! dl−m (2l + 1)(l + m)! (1 − x2 )−m/2 l−m [(1 − x2 )l ] 2l+1 (l − m)! 2 d x (5.2.11)

Si ahora usamos la ecuaci´n (5.1.47) tenemos o
m,m Pl−m (x) =

(l − m)! dm Pl (x), l! dm x

donde Pl (x) son los polinomios de Legendre de grado l, expresados anal´ ıticamente mediante la f´rmula de Rodrigues o Pl (x) = (−1)l l! dl [(1 − x2 )l ] (2l)! dl x

Combinado las dos expresiones anteriores con (5.2.10) tenemos otra representaci´n de o las funciones Θl m (x) Θl m (x) = (−1)l l! dl+m (2l + 1)(l − m)! (1 − x2 )m/2 l+m [(1 − x2 )l ]. 2l+1 (l + m)! 2 d x (5.2.12)

Comparando (5.2.11) y (5.2.12) se deduce que Θl −m (x) = (−1)m Θl m (x), m = 0, 1, 2, . . . , l.

La expresi´n anterior permite definir la funci´n Θl m (x) para m < 0. As´ para µ = l(l+1), o o ı, l = 0, 1, 2, . . . y m = −l, −l + 1, . . . , l, tenemos que las funciones Y (θ, φ) := Yl m (θ, φ) se define por la expresi´n o 1 Yl m (θ, φ) = √ eimφ Θl m (cos θ), 2π l = 0, 1, 2, . . . , m = −l, −l + 1, . . . , l. (5.2.13)

Estas funciones se denominan arm´nicos esf´ricos. o e

´ ´ ¨ 5.2. Resolucion de la ecuacion de Schrodinger

89

5.2.4.

Resolviendo la parte radial de la ecuaci´n de Schr¨dinger o o

De los resultados del apartado anterior se sigue que (5.2.5) se transforma en ∆r F (r) + ε − v(r) − l(l + 1) F (r) = 0. r2

Para resolver esta ecuaci´n hacemos el cambio9 F (r) = R(r)/r que nos conduce a la o ecuaci´n o l(l + 1) R(r) = 0, (5.2.14) R′′ (r) + ε − v(r) − r2 donde ahora la primera de las condiciones de contorno (5.2.6) se transforma en
∞ 0

|R(r)|2 dr = 1.

La ecuaci´n (5.2.14) ser´ nuestro punto de partida para resolver dos casos de exo a trema importancia en las aplicaciones: el ´tomo de hidr´geno y el oscilador arm´nico a o o tridimensional. El ´tomo de hidr´geno a o Puesto que para el ´tomo de hidr´geno V (r) = −α/r, (5.2.14) tiene la forma a o R′′ (r) + 2m
2

E+

l(l + 1) α − R(r) = 0. r r2
2

Haciendo el cambio ζ = r/a0 , donde a0 = en la ecuaci´n adimensional o R′′ (ζ) + 2 ε + Esta ecuaci´n es del tipo (5.1.1) con o σ(ζ) = ζ, Por tanto, tenemos π(ζ) = 1 ± 2 1 ζ

/(mα), la ecuaci´n anterior se transforma o l(l + 1) R(ζ) = 0. ζ2

σ(ζ) = 2εζ 2 + 2ζ − l(l + 1),

τ (ζ) = 0.

1 − 2εζ 2 − 2r + l(l + 1) + kζ. 4

Como Υ(ζ) = 1/4 − 2εζ 2 −√ + l(l + 1) + kζ a de ser un cuadrado perfecto (en la variable 2r ζ), tenemos que k = 2 ± −2ε(2l + 1), luego para π(ζ) tenemos las siguientes cuatro opciones π(ζ) =
9 La

1 1 √ + −2εζ ± l + 2 2
1 ∂ r 2 ∂r

,
” =

π(ζ) =

1 1 √ − −2εζ ± l + 2 2

.

raz´n fundamental es que o

r2

∂F (r) ∂r

1 ∂2 [rF (r)]. r ∂r 2

90

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

Como τ (ζ) = 2π(ζ), tenemos, usando la nota 5.1.9 que τ ′ < 0, luego π ′ < 0 de donde eliminamos las dos primeras. De las dos posibilidades restantes para el polinomio π(ζ) seleccionamos, siguiendo nuevamente la nota 5.1.9, la que conduce a una funci´n τ que o se anule para alg´ n ζ > 0, es decir u √ π(ζ) = − −2εζ + (l + 1) . √ Dicha soluci´n corresponde a k = 2 − −2ε(2l + 1), luego —la otra posibilidad, como se o puede comprobar, conduce a una funci´n no integrable en (0, +∞)— o √ √ τ (ζ) = 2(l + 1 − −2εζ) ⇒ λ = k + π ′ (ζ) = 2(1 − (l + 1) −2ε). Usando (5.1.2) tenemos √ φ′ (ζ) l + 1 − −2εζ = φ(ζ) ζ =⇒ φ(ζ) = ζ l+1 e−
√ −2εζ √

.

Entonces la soluci´n de nuestra ecuaci´n es del tipo R(ζ) = ζ l+1 e− −2εζ y(ζ), siendo y o o la soluci´n de la ecuaci´n o o √ ζy ′′ (ζ) + [2(l + 1) − −2εζ]y ′ (ζ) + λy(ζ) = 0. √ El cambio lineal x = 2 −2εζ nos transforma la ecuaci´n anterior en la ecuaci´n o o xy ′′ (x) + [(2l + 1) + 1 − x]y ′ (x) + λy(x) = 0, λ , λ= √ 2 −2ε

que corresponde a los polinomios de Laguerre L2l+1 (x). Adem´s, como λ = n, entonces a n √ λ = 2n −2ε. Por otro lado, λ = k + π ′ (ζ), luego ε := εn,l = − 1 , 2(n + l + 1)2 n, l = 0, 1, 2, . . .

As´ fijados n y l, n, l = 0, 1, 2, . . . la soluci´n es ı, o Rn l (ζ) = Nn,l xl+1 e−x/2 L2l+1 (x), n con Nn,l tal que
∞ 0 2 Rn l (r)dr = 1

x=2

−2εn,l ζ,
∞ 0

=⇒

a0
0

2 Rn l (ζ)dζ = 1

=⇒

a0 (n + l + 1) 2

2 Rn l (x)dx = 1.

Ahora bien,
∞ 0 2 2 Rn l (x)dx = Nn,l ∞ 0 2 x2l+2 e−x (L2l+1 (x))2 dx = Nn,l n ∞ 0

ρ(x)x(L2l+1 (x))2 dx n

2 2 = Nn,l βn d2 = Nn,l 2(n + l + 1)n!(n + 2l + 2)!, n

donde hemos usado la relaci´n de recurrencia (5.1.22) para el producto x L2l+1 (x) y luego o n la ortogonalidad. Por tanto Nn,l = 1 . a0 (n + l + 1)2 n!(n + 2l + 1)!

´ ´ ¨ 5.2. Resolucion de la ecuacion de Schrodinger
|Rn,l |2
0,5 0,4 0,3 0,2 0,1

91

|R0,0 |2

5

10

15

20

25

x

|Rn,l |2
0,5 0,4 0,3 0,2 0,1 10 20 30 40 50

|R1,0 |2 |R1,1 |2 |R1,2 |2

x

Figura 5.2: Estado fundamental (arriba) y excitados n = 1, l = 0, 1, 2 (abajo) del ´tomo a de Hidr´geno. o

N´tese que la energ´ E de la ecuaci´n (5.2.2) es por tanto o ıa o En,l = − 1 mα2 1 mα2 = − 2 ′2 , 2 2 (n + l + 1)2 2 n n′ = 1, 2, 3, . . .

que, teniendo en cuenta que α = e2 , nos conduce a la misma expresi´n10 de Bohr (2.3.1) o Finalmente notemos que las autofinciones correspondientes a las energ´ anteriores son ıas 2 a0 (n + l + 1)2 a0 =
2

Ψn,l,m (r, θ, φ) =

1 xl e−x/2 L2l+1 (x)Yl m (θ, φ), n a0 n!(n + 2l + 1)! /(mα).

n, l = 0, 1, 2, . . .

donde x =

2r a0 (n+l+1) ,

10 En nuestra f´rmula n no representa al n´ mero cu´ntico principal. Este corresponder´ al valor o u a ıa n′ = n + l + 1.

92

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

5.2.5.

El oscilador arm´nico tridimensional o

1 ı Para el oscilador arm´nico tridimensional V (r) = 2 mω 2 r2 , as´ que (5.2.14) se cono vierte en 2m 1 l(l + 1) R′′ (r) + E − mω 2 r2 − R(r) = 0. 2 2 r2

Haciendo el cambio ζ = r/r0 , donde r0 = se transforma en la ecuaci´n adimensional o R′′ (ζ) + ε − ζ 2 −

/(mω), y E = ( ω/2)ε la ecuaci´n anterior o l(l + 1) R(ζ) = 0. ζ2

Para convertir esta ecuaci´n en una del tipo (5.1.1) hacemos el cambio z = ζ 2 , as´ teno ı dremos 1 εz − z 2 − l(l + 1) R′′ (z) + R′ (z) + R(ζ) = 0. 2z 4ζ 2 donde tendremos σ(z) = 2z, Por tanto, tenemos π(z) = 1 ± 2 Υ(z), Υ(z) = z 2 + (2k − ε)z + l + 1 2
2

σ(z) = εz − z 2 − l(l + 1),

τ (ζ) = 1.

,
1 2

y para que este sea un cuadrado perfecto en z, k debe tomar los valores k = ε/2± l + luego para π(z) tenemos las siguientes dos opciones π(z) = ±z + l + 1.

,

Como τ (z) = 1 + 2π(z), tenemos, usando la nota 5.1.9 que τ ′ < 0, luego π ′ < 0 de donde deducimos que π(z) = −z + l + 1, que corresponde a k = ε/2 − l +
1 2

, luego ⇒

τ (z) = −2z + 2l + 3 Usando (5.1.2) tenemos φ′ (z) −z + l + 1 = φ(z) 2z

λ = k + π ′ (z) =

3 ε −l− . 2 2

=⇒

φ(z) = z (l+1)/2 e−z/2 .

Entonces la soluci´n de nuestra ecuaci´n es del tipo R(z) = z (l+1)/2 e−z/2 y(z), siendo y o o la soluci´n de la ecuaci´n o o zy ′′ (z) + [−z + l + 3/2]y ′(z) + que corresponde a los polinomios de Laguerre Ln 3 ε λ = k + π ′ (z) = 2 − l − 2 , luego ε := εn,l = 2 2n + l + 3 2 , λ y(z) = 0. 2 (z). Adem´s, como λ/2 = n, y a

l+1/2

n, l = 0, 1, 2, . . .

´ ´ ¨ 5.2. Resolucion de la ecuacion de Schrodinger As´ fijados n y l, la parte radial es Fn l (r) = Rn l (r)/r donde ı, Rn l (z) = Nn,l z (l+1)/2 e−z/2 Ll+1/2 (z), n con Nn,l tal que
|Rn,l |2
0,8 0,6 0,4 0,2

93

z = ζ2 =

r r0

2

,

|R0,0 |2 |R1,0 |2 |R2,0 |2

1

2

3

4

5

x

|Rn,l |2
0,8 0,6 0,4 0,2

|R0,2 |2 |R1,2 |2 |R2,2 |2

1

2

3

4

5

x

Figura 5.3: Estado con l = 0, n = 0, 1, 2 (arriba) y l = 2, n = 0, 1, 2 (abajo) del oscilador cu´ntico tridimensional. a

∞ 0

2 Rn l (r)dr = 1

=⇒

r0
0

2 Rn l (ζ)dζ = 1,

pero
∞ 0 2 2 Rn l (ζ)dζ = Nn,l ∞ 0 2 Nn,l R(z)2 dz = 2z 2 ∞ 0

z l+1/2 e−z (Ll+1/2 (z))2 dz = n
l+1/2

2 Nn,l

2

,

donde d2 es el cuadrado de la norma de los polinomios de Laguerre Ln n n!Γ(n + l + 3/2). Luego 2 . Nn,l = r0 n!Γ(n + l + 3/2)

, i.e., d2 = n

94

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

5.3.
5.3.1.

El m´todo de factorizaci´n de Schr¨dinger e o o
Introducci´n o

El objetivo de este apartado es estudiar un m´todo sencillo que permite resolver e ecuaciones diferenciales de Sturm-Liuville. El m´todo debe su “popularidad” fundamene talmente a Schr¨dinger que lo us´ para resolver la ecuaci´n de Schr¨dinger para muchos o o o o sistemas f´ ısicos reales. Actualmente el m´todo se le conoce como m´todo de factorizaci´n de Infeld y Hull e e o debido al estudio detallado que estos autores hicieron en [10].

5.3.2.

El oscilador arm´nico o

Sea la ecuaci´n de Schr¨dinger para el oscilador arm´nico o o o HΨλ (x) := −Ψ′′ (x) + x2 Ψλ (x) = λΨλ (x), λ que escribiremos convenientemente en la forma −(D2 − x2 I)Ψλ (x) = λΨλ (x), e I es el operador identidad. Si operamos “formalmente”podemos sustituir x2 − D2 por la correspondiente diferencia de cuadrados (x − D)(x + D) o (x + D)(x − D). En la pr´ctica esto no es del a todo cierto pues x2 − D2 es un operador y obviamente no tiene por que tener lugar las expresiones anteriores como de hecho ocurre. No obstante (x − D)(x + D)Ψλ (x) =(xI − D)(xΨλ (x) + Ψ′ (x)) = −Ψ′′ (x) + x2 Ψλ (x) − Ψλ (x) λ λ =HΨλ (x) − Ψλ (x) = (λ − 1)Ψλ (x), y (x + D)(x − D)Ψλ (x) =(xI + D)(xΨλ (x) − Ψ′ (x)) = −Ψ′′ (x) + x2 Ψλ (x) + Ψλ (x) λ λ =HΨλ (x) + Ψλ (x) = (λ + 1)Ψλ (x). Lo anterior nos conduce a definir dos operadores H+ := x + D, para los que se cumple H− H+ Ψλ (x) = (λ − 1)Ψλ (x), H+ H− Ψλ (x) = (λ + 1)Ψλ (x), y HΨλ (x) = (H− H+ + I)Ψλ (x) = λΨλ (x). Aplicando H+ a (5.3.3) tenemos (H+ H− )H+ Ψλ (x) = (λ − 1)H+ Ψλ (x), (5.3.5) (5.3.3) (5.3.4) H− := x − D donde D := d , dx (5.3.2) (5.3.1)

´ ¨ 5.3. El m´todo de factorizacion de Schrodinger e que al compararla con (5.3.4) nos conduce a11 H+ Ψλ (x) = α(λ)Ψλ−2 (x). An´logamente, aplicando H− a (5.3.4) tenemos a (H− H+ )H− Ψλ (x) = (λ + 1)H− Ψλ (x), que al compararla con (5.3.3) nos da H− Ψλ (x) = β(λ)Ψλ+2 (x).

95

(5.3.6)

(5.3.7)

De lo anterior se deduce que H− es un operador “ascenso”(raising) y H+ es un operador “descenso”(lowering).12 Sea ahora el conjunto de las funciones Ψ(x) tales que Ψ(a) = Ψ(b) = 0 (a, b ∈ R ∪ ±∞) y definamos en dicho espacio el producto escalar13
b

Ψ, Φ =
a

Ψ(x)Φ(x) dx.

N´tese que H± = H± . o Los operadores H+ y H− son uno el adjunto del otro. En efecto,
b b b

Ψ(x)H+ Φ(x)dx =
a a

Ψ(x)xΦ(x)dx +
a b

Ψ(x)Φ′ (x)dx
b b

=
a

Ψ(x)xΦ(x)dx + Ψ(x)Φ(x)
a b b a

Ψ′ (x)Φ(x)dx

a

=
a

(x − D)Ψ(x)Φ(x)dx =

H− Ψ(x)Φ(x)dx

Como consecuencia de lo anterior se sigue que H := −D2 + x2 = H− H+ + I es autoadjunto y por tanto (ver Proposici´n 4.2.12) sus autovalores son reales. Adem´s, si o a λ = γ entonces Ψλ es ortogonal a Ψγ (ver Proposici´n 4.2.13). o Supongamos que |Ψλ |2 es integrable. Calculemos Ψλ−2
2

es decir H− Ψ, Φ = Ψ, H+ Φ .

:= Ψλ−2 , Ψλ−2 = α−2 (λ) H+ Ψλ , H+ Ψλ = α−2 (λ) Ψλ , H− H+ Ψλ =α−2 (λ)(λ − 1) Ψλ , Ψλ = α−2 (λ)(λ − 1) Ψλ 2 , Ψλ−2n
2

(5.3.8)

luego = (λ − 1) (λ − 2) (λ − n) ··· 2 Ψλ 2 . α2 (λ) α2 (λ − 1) α (λ − n + 1)

11 N´tese que de (5.3.4) se deduce que el operador H H o + − tiene como autovectores Ψλ y sus correspondientes autovalores son λ + 1, por tanto la expresi´n anterior indica que H+ Ψλ son los autovectores o correspondientes a λ − 2 de donde se sigue que han de ser proporcionales a Ψλ−2 . 12 Pues aumentan o disminuyen el valor del autovalor, i.e., suben o bajan por el espectro de H. 13 Aqu´ la operaci´n a denota al complejo conjugado de a. En general trabajaremos en el espacio de ı o funciones reales.

96

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

Obviamente para cada λ fijo, existir´ un n tal que λ − n + 1 > 0, λ − n ≤ 0, por a tanto el proceso H+ · · · H+ Ψλ debe de culminar en alg´ n momento, i.e., debe existir una u funci´n que denotaremos por Ψ0 (x) tal que o H+ Ψ0 (x) = 0, o, equivalentemente, para cierto λ0 , α(λ0 ) = 0. En este caso la ecuaci´n (5.3.5) nos da HΨ0 = λ0 Ψ0 , o (H− H+ + I)Ψ0 (x) = λ0 Ψ0 (x) ⇒ λ0 = 1.

As´ pues aplicando H− consecutivamente a Ψ0 obtendremos los valores Ψλ para λ = ı 1, 3, 5, . . . , 2N + 1, . . . . En general tenemos λn = 2n + 1, n = 0, 1, 2, . . . . An´logamente a Ψλ+2
2

=β −2 (λ)(λ + 1) Ψλ 2 .

(5.3.9)

Lo anterior nos indica que conviene escribir la funci´n Ψλn como Ψn (Ψλn −2 se o convierte en Ψn−1 y Ψλn +2 se convierte en Ψn+1 ). Luego tenemos las ecuaciones H+ Ψ0 (x) = 0, H+ Ψn = αn Ψn−1 , H− Ψn = βn Ψn+1 , n = 0, 1, 2, . . . ,

donde hemos denotado por αn := α(λn ) y βn := β(λn ).
−2 Adem´s (5.3.8) implica Ψn−1 2 = 2nαn Ψn 2 y (5.3.9) implica Ψn+1 2 = (2n + a 2 Ψn . Si queremos que los operadores H+ y H− mantengan invariante la √ norma de las funciones Ψn entonces de las f´rmulas anteriores se deduce que αn = 2n y o √ βn = 2n + 2. As´ tenemos ı √ √ H+ Ψn = 2n Ψn−1 , H− Ψn = 2n + 2 Ψn+1 , n = 0, 1, 2, . . . . −2 2)βn

Finalmente, usando que H+ Ψ0 (x) = 0, Ψ0 = 1, obtenemos las soluciones normalizadas xΨ0 (x) + Ψ′ (x) = 0 0 y [H− ]n Ψ0 (x) = (2n)!!Ψn (x), luego 1 π
1 4

2 1 Ψ0 (x) = √ e−x /2 , 4 π

Ψn (x) =

(2n)!!

[H− ]n e−x

2

/2

=

1 π
1 4

(2n)!!

[xI − D]n e−x

2

/2

.

Esta forma de resolver el problema del oscilador arm´nico cu´ntico es totalmente o a an´loga a la del apartado 5.2.1. a

5.3.3.

El m´todo de factorizaci´n e o

En este apartado vamos a generalizar el ejemplo anterior a ecuaciones algo m´s genea rales. Partiremos de la ecuaci´n diferencial lineal de segundo orden (de Sturm-Liouville) o y ′′ (x) + r(x, m)y(x) + λy(x) = 0, m = 0, 1, 2, . . . (5.3.10)

´ ¨ 5.3. El m´todo de factorizacion de Schrodinger e o, equivalentemente14 , Hm y(x, m, λ) = λy(x, m, λ), Hm := −D2 − r(x, m)I.

97

(5.3.11)

La funci´n r(x, m) se suele denominar funci´n potencial y a Hm , hamiltoniano. Aqu´ m o o ı es un par´metro y λ es el correspondiente autovalor. En adelante asumiremos que λ y m a son independientes. Definici´n 5.3.1 Diremos que la ecuaci´n diferencial ordinaria (EDO) (5.3.10) es faco o torizable si la podemos cambiar por cada una de las siguientes ecuaciones
m+1 m+1 H+ H− y(x, λ, m) = [λ − L(m + 1)]y(x, λ, m), m m H− H+ y(x, λ, m) = [λ − L(m)]y(x, λ, m),

(5.3.12) (5.3.13)

donde L(m) son ciertas constantes y
m H− = k(x, m)I −

d , dx

m H+ = k(x, m)I +

d . dx

(5.3.14)

m Los operadores H± se conocen como operadores “escalera”. N´tese adem´s que ambos o a m operadores H± son de orden 1.

Teorema 5.3.2 Si y(x, λ, m) es soluci´n de y ′′ (x) + r(x, m)y(x) + λy(x) = 0, entonces o
m+1 H− y(x, λ, m) = α(λ, m)y(x, λ, m + 1), m H+ y(x, λ, m) = β(λ, m)y(x, λ, m − 1). m+1 a (5.3.12), obtenemos Demostraci´n: Aplicando H− o m+1 m+1 m+1 m+1 H− H+ [H− y(λ, m)] = [λ − L(m + 1)][H− y(λ, m)],

(5.3.15) (5.3.16)

y comparando el resultado con (5.3.13) deducimos (5.3.15). An´logamente, si aplicamos a m+1 H+ a (5.3.13), obtenemos
m m m m H+ H− [H+ y(λ, m)] = [λ − L(m)][H− y(λ, m)],

que al compararlo con (5.3.12), nos conduce a (5.3.16). En adelante, denotaremos αm := α(λ, m), βm := β(λ, m).

2

Como en el caso del oscilador arm´nico vamos a considerar el conjunto de las funo ciones Ψ(x) tales que Ψ(a) = Ψ(b) = 0 (a, b ∈ R ∪ ±∞) y en dicho espacio definiremos el producto escalar
b

Ψ, Φ =
a

Ψ(x)Φ(x)dx.

14 Hemos decidido mantener en la medida de lo posible la notaci´n original de [10], por lo que aqu´ Hm o ı d2 denota al operador dx2 + r(x, m)I, y no a la potencia m-´sima de H. e

98

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

m m Teorema 5.3.3 Los operadores H+ y H− son adjuntos entre s´, i.e., ı m H− φ, ψ = b a m H− φ · ψdx = b a m m φ · H+ ψdx = φ, H+ ψ

(5.3.17)

m m Demostraci´n: Ante todo notemos que si k(x, m) es una funci´n real entonces H± = H± . o o En adelante asumiremos que k(x, m) es real. Entonces b a m Ψ(x)H− Φ(x)dx = a b b

Ψ(x)k(x, m)Φ(x)dx −
b

Ψ(x)Φ′ (x)dx
a b a b

=
a

Ψ(x)k(x, m)Φ(x)dx − Ψ(x)Φ(x) +
a b b a

Ψ′ (x)Φ(x)dx

=
a

(k(x, m) + D)Ψ(x)Φ(x)dx =

m H+ Ψ(x)Φ(x)dx,

m m es decir H− Ψ, Φ = Ψ, H+ Φ .

2
m

N´tese tambi´n que el hamiltoniano H o e de las expresiones

es un operador autoadjunto. Ello se deduce

m+1 m+1 m m Hm = H+ H− + L(m + 1)I = H− H+ + L(m)I

o directamente de (5.3.11). Adem´s, como es autoadjunto, entonces sus autovalores son a reales y las autofunciones correspondientes a diferentes autovalores son ortogonales. El objetivo fundamental del m´todo es poder resolver EDOs de una forma sencilla y e “razonable” obteniendo soluciones “buenas”. As´ ser´ deseable que si parti´semos de una ı, ıa e m+1 m funci´n y(x, λ, m) de cuadrado integrable las operaciones H− y(x, λ, m) y H+ y(x, λ, m) o dieran como resultado funciones de cuadrado integrable. Esta condici´n la asumiremos (su demostraci´n es bastante engorrosa), no obstante o o en los ejemplos veremos f´cilmente que se cumple, es decir que partiendo de una y(x, λ, m) a de cuadrado integrable y(x, λ, m±1) tambi´n lo ser´. Adem´s, nos restringiremos a EDOs e a a cuyos coeficientes tienen singularidades a lo sumo en el extremo del intervalo (a, b) lo cual reduce el an´lisis de la integrabilidad cuadr´tica de las soluciones a su comportamiento a a en dichos extremos. Teorema 5.3.4 (Clase I) Sea L(m) una funci´n creciente en 0 < m ≤ M (M puede o ser +∞), m ∈ Z y supongamos que λ ≤ m´x[L(M ), L(M + 1)]. a Entonces para que la EDO y ′′ (x) + r(x, m)y(x) + λy(x) = 0 tenga una sucesi´n de o soluciones integrables es necesario que exista un l ∈ N tal que λ = λl = L(l + 1).
l Adem´s para ese l, y denotando ym (x) := y(x, L(l + 1), m) tenemos a l+1 l H− yl (x) = 0 l ⇒ yl (x) = e R k(x,l+1)dx

,

´ ¨ 5.3. El m´todo de factorizacion de Schrodinger e y, entonces para m = 0, 1, . . . , l − 1, l,
m l H+ ym (x) = l L(l + 1) − L(m) ym−1 (x),

99

(5.3.18)

y, por tanto,
l l ym (x) = k=m+1

1 L(l + 1) − L(k)

m+1 m+2 l l H+ H+ · · · H+ yl (x),

m < l.

(5.3.19)

l l N´tese que, si yl = 1, entonces las funciones ym son ortonormales. o

Demostraci´n: Asumamos que y(x, λ, m) es de cuadrado integrable en (a, b). Entonces, o y(x, λ, m + 1) tambi´n lo ser´. En efecto como e a
m+1 H− y(x, λ, m) = αm y(x, λ, m + 1),

tenemos
b a

[y(x, λ, m + 1)]2 dx =α−2 m

b a

m+1 [H− y(x, λ, m)]2 dx b a m+1 m+1 y(x, λ, m)H+ H− y(x, λ, m)]dx b

= α−2 m = Luego para l > m,
b a

λ − L(m + 1) α2 m

[y(x, λ, m)]2 dx.
a

[y(x, λ, l + 1)]2 dx =

λ − L(l + 1) λ − L(m + 1) ··· α2 α2 m m

b a

[y(x, λ, m)]2 dx.

Ahora bien, como L(m) es creciente entonces existir´ un l tal que L(l + 1) > λ, lo cual a implica que λ = L(l + 1) o y(x, λ, l + 1) ≡ 0. En caso que y(x, λ, l + 1) ≡ 0, usando (5.3.15) tenemos l+1 H− y(x, λ, l) = 0, y por tanto, asumiendo que y(x, λ, l) = 0, (5.3.12) nos da
l+1 l+1 H+ H− y(x, λ, l) = [λ − L(l + 1)] y(x, λ, l) =0 =0

⇒ λ − L(l + 1) = 0.

m+1 Adem´s, si queremos que el operador H− a mantenga la normalizaci´n entonces αm o = L(l + 1) − L(m + 1). De forma an´loga pero usando (5.3.16) y (5.3.13) tenemos que a

y(x, λ, m − 1)

2

=

λ − L(m) y(x, λ, m) 2 βm L(l + 1) − L(m).

2

=

L(l + 1) − L(m) y(x, λ, m) 2 , 2 βm

de donde se sigue que βm =

l As´ pues, denotando por ym (x) := y(x, L(l + 1), m) tenemos que (5.3.15) se transı forma en m+1 l l (5.3.20) H− ym (x) = L(l + 1) − L(m + 1) ym+1 (x), m < l,

100 y, en particular,

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

l+1 l H− yl (x) = 0,

as´ que usando (5.3.16) ı
m l H+ ym (x) = l L(l + 1) − L(m) ym−1 (x),

(5.3.21) 2

de donde, por inducci´n se deduce (5.3.19). o De forma totalmente an´loga se tiene el siguiente a

Teorema 5.3.5 (Clase II) Sea L(m) una funci´n decreciente en 0 ≤ m ≤ M (M o puede ser +∞, m ∈ Z y supongamos que λ ≤ L(0). Entonces para que la EDO y ′′ (x) + r(x, m)y(x) + λy(x) = 0 tenga una sucesi´n de soluciones integrables es necesario que o exista un l ∈ N tal que λ := λl = L(l),
l Adem´s, denotando por ym (x) := y(x, L(l), m), tenemos a m l H+ ym (x) = l L(l) − L(m) ym−1 (x), l ⇒ yl (x) = e− R k(x,l)dx

(5.3.22)

y, en particular,
l l H+ yl (x) = 0

Adem´s, para m = l, l + 1, . . . tenemos a
m+1 l H− ym (x) = l L(l) − L(m + 1) ym+1 (x),

(5.3.23)

y por tanto,
m−1 l ym (x) = k=l

1 L(l) − L(k + 1)

l+1 l m m−1 H− H− · · · H− yl (x),

m > l.

(5.3.24)

La demostraci´n es an´loga y la omitiremos. o a Veamos ahora bajo que condiciones podemos factorizar la ecuaci´n (5.3.10). o Partimos de la expresi´n (5.3.12) o (k(x, m + 1) + D)(k(x, m + 1) − D)y(x) = [λ − L(m + 1)]y(x)
2 ′ ′′

k (x, m + 1)y(x) + k (x, m + 1)y(x) − y (x) = [λ − L(m + 1)]y(x).

(k(x, m + 1) + D)(k(x, m + 1)y(x) − y ′ (x)) = [λ − L(m + 1)]y(x)

Si eliminamos y ′′ usando la ecuaci´n diferencial (5.3.10) y cambiamos m por m − 1 o obtenemos k 2 (x, m) + k ′ (x, m) + L(m) = −r(x, m − 1). (5.3.25) Si ahora usamos (5.3.13) (k(x, m) − D)(k(x, m) + D)y(x) = [λ − L(m)]y(x) ⇒ (k(x, m) − D)(k(x, m)y(x) + y ′ (x)) = [λ − L(m)]y(x) ⇒

k 2 (x, m)y(x) − k ′ (x, m)y(x) − y ′′ (x) = [λ − L(m)]y(x),

´ ¨ 5.3. El m´todo de factorizacion de Schrodinger e y nuevamente eliminamos y ′′ usando la ecuaci´n diferencial (5.3.10) obtenemos o k 2 (x, m) − k ′ (x, m) + L(m) = −r(x, m). Restando y sumando (5.3.25) y (5.3.26) obtenemos, respectivamente L(m) = − r(x, m) + r(x, m − 1) − k 2 (x, m), 2

101

(5.3.26)

r(x, m) − r(x, m − 1) . 2 Derivando la primera de las expresiones respecto a x y sustituyendo el resultado en la segunda deducimos que15 k ′ (x, m) = k(x, m) = − r′ (x, m) + r′ (x, m − 1) . 2(r(x, m) − r(x, m − 1))

Ahora bien, para que la EDO (5.3.10) sea factorizable L(m) ha de ser independiente de x. As´ pues hemos probado el siguiente ı Teorema 5.3.6 La EDO y ′′ (x) + r(x, m)y(x) + λy(x) = 0 es factorizable en el sentido de la definici´n 5.3.1 si y s´lo si o o k(x, m) = − y L(m) = − es independiente de x. r(x, m) + r(x, m − 1) − k 2 (x, m), 2 (5.3.28) r′ (x, m) + r′ (x, m − 1) , 2(r(x, m) − r(x, m − 1)) (5.3.27)

5.3.4.

Ejemplos

Antes de pasar a ver algunos ejemplos debemos destacar que el m´todo descrito e es v´lido para una gran cantidad de ecuaciones diferenciales. Es f´cil comprobar que si a a tenemos la EDO dz(t) d p(t) + q(t)z(t) + λρ(t)z(t) = 0, dt dt entonces el cambio y(x) =
4

p(t)ρ(t)z(t),

dx =

ρ(t) dt p(t)

la transforma en una ecuaci´n del tipo (5.3.10) o y ′′ (x) + r(x, m)y(x) + λy(x) = 0. En el razonamiento anterior se supone que p(x)ρ(x) ≥ 0 en el intervalo a considerar.
15 N´tese o

que si r(x, m) es una funci´n real, entonces k(x, m) tambi´n lo ser´. o e a

102

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

Los arm´nicos esf´ricos o e
l Comenzaremos por los arm´nicos esf´ricos Ym (θ). Estos satisfacen la ecuaci´n o e o

1 sen θ

d dθ

sen θ

dY dθ

m2 Y + λY = 0, sen2 θ

0 ≤ θ ≤ π.

Hacemos el cambio y(x) = (5.3.10) y ′′ − por tanto k(x, m) = m− 1 2

√ sen θ Y (θ), x = θ y obtenemos la forma can´nica o
1 µ = λ + 4,

m2 − 1 4 y + µy = 0, sen2 x

cot θ,

L(m) = m(m − 1) +

1 = 4

m−

1 2

2

.

Como L(m) es creciente tenemos el caso I, as´ que el teorema 5.3.4 nos da ı µ=λ+ 1 = L(l + 1) 4 ⇒ λ = l(l + 1), l = 0, 1, 2, . . . , m = 0, 1, 2, . . . , l.

Usando (5.3.20) tenemos
l+1 l H− yl (θ) = 0

l+

1 2

cot θ −

d y l (θ) = 0 dθ l

l yl (θ) = C senl+1/2 θ. l Calculamos C para que yl = 1:

1 = C2
0

π

sen2l+1 θdθ = C 2

2l+1 l! , (2l + 1)!!

luego
l yl (θ) =

(2l + 1)!! senl+1/2 θ. 2l+1 l!

Finalmente, como L(l + 1) − L(m) = (l + m)(l − m + 1) y L(l + 1) − L(m + 1) = (l − m)(l + m + 1), entonces (5.3.20) y (5.3.21) nos dan m− m− respectivamente. 1 2 1 2 cot θ − cot θ + d y l (θ) = dθ m d y l (θ) = dθ m
l (l − m)(l + m + 1) ym+1 (θ),

l (l + m)(l − m + 1) ym−1 (θ),

´ ¨ 5.3. El m´todo de factorizacion de Schrodinger e Potencial de Poschl-Teller 1 Sea y ′′ + − α2 (m + g)(m + g + 1) α2 (m − g)(m − g − 1) − sen2 α(x − x0 ) cos2 α(x − x0 ) y + λy = 0,

103

con x ∈ (x0 , x0 + π/(2α)). Entonces el teorema 5.3.6 nos da k(x, m) =2 α g + m cos 2α (x − x0 ) csc 2α (x − x0 ) = (g + m) α cot α (x − x0 ) + (g − m) α tan α (x − x0 ) , L(m) = 4 m2 α2 . Al ser L(m) creciente usamos el teorema 5.3.4 y por tanto λ = 4α2 (l + 1)2 , En este caso
l+1 l H− yl (x) = 0 l yl (x)

l = 0, 1, 2, . . . ,

m = 0, 1, 2, . . . , l. ⇒

= C cos

l−g+1

l ⇒ [k(x, l + 1) − D] yl (x) = 0

l Calculamos C para que yl = 116

α (x − x0 ) sen

l+g+1

α (x − x0 ) .

1 =C

2

π r0 + 2α

r0

cos2(l−g+1) α (x − x0 ) sen2(l+g+1) α (x − x0 ) dx

3 Γ(l − g + 3 )Γ(l + g + 2 ) 2 =C 2 . 2αΓ(2 + +3)

luego
l yl (x) =

2αΓ(2l + 3) l−g+1 α (x − x0 ) senl+g+1 α (x − x0 ) . 3 cos Γ(l − g + 3 )Γ(l + g + 2 ) 2 L(l + 1) − L(m + 1) = 4α2 (l − m) (l + m + 2) , L(l + 1) − L(m) = 4α2 (l − m + 1) (l + m + 1) ,

Finalmente, como

entonces (5.3.20) y (5.3.21) nos conducen a las expresiones k(x, m + 1) − k(x, m) + respectivamente.
16 Hemos

d dx

l l ym (x) = 2α (l − m) (l + m + 2) ym+1 (x),

0 ≤ m ≤ l, 0 ≤ m ≤ l,

d dx

l l ym (x) = 2α (l − m + 1) (l + m + 1) ym−1 (x),

usado que Z

π 2

cosa x senb x dx =

Γ( a+1 )Γ( b+1 ) 2 2 2Γ( a+b+2 ) 2

,

0

ℜa > −1, ℜb > −1.

104

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

Potencial de Poschl-Teller 2 Sea y ′′ + − α2 (m + g)(m + g + 1) α2 (m − g)(m − g + 1) + senh2 α(x − x0 ) cosh2 α(x − x0 ) y + λy = 0,

con x ∈ (r0 , ∞). Entonces el teorema 5.3.6 nos da k(x, m) =2 α g + m cosh 2α (x − x0 ) csch 2α (x − x0 ) L(m) = −4 m2 α2 . Al ser L(m) decreciente usamos el teorema (5.3.5) y por tanto λ = −4α2 l2 , En este caso
l l H+ yl (x) = 0

= (g + m) α coth α (x − x0 ) + (m − g) α tanh α (x − x0 )

l = 0, 1, 2, . . . , ⇒

m = l, l + 1, l + 2, . . . . ⇒

y por tanto17 para todo g <
l yl (x) =

1 2

l [k(x, l) + D] yl (x) = 0

−l

2αΓ(l − g + 1 ) 2 coshg−l α (x − x0 ) senh−l−g α (x − x0 ) . 1 Γ(−l − g + 2 )Γ(2l) L(l) − L(m) = 4α2 (m − l) (m + l) ,

Finalmente, como L(l) − L(m + 1) = 4α2 (m + 1 − l) (l + m + 1) , entonces (5.3.20) y (5.3.21) nos dan k(x, m + 1) − d dx
l l ym (x) = 2α (m + 1 − l) (l + m + 1) ym+1 (x),

m ≥ l,

k(x, m) + respectivamente. Potencial de Morse Sea ahora la ecuaci´n o

d dx

l l ym (x) = 2α (m − l) (m + l) ym−1 (x),

y ′′ + ae−2u + be−u y + λy = 0,

a, b ∈ C,

0 ≤ u < +∞.
1 2

Si hacemos el cambio u = x + α de forma que e2α a = −1/4, m = beα −
17 Hemos

obtenemos

usado que Z ∞ Γ(− a+b )Γ( b+1 ) 2 2 , cosha x senhb x dx = 2Γ( 1−a ) 0 2

ℜb > −1, ℜa + ℜb < 0.

´ ¨ 5.3. El m´todo de factorizacion de Schrodinger e

105

1 y ′′ + − 4 e−2x + m +

1 2

e−x y + λy = 0,

con x ∈ R. Entonces el teorema 5.3.6 nos da k(x, m) = − e−x + m, 2 L(m) = −m2 .

Al ser L(m) decreciente usamos el teorema 5.3.5 y por tanto λ = −l2 , En este caso
l l H+ yl (x) = 0

l = 1, 2, . . . , ⇒

m = l, l + 1, l + 2, . . . . ⇒

y por tanto18

l [k(x, l) + D] yl (x) = 0

l yl (x) =

1 e−exp(−x)/2−lx . Γ(2l)

Finalmente, como L(l) − L(m) = (m − l) (m + l) , L(l) − L(m + 1) = (m + 1 − l) (l + m + 1) , entonces usando (5.3.20) y (5.3.21) tenemos − d e−x +m+1− 2 dx − e−x d +m+ 2 dx
l ym (x) = l (m + 1 − l) (l + m + 1) ym+1 (x), l (m − l) (m + l) ym−1 (x),

m ≥ l,

l ym (x) =

m ≥ l,

respectivamente. La ecuaci´n de Whittaker & Watson o Sea 1 m+ W ′′ + − + 4 z
1 2 1 4

+
x

+λ z2

W = 0,

0 ≤ z < +∞.

Haciendo el cambio z = ex , W (z) = e 2 y obtenemos
1 y ′′ + − 4 e2x + m + 1 2

ex y + λy = 0,

que esencialmente la misma ecuaci´n diferencial del ejemplo anterior pero cambiando x o por −x. Tambi´n corresponde al caso II con e k(x, m) =
18 Hemos

ex − m, 2

L(m) = −m2 ,
l > 0.

usado que

Z

e− exp(−x)−2lx dx = Γ(2l),

−∞

106 as´ que ı

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

λ = −l2 ,
l l H+ yl (x) = 0

l = 0, 1, 2, . . . ,

m = l, l + 1, l + 2, . . . ,
l ⇒ yl (x) =

l ⇒ [k(x, l) + D] yl (x) = 0

1 e−exp(x)/2+lx . Γ(2l)

Finalmente, (5.3.20) y (5.3.21) nos dan d ex −m−1− 2 dx ex d −m+ 2 dx respectivamente.
l ym (x) = l (m + 1 − l) (l + m + 1) ym+1 (x),

m ≥ l,

l ym (x) =

l (m − l) (m + l) ym−1 (x),

m ≥ l,

La ecuaci´n de Bessel o Sea y ′′ −
1 m2 − 4 y + λy = 0, z2

z ∈ R.

Aplicando el teorema 5.3.6 tenemos k(x, m) = m− 1 2 , x L(m) = 0.

Como L(m) es constante no podemos usar ninguno de nuestros resultados por lo que no tenemos ninguna expresi´n para λ. No obstante si podemos seguir usando las expresiones o (5.3.20) y (5.3.21) que en este caso dan m+ x m− x
1 2

d dx d dx

ym (x) =

√ λ ym+1 (x), √ λ ym−1 (x).

1 2

+

ym (x) =

Ambas expresiones dan sendas relaciones de recurrencia para las funciones de Bessel. Para resolver la ecuaci´n tenemos que usar el m´todo de Frobenius (ver e.g [4, 18]). o e La soluci´n general en este caso da o y(x) = √ √ √ x c1 Jm ( λx) + c2 Ym ( λx) ,

donde Jm (z) y Ym (z) son las funciones de Bessel de primera y segunda especie, respectivamente.

´ ¨ 5.3. El m´todo de factorizacion de Schrodinger e El ´tomo de hidr´geno a o Sea la ecuaci´n radial de Schr¨dinger para el ´tomo de hidr´geno o o a o 2 m(m + 1) 2 R + λR = 0, R′′ + R′ + R − r r r2 Si hacemos el cambio y(r) = rR(r), tenemos y ′′ + 2 m(m + 1) − r r2 y + λy = 0, r ≥ 0. r ≥ 0.

107

Aplicando el teorema 5.3.6 obtenemos k(r, m) = m 1 − , r m L(m) = − 1 . m2

Como L(m) crece tenemos el caso I. As´ ı, λ=− En este caso
l+1 l H− yl (r) = 0

1 , (l + 1)2

l = 0, 1, 2, . . . ,

m = 1, 2, . . . , l.

1 l+1 l − − D yl (r) = 0 r l+1
r

l yl (x) = Crl+1 e− l+1 . l Calculamos C para que yl = 119 l yl (r) =
r 1 rl+1 e− l+1 . (l + 1)l+3 Γ(l + 1)

Finalmente, como L(l + 1) − L(m + 1) = L(l + 1) − L(m) = entonces de (5.3.20) y (5.3.21) obtenemos 1 d m+1 − − r m + 1 dr 1 d m − + r m dr respectivamente.
19 Hemos

1 1 − , 2 (m + 1) (l + 1)2 1 1 − , 2 m (l + 1)2

l ym (r) =

1 1 − y l (r), 2 (m + 1) (l + 1)2 m+1 1 1 − y l (r), 2 m (l + 1)2 m−1

1 ≤ m ≤ l,

l ym (r) =

1 ≤ m ≤ l,

usado que

Z

xβ e−αx dx = Γ(β + 1)α−1−β ,

0

ℜα > 0,

ℜβ > −1.

108

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

5.4.

Factorizaci´n de la EDO hipergeom´trica o e

En este apartado vamos a probar que la ecuaci´n hipergeom´trica (5.1.7) admite o e una factorizaci´n tipo Infeld-Hull. Vamos a seguir el trabajo de Lorente [11] o

5.4.1.

El hamiltoniano y los operadores escalera
ϕn (s) = ρ(s)/d2 Pn (x), n (5.4.1)

Sean las funciones Usando (5.1.22) y (5.1.7), obtenemos las expresiones αn dn+1 dn−1 ϕn+1 (s) + γn ϕn−1 (s) + (βn − x(s))ϕn (s) = 0, dn dn σ(x)ϕ′′ (x) + σ ′ (x)ϕ′ (x) + ν(x)ϕn (x) + λn ϕn (x) = 0, n n donde ν(x) = − 1 (τ (x) − σ ′ (x))2 1 − (τ ′ − σ ′′ ). 4 σ(x) 2 (5.4.2) (5.4.3)

En particular la EDO anterior induce a definir el siguiente operador H(x, n) orden 2 H(x, n) := σ(x)D2 + σ ′ (x)D + [ν(x) + λn ]I, H(x, n)ϕn (x) = 0. (5.4.4)

En adelante diremos que H(x, n) es el hamiltoniano asociado a la EDO (5.1.7). Si ahora usamos las expresiones (5.1.34) y (5.1.35) obtenemos L+ (x, n)ϕn (s) := [f (x, n) − σ(x)D]ϕn (x) = αn donde L+ (x, n) = λ2n dn+1 ϕn+1 (x), 2n dn

(5.4.5)

λn τn (x) 1 + (τ (x) − σ ′ (x)) I − σ(x)D, ′ n τn 2
f (x,n)

(5.4.6)

y L− (x, n)ϕn (x) := [g(x, n) + σ(x)D]ϕn (x) = γn donde L− (x, n) = −

λ2n dn−1 ϕn−1 (x), 2n dn

(5.4.7)

λn τn (x) λ2n 1 + (x − βn ) − (τ (x) − σ ′ (x)) I + σ(x)D. ′ n τn 2n 2
g(x,n)

(5.4.8)

Los operadores anteriores L+ (x, n) y L− (x, n) constituyen los operadores “escalera”de ascenso (raising) y descenso (lowering), respectivamente. Si usamos las expresiones expl´ ıcitas de τn y λn (ver apartado 5.1.2) λn = −n τ ′ + (n − 1) σ ′′ 2 , τn (x) = τ (x) + nσ ′ (x),

´ 5.4. Factorizacion de la EDO hipergeom´trica e y βn = se comprueba que f (x, n − 1) = g(x, n). Adem´s, para todos n, k ∈ N ∪ {0}, a
b a

109

nτn−1 (0) (n + 1)τn (0) − , ′ ′ τn−1 τn (5.4.9)

ϕn (x)[L+ (x, n)ϕk (x)] dx =
a

b

[L− (x, n)ϕn (x)]ϕk (x) dx,

en particular
b a b

ϕn+1 (x)[L+ (x, n)ϕn (x)] dx = αn

λ2n dn−1 , 2n dn λ2n+2 dn . 2n + 2 dn+1

[L− (x, n + 1)ϕn+1 (x)]ϕn (x) dx, = γn+1
a

De lo anterior se sigue que L+ y L− son el adjunto el uno del otro respecto al producto escalar20
b

Ψ, Φ =
a

Ψ(x)Φ(x) dx.

N´tese que el operador H(x, n) es autoadjunto. o

5.4.2.

Factorizaci´n de H(x, n) o
L− (x, n + 1)L+ (x, n) =g(x, n + 1)f (x, n)I + σ(x) [f (x, n) − g(x, n + 1)] D
=0

Si ahora calculamos

+ σ(x)[f ′ (x, n) − σ ′ (x)D − σ(x)D2 ] o, equivalentemente, L− (x, n + 1)L+ (x, n) = [g(x, n + 1)f (x, n) + σ(x)(f ′ (x, n) + ν(x) + λn )] I − σ(x)H(x, n). Ahora bien, g(x, n + 1)f (x, n) + σ(x)(f ′ (x, n) + ν(x) + λn ) =−
′ (n + 1) τ ′ + τn−1 ′ ′ τ (0) σ ′′ − 2τ (0)σ ′ (0)τ ′ + 2σ(0)τn − nσ ′ (0) (τ ′ + τn ) ′ 4τn 2 2 2 2

no depende de x. Dicha cantidad la denotaremos por µn . Adem´s, si aplicamos el operador a L− (x, n + 1)L+ (x, n) = µn I − σ(x)H(x, n)
20 Estamos usando que las funciones (ϕ ) n n son una base ortonormal completa del espacio de las funciones de cuadrado integrable y que ϕn (±a) = 0.

110

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

a ϕn (x) y usamos (5.4.5), (5.4.7) y (5.4.4) obtenemos la expresi´n o µn = An´logamente se tiene a L+ (x, n − 1)L− (x, n) =g(x, n)f (x, n − 1)I + σ(x) [f (x, n − 1) − g(x, n)] D
=0

λ2n λ2n+2 αn γn+1 . 2n 2n + 2

− σ(x)[g (x, n) + σ (x)D + σ(x)D ] o, equivalentemente, L+ (x, n − 1)L− (x, n) = [g(x, n)f (x, n − 1) − σ(x)(g ′ (x, n) − ν(x) − λn )] I − σ(x)H(x, n). Ahora bien, como antes, g(x, n)f (x, n − 1) − σ(x)(g ′ (x, n) − ν(x) − λn ) =−
′ n τ ′ + τn−2

2

′2 ′ τ (0)2 σ ′′− 2τ (0)σ ′ (0)τ ′ + 2σ(0)τn−1 − (n−1)σ ′ (0) τ ′ + τn−1 ′ 4τn−1 2

2

no depende de x. N´tese que la expresi´n anterior coincide con µn−1 . Otra forma de o o comprobarlo es aplicar el operador L+ (x, n − 1)L− (x, n) = M (n)I − σ(x)H(x, n) a ϕn (x) y usar, como antes (5.4.5), (5.4.7) y (5.4.4). Lo anterior nos conduce a la expresi´n o M (n) = λ2n λ2n−2 αn−1 γn = µn−1 . 2n 2n − 2

As´ hemos probado el siguiente ı, Teorema 5.4.1 Para la ecuaci´n hipergeom´trica (5.1.7), haciendo el cambio (5.4.1), o e se obtiene la ecuaci´n (5.4.4), para la cual se cumple la siguiente factorizaci´n del tipo o o Infeld y Hull L+ (x, n − 1)L− (x, n) = µn−1 I − σ(x)H(x, n), L− (x, n + 1)L+ (x, n) = µn I − σ(x)H(x, n), (5.4.10)

donde los operadores L+ (x, n) y L− (x, n) son los operadores de ascenso (raising) y descenso (lowering), respectivamente definidos por L+ (x, n) = f (x, n)I − σ(x)D, f (x, n) = Adem´s, a
′√ L+ ϕn (x) = −τn αn γn+1 ϕn+1 (x), ′√ L− ϕn (x) = −τn αn−1 γn ϕn−1 (x).

L− (x, n) = f (x, n − 1)I + σ(x)D,

λn τn (x) 1 + (τ (x) − σ ′ (x)) ′ n τn 2

´ 5.4. Factorizacion de la EDO hipergeom´trica e y, por tanto, L− (x, 0)ϕ0 (x) = 0 ϕn (x) = 1 ⇒ ϕ0 (x) = N0 exp −
+

111

f (x, n − 1)dx ,

ϕ0

2

= 1,

L n−1 ′ k=0 (−τk αk γk+1 )

(x, n − 1) · · · L+ (x, 1)L+ (x, 0)ϕ0 (x),

n ≥ 1.

5.4.3.

Ejemplos

Como ejemplo consideraremos el caso correspondiente a los polinomios de Hermite y Laguerre. Caso Hermite En el primer caso como σ(x) = 1 y τ (x) = −2x tenemos21 ϕn (x) = 2n/2 −x2 /2 Hn (x), √ e n! π λn = 2n,

H(x, n) = D2 + (1 − x2 + λn )I, entonces f (x, n) = g(x, n) = x, luego L+ (x, n)ϕn (x) = (xI − D)ϕn (x) = De lo anterior se sigue
2 1 ϕ0 (x) = √ e−x /2 , 4 π

2(n + 1) ϕn+1 (x), √ L− (x, n)ϕn (x) = (xI + D)ϕn (x) = 2n ϕn−1 (x).
2 1 ϕn (x) = √ √ (xI − D)n e−x /2 . 4 n n! π 2

Finalmente L+ (x, n − 1)L− (x, n) = 2nI − H(x, n), Caso Laguerre En este caso σ(x) = x y τ (x) = −x + α + 1 tenemos H(x, n) = xD2 + D + y22 ϕn (x) =
21 Estamos 22 Estamos

L− (x, n + 1)L+ (x, n) = (2n + 2)I − H(x, n).

1 (x − α) − λn 2 4x 1

2

I,

λn = n,

n!Γ(α + n + 1)

e−x/2 xα/2 Lα (x) n

usando polinomios m´nicos de Hermite. o usando polinomios m´nicos de Laguerre. o

112 Entonces f (x, n) = L+ (x, n)ϕn (x) =

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

+x − α − 2 − 2n , 2

g(x, n) =

x − α − 2n 2

x − α − 2 − 2n I − xD ϕn (x) = 2 x − α − 2n I + xD ϕn (x) = 2

(n + 1)(n + α + 1) ϕn+1 (x), n(n + α) ϕn−1 (x).

L− (x, n)ϕn (x) = De lo anterior se sigue

ϕ0 (x) = ϕn (x) = Finalmente 1 n!Γ(α + n + 1)

1 e−x/2 xα/2 , Γ(α + 1)

L+ (x, n − 1) · · · L+ (x, 1)L+ (x, 0)e−x/2 xα/2 .

L+ (x, n − 1)L− (x, n) = (n)(n + α)I − H(x, n), L− (x, n + 1)L+ (x, n) = (n + 1)(n + 1 + α)I − H(x, n).

5.5.

Problemas

Problema 5.5.1 Prueba la relaci´n de ortogonalidad (5.1.20) y calcula una expresi´n o o (k) para la norma de las derivadas Pn . Problema 5.5.2 Calcula todas las caracter´sticas de los polinomios cl´sicos que aparecen ı a en la tabla 5.2. Problema 5.5.3 Prueba que los polinomios ortogonales m´nicos Pn , soluciones de la o ecuaci´n (5.1.7), satisfacen la siguiente relaci´n de estructura o o Pn (x) = Qn + δn Qn−1 + ǫn Qn−2 , (5.5.1)

′ donde Qn (x) ≡ Pn+1 (x)/(n + 1). Encuentra una expresi´n de los coeficientes en funci´n o o de los coeficientes calculados en el apartado 5.1.2.

Problema 5.5.4 Probar que para los polinomios cl´sicos se tienen las siguientes idena tidades. tx ∞ ∞ 2 (−1)n α e− 1−t 2n , (5.5.2) Hn (x)tn = e2xt−t , Ln (x)tn = n! n! (1 − t)α+1 n=0 n=0 2α+β (−1)n (α + β + 1)n α,β , Pn (x)tn = n! R(1 − 2t + R)α (1 + 2t + R)β n=0 con R = 1 + 4t(t + x).

(5.5.3)

5.5. Problemas Problema 5.5.5 Sea la ecuaci´n de Schr¨dinger estacionaria unidimensional o o
2

113

2m

Ψ′′ −

U0 Ψ = EΨ, cosh2 (αx)

x ∈ R,

con E < 0. Hacer el cambio s = tanh x y obtener la EDO Ψ′′ − 2s γ 2 (1 − s2 ) − β 2 Ψ′ + , 2 1−s (1 − s2 )2 β2 = − 2mE 2 2mU0 ,γ = 2 2, 2 α2 α γ, β > 0.

Resuelve la EDO anterior y calcula las soluciones estacionarias de la ecuaci´n. El poo tencial anterior se conoce como potencial de Posch-Teller y modeliza la interacci´n moo lecular. Problema 5.5.6 Resolver la ecuaci´n de Schr¨dinger tridimensional o o
2

2m

∆Ψ + D(e−2αx − 2e−αx )Ψ = EΨ,

x=

r − r0 . r0
2mDr 2

0 . Resuelve Pasa a unidades adimensionales y haz el cambio y = 2γ e−αx donde γ 2 = 2 α primero el caso l = 0. El potencial anterior se conoce como potencial de Morse y tambi´n e modeliza la interacci´n molecular. o

Problema 5.5.7 Para el atomo de hidr´geno calcula el valor medio de la posici´n del ´ o o electr´n en el estado definido por los valores n, l y m r n,l,m = Rn l |r|Rn l . Prueba que o si n = l = 0, entonces r 0,0,0 = a0 = 2 /(2α). Prueba adem´s que en el estado definido a por los valores n, l y m la media de la energ´a potencial ı V (r) es la mitad de la energ´a total En,l . ı Calcula r
n,l,m n,l,m

= Rn l |V (r)|Rn l

y V (r)

n,l,m

para el oscilador arm´nico tridimensional. o

Problema 5.5.8 La ecuaci´n de Klein-Gordon o ψKG + EKG + µ r
2

− 1 ψKG = 0,

se puede resolver usando el m´todo de separaci´n de variables obteni´ndose para sus solue o e ciones la expresi´n ψKG (r, θ, φ) = R(r)r−1 Yl,m (θ, φ), siendo Yl,m los arm´nicos esf´ricos o o e y R(r) las soluciones de R′′ + E+ µ r
2

−1−

l(l + 1) R = 0. r2

Demuestra usando el m´todo descrito al final de cap´tulo que las soluciones se expresan e ı mediante la f´rmula o R(x) = Nl,n e− 2 rν+1 L2ν+1 (2ar) , n
r

1 ν=− + 2

l+

1 2

2

− µ2 ,

donde Lα son los polinomios de Laguerre y determina el factor de normalizaci´n Nl,n . o n

114

´ ¨ Cap´ ıtulo 5. Resolviendo la ecuacion de Schrodinger

Problema 5.5.9 Aplica el m´todo de factorizaci´n de Schr¨dinger para resolver las sie o o guientes EDOs 1. Los esf´ricos arm´nicos generalizadosΦ, definidos por la expresi´n y(θ) = senγ θΦ(θ) e o o donde y satisface la EDO y ′′ − (m + γ)(m + γ − 1) y + (λ + γ 2 )y = 0. sen2 θ

2. La ecuaci´n de onda para una “peonza” sim´trica. La funci´n de onda Ψ(θ, φ, ψ) = o e o 1 Θ(θ)eiKφ eiMψ , donde la funci´n Θ es tal que y(θ) = sen 2 θ Θ(θ), e y satisface la o EDO y ′′ −
1 1 (M − 2 )(M + 2 ) + K 2 − 2M K cos θ 1 y + λ + K2 + sen2 θ 4

y = 0.

3. La parte radial de la ecuaci´n de Schr¨dinger para s osciladores de Plank unidio o mensionales Ψ′′ + donde r2 = EDO n(n + s − 2) s−1 ′ + r2 Ψ + λΨ = 0, Ψ − r r2
s k=1

n = 0, 1, 2, . . . ,

x2 . Si hacemos el cambio Ψ(r) = r(1−s)/2 y(r), y satisface la k (n +
s 2 1 − 2 )(n + r2 s 2 3 − 2)

y ′′ −

+ r2 y + λy = 0.

4. El problema de Kepler generalizado. En este caso R satisface la EDO 2 (l + γ)(l + γ + 1) 2 y + λy = 0, R′′ + R′ + R − r r r2 r ≥ 0, λ=− 1 . (n + γ)2

Problema 5.5.10 Usando el m´todo de factorizaci´n del apartado 5.4 obt´n las solue o e ciones para el caso de los polinomios de Legendre, Gegenbauer y Jacobi.

Bibliograf´ ıa
´ [1] R. Alvarez-Nodarse, Polinomios hipergem´tricos y q-polinomios. Monograf´ del e ıas Seminario Matem´tico “Garc´ de Galdeano” Vol. 26. Prensas Universitarias de a ıa Zaragoza, Zaragoza, 2003. [2] G. Auletta, Foundations and interpretation of quantum mechanics. In the light of a critical-historical analysis of the problems and of a synthesis of the results. World Scientific Publishing Co., Inc., River Edge, NJ, 2000. [3] J-L. Basdevant, J. Dalibard, Quantum mechanics. Springer Verlagr, 2002. [4] M. Braun, Differential Ecuations and their Applications. Springer Verlag, 1993. [5] S. Deligeorges (Ed.), El mundo cu´ntico, Alianza Universidad, 1985. a [6] P. V. El tin, V. D. Krivqenkov Kvantova Mehanika, Nauka 1975 [7] R. Feynman, R. B. Leighton y M. Sands, The Feynman Lectures on Physics. Vol. III. Mec´nica Cu´ntica. Fondo Educativo Interamericano 1971. a a [8] R. Feynman, El car´cter de la Ley f´sica. Matemas 65, 2000. a ı [9] J. Gribbin, En busca del gato de Schr¨dinger. La fascinante historia de la Mec´nica o a Cu´ntica. Biblioteca Cient´ a ıfica Salvat, 1994. [10] L. Infeld and T. E. Hull, The factorization method. Rev. Modern Physics 23 (1951), 21–68. [11] M. Lorente, Raising and lowering operators, factorization method and differential/difference operators of hypergeometric type. J. Phys. A: Math. Gen. 34 (2001), 569-588. [12] A. Messiah, Mec´nica Cu´ntica. Vol. I y II. Ed. Tecnos. (Hay una edici´n inglesa a a o reciente Quamtum Mechanics, Dover, New York, 1999) [13] A. F. Nikiforov y V. B. Uvarov, Special Functions of Mathematical Physics. Birkh¨user Verlag, Basilea, 1988. a [14] E. Prugovecki, Quantum Mechanics in Hilbert space. Academic Press, New York, 1971. [15] H. Rechenberg, Quanta and Quantum Mechanics, Twentieth century physics. Vol. I, 143–248, Inst. Phys., Bristol, 1995. 115

116 [16] I. V. Sav´liev, Curso de f´sica general. Mir, Mosc´ , 1989. e ı u

BIBLIOGRAF´ IA

[17] J. Schwinger, Quantum Kinematic and Dynamics, Frontiers in Physics. W.A. Benjamin Inc. Publishers. 1970. [18] G. F. Simmons, Ecuaciones diferenciales: con aplicaciones y notas hist´ricas. o McGraw-Hill, 1993. [19] A. A. Sokolov, I. M. Ternov, V. Ch. Zhukovskii, Quantum Mechanics. Mir, Mosc´ , u 1994. [20] Una historia interactiva de la Mec´nica a http://library.thinkquest.org/C005775/ Cu´ntica a en la WWW:

[21] Cu´ntica sin f´rmulas en la WWW: http://eltamiz.com/cuantica-sin-formulas/ a o

Anexo A: Breve introducci´n o al an´lisis funcional a
A.1. Introducci´n: Estacios m´tricos y espacios noro e mados

Definici´n A.1.1 Un espacio m´trico es un par (X, r) donde X es un conjunto y r := r(x, y) o e es una funci´n real (univaluada) no negativa definida para todos x, y, z ∈ X tal que o 1. r(x, y) = 0 ⇐⇒ x = y, 2. r(x, y) = r(y, x), 3. r(x, z) ≤ r(x, y) + r(y, z). Normalmente se dice que X es el espacio y r su m´trica. e Por ejemplo, el espacio X = Rn de las n-tuplas x = (x1 , x2 , . . . , xn ) con la m´trica e !1/p n X |xk − yk |p , p ≥ 1, r(x, y) =
k=1

es un espacio m´trico. Otro ejemplo de especial importancia es el espacio de todas las sucesiones e P reales (o complejas) x = (x1 , x2 , . . . , xn , . . .) tales que ∞ |xk |p < +∞ con la m´trica e k=1 r(x, y) =
∞ X

|xk − yk |p

k=1

!1/p

,

p ≥ 1.

Dicho espacio lo denotaremos por lp . Un caso particular de estos espacios corresponde al caso p = 2 que conduce al espacio m´trico l2 de Hilbert. e Como ultimo ejemplo consideraremos el espacio X = C[a,b] , es decir, el espacio de las ´ funciones continuas definidas sobre el segmento [a, b]. Definamos en X la m´trica e ρ(f, g) = „Z
b a

|f (x) − g(x)|p

«1/p

,

p ≥ 1.

El par obtenido Cp ([a, b]) es un espacio m´trico. Como caso particular (de especial relevancia) e tenemos el caso p = 2, i.e., X = C[a,b] y r es la funci´n o s Z b |f (x) − g(x)|2 . ρ(f, g) =
a

117

118

´ ´ Anexo: Breve introduccion al analisis funcional

El espacio L2 (a, b) de las (clase de equivalencia de las) funciones de cuadrado integrable en [a, b] que vimos el el cap´ ıtulo 3 es una generalizaci´n de este espacio. o Definici´n A.1.2 Sea X un espacio m´trico, x0 ∈ X y r > 0. Definiremos la bola abierta o e B(x0 , r) al conjunto B(x0 , r) = {x ∈ X; r(x0 , x) < r}, bola o esfera cerrada S(x0 , r) al conjunto S(x0 , r) = {x ∈ X; r(x0 , x) ≤ r}. Definici´n A.1.3 Se dice que el conjunto M ⊂ X es abierto en X si todos sus puntos (eleo mentos) se pueden encerrar en una bola abierta contenida completamente en M . Un conjunto M ⊂ X es cerrado en X si es su complementario en X, X\M es abierto. Las bolas abiertas B(x0 , ε) se suelen denominar ε-vecindades (o entornos) de x0 . Es evidente que toda ε-vecindad de x0 contiene al propio x0 . Definici´n A.1.4 Un punto x0 se denomina punto interior del conjunto M ⊂ X si existe un o ε > 0 tal que B(x0 , ε) ⊂ M . De lo anterior se deduce que el conjunto M ⊂ X es abierto si y s´lo si todos sus puntos son o interiores. Definici´n A.1.5 Por aplicaci´n (operador) o funci´n entenderemos una regla T que le hace o o o corresponder a cada elemento del subconjunto D(T ) ⊂ X un unico elemento del espacio m´trico ´ e Y. As´ T : X → Y, y = T x o y = T (x), donde x ∈ D(T ) ⊂ X e y ∈ Y. Al conjunto ı, D(T ) ⊂ X se le denomina dominio de la aplicaci´n. Si a cada x ∈ D(T ) le corresponde un valor o y = T x ∈ Y diremos que T x es la imagen de x seg´n T . Al conjunto de todas las im´genes T x u a le denominaremos imagen de T y le denotaremos por I(T ). Definici´n A.1.6 Una aplicaci´n T : D(T ) ⊂ X → Y se llama sobreyectiva si todo elementoy o o de Y es imagen de alg´n elemento x del dominio. Una funci´n se llama inyectiva si todo elemento u o y de la imagen de T es imagen a lo sumo de uno y s´lo un elemento x del dominio. Una aplicaci´n o o inyectiva y sobreyectiva se denomina biyectiva. Es decir una aplicaci´n es sobreyectiva si, para todo y ∈ Y, la ecuaci´n T x = y tiene al o o menos una soluci´n, e inyectiva si la ecuaci´n anterior tiene o bien una unica soluci´n, o bien o o ´ o no tiene soluci´n. As´ mismo, T es biyectiva si para todo y ∈ Y, la ecuaci´n T x = y tiene una y o ı o s´lo una soluci´n. o o Para las funciones inyectivas se puede definir la aplicaci´n inversa. o Definici´n A.1.7 Sea T : D(T ) ⊂ X → Y una aplicaci´n inyectiva. Definiremos su aplicaci´n o o o inversa T −1 a la aplicaci´n T −1 : I(T ) ⊂ Y → D(T ) ⊂ X tal que a cada elemento y ∈ I(T ) le o hace corresponder un unico x ∈ D(T ) tal que T x = y. ´ Definici´n A.1.8 La restricci´n de una aplicaci´n T : D(T ) ⊂ X −→ Y a un subconjunto o o o B ⊂ D(T ) es la aplicaci´n T |B que se obtiene de T cuando x se restringe al conjunto B ⊂ D(T ). o Definici´n A.1.9 La extensi´n de una aplicaci´n T : D(T ) ⊂ X −→ Y a un subconjunto o o o e e C ⊃ D(T ) es la aplicaci´n T tal que T |D(T ) = T , i.e., T x = T x para todo x ∈ D(T ). o e

´ A.1. Introduccion: Estacios m´tricos y espacios normados e

119

Definici´n A.1.10 Una aplicaci´n T : D(T ) ⊂ X −→ Y es continua en x0 ∈ D(T ) si para todo o o ε > 0, existe un δ > 0 tal que ∀x ∈ D(T ) con r(x, x0 ) < δ es tal que23 σ(T x, T x0 ) < ε. Se dice que T es continua en todo M ⊂ D(T ) si T es continua en todo x ∈ M . Definici´n A.1.11 La imagen inversa de y ∈ Y es el conjunto de todas las x ∈ D(T ) tales que o T x = y. La imagen inversa de un subconjunto N ⊂ Y es el conjunto de todas las x ∈ D(T ) tales que T x = y para todos y ∈ M . La imagen inversa de un elemento y ∈ Y puede ser el conjunto vac´ un unico punto (elemento) ıo, ´ de D(T ) o un subconjunto M ⊂ D(T ). Proposici´n A.1.12 Una aplicaci´n T : D(T ) ⊂ X −→ Y es continua si y s´lo si la imagen o o o inversa de cualquier subconjunto abierto (cerrado) de Y es un subconjunto abierto (cerrado) de X. Demostraci´n: ⇒ Sea T continua y sea S ⊂ Y un abierto. Sea S0 la imagen inversa de S. Si o S0 = ∅ la proposici´n es trivial asi que asumiremos que S0 = ∅. Sea x0 ∈ S0 cualquiera y sea o y0 = T x0 ∈ S su imagen. Como S es abierto existe una bola B(y0 , ε) ⊂ S. Pero T es continua as´ que existe una bola B(x0 , δ) tal que T (B(x0 , δ)) ⊂ B(y0 , ε). Pero como B(y0 , ε) ⊂ S, entonces ı necesariamente B(x0 , δ) ⊂ S0 , luego x0 ∈ S0 es interior y en virtud de que x0 ∈ S0 es arbitrario, S0 es abierto. ⇐ Sea T una aplicaci´n tal que imagen inversa de cualquier subconjunto abierto de Y es un o subconjunto abierto de X. Sea x0 ∈ S0 cualquiera e y0 = T x0 ∈ S. Sea B(y0 , ε) ⊂ S una bola de radio ε arbitrario. Sea S0 la imagen inversa de dicha bola B(y0 , ε) que es un abierto. Entonces existe una bola B(x0 , δ) ⊂ S0 tal que T (B(x0 , δ)) ⊂ B(y0 , ε) ⊂ S, i.e., T es continua en x0 . Como x0 era arbitrario, entonces T es continua en D(T ). 2 Definici´n A.1.13 Sea M ⊂ X. Diremos que x ∈ X es un punto de contacto (o adherente) de o M si en cualquier bola B(x, ε), ε > 0 hay al menos un elemento de M . As´ mismo, diremos ı que x es un punto de acumulaci´n (o punto l´ o ımite) de M si en cualquier bola B(x, ε), ε > 0 hay al menos un elemento de M distinto de x, o equivalentemente, en cada bola B(x, ε), ε > 0 hay infinitos elementos de M . Un punto x se denomina aislado de M si existe una bola B(x, ε), ε > 0 que no contiene ning´n elemento M excepto el propio x. u Es f´cil ver que si M solo contiene puntos aislados entonces M es cerrado (pues X\M es a abierto). De lo anterior se deduce adem´s que los puntos de contacto de M o bien son puntos a l´ ımites, o bien son aislados. Definici´n A.1.14 Dado un subconjunto M ∈ X, se denomina clausura de M al conjunto M o de los elementos de M y sus puntos de contacto. De lo anterior se sigue que M = M ∪ {conjunto de sus puntos l´ ımites}. ımite de Q (¿por Por ejemplo, si X = Q, entonces Q = R pues todo x ∈ R es un punto l´ qu´?). e Proposici´n A.1.15 Un subconjunto M ∈ X es cerrado si y s´lo si M = M . As´ como o o ı, M ⊂ M , entonces M es el menor conjunto cerrado que contiene a M .
23 Aqu´ ı

r denota la m´trica de X y σ la de Y. e

120

´ ´ Anexo: Breve introduccion al analisis funcional

Demostraci´n: ⇒ Sea M cerrado. Como M ⊂ M basta probar que M ⊃ M . Como M es carrado, o entonces X \ M es abierto as´ que para todo x ∈ X \ M existe una bola B(x, r) completamente ı contenida en X \ M , i.e., B(x, r) no contiene puntos de M , luego x ∈ M , es decir, x ∈ X \ M , as´ que X \ M ⊂ X \ M , i.e. M ⊂ M . ı ⇐ Asumamos que M = M . Probaremos que X \ M es abierto. Sea x ∈ M , entonces x ∈ M . Entonces x ∈ X \ M . Como x ∈ M entonces x no es un punto adherente de M as´ que debe ı existir al menos una bola B(x, r) que no contiene a ning´n elemento de M , es decir x ∈ X \ M u es un punto interior del conjunto ∈ X \ M . Como x es arbitrario, X \ M es abierto luego M es cerrado. 2 Definici´n A.1.16 Un subconjunto M ⊂ X es acotado si su di´metro d(M ) = supx,y∈M r(x, y) o a es es finito. Definici´n A.1.17 Dada una sucesi´n (xn )n de elementos de X, diremos que (xn )n es acotada o o si existe un subconjunto M ⊂ X acotado tal que xn ∈ M para todo n ∈ N. Lo anterior es equivalente a que exista un x ∈ X y un n´mero K > 0 tal que r(x, xn ) < K para u todo n ∈ N. Definici´n A.1.18 Una sucesi´n (xn )n de elementos de X es convergente, y lo denotaremos o o por l´ n→∞ xn = x, si existe un x ∈ X tal que para todo ε > 0 existe un N ∈ N tal que para ım todo n > N , r(x, xn ) < ε. En caso contrario diremos que (xn )n es divergente. N´tese que en la propia definici´n de l´ o o ımite est´ expl´ a ıcito que el l´ ımite ha de ser un elemento de X. Por ejemplo, sea X el intervalo abierto (0, 1) con la m´trica habitual de R. La sucesi´n e o n→∞ xn = 1/(n + 1) no tiene l´ ımite en X ya que claramente 1/(n + 1) −→ 0 pero 0 ∈ (0, 1). Definici´n A.1.19 Una sucesi´n (xn )n de elementos de X se denomina de Cauchy o fundao o mental si existe para todo ε > 0 existe un N ∈ N tal que para todo n > N y todo p ∈ N, r(xn , xn+p ) < ε. En R toda sucesi´n es convergente si y s´lo si es de Cauchy. Esta propiedad fundamental o o de R no es cierta para cualquier espacio m´trico X. Por ejemplo, si escogemos nuevamente X e como el intervalo abierto (0, 1) con la m´trica habitual de R, la sucesi´n xn = 1/(n + 1), que es e o de Cauchy (¿por qu´?) no tiene l´ e ımite en X. Definici´n A.1.20 Un espacio m´trico X se denomina completo si y s´lo si toda sucesi´n de o e o o Cauchy de elementos de X converge (a un elemento de X). Por ejemplo, el espacio X = R con la m´trica usual de R, es completo. Tambi´n lo es X = C e e con la m´trica usual de C. Sin embargo Q, el conjunto de los n´meros racionales, es incompleto e u (¿por qu´?), y el conjunto X = (0, 1) de antes tambi´n lo es. El espacio m´trico (de Hilbert) l2 e e e es completo no as´ el espacio C2 ([a, b]). ı Teorema A.1.21 Un subespacio M de un espacio m´trico completo X es completo si y s´lo si e o es cerrado en X. Demostraci´n: ⇒ Sea M completo. Probaremos que M = M . Sea x ∈ M cualquiera, entonces o existe (¿por qu´?) una sucesi´n de elementos de M que converge a x. Entonces (xn )n es de e o Cauchy (pues es convergente) pero M es completo, luego x ∈ M , i.e., M = M . o ⇐ Sea M cerrado (i.e., M = M ) y (xn )n una sucesi´n de Cauchy en M . Entonces l´ n→∞ xn = x con x ∈ X (X es completo). Pero entonces x ∈ X es un punto de acumulaım ci´n de M , i.e., x ∈ M y como M es cerrado x ∈ M , i.e., toda sucesi´n de Cauchy en M tiene o o l´ ımite en M , i.e., M es completo. 2

´ A.1. Introduccion: Estacios m´tricos y espacios normados e
Definici´n A.1.22 Un subconjunto M ⊂ X es denso en X si su clausura M = X. o

121

De la definici´n anterior se infiere que si M es denso X entonces cualquiera sea la bola B(x, ε) o (por peque˜o que sea ε > 0) siempre contiene puntos de M . En otras palabras, cualquiera sea n x ∈ X, siempre tiene elementos de M tan cerca como se quiera. Por ejemplo Q es denso en R pues como ya hemos visto Q = R. Definici´n A.1.23 Un espacio m´trico X es separable si contiene un subespacio numerable24 o e M ⊂ X denso en X. As´ pues, R es separable pues Q es numerable y denso en R. Usando la separabilidad de R se ı puede probar que l2 tambi´n es separable. e Definici´n A.1.24 Un espacio m´trico X se denomina compacto si cualquier sucesi´n (xn )n o e o de elementos de X tiene una subsucesi´n convergente. o Entenderemos que M ⊂ X es compacto si M es compacto como subconjunto de X, i.e., cualquier (xn )n de elementos de M tiene una subsucesi´n convergente en M . o Lema A.1.25 Si M ⊂ X es compacto, entonces M es cerrado y acotado. Demostraci´n: Sea M compacto y sea x ∈ M cualquiera. Como x ∈ M entonces existe una o n→∞ sucesi´n (xn )n en M tal que xn −→ x ∈ X. Como M es compacto, entonces x ∈ M , luego o M = M por lo que M es cerrado. Supongamos que M es no acotado. Entonces existe al menos una sucesi´n (xn )n de eleo mentos de M tal que, fijado un b ∈ M arbitrario, se tiene que r(xn , b) > n (¿por qu´?). Dicha e sucesi´n obviamente no puede tener ninguna subsucesi´n convergente (pues caso que la tuviera o o ´sta fuese acotada) y por tanto M no puede ser compacto. e 2 El rec´ ıproco es falso. Por ejemplo escojamos X = l2 y sea el conjunto M de los vectores ek = δk,i , i.e., vectores que todas las coordenadas son cero excepto la k-´sima que es 1. Obviamente e ek = 1. Adem´s todos los puntos de M son aislados (¿por qu´?), por tanto M es cerrado. a e Ahora bien, como M solo tiene puntos aislados, M no tiene ning´n punto de acumulaci´n por u o lo tanto ninguna sucesi´n que escojamos de elementos distintos de M contiene una subsucesi´n o o convergente. Definici´n A.1.26 Un espacio vectorial X se denomina espacio normado si para todo x ∈ X o existe un n´mero real denominado norma, y que denotaremos por x , que cumple con las u condiciones 1. Para todo x ∈ X, x ≥ 0 y si x = 0 entonces x = 0. 2. Para todo x ∈ X y λ ∈ R, λx = |λ| x , 3. Para todos x, y ∈ X se tiene la desigualdad triangular x+y ≤ x + y . (A.1.1)

24 Un conjunto M cualquiera se denomina numerable si se puede poner en correspondencia biun´ ıvoca con N = {1, 2, 3, . . . }. Es decir, existe una correspondencia biun´ ıvoca entre los elementos de M y los n´meros naturales. Por ejemplo, Q es numerable, pero R no lo es. u

122

´ ´ Anexo: Breve introduccion al analisis funcional

Es evidente que si en un espacio normado X definimos la funci´n r(x, y) = x − y , esta satisface o los axiomas de la definici´n A.1.1, i.e., todo espacio normado es un espacio m´trico. La funci´n o e o r anterior se denomina m´trica inducida por la norma. e Definici´n A.1.27 Un espacio normado completo (en la m´trica inducida por la norma) se o e denomina espacio de Banach. As´ el espacio l2 , de todas las sucesiones x = (x1 , x2 , . . . , xn , . . .) reales (o complejas) tales ı, ´ `P∞ P∞ 2 1/2 , es un espacio de Banach, pero el que k=1 |xk |2 < +∞ con la norma x = k=1 |xk | “R ”1/2 b espacio de las funciones continuas en [a, b] con la norma f = |f (x)|2 es un espacio a normado pero no de Banach (¿por qu´?). e Est´ claro que todo espacio normado es un espacio m´trico con la m´trica inducida por la a e e norma, pero no a la inversa (construir un contra ejemplo como ejercicio). Obviamente en los espacios normados podemos definir la convergencia de sucesiones, sucesiones de Cauchy, etc.. Basta considerarlos como espacios m´tricos con la m´trica r inducida e e por la norma: r(x, y) = x − y . Consideremos ahora un caso particular de las aplicaciones introducidas en la definici´n o A.1.5. Definici´n A.1.28 Una aplicaci´n (operador) es lineal si o o 1. El dominio de T , D(T ), y la imagen de T , I(T ), son ambos espacios vectoriales sobre el mismo cuerpo K (R o Z). 2. ∀α, β ∈ K, ∀x, y ∈ D(T ), T (αz + βy) = αT (x) + βT (y).

Definici´n A.1.29 Sean X e Y dos espacios normados y sea el operador T : D(T ) → Y lineal. o T es acotado si existe c ≥ 0 tal que25 Tx ≤ c x , ∀x ∈ D(T ). (A.1.2)

De lo anterior se sigue que si T es acotado, entonces para todo x = 0, Tx ≤ c, x ∀x ∈ D(T ), x = 0. (A.1.3)

El menor valor de c para el cual (A.1.2) se cumple lo denotaremos por T y se denomina norma del operador lineal T . De hecho se tiene que T = sup
x∈X\{0}

Tx . x

(A.1.4)

Si T = 0 obviamente T = 0. Adem´s de (A.1.2), tomando ´ a ınfimos en c obtenemos ∀y ∈ X, Es f´cil probar que T a
25 Se

Ty ≤ T y

⇐⇒

Ty ≤ T

y .

es una norma, es decir se cumplen los axiomas de la definici´n. o

sobrentiende que x es la norma en X y T x es en Y.

A.2. Espacios de Hilbert separables

123

Teorema A.1.30 Sea T : D(T ) ⊂ X → Y una aplicaci´n lineal de un espacio normado X a o otro espacio normado Y. Entonces 1. T es continuo si y s´lo si T es acotado. o 2. Si T es continuo en alg´n x0 ∈ D(T ), T es continuo en D(T ). u Demostraci´n: Asumiremos que T no es el operador nulo. o 1. ⇒ Sea T acotado y sea x0 ∈ D(T ) cualquiera. Como T es lineal y acotado, entonces T x − T x0 = T (x − x0 ) ≤ T Entonces, para todo ε > 0, existe un δ = ε/ T T x − T x0 < ε, i.e., T es continuo en D(T ). x − x0 .

> 0 tal que, para todo x con x − x0 < δ,

⇐ Sea T lineal y continuo en x0 ∈ D(T ) cualquiera. Entonces para todo ε > 0, existe un δ > 0 tal que, para todo x con x − x0 < δ, T x − T x0 < ε. Sea y = 0 en D(T ) cualquiera. Escojamos x tal que x = x0 + δ y 2 y =⇒ x − x0 = δ y 2 y =⇒ x − x0 < δ =⇒ T x − T x0 < ε.

Adem´s, para dichos x tenemos, usando la linealidad de T , que a ‚ ‚ ‚ ‚ δ δ T x − T x0 = T (x − x0 ) = ‚T y‚ = ‚ 2 y ‚ 2 y Ty ≤ ε luego T es acotado.

=⇒

Ty ≤

2ε y , δ

2. N´tese que en la prueba anterior se prob´ que si T era continuo en un punto x0 ∈ D(T ), o o entonces era acotado en D(T ). Pero entonces por 1, al ser acotado en D(T ), es continuo en D(T ). 2 Finalmente concluiremos con una secci´n sobre los espacios de Hilbert separables que como plementa los apartados 4.1 y 4.2.

A.2.

Espacios de Hilbert separables

Definici´n A.2.1 Dado un vector x ∈ H definiremos la serie de Fourier respecto al sistema o ortonormal (φn )∞ a la serie n=1 ∞ X cn φn , (A.2.1) s :=
n=1

donde los coeficientes vienen dados por las expresiones cn = x, φn ,

∀n ≥ 1.

(A.2.2)

Teorema A.2.2 Sea H el subespacio lineal de H generado por los vectores φ1 , φ2 . . . , φn , n ∈ N, i.e., H = span (φ1 , φ2 . . . , φn ). Entonces m´ ||x − q||2 = ||x||2 − ın
q∈H n X

|ck |2

k=1

donde ck son los coeficientes definidos en (A.2.2) y se alcanza cuando q es la suma parcial de la serie de Fourier (A.2.1) n X ck φk . q = sn :=
k=1

124
Demostraci´n: Sea gn = o Pn
k=1

´ ´ Anexo: Breve introduccion al analisis funcional
ak φk . Calculamos
2

x − gk , x − gk = x

n X

c2 φk k

2

+

k=1

n X

(ak − ck )2 φk

2

.

k=1

Obviamente la expresi´n anterior es m´ o ınima si y s´lo si ak = ck para todo k ∈ N, i.e., gn = sn .2 o N´tese que o *
2

x − sn

= x−

n n X X | x, φk |2 φm , φk = x + φk 2 φm 2 k=1 m=1

n n X x, φk X x, φk φ ,x − φk 2 k φk φk 2 k=1 k=1

+

= x

2

−2

n X | x, φk |2 2 − = x φk 2 k=1

n X | x, φk |2 φk 2 k=1 2

n X

(A.2.3)
2

|ck | .

k=1

Como corolario de lo anterior tenemos que I n = x − sn luego
∞ X 2

= x

2

n X

|ck |2 ≥ 0,

∀n ∈ N,

k=1

|ck |2 ≤ x 2 ,

(A.2.4)

por lo que la serie

P∞

k=1

k=1

|ck |2 converge (¿por qu´?) y por tanto e =⇒
n→∞

n→∞

l´ |cn | = 0 ım

l´ ım x, φk = l´ ım φk , x = 0.
n→∞

(A.2.5)

La desigualdad (A.2.4) se conoce como desigualdad de Bessel. N´tese que una condici´n o o necesaria y suficiente para que la serie de Fourier (A.2.1) converja a x (en norma) es que x
2

=

∞ X

|ck |2 =

k=1

∞ X

| x, φn |2 .

k=1

Esta igualdad se denomina com´nmente igualdad de Parseval y es, en general, muy compliu cada de comprobar. Definici´n A.2.3 Se dice que un sistema de vectores linealmente independientes (φn )n es como pleto en X ⊂ H si para todo vector x ∈ X ⊂ H y cualquiera sea ǫ > 0 existe una combinaci´n o lineal n X αk φk tal que x − ln < ǫ . ln =
k=1

En otras palabras cualquier vector x ∈ X ⊂ H se puede aproximar en norma tanto como se quiera mediante alguna combinaci´n finita de vectores del sistema (φn )n . Esta definici´n es equivalente o o a decir que H es el menor subespacio vectorial cerrado que contiene al conjunto φ1 , φ2 , . . . ((φn )n genera a todo H). Definici´n A.2.4 Un sistema ortogonal (ortonormal) completo de X ⊂ H se denomina base o ortogonal (ortonormal) de X ⊂ H.

A.2. Espacios de Hilbert separables

125

Por ejemplo, los sistemas (ek )k definidos por (A.2.6) y (A.2.7) son bases ortogonales completas de Cn y l2 , respectivamente e1 = (1, 0, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . . , en = (0, 0, 0, . . . , 1), e1 = (1, 0, 0, 0, . . . ), e2 = (0, 1, 0, 0, . . . ), en = (0, 0, 1, 0 . . . ), . . . . (A.2.6) (A.2.7)

Teorema A.2.5 Sea H un espacio de Hilbert y sea el sistema ortonormal de vectores (φn )∞ n=1 de H. Entonces las siguientes condiciones son equivalentes: 1. (φn )n es completo en X ⊂ H. ∞ X x, φk φk . 2. Para todo x ∈ X ⊂ H, x =
k=1

3. Para todo x ∈ X ⊂ H, se cumple la igualdad de Parseval x
2

=

∞ X

| x, φk |2 .

k=1

4. Si x, φk = 0 para todo k ∈ N entonces x = 0. Demostraci´n: 1)↔ 2) Cualquiera sea x ∈ H construimos la serie de Fourier (A.2.1) y sean o P sn = n ck φk sus sumas parciales. Usando 1) y el teorema A.2.2 tenemos k=1 ∀ǫ > 0, ∃N ∈ N tal que x − sN < ǫ. Pero como para todo n > N , x − sn ≤ x − sN (basta usar la identidad (A.2.3)), entonces para todo n > N , x − sn ≤ ǫ, es decir, l´ n→∞ sn = x de donde se sigue 2). Obviamente 2) ım implica 1) (¿por qu´?). e 2)→3) Tomando el l´ ımite n → ∞ en (A.2.3) y usando 2) (l´ n→∞ x−sn = 0), se sigue 3). ım 3)→4) Si para todo k ∈ N x, φk = 0, entonces de 3) se deduce que x = 0, luego x = 0. P 4)→2) Por sencillez consideremos que el sistema (φn )n es ortonormal. Sea yn = n ck φk , k=1 P∞ ck = x, φk . Usando la desigualdad de Bessel (A.2.4) se sigue que la serie m=1 |cm |2 es una serie convergente y por tanto la cantidad
n+p

yn − yn+p

2

=

k=n+1

X

|ck |2 ,

se puede hacer tan peque˜a como se quiera, i.e., la sucesi´n yn es de Cauchy, luego es convergente. n o Sea y su l´ ımite. Probemos que y = x. Usando la desigualdad de Cauchy-Schwarz | y, φk − yn , φk | = | y − yn , φk | ≤ yn − y deducimos que l´ n→∞ yn , φk = y, φk para todo k ∈ N. Pero ım yn , φ k =
n X j=1

φk ,

x, φj φk , φj = x, φk ,

∀k ≤ n,

luego x−yn , φk = 0 para todo k ≤ n de donde, tomando n → ∞ deducimos que x−y, φk = 0 para todo k ∈ N, luego por 4) x − y = 0. 2

126

´ ´ Anexo: Breve introduccion al analisis funcional

Nota A.2.6 La equivalencia entre 1 y 2, as´ como las implicaciones 2 → 3 → 4, son tambi´n ı e ciertas para espacios eucl´ ıdeos cualesquiera (no necesariamente completos). A partir del apartado 4 del Teorema A.2.5 se sigue el siguiente corolario: Corolario A.2.7 Sea el sistema ortonormal completo (φn )n y sean x, y ∈ X ⊂ H tales que x, φk = y, φk para todo k ∈ N, entonces x = y. En otras palabras, dos elementos de H con iguales coeficientes de Fourier son iguales, por tanto cualquier vector de H queda biun´ ıvocamente determinado por sus coeficientes de Fourier. Definici´n A.2.8 Se dice que un sistema ortonormal (φn )n es cerrado en un espacio eucl´ o ıdeo E si para todo vector x ∈ E se cumple la igualdad de Parseval
∞ X

|ck |2 =

k=1

∞ X

| x, φk |2 = x 2 .

k=1

De la definici´n anterior y el Teorema A.2.5 se sigue que un un sistema ortonormal (φn )n o es completo en un espacio de Hilbert H si y s´lo si (φn )n es cerrado en H. o Teorema A.2.9 Todo espacio de Hilbert H separable tiene una base ortonormal. Demostraci´n: Como H es separable, existe un conjunto numerable de vectores (φn )n denso en o H. Si de dicho conjunto eliminamos aquellos vectores φk que se pueden obtener como combinaci´n lineal de los anteriores φj , j < k obtenemos un sistema completo de vectores linealmente o independientes de H. La base ortonormal se obtiene al aplicar a dicho sistema el proceso de ortogonalizaci´n de Gram-Schmidt. o 2 El teorema anterior se puede generalizar a cualquier espacio eucl´ ıdeo separable. Teorema A.2.10 (Riesz-Fischer) Sea (φn )n un sistema ortonormal en un espacio de Hilbert H y sean los n´meros c1 , c2 , . . . , cn , . . . tales que u
∞ X

|cn |2 < +∞.

n=1

Entonces, existe un elemento x ∈ H cuyos coeficientes de Fourier son precisamente los n´meros u c1 , c2 , . . . , cn , . . . , i.e., ∞ X |cn |2 = x 2 , cn = x, φn .
n=1

Demostraci´n: Sea xn = k=1 ck φk . Como vimos en la prueba del Teorema A.2.5 la sucesi´n o o n→∞ anterior es de Cauchy y como H es completo entonces xn −→ x ∈ H. Probemos que entonces ck = x, φk , k = 1, 2, . . . . Para ello notemos que x, φk = xn , φk + x − xn , φk . Pero entonces si n ≥ k, x − xn , φk = 0 y, por tanto, ck = x, φk = xn , φk , de donde se sigue, tomando el l´ ımite n → ∞ y usando la continuidad del producto escalar que para todo n→∞ k = 1, 2, 3, . . . , ck = x, φk . Adem´s, como xn −→ x, usando (A.2.3), se tiene que a x de donde se sigue el teorema.
2

Pn

n X

|ck |2 = x − xn

2 n→∞

−→ 0, 2

k=1

A.2. Espacios de Hilbert separables

127

Definici´n A.2.11 Una aplicaci´n U entre dos espacios de Hilbert H y H∗ se denomina unio o taria si U es lineal, biyectiva y preserva el producto escalar, i.e.26 , x, y = U x, U y

= x∗ , y ∗ ∗ .

Los espacios H y H∗ son isomorfos si existe una aplicaci´n unitaria U : H → H∗ tal que x∗ = U x, o donde x ∈ H y x∗ ∈ H∗ . Como consecuencia de los Teoremas A.2.5, A.2.9 y A.2.10 se tiene el siguiente resultado: Teorema A.2.12 (del isomorfismo) Cualquier espacio de Hilbert separable H es isomorfo a Cn o a l 2 . Demostraci´n: Como H es separable, en H existe una base ortonormal numerable (ver Teorema o A.2.9) que denotaremos por (φn )n∈I , donde I es un conjunto numerable (finito o infinito). Asumiremos que I es infinito, (I = N) i.e., probaremos el caso cuando H es isomorfo a l2 (el caso finito es totalmente an´P alogo). Sea x ∈ H y sea la aplicaci´n U : H → l2 definida por o P ∗ x = U x = k∈I x, φk ek = k∈I xk ek ∈ l2 , donde (en )n denota la base ortonormal can´nica o de l2 que ya hemos visto antes. Esta claro que U es biun´ ıvoco, pues dada cualquier sucesi´n o (xn )n de l2 por el Teorema de Riesz-Fischer existe un x ∈ H cuyos coeficientes de Fourier coinciden con dichos valores xn y por el Corolario A.2.7 dicho elemento es unico. Adem´s, como ´ a el producto escalar x, y es linear respecto al elemento de la izquierda (i.e., x), esta claro que U es lineal (probarlo como ejercicio). Finalmente, para probar que U es unitario usamos, por un lado, que + * X X X ym φ m = x k φk , x k yk , x, y =
k∈I m∈I k∈I

y, por el otro, que el producto escalar en l2 viene dado por x∗ , y ∗ sigue que x, y = x∗ , y ∗ l2 .

l2

=

P

k∈I

xk yk , de donde se 2

Definici´n A.2.13 Sea M ⊂ H un subespacio27 cerrado del espacio de Hilbert H. Denominao remos complemento ortogonal de M , y lo denotaremos por M ⊥ , al conjunto M ⊥ = {x ∈ H; x, y = 0, ∀y ∈ M }. N´tese que al ser M ⊥ cerrado, es completo (pues H es completo, y todo subespacio M de o un espacio m´trico completo H es completo si y s´lo si es cerrado en H). e o Teorema A.2.14 Sea M ⊂ H un subespacio cerrado del espacio de Hilbert H y M ⊥ su complemento ortogonal. Entonces, todo vector x ∈ H admite una unica representaci´n de la forma ´ o x = y + y ⊥ donde y ∈ M e y ⊥ ∈ M ⊥ . Demostraci´n: Como H es separable y M es cerrado en H, entonces M es completo (recordemos o nuevamente que todo subespacio M de un espacio m´trico completo H es completo si y s´lo si e o es cerrado en H) y separable, i.e., M es a su vez un espacio de Hilbert separable por lo que P existe una base orthonormal completa (φn )n de M . Definamos y = n x, φn φn . Obviamente ⊥ ⊥ y ∈ M . Definamos y = x − y. Entonces, para todo n y , φn = 0. Ahora bien, cualquiera sea P y ∈ M , y = n an φn , luego y ⊥ , y = 0, es decir y ⊥ ∈ M ⊥ . Luego cualquiera sea x ∈ H, existen ˜ ˜ ˜ y ∈ M y y ⊥ ∈ M ⊥ tales que x = y + y ⊥ . Probemos que esta descomposici´n es unica. Para o ´
26 Se 27 Se

entiende que ·, · ∗ denota el producto escalar en H∗ que no tiene por que ser el mismo que en H. entender´, como el caso de los espacios normados que M es un subespacio lineal de H. a

128

´ ´ Anexo: Breve introduccion al analisis funcional

ello supongamos que no, i.e., supongamos que existen un y ′ ∈ M , y ′ = y tal que x = y ′ + y ′ , ⊥ y ′ ∈ M ⊥ (y obviamente distinta de y ⊥ ). Entonces y ′ , φn = x − y ′ , φn = x, φn = y, φn lo que es una contradicci´n. o
⊥ ⊥ ⊥

=⇒

y ′ = y, 2

Si todo elemento de H se puede escribir en la forma x = y + y donde y ∈ M e y ∈ M , entonces se dice que M es suma directa de M y M ⊥ y se escribe como H = M ⊕ M ⊥ . Es f´cil a ver que la noci´n de suma directa se puede extender al caso de un n´mero finito o contable de o u subespacios M1 , M2 , etc. N´tese adem´s que del teorema anterior se sigue que (M ⊥ )⊥ = M . o a Para terminar mencionaremos un teorema sobre funcionales lineales acotados. Teorema A.2.15 (Riesz) Cualquier funcional lineal acotado T : H → K (K es C o R) se puede representar en t´rminos de un producto escalar, i.e., e T x = x, z , donde z depende de T y esta un´ ıvocamente determinado por T y su norma satisface la ecuaci´n o z = T . La prueba de este importante teorema se puede encontrar en [E. Kreyszig. Introductory Functional Analysis with Applications, p´g. 188]. a

A.2.1.

Operadores en espacios de Hilbert

Definici´n A.2.16 Sea la aplicaci´n (operador) linear A : E → E′ , E, E′ espacios eucl´ o o ıdeos. Si existe el operador lineal A∗ : E′ → E tal que para todo x ∈ E e y ∈ E′ Ax, y lo denominaremos adjunto de A. Por sencillez asumiremos E′ = E. Por ejemplo sea el operador S : l2 → l2 S(x1 , x2 , x3 , . . .) = (0, x1 , x2 , . . .), com´nmente denominado operador desplazamiento (shift). Entonces su adjunto S ∗ es el operador u S : l2 → l2 S ∗ (x1 , x2 , x3 , . . .) = (x2 , x3 , . . .), Para los espacios eucl´ ıdeos la existencia del operador adjunto no est´ garantizada en general, a no obstante si que lo est´ en el caso de los espacios de Hilbert. De hecho, como consecuencia del a Teorema de representaci´n de Riesz A.2.15 se tiene el siguiente resultado: o Teorema A.2.17 Sea la aplicaci´n (operador) linear A : H → H′ , H, H′ espacios de Hilbert. o Entonces existe un unico operador A∗ : H′ → H adjunto a A. Adem´s, A∗ es lineal y A∗ = A . ´ a

= x, A∗ y ,

A.2. Espacios de Hilbert separables

129

Demostraci´n: Definimos el funcional Ty x : H → K, Ty x := Ax, y ′ . Obviamente, para cada y o fijo |Ty x| ≤ Ax y ≤ A x y ≤ K x , ∀y ∈ H′ , i.e., Ty es un funcional acotado, as´ que el teorema de Riesz A.2.15 nos asegura que existe un ı unico vector y ∗ tal que Ty x = x, y ∗ , para todo x ∈ H. As´ el operador A : H → H′ induce un ´ ı, operador A∗ : H′ → H con A∗ y = y ∗ , pues Ax, y ′ = x, y ∗ = x, A∗ y . La linealidad de A∗ se sigue de la linealidad de A. Probemos ahora que A∗ = A . De la igualdad Ax, y ′ = x, A∗ y y usando que A es acotado tenemos | x, A∗ y | = | Ax, y ′ | ≤ A Escogiendo x = A y obtenemos A∗ y
2 ∗

x

y .

≤ A

A∗ y

y

=⇒

A∗ y ≤ A y

=⇒

A∗ ≤ A .

De lo anterior se sigue que A∗ es acotado. Pero entonces podemos aplicar el mismo razonamiento intercambiando A y A∗ lo que nos conduce a la desigualdad contraria A ≤ A∗ por tanto A = A∗ . 2 En adelante asumiremos que H = H′ . Supongamos que H es un espacio de Hilbert de dimensi´n finita. Entonces como ya hemos visto, H es isomorfo a Cn . Sea (ek )k una base de H. o Entonces para todo x ∈ H x= Si Aek =
n X

x k ek

=⇒

y = Ax =

k=1 n X i=1 n n X X i=1

n X

xk Aek .

k=1

ai,k ei

=⇒ yi =

y=

ai,k xk

k=1

!

ei =

Es decir, si consideramos los vectores x, y ∈ Cn con coordenadas xi , yi , i = 1, . . . , n, respectivamente, entonces el operador A se puede representar como una matriz (ai,j )n , i.e., tenemos i,j=1 la aplicaci´n A : Cn → Cn , y = Ax, donde A es una matriz n × n o 1 0 a1,1 a1,2 a1,3 · · · a1,n B a2,1 a2,2 a2,3 · · · a2,n C C B C B A = B a3,1 a3,2 a3,3 · · · a3,n C . B . . . C . .. . . . A @ . . . . . . an,1 an,2 an,3 · · · an,n Obviamente la matriz de la aplicaci´n identidad es la matriz identidad. o N´tese que lo anterior se puede generalizar al o caso la matriz ser´ una matriz infinita ıa 0 a1,1 a1,2 a1,3 B a2,1 a2,2 a2,3 B B a3,1 a3,2 a3,3 B . . A=B . . . B . . . B . B an,1 an,2 an,3 @ . . . . . . . . .

n X

n X i=1

yi e i

=⇒

ai,k xk ,

i = 1, 2, . . . n.

k=1

caso de dimensi´n infinita, s´lo que en este o o ··· ··· ··· .. . ··· . . . a1,n a2,n a3,n . . . an,n . . . 1 ··· ··· C C ··· C C C. ··· C C ··· C A .. .

130

´ ´ Anexo: Breve introduccion al analisis funcional

Definici´n A.2.18 Sea el operador lineal A : X → Y, X e Y espacios de Banach. Diremos que o A es invertible si existe un operador B, A : Y → X tal que AB = IY , BA = IX . Est´ claro que para el caso de dimensi´n finita, existir´ el inverso de A si dim X = dim Y y a o a la matriz correspondiente ser´ la matriz inversa de A. En dimensi´n infinita la situaci´n es algo a o o m´s complicada. Por ejemplo, el operador desplazamiento S cumple con S ∗ S = I pero SS ∗ = I, a luego S no tiene inverso. Teorema A.2.19 Sea el operador lineal A : X → X, X espacio de Banach. Si A < 1, entonces I − A es invertible y (en norma) (I − A)−1 =
∞ X

Ak ,

donde A0 := I.

k=0

Demostraci´n: Sea la sucesi´n de operadores (An )n , definida por An x := Xn = (I +A+A2 +· · ·+ o o An )x, x ∈ X (cualquiera). Obviamente An es un operador acotado (probarlo como ejercicio). Probemos que (Xn )n es de Cauchy (en la norma de X): Xn+p − Xn = Xn+1 + · · · + Xn+p = An+1 x + · · · + An+p x ≤ An+1 x + · · · + An+p x ≤ x ( An+1 + · · · + An+p ) ≤ x ( A ≤ x ( A
n+1 n+1

+ ··· + A
n+1 n→∞

n+p

)

+ ··· + A

n+p

+ ···) ≤ x

A 1− A

−→ 0.

Como X es completo (es de Banach) entonces, para cada x ∈ X la sucesi´n An x converge a un o y ∈ X que denotaremos por y = T x. As´ tendremos el operador T : X → X bien definido. Como ı, A es lineal, An lo ser´ y por tanto T tambi´n. Para ello basta tomar el l´ a e ımite cuando n → ∞ en la igualdad An (αx + βy) = αAn x + βAn y, α, β ∈ K y x, y ∈ X. Si tomamos ahora el l´ ımite p → ∞ en la desigualdad de antes y usamos que Xn+p = An+p x → T x, obtenemos T x − An x ≤ x A n+1 , 1− A

de donde se sigue que T − An es un operador lineal acotado, luego T lo ser´ (¿por qu´?). De la a e desigualdad anterior se sigue adem´s que a T x − An x A n+1 A n+1 n→∞ −→ 0 =⇒ l´ An = T. ım ≤ =⇒ T − An ≤ n→∞ x 1− A 1− A Probemos ahora que T = (I − A)−1 . Ante todo notemos que I − A es un operador lineal y acotado y por tanto continuo28 . Calculemos el producto (I − A)T x = (I − A) l´ An x = l´ (I − A)An x = l´ (An x − A · An x) = l´ (x − An+1 x). ım ım ım ım
n→∞ n→∞ n→∞ n→∞

Pero An+1 x ≤ A n+1 x −→ 0, luego An+1 x −→ 0, y por tanto (I − A)T x = x para todo x. La prueba de que T (I − A)x = x para todo x es an´loga y la omitiremos. a 2 Definici´n A.2.20 Denotaremos por L(X) el conjunto de todos los operadores lineales A en X, o i.e., A : X → X.
28 Aqu´ usamos el hecho conocido de que toda aplicaci´n lineal T : D(T ) ⊂ X → Y de un espacio ı o normado (Hilbert) X a otro espacio normado (Hilbert) Y tiene las propiedades: 1. T es continua si y s´lo o si T es acotada y 2. Si T es continua en alg´n x0 ∈ D(T ), T es continua en todo su dominio D(T ). u

n→∞

n→∞

A.2. Espacios de Hilbert separables

131

N´tese que la prueba del Teorema A.2.19 se puede adaptar para probar que toda sucesi´n o o de Cauchy de operadores Tn ∈ L(X) es convergente. Si Tn es de Cauchy entonces ∀ε > 0, existe un N ∈ N tal que ∀n ∈ N, n > N y ∀p ∈ N, Tn+p − Tn < ε. Luego la sucesi´n Xn := Tn x es o de Cauchy Tn+p x − Tn x ≤ Tn+p − Tn x ≤ ε x =⇒ Tn+p x − Tn x
n→∞

−→ 0.

Como X es completo Tn x tendra un l´ ımite y para cada x, i.e., podemos definir el operador T : X → X por T x = y. De la misma forma que en la prueba del Teorema A.2.19 se sigue que T es lineal. Para probar que es acotado usamos la desiguladad anterior: Tn+p x − Tn x ≤ Tn+p − Tn x =⇒ T x − Tn x Tn+p x − Tn x ≤ ε =⇒ ≤ε x x

donde hemos tomando el l´ ımite p → ∞ y usado la continuidad de la norma. I.e., T − Tn es acotado y por tanto T lo es (Tn es acotado). Adem´s, de lo anterior se sigue tambi´n, tomando a e n→∞ el supremo en x, que T − Tn ≤ ε para todo n > N , i.e., Tn −→ T . Lo anterior nos conduce al siguiente teorema: Teorema A.2.21 El espacio L(X) es un espacio de Banach respecto a la norma de los operadores. Una aplicaci´n directa del Teorema A.2.19 es el siguiente resultado: o Teorema A.2.22 Sea X un espacio de Banach y sea L(X) el conjunto de todos los operadores lineales A : X → X. El conjunto E ⊂ L(X) de los operadores invertibles en X es abierto en L(X). Demostraci´n: Sea A ∈ L(X) un operador invertible. Definamos la bola B(A, 1/ A−1 ). Cualo quiera sea B ∈ B(A, 1/ A−1 ) tendremos que B−A ≤ 1 =⇒ (B − A)A−1 ≤ B − A A−1 A−1 < 1,

luego el operador I + (B − A)A−1 = BA−1 es invertible, por tanto el operador B = (BA−1 )A lo ser´, i.e., todo operador B ∈ B(A, 1/ A−1 ) es invertible, por tanto para cualquiera sea A ∈ E a existe una bola B(A, 1/ A−1 ) ⊂ E centrada en A, luego E es abierto. 2 Definici´n A.2.23 Un operador lineal A : X → Y, X e Y espacios de Banach es compaco to si para toda sucesi´n acotada (xn )n de X, la sucesi´n (Axn )n de Y tiene una subsucesi´n o o o convergente. N´tese que si A es compacto, A es acotado pues en caso contrario existir´ una sucesi´n o ıa o n→∞ acotada (xn )n tal que Axn −→ ∞ y entonces la sucesi´n (Axn )n no tendr´ una subsucesi´n o ıa o convergente. Se puede probar que cualquier operator A : H → H, siendo H un espacio de Banach de dimensi´n finita es compacto, no obstante la compacidad no es trivial en el caso infinito tal y o como muestra el siguiente ejemplo: El operador identidad I : H → H, H espacio de Hilbert de dimensi´n infinita no es compacto. Para probarlo, escojamos una sucesi´n orthonormal (xn )n o o en H. Como xn − xm 2 = 2 para todos n, m ∈ N, entonces la sucesi´n Ixn = xn no contiene o subsucesiones de Cauchy y por tanto no tiene subsucesiones convergentes. Teorema A.2.24 Sea A ∈ L(H) un operador compacto y B ∈ L(H) uno acotado, H espacio de Hilbert. Entonces los operadores AB y BA son compactos.

132

´ ´ Anexo: Breve introduccion al analisis funcional

o Demostraci´n: Sea (xn )n una sucesi´n acotada de H. Como B es acotado, entonces la suceo si´n (Bxn )n es acotada y como A es compacto, de la sucesi´n (ABxn )n se puede extraer una o o subsucesi´n convergente, luego AB es compacto. o Sea ahora (xn )n una sucesi´n acotada de H. Como A es compacto, existe una subsucesi´n o o (Axnk )k de (Axn )n que converge. Ahora bien, B es acotado, luego es continuo (ver Teorema 2 A.1.30), por lo que la subsucesi´n (BAxnk )k converge, luego BA es compacto. o Definici´n A.2.25 Un operador A : H → H, H espacio de Hilbert, se llama herm´ o ıtico o autoadjunto si A = A∗ , i.e., Ax, y = x, A∗ y , ∀x, y ∈ H.

A.2.2.

Teor´ Espectral de operadores compactos autoadjuntos ıa

En un espacio de dimensi´n finita podemos definir el espectro de un operador como el o conjunto de los autovalores de su correspondiente matriz (en alguna base29 ), i.e., es el conjunto de los n´meros complejos λ tales que u Ax = λx, x = 0. (A.2.8)

Puesto que para cualquier matriz n × n existen n autovalores, en el caso finito es relativamente simple de estudiar. No as´ el caso infinito. ı Por ejemplo el operador desplazamiento ya visto antes S : l2 → l2 , S(x1 , x2 , x3 , . . .) = (0, x1 , x2 , . . .), no tiene autovalores pues la igualdad Sx = λx implica x = 0. As´ se precisa de una definici´n m´s general. ı o a Definici´n A.2.26 Sea X un espacio de Banach y A una aplicaci´n lineal A : X → X. El o o espectro de A, que denotaremos por σ(A) es el conjunto de n´meros complejos tales que el u operador (λI − A) es no invertible, i.e., no existe (λI − A)−1 . De la definici´n anterior se sigue que en dimensi´n finita σ(A) es el conjunto de todos los o o autovalores de A. Teorema A.2.27 σ(A) es un compacto de C (conjunto cerrado y acotado de C) contenido en el interior del disco cerrado D = {z; |z| ≤ A }. Demostraci´n: Sea L(X) el conjunto de todos los operadores lineales de X en X, X espacio de o Banach. Definamos el operador F : C → L(X), F (λ) = λI − A. Esta claro que F es lineal. Como para todo µ, λ ∈ C, F (µ) − F (λ) = |µ − λ|, entonces F es acotado y por el Teorema A.1.30 F es continuo (en λ) en la norma de los operadores. Sea E ⊂ L(X) el espacio de las aplicaciones invertibles. Si λ ∈ σ(A), entonces λI − A no es invertible, luego para λ ∈ σ(A) no existe el inverso de F , i.e., σ(A) es la imagen inversa F −1 de L(X) \ E, σ(A) = F −1 (L(X) \ E). Como E es abierto (Teorema A.2.22) entonces L(X) \ E es cerrado, y como F es continua entonces por la Proposici´n A.1.12, F −1 (L(X) \ E) es cerrado, o luego σ(A) lo ser´. Escojamos ahora λ tal que |λ| > A , entonces λ−1 A < 1 as´ que (I −λ−1 A) a ı es invertible y por tanto λI − A lo ser´. Entonces para dichos λ tendremos que λ ∈ σ(A), i.e., a σ(A) ∈ B(0, A ). Es decir, σ(A) es cerrado y acotado, por lo tanto es compacto (en dimensi´n o finita cerrado y acotado es equivalente a compacto) contenido en el interior de la bola cerrada B(0, A ). 2
29 Es un hecho conocido del algebra lineal que los autovalores de un operador no dependen de la base ´ escogida.

A.2. Espacios de Hilbert separables

133

Teorema A.2.28 Sea H un espacio de Hilbert y A una aplicaci´n lineal A : H → H herm´ o ıtica (autoadjunta). Entonces todos los autovalores de A (si los tiene) son reales. Adem´s los autoa vectores correspondientes a autovalores distintos son ortogonales. e Demostraci´n: Sea λ un autovalor de A y x su correspondiente autovector, que sin p´rdida o de generalidad asumiremos normalizado x = 1. Entonces, usando que Ax = λx y que A es herm´ ıtico, tenemos Ax, x = x, Ax =⇒ λ x = λ x =⇒ λ = λ =⇒ λ ∈ R. Sea Ax1 = λ1 x1 y Ax2 = λ2 x2 . Entonces como A es herm´ ıtico Ax1 , x2 = x1 , Ax2 =⇒ λ1 x 1 , x 2 = λ2 x 1 , x 2 =⇒ (λ1 − λ2 ) x1 , x2 = 0, 2

de donde se sigue que si λ1 = λ2 entonces x1 y x2 son ortogonales.

Teorema A.2.29 Sea A un operador compacto en un espacio de Hilbert y (φn )n una sucesi´n o ortonormal de H. Entonces l´ n→∞ Aφn = 0. ım u Demostraci´n: Supongamos que el teorema es falso, entonces para alg´n ε > 0 ha de existir o una subsucesi´n (φkn )n tal que Aφkn > ε para todo n ∈ N. Como A es compacto y la o sucesi´n (φkn )n es acotada, entonces hay al menos una subsucesi´n convergente (φmn )n tal que o o l´ n→∞ Aφmn = ψ = 0. Entonces ım 0= ψ
2

= ψ, ψ = l´ ım Aφmn , ψ = l´ ım φmn , A∗ ψ = 0,
n→∞ n→∞

pues A∗ ψ ∈ H y por tanto φmn , A∗ ψ es, escencialmente, el mn coeficiente de Fourier cmn de A∗ ψ el cual sabemos que tiende a cero si n → ∞ (A.2.5). 2 Como hemos visto en dimensi´n infinita un operador lineal A en general puede no tener o autovalores. No ocurre as´ con los operadores compactos y autoadjuntos. ı Teorema A.2.30 Sea H un espacio de Hilbert y A un operador lineal A : H → H autoadjunto (herm´ ıtico) y compacto. Entonces λ = A o λ = − A es un autovalor de A. Demostraci´n: Ver, por ejemplo, L. Debnath & P. Mikusinski - Introduction to Hilbert spaces o with applications, Academic Press, 1990. Teorema 4.9.8 p´g. 182. a 2 Del teorema anterior se sigue que todo operador compacto y autoadjunto tiene siempre al menos un autovalor. De hecho se tiene el siguiente teorema: Teorema A.2.31 Sea H un espacio de Hilbert separable y A una aplicaci´n lineal A : H → H o autoadjunta (herm´ ıtica) y compacta. Entonces A tiene un n´mero finito de autovalores λn reales u n→∞ distintos o si es infinito, entonces, es numerable y si lo ordenamos de mayor a menor λn −→ 0. Demostraci´n: Del teorema A.2.30 se sigue que el conjunto de autovalores no es vac´ luego o ıo, est´ compuesto por un n´mero finito o infinito de elementos (que son n´meros reales por el a u u Teorema A.2.28). Sea λ1 tal que |λ1 | = A y sea x1 el correspondiente autovector (normalizado a la unidad, i.e. x1 = 1). Sea H1 = H y definamos H2 el espacio de todos los vectores ortogonales a x1 , i.e., H2 = {x ∈ H | x, x1 = 0},

134

´ ´ Anexo: Breve introduccion al analisis funcional

es el complemento ortogonal de x1 . Pero, para todo x ∈ H2 , Ax, x1 = x, Ax1 = λ1 x, x1 = 0 es decir, H2 es invariante respecto a la acci´n de A. Sea A|H2 la restricci´n de A al espacio H2 . Si o o A|H2 no es el operador nulo, entonces podremos aplicar el mismo razonamiento de antes, por lo que existir´ λ2 y x2 tales que |λ2 | = A|H2 , donde adem´s es obvio que |λ2 | ≤ |λ1 |. As´ podemos a a ı seguir hasta que en cierto paso k A|Hk = 0 obteniendo la sucesi´n finita de autovalores (λk )n o k=1 con sus correspondientes autovectores normalizados30 (xk )n tales que k=1 |λ1 | = A|H1 ≥ |λ2 | = A|H2 ≥ · · · ≥ |λn | = A|Hn . Si A|Hk = 0 para todo k ∈ N, entonces existen infinitos autovalores distintos λn con sus correspondientes autovectores xn normalizados (que pueden ser m´s de uno), que son numerables a pues H es separable (¿por qu´?). Ahora bien, por el Teorema A.2.29 tenemos e 0 = l´ ım
n→∞ n→∞

Axn

2

= l´ ım Axn , Axn = l´ |λn |2 , ım
n→∞ n→∞

de donde se sigue que λn −→ 0.
n→∞

2

Existe otra forma de probar que λn −→ 0. En efecto, supongamos que hay infinitos λn distintos pero que λn −→ 0. Entonces existe un ε > 0 tal que infinitos λnk son tales que o |λnk | > ε. Construyamos con dichos elementos una sucesi´n que denotaremos por (λk )k . Como todos los elementos de (λk )k son distintos, el Teorema A.2.28 garantiza que sus correspondientes autovectores son ortogonales xk , i.e., xk1 , xk2 = 0. Si calculamos ahora la norma Axk+p − Axk
2 n→∞

= λk+p xk+p − λk xk

2

= |λk+p |2 + |λk |2 > 2ε2 ,

∀k, p ∈ N

es decir, la sucesi´n (Axk )k no contiene ninguna subsucesi´n de Cauchy y por tanto no contienne o o ninguna sucesi´n convergente (¿por qu´?) lo que contradice que A sea un operador compacto. o e Del teorema anterior se sigue adem´s que los espacios ker(λk I − A), para cada λk , k = a 1, 2, 3, . . . son de dimensi´n finita, pues en caso contrario λn −→ 0. o Teorema A.2.32 (Teorema espectral) Sea H un espacio de Hilbert y A una aplicaci´n lio neal A : H → H autoadjunta y compacta. Existe una sucesi´n numerable (finita o infinita) de o autovectores ortonormales (xn )n de H cuya correspondiente sucesi´n de autovalores denotaremos o por (λn )n tales que, X λn x, xn xn , ∀x ∈ H, (A.2.9) Ax =
n n→∞

donde se tiene que:

1. En (A.2.9) aparecen todos los autovalores de A. 2. Si la sucesi´n (λn )n es infinita se puede reordenar de forma que λn −→ 0. o 3. Los correspondientes espacios ker(λn I − A), para todo n = 1, 2, 3, . . . son de dimensi´n o finita, siendo la dimensi´n de estos el n´mero de veces que aparece un mismo λk en la o u f´rmula (A.2.9). o
30 Es n→∞

importante destacar que para cada λk , k = 1, 2, 3, . . . puede haber m´s de un autovector. a

A.2. Espacios de Hilbert separables

135

o Demostraci´n: Utilizando la misma construcci´n que usamos en la prueba del teorema A.2.31 o obtenemos una sucesi´n de autovalores (λk )n con sus correspondientes autovectores normalio k=1 zados (xk )n (para cada λk puede haber m´s de un autovector, en funci´n de la multiplicidad a o k=1 del mismo) tales que |λ1 | ≥ λ2 | ≥ · · · ≥ |λn |. Durante el proceso hemos construido adem´s la cadena de subespacios invariantes respecto a A a H = H1 ⊇ H2 ⊇ · · · ⊇ Hn donde Hk+1 = {x ∈ Hk | x, xj = 0, j = 1, 2, . . . , k}. Supongamos que A|Hn+1 = 0, entonces el proceso acaba (caso finito). Sea, en este caso, P yn = x − n x, xk xk . Entonces k=1 yn , xj = x, xj −
n X

x, xk

k=1

Luego, yn ∈ Hn+1 y por tanto Ayn = 0, i.e., 0 = Ayn = Ax − como se quer´ probar. ıa
n X

xk , xj = x, xj − x, xj xj = 0. | {z } | {z }
δj,k =1

x, xk Axk

=⇒

Ax =

k=1

n X

λk x, xk xk

k=1

El caso infinito es similar. Ante todo notemos que en este caso tenemos unaP sucesi´n λn tal o n→∞ que λn −→ 0 (ver Teorema A.2.31). Definamos nuevamente el vector yn = x − n x, xk xk . k=1 Usando (A.2.3) se sigue que yn 2 ≤ x 2 . Adem´s, como ya vimos yn ∈ Hn+1 , luego, usando a que Ayn = A|Hn+1 yn , y A|Hn+1 = |λn+1 | obtenemos Ayn ≤ |λn+1 | x de donde se sigue la iguladad buscada Ax =
∞ X n→∞

−→ 0

=⇒

n→∞

l´ Ayn = 0, ım

λn x, xn xn ,

∀x ∈ H.

n=1

Comprobemos ahora que todos los autovalores de A est´n presentes en la f´rmula (A.2.9). a o Esta cuesti´n es de suma importancia pues en la prueba hemos usado los autovalores obtenidos o gracias al Teorema A.2.30 por lo que procede preguntarse si existen otros autovalores de A no nulos distintos a los anteriores. Comprobemos que eso es imposible. Supongamos que existe un autovalor λ = 0 distinto de los autovalores λk que aparecen en la suma (A.2.9), i.e., λ = λk , para todo k, y sea x su correspondiente autovector normalizado a la unidad. Por el Teorema A.2.28 x es ortogonal a todos los xk , i.e., x, xk = 0 para todo k. Pero entonces, aplicando la f´rmula (A.2.9) a dicho autovector x tenemos o λx = Ax =
∞ X

λn x, xn xn =

n=1

n=1

∞ X

λn 0 xn = 0,

lo que es una contradicci´n. Lo anterior tiene una implicaci´n importante: Formalmente el o o proceso de encontrar los autovalores de A basado en el Teorema A.2.30 permite encontrarlos todos. Probemos finalmente que, en caso de que λk = 0, k = 1, 2, 3, . . ., la dimensi´n de ker(λk I − o A) = p, donde p es el n´mero de veces que aparece λk en la f´rmula (A.2.9). Por simplicidad u o

136
(1) (p)

´ ´ Anexo: Breve introduccion al analisis funcional

denotemos por xj , . . . , xj p autovectores linealmente independientes asociados a λj . Supongamos que dim ker(λj I − A) > p, entoces existe al menos un x ∈ ker(λj I − A) que es linealmente (1) (p) independiente de los vectores xj , . . . , xj y que asumiremos, sin p´rdida de generalidad, que e ortogonal a ellos (¿por qu´?). Entonces est´ claro que dicho x es ortogonal a todos los vectores e a xk que aparecen en la f´rmula (A.2.9) (ya sea porque los xk corresponden a autovalores distintos o (1) (p) a λj o bien sean los xj , . . . , xj de antes), i.e., x, xk = 0 para todo k, luego usando (A.2.9) obtenemos X X λk 0 xk = 0, λk x, xk xk = 0 = λj x = Ax =
k k

lo cual es una contradicci´n. o

2

Corolario A.2.33 Sea H un espacio de Hilbert separable y A una aplicaci´n lineal A : H → H o autoadjunta y compacta. Entonces existe un sistema ortogonal completo (base ortonormal) de autovectores ortonormales (en )n de H consistente en los correspondientes autovectores de A. Adem´s, a X λn x, en en , ∀x ∈ H, Ax =
n

donde (λn )n es la correspondiente sucesi´n de autovalores asociados a (en )n . o

Demostraci´n: Del Teorema espectral A.2.32 se sique que existe un conjunto de autovectores o (finito o infinito) (φn )n tal que X Ax = λn x, φn φn , ∀x ∈ H. (A.2.10)
n

Asumamos que λn = 0 (si hay alg´n λn = 0 este se puede omitir de la suma). Como el n´cleo u u de A, ker A ⊂ H (que coincide con el subespacio vectorial generado por los autovectores correspondientes a λ = 0) es a su vez un espacio de Hilbert separable (¿por qu´?) existir´ una e a sistema (numerable) ortogonal completo que denotaremos por (ψn )n . Dicho sistema de vectores son autovectores correspondientes al autovalor 0. Sea ahora un autovector cualquiera φm correspondiente al autovalor λm = 0. Entonces φm ser´ ortogonal a todos los ψn y el sistema (φm )m a ser´ ortogonal a (ψn )n . Adem´s de (A.2.10) se tiene que para todo x ∈ H a a ! X X x, φm φm = Ax − A x− x, φm Aφm = 0,
m m

i.e., x − m x, φm φm ∈ ker A, luego podemos desarrollarlo en serie de Fourier en la base de ker A (ψn )n de forma que obtenemos X X X X x, ψn ψn ∀x ∈ H, x, φm φm + x, ψn ψn =⇒ x = x, φm φm = x−
m n m n

P

Como consecuencia del teorema anterior tenemos que todo operador lineal A : H → H autoadjunto y compacto en H, espacio de Hilbert separable, se le puede puede hacer corresponder una matriz (finita o infinita) que adem´s es diagonalizable y en cuya diagonal aparecen los a correspondientes autovalores. Adem´s se tiene el siguiente resultado: a

i.e., el sistema (φm )m (ψn )n es completo (Teorema A.2.5) que podemos ortogonalizar utilizando el m´todo de Gram-Schmidt obteniendo el sistema ortonormal (numerable) (en )n (recordemos e que para autovectores correspondientes a autovalores distintos ya teniamos la ortogonalidad, as´ que s´lo es necesario aplicarlo a los autovectores correspondientes a un mismo autovalor), ı o P luego tendremos x = n x, en en de donde se sigue el teorema. 2

S

Teorema A.2.34 Sean A y B dos operadores autoadjuntos y compactos en un espacio de Hilbert separable. Si A y B conmutan, entonces tienen un sistema completo de autovectores com´n. u Demostraci´n: Sea λ un autovalor de A y sea S el correspondiente subespacio lineal generado por o los autovectores de A. Para todo x ∈ S tenemos ABx = BAx = λBx, i.e., Bx es tambien es un autovector de A correspondiente a λ, Bx ∈ S, as´ que el espacio S es un subespacio vectorial de H ı invariante respecto a B y es a su vez un espacio de Hilbert. Como B es autoadjunto y compacto, el Corolario anterior A.2.33 nos asegura que S tiene una base orthonormal de autovectores de B, que adem´s son autovectores de A pues est´n en S. Repitiendo en proceso para cada uno de a a los subespacios S de A obtenemos para cada uno de dichos subespacios la correspondiente base de autovectores. La uni´n de todas ellas es la base com´n buscada. o u 2

Bibliograf´ ıa
[1] L. Debnath y P. Mikusinsk. Introduction to Hilbert spaces with applications, Academic Press, 1990.h 31 [2] Yuli Eidelman, Vitali D. Milman, Antonis Tsolomitis. Functional Analysis: An Introduction, Graduate Studies in Mathematics Vol. 66, AMS, 2004.m,h [3] A.N. Kolmogorov y A.V. Fom´ Elementos de la teor´ de funciones y del an´lisis funcional. ın. ıa a Editorial MIR, 1978. (Elements of the Theory of Functions and Functional Analysis. Dover, 1999.)m,h [4] E. Kreyszig. Introductory Functional Analysis with Applications. Wiley Classics Library Edition, 1989.m,n [5] K. Saxe. Beginning Functional Analysis. Springer, New York, 2002.h [6] J. Tinsley Oden y L.F. Demkowicz. Applied Functional Analysis. CRC Press, 1996.m,n [7] N. Young. An introduction to Hilbert Space. Cambridge University Press, 1988.n,h

31 Se recomienda para el tema de espacios m´tricos, normados y de Hilbert los libros marcados con e “m”, “n” y “h”, respectivamente.

139