Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Grupos, Notas de estudo de Física

fisica matematica para fisicos parte 18

Tipologia: Notas de estudo

2010

Compartilhado em 20/09/2010

marilton-rafael-1
marilton-rafael-1 🇧🇷

4.5

(6)

140 documentos

Pré-visualização parcial do texto

Baixe Grupos e outras Notas de estudo em PDF para Física, somente na Docsity! Caṕıtulo 18 Grupos. Alguns Exemplos Conteúdo 18.1 O Grupo de Permutações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 864 18.1.1 Ciclos, Transposições e Transposições Elementares . . . . . . . . . . . . . . . . . . . . . . . . . 865 18.2 Alguns Grupos Matriciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 869 18.2.1 Os Grupos GL(n) e SL(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 869 18.2.2 O Grupo de Borel e o Grupo de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . 872 18.2.3 Grupos Associados a Formas Bilineares e Sesquilineares . . . . . . . . . . . . . . . . . . . . . . 878 18.2.4 Os Grupos Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 879 18.2.5 Os Grupos Unitários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 880 18.3 Os Grupos SO(2), SO(3), SU(2) e SL(2, C) . . . . . . . . . . . . . . . . . . . . . . . . . . . 881 18.3.1 Os Grupos SO(2), O(2), SO(1, 1) e O(1, 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 882 18.3.2 O Grupo SO(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 885 18.3.3 O Grupo SU(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 891 18.3.4 A Relação entre SO(3) e SU(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 894 18.3.5 O Grupo SL(2, C) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 896 18.4 Generalidades sobre os grupos SU(n) e SO(n) . . . . . . . . . . . . . . . . . . . . . . . . . 898 18.4.1 Os Grupos SU(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 898 18.4.2 O Grupo SU(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 900 18.4.3 Os Grupos SO(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 901 18.5 O Grupo Afim e o Grupo Euclidiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 906 18.6 O Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 910 18.6.1 O Espaço-Tempo, a Noção de Intervalo e a Estrutura Causal . . . . . . . . . . . . . . . . . . . 910 18.6.2 A Invariância do Intervalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 915 18.6.3 O Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 917 18.6.4 Alguns Subgrupos do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 918 18.6.5 A Estrutura do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 921 18.6.6 Os Geradores do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 926 18.7 O Grupo de Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 929 18.8 SL(2, C) e o Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 933 APÊNDICES . . . . . . . . . . . . . . . . . . . . . . . . 940 18.A Prova do Teorema 18.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 940 18.B Um Isomorfismo entre SL(2, C) / {1, −1} e L↑+ . . . . . . . . . . . . . . . . . . . . . . . . . 950 G rupos são objetos de suma importância na F́ısica devido à sua relação com transformações de simetria. Anoção abstrata de grupo foi introduzida na Seção 2.1.3, página 73. No presente caṕıtulo introduziremos algunsgrupos de particular interesse na F́ısica e na Matemática e estudaremos algumas de suas propriedades maissimples e importantes. Com particular detalhe trataremos do grupo de Lorentz na Seção 18.6, grupo este de fundamental importância na Teoria da Relatividade. 18.1 O Grupo de Permutações Seja C um conjunto não-vazio qualquer e seja Perm(C) o conjunto de todas as funções bijetoras de C em C. Perm(C) é naturalmente um grupo, onde o produto é a composição de funções e o elemento neutro é a função identidade (que denotaremos doravante por id). O elemento inverso de uma função f ∈ Perm(C) é a sua função inversa f−1 (que existe, pois Perm(C) contém funções bijetoras, por definição). Perm(C) é denominado grupo de permutações do conjunto C. 864 JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 865/1730 E. 18.1 Exerćıcio. Mostre que Perm(C) somente é um grupo Abeliano se C possuir um ou dois elementos. 6 Grupos de permutações desempenham um papel de destaque na teoria de grupos, em parte devido ao seguinte teorema estrutural, que não demonstraremos nestas notas, e que é denominado Teorema de Cayley1: Teorema 18.1 Todo grupo é subgrupo de um grupo de permutações Perm(C), para algum conjunto C. 2 De particular importância é o caso em que C é um conjunto finito. Tais grupos de permutação e suas representações também desempenham um papel de destaque na F́ısica, particularmente na Mecânica Quântica, e por isso vamos nos deter um pouco nos mesmos. • Grupos de permutações de n elementos Seja n ≥ 1, inteiro, e considere-se o conjunto {1, . . . , n}. O grupo Sn = Perm({1, . . . , n}) é denominado grupo de permutações de n elementos. E. 18.2 Exerćıcio. Seja C um conjunto com n elementos. Mostre que Perm(C) é isomorfo a Sn. 6 Um elemento π ∈ Sn é dito ser uma permutação. Como toda a permutação, π é uma função bijetora {1, . . . , n} → {1, . . . , n} e é costume representá-la na forma de um arranjo matricial: π =     1 2 . . . n π(1) π(2) . . . π(n)     , onde na primeira linha ordenamos os elementos de {1, . . . , n} e na segunda suas imagens por π. Exemplos. Os elementos de S2 são π1 =     1 2 1 2     e π2 =     1 2 2 1     . π1 é a identidade do grupo. Os elementos de S3 são π1 =     1 2 3 1 2 3     , π2 =     1 2 3 2 1 3     , π3 =     1 2 3 1 3 2     , π4 =     1 2 3 3 2 1     , π5 =     1 2 3 3 1 2     , π6 =     1 2 3 2 3 1     . π1 é a identidade do grupo. E. 18.3 Exerćıcio. Mostre que Sn tem exatamente n! elementos. 6 18.1.1 Ciclos, Transposições e Transposições Elementares Vamos aqui estudar alguns fatos estruturais importantes sobre os grupos Sn. 1Arthur Cayley (1821–1895). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 868/1730 Prova. Seja tp, q uma transposição com p < q. A prova resume-se em constatar que tp, q = tq−1, q · · · tp+1, p+2tp, p+1tp+1, p+2 · · · tq−1, q = tq−1 · · · tp+1tptp+1 · · · tq−1 . E. 18.6 Exerćıcio. Complete os detalhes e/ou faça alguns casos particulares para convencer-se. 6 O seguinte teorema é um corolário imediato dos Teoremas 18.2, 18.3, 18.4 e 18.5: Teorema 18.6 Toda permutação diferente da identidade é um produto de transposições elementares. 2 O Teorema 18.6 afirma que Sn é um grupo gerado por transposições elementares, ou seja, todo π ∈ Sn (distinto da identidade) é da forma π = ti1 · · · tik , (18.1) para certas transposições ti1 , . . . , tik . E. 18.7 Exerćıcio. Determine quais dos elementos π1, . . . , π6 do grupo S3 (página 865) são transposições elementares e escreva os demais como produtos de tais transposições elementares. 6 Podemos nos perguntar, essa forma de escrever π é única? A resposta é não, pelas razões que agora expomos. • Transposições elementares e suas relações Proposição 18.1 Em Sn as transposições elementares ti, i = 1, . . . , n− 1 satisfazem as seguintes relações: (ti) 2 = id, (18.2) titj = tjti, se |i− j| ≥ 2, (18.3) titi+1ti = ti+1titi+1, se i = 1, . . . , n− 2 . (18.4) 2 Prova. ←→ Exerćıcio. Essa proposição explica por que a representação (18.1) não é geralmente única: o lado direito de (18.1) pode even- tualmente ser reescrito se aplicarmos quaisquer das relações (18.2)-(18.4). Estas, porém, são as únicas relações que as transposições elementares ti satisfazem. Desses fatos extráımos a seguinte conclusão: Proposição 18.2 Todo grupo gerado por n − 1 elementos t1, . . . , tn−1 e que satisfazem as relações (18.2)-(18.4) (e somente elas) é isomorfo a Sn. 2 Prova. ←→ Exerćıcio. • O sinal, ou paridade, de uma permutação Seja π ∈ Sn. O sinal, ou paridade de π é (−1)k, onde k é o menor número de transposições elementares que geram π. Assim, se π = ti1 · · · tik define-se sinal(id) = +1 e sinal(π) := (−1)k, π 6= id . O estudante é convidado a constatar que sinal(π) não depende da particular representação de π em termos de produtos de transposições elementares, pois sinal(π) não muda por aplicação das relações (18.2)-(18.4). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 869/1730 E. 18.8 Exerćıcio. Determine o sinal das permutações π1, . . . , π6 do grupo S3 dadas acima (página 865). 6 E. 18.9 Exerćıcio importante. Mostre que sinal(ππ′) = sinal(π)sinal(π′) para todos π, π′ ∈ Sn. Mostre dáı que S+n = {π ∈ Sn| sinal(π) = +1} é um subgrupo de Sn, o subgrupo das permutações pares. Mostre também que S+n é normal. 6 S+n é também denominado subgrupo alternante de grau n. E. 18.10 Exerćıcio. Já mencionamos que Sn tem n! elementos. Quantos elementos tem S + n ? 6 • O grupo de tranças Há um grupo importante aparentado ao grupo Sn que é o chamado grupo de n tranças, denotado por Bn (do inglês braid = trança). Este é, por definição, o grupo gerado por n− 1 elementos b1, . . . , bn−1 que satisfazem as relações bibj = bjbi, se |i− j| ≥ 2, (18.5) bibi+1bi = bi+1bibi+1, se i = 1, . . . , n− 2 , (18.6) de tal forma que para todo β ∈ Bn existem {bi1 , . . . , bik} ⊂ {b1, . . . , bn−1} e números inteiros n1, . . . , nk ∈ Z tais que β = (bi1) n1 · · · (bik)nk . Note-se que a relação (18.2) não tem análogo em Bn, ou seja, ao contrário do que ocorre em Sn, os elementos bi não têm a si mesmos como inversa. Por essa razão elementos como (bi) n para n’s diferentes são todos distintos entre si. Assim, ao contrário de Sn, Bn é um grupo infinito, apesar de ter um número finito de geradores. E. 18.11 Exerćıcio. Seja p : Z → {0, 1} definida por p(n) = 0 se n for par e p(n) = 1 se n for ı́mpar. Mostre que φ : Bn → Sn definido por φ((bi1 )n1 · · · (bik)nk) = t p(n1) i1 · · · tp(nk)ik é um homomorfismo. 6 O grupo de tranças foi inventado pelo matemático E. Artin2 em 1925 e desempenha um papel importante na chamada teoria dos nós, um rico caṕıtulo do estudo das propriedades topológicas do espaço tridimensional. Nesse contexto os elementos bi têm uma interpretação interessante em termos de transposições de tranças (barbantes) no espaço tridimen- sional. Por falta de espaço e habilidade em apresentar as figuras correspondentes, não entraremos em mais detalhes aqui e remetemos o estudante à leitura de [106], por exemplo. No final dos anos 80 e nos anos 90 do Século XX encontrou-se aplicações dos grupos de tranças na F́ısica, no contexto das Teorias Quânticas de Campos em dimensões 2 e 3, assim como na f́ısica dos materiais (problema da Supercondutividade a altas temperaturas). 18.2 Alguns Grupos Matriciais 18.2.1 Os Grupos GL(n) e SL(n) Vamos denotar por Mat (n, R) ou Mat (R, n) o conjunto de todas as matrizes reais n×n e por Mat (n, C) ou Mat (C, n) o conjunto de todas as matrizes complexas n× n. Mat (n, R) e Mat (n, C) são naturalmente dois grupos (Abelianos) em relação à operação de soma de matrizes. Não, porém, em relação à operação de produto, pois é bem sabido que nem toda matriz possui uma inversa. O conjunto de todas as matrizes de Mat (n, R) que são inverśıveis forma naturalmente um grupo não-Abeliano3 em relação ao produto usual de matrizes. Esse grupo, denominado grupo linear real, é denotado por GL(n, R). Analo- gamente, o conjunto de todas as matrizes de Mat (n, C) inverśıveis forma um grupo não-Abeliano4 que é denominado 2Emil Artin (1889–1962). 3Exceto no caso n = 1, onde o grupo é Abeliano, trivialmente. 4Idem. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 870/1730 grupo linear complexo e denotado por GL(n, C). Em śımbolos GL(n, R) := {A ∈ Mat (n, R), det(A) 6= 0} e GL(n, C) := {A ∈Mat (n, C), det(A) 6= 0} . Devido à propriedade bem conhecida det(AB) = det(A) det(B), o produto de duas matrizes com determinante igual a 1 é novamente uma matriz com determinante igual a 1. Assim, SL(n, R) := {A ∈ Mat (n, R), det(A) = 1} e SL(n, C) := {A ∈Mat (n, C), det(A) = 1} são subgrupos de GL(n, R) e GL(n, C), respectivamente. E. 18.12 Exerćıcio. Para qualquer matriz n× n real ou complexa e inverśıvel A vale que ( AT )−1 = ( A−1 )T . Além disso, para qualquer matriz n×n complexa A vale que (A∗)−1 = ( A−1 )∗ . Usando esses fatos, mostre que se A ∈ GL(n, R), então AT ∈ GL(n, R). Analogamente, mostre que se A ∈ GL(n, C) então A∗ e AT ∈ GL(n, C). 6 E. 18.13 Exerćıcio. Para qualquer matriz n×n real ou complexa A vale que det(A) = det ( AT ) . Fora isso, para qualquer matriz n × n complexa A vale que det(A) = det (A∗). Usando esses fatos, mostre que se A ∈ SL(n, R) então AT ∈ SL(n, R). Analogamente, mostre que se A ∈ SL(n, C) então A∗ e AT ∈ SL(n, C). 6 * Os grupos GL(n, R), GL(n, C), SL(n, R) e SL(n, C) possuem vários outros subgrupos de interesse. Discutiremos alguns adiante, como os grupos de Borel, os grupos ortogonais, unitários e simpléticos. • Os grupos GL(n, Q), SL(n, Q) e SL(n, Z) Vamos denotar por Mat (n, Z) ou Mat (Z, n) o conjunto de todas as matrizes n × n cujos elementos de matriz são números inteiros e por Mat (n, Q) ou Mat (Q, n) o conjunto de todas as matrizes n × n cujos elementos de matriz são números racionais. Analogamente, defina-se GL(n, Z) := {A ∈Mat (n, Z), det(A) 6= 0} e GL(n, Q) := {A ∈ Mat (n, Q), det(A) 6= 0} e SL(n, Z) := {A ∈Mat (n, Z), det(A) = 1} e SL(n, Q) := {A ∈ Mat (n, Q), det(A) = 1} . Então valem as seguintes afirmações: 1. GL(n, Q) é um grupo em relação à operação de produto usual de matrizes. 2. SL(n, Q) é um grupo em relação à operação de produto usual de matrizes. 3. GL(n, Z) não é um grupo em relação à operação de produto usual de matrizes, mas sim um monóide. 4. SL(n, Z) é um grupo em relação à operação de produto usual de matrizes. Para provar 1, notemos que o produto de matrizes n × n com entradas racionais é também uma matriz n × n com entradas racionais (por quê?). Assim, a operação de produto é uma operação binária em GL(n, Q). O elemento neutro é a matriz identidade, que é elemento de GL(n, Q) (pois os números 0 e 1 são racionais). Por fim, resta mostrar que a inversa de uma matriz inverśıvel com entradas racionais também tem entradas racionais. Para mostrar isso, notemos primeiramente que o determinante de uma matriz com entradas racionais é também um número racional, pois o cálculo do determinante de uma matriz M envolve apenas operações de soma e produto dos elementos de matriz de M . Além disso, lembremos a chamada “regra de Laplace5”), expressão (6.19), página 241, que para qualquer matriz A o elemento ij da sua matriz inversa (se houver) é dado por (A−1)ij = (−1)i+j det(A) Men(A)ji , (18.7) 5Pierre-Simon Laplace (1749–1827). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 873/1730 Um caso particular do grupo de Borel é o grupo de Heisenberg, que agora discutiremos. • O grupo de Heisenberg GH3(C) O chamado grupo de Heisenberg8, denotado por GH3(C) (os grupos GHn(C) com n ≥ 3 são definidos adiante), é definido como o grupo formado por todas as matrizes 3× 3 da forma H(a, b, c) =         1 a c 0 1 b 0 0 1         , onde a, b, c ∈ C, com o produto usual de matrizes (se a, b, c ∈ R temos o grupo GH3(R)). A matriz identidade é um elemento de GH3(C) pois H(0, 0, 0) = 1 e tem-se H(a, b, c)H(a′, b′, c′) = H ( a+ a′, b+ b′, c+ c′ + ab′ ) . (18.8) Essa relação, em particular, diz que o produto de duas matrizes de GH3(C) é novamente uma matriz de GH3(C). Tem-se também que H(a, b, c)−1 = H(−a, −b, ab− c) =         1 −a ab− c 0 1 −b 0 0 1         , (18.9) que mostra que toda matriz de GH3(C) tem inversa e que essa inversa é também uma matriz de GH3(C). Assim, GH3(C) é um grupo matricial. De (18.8) constata-se facilmente que GH3(C) não é um grupo Abeliano. E. 18.21 Exerćıcio. Verifique essas afirmações. 6 E. 18.22 Exerćıcio. Mostre que o centro do grupo de Heisenberg é formado pelas matrizes do tipo H(0, 0, c) com c ∈ C. O conceito de centro de um grupo foi introduzido à página 102. 6 Como é fácil de ver, o grupo de Heisenberg é um grupo de Lie (grupos de Lie serão tratados no Caṕıtulo 19, página 958) que, como variedade anaĺıtica, é difeomorfo a C3. O exerćıcio seguinte discute três de seus subgrupos uniparamétricos. E. 18.23 Exerćıcio. Verifique que as matrizes H1(t) := H(t, 0, 0), H2(t) := H(0, t, 0), H3(t) := H(0, 0, t) satisfazem Hj(t)Hj(t ′) = Hj(t+ t ′) e Hj(0) = 1, j = 1, 2, 3. Assim, para cada j, as matrizes Hj(t) representam subgrupos uniparamétricos de GH3(C). Os geradores desses subgrupos são hj := d dtHj(t) ∣ ∣ t=0 . Verifique que h1 =         0 1 0 0 0 0 0 0 0         , h2 =         0 0 0 0 0 1 0 0 0         , h3 =         0 0 1 0 0 0 0 0 0         e mostre explicitamente que para todo t vale H1(t) = e th1 , H2(t) = e th2 e H3(t) = e th3 . 6 8Werner Karl Heisenberg (1901–1976). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 874/1730 Mostraremos agora que esses geradores formam uma álgebra de Lie, a chamada álgebra de Heisenberg gh3(C). Adiante explicaremos por que o nome de Heisenberg é associado ao grupo GH3(C) e à álgebra gh3(C). • A álgebra de Heisenberg gh3(C) Considere matrizes h(a, b, c) da forma ah1 + bh2 + ch3 (hk são os geradores definidos no Exerćıcio E. 18.23), ou seja, h(a, b, c) =         0 a c 0 0 b 0 0 0         , (18.10) onde a, b, c ∈ C. Calculando-se o comutador de duas de tais matrizes tem-se [h(a, b, c), h(a′, b′, c′)] = h(0, 0, ab′ − a′b) , (18.11) (verifique!) que é novamente da forma (18.10). Assim, o conjunto de matrizes da forma (18.10) forma uma álgebra de Lie com o produto definido pelo comutador de matrizes. Essa álgebra de Lie, denotada por gh3(C), é denominada álgebra de Heisenberg. A razão dessa denominação é a seguinte. Podemos encontrar em gh3(C) uma base especial formada por três matrizes que, por razões “psicológicas”, denotaremos por p, q e ~: p =         0 1 0 0 0 0 0 0 0         , q =         0 0 0 0 0 1 0 0 0         , ~ =         0 0 i 0 0 0 0 0 0         . É um exerćıcio fácil (e fortemente recomendado) verificar que essas matrizes satisfazem as seguintes regras de co- mutação: [p, ~] = 0 , [q, ~] = 0 , [p, q] = −i~ . Para aqueles familiarizados com a Mecânica Quântica as relações acima justificam a denominação dessa álgebra em honra a Heisenberg: as relações de comutação acima são precisamente iguais às relações canônicas de comutação satisfeitas pelos operadores associados ao momento (p) e posição (q) de uma part́ıcula se movendo em uma dimensão. No caso da Mecânica Quântica, p é o operador −i~ ∂∂x , q = x e ~ representa um número (a constante de Planck9), que obviamente comuta com os operadores p e q. Nota. O estudante deve, porém, observar que as matrizes p, q e ~, acima, não são auto-adjuntas, ao contrário dos operadores correspondentes da Mecânica Quântica. Essa observação é relevante, pois é posśıvel provar que as relações canônicas de comutação não podem ser satisfeitas por operadores auto-adjuntos agindo em espaços de Hilbert de dimensão finita ou por operadores auto-adjuntos limitados agindo em espaços de Hilbert de dimensão infinita. De fato, no espaço de Hilbert L2(R, dx) os operadores p = −i~ ∂ ∂x e q = x são auto-adjuntos (em um domı́nio conveniente), mas não são limitados. ♣ O que faz gh3(C) especial como álgebra de Lie é a propriedade expressa no seguinte exerćıcio: E. 18.24 Exerćıcio importante. Verifique que para quaisquer três elementos l1, l2 e l3 da álgebra de Heisenberg gh3(C) tem-se [ l1, [l2, l3] ] = 0 . (18.12) Sugestão: use as relações de comutação de p, q e ~, dadas acima ou use diretamente (18.11). A relação (18.12) mostra que gh3(C) é o que se chama uma álgebra de Lie nilpotente (de grau 2). 6 9Max Karl Ernst Ludwig Planck (1858–1947). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 875/1730 Para entender a relação da álgebra de Heisenberg gh3(C) com o grupo de Heisenberg GH3(C), façamos o seguinte. Notemos em primeiro lugar que as matrizes h(a, b, c) são matrizes nilpotentes de grau 3, ou seja, h(a, b, c)3 = 0. (Mostre isso!). É fácil com isso verificar que se calcularmos a exponencial de h(a, b, c) teremos exp (h(a, b, c)) = 1+ h(a, b, c) + 1 2 h(a, b, c)2 =         1 a c+ ab2 0 1 b 0 0 1         = H ( a, b, c+ ab 2 ) (18.13) e disso conclui-se que H(a, b, c) = exp ( h ( a, b, c− ab 2 )) . (18.14) E. 18.25 Exerćıcio. Escreva h ( a, b, c− ab2 ) como combinação linear de p, q e ~. 6 Pelo que vimos, todos os elementos do grupo de Heisenberg GH3(C) são obtidos pela exponenciação de elementos da álgebra de Lie gh3(C), ou seja, a exponenciação é uma aplicação sobrejetora de gh3(C) em seu grupo de Lie GH3(C). Em verdade, é fácil constatar que essa aplicação é também injetora (faça isso!). A aplicação exponencial é, portanto, uma bijeção de gh3(C) em GH3(C). E. 18.26 Exerćıcio importante. Usando a fórmula de Baker-Campbell-Hausdorff (equações (7.4), página 324, ou (7.45), página 345) e as relações (18.11) e (18.12), mostre que exp ( h(a, b, c) ) exp ( h(a′, b′, c′) ) = exp ( h ( a+ a′, b+ b′, c+ c′ + ab′ − a′b 2 )) . (18.15) Usando (18.13) e (18.14), re-obtenha de (18.15) a regra de produto (18.8). 6 Comentário. Esse exerćıcio ilustra uma aplicação da fórmula de Baker-Campbell-Hausdorff. Note-se que, devido ao fato de gh3(C) ser uma álgebra de Lie nilpotente (vide (18.12)), a série de Baker-Campbell-Hausdorff é composta apenas por um número finito de termos e, portanto, converge sempre. ♣ • O grupo de Heisenberg GHn(C), n ≥ 3 Vamos agora generalizar o grupo GH3(C). Para n ≥ 3, os chamados grupos de Heisenberg GHn(C) são definidos como sendo os grupos formados por todas as matrizes n× n da forma H(a, b, c) =         1 aT c0m 1m b 0 0Tm 1         com o produto usual de matrizes, sendo m = n− 2, onde a, b ∈ Cn−2 e c ∈ C. Acima, a e b representam matrizes-coluna com m = n− 2 linhas, enquanto que aT e bT , as transpostas de a e b, respectivamente, representam matrizes-linha com m = n− 2 colunas: a =         a1 ... an−2         , aT = ( a1 · · · an−2 ) , b =         b1 ... bn−2         , bT = ( b1 · · · bn−2 ) , JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 878/1730 (Mostre isso!). É fácil com isso verificar que exp (h(a, b, c)) = 1+ h(a, b, c) + 1 2 h(a, b, c)2 =         1 a c+ a T b 2 0 1 b 0 0 1         = H ( a, b, c+ aT b 2 ) , (18.21) ou seja, H(a, b, c) = exp ( h ( a, b, c− a T b 2 )) . (18.22) Pelo que vimos, todos os elementos do grupo de Heisenberg GHn(C) são obtidos pela exponenciação de elementos da álgebra de Lie ghn(C), ou seja, a exponenciação é uma aplicação sobrejetora de ghn(C) em seu grupo de Lie GHn(C). Em verdade, é fácil constatar que essa aplicação é também injetora (faça isso!). A aplicação exponencial é, portanto, uma bijeção de ghn(C) em GHn(C). E. 18.29 Exerćıcio importante. Usando a fórmula de Baker-Campbell-Hausdorff (equações (7.4), página 324, ou (7.45), página 345) e as relações (18.19) e (18.20), mostre que exp ( h(a, b, c) ) exp ( h(a′, b′, c′) ) = exp ( h ( a+ a′, b+ b′, c+ c′ + aT b′ − a′T b 2 )) . (18.23) Usando (18.21) e (18.22), re-obtenha de (18.23) a regra de produto (18.16). 6 18.2.3 Grupos Associados a Formas Bilineares e Sesquilineares Seja E um espaço vetorial. Vamos denotar por GL(E) o conjunto de todos os operadores lineares bijetores (e portanto inverśıveis) de E em E. É bem claro que (GL(E) forma um grupo, tendo como produto o produto de operadores. Seja ω uma forma bilinear ou sesquilinear (caso E seja complexo) em E. Denotaremos por Ω(E, ω) o subconjunto de GL(E) formado por todos os operadores lineares O inverśıveis tais que ω(Ox, Oy) = ω(x, y) para todos x, y ∈ E. Vamos mostrar que Ω(E, ω) é um subgrupo de GL(E). Primeiramente é claro que 1 ∈ Ω(E, ω). Em segundo lugar, sejam O1 e O2 dois operadores de Ω(E, ω). Teremos pelas hipóteses que ω(O1O2x, O1O2y) = ω(O2x, O2y) = ω(x, y) para todos x, y ∈ E e, portanto, O1O2 ∈ Ω(E, ω). Resta mostrar que se O ∈ Ω(E, ω) então O−1 ∈ Ω(E, ω). De fato, ω(O−1x, O−1y) = ω(OO−1x, OO−1y) = ω(x, y) para todos x, y ∈ E, que é o que queŕıamos provar. Vamos considerar casos particulares em que E é o espaço Rn ou Cn. Seja E = Rn e seja ωA uma forma bilinear em R n, que pelas considerações da Seção 3.4 é da forma ωA(x, y) = 〈x, Ay〉 R para alguma matriz real A. Neste caso Ω(Rn, ωA) é o conjunto de todas as matrizes M inverśıveis reais n× n tais que 〈Mx, AMy〉 R = 〈x, Ay〉 R para todos x, y ∈ Rn. Essa relação nos diz que 〈x, MTAMy〉 R = 〈x, Ay〉 R JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 879/1730 para todos x, y ∈ Cn, o que implica MTAM = A . (Por quê?). Assim, Ω(Rn, ωA) = { M ∈Mat (R, n), det(M) 6= 0 e MTAM = A } . Se a matriz A for inverśıvel (ou seja, se ωA for não-degenerada), então podemos escrever também Ω(Rn, ωA) = { M ∈Mat (R, n), det(M) 6= 0 e M−1 = A−1MTA } . Seja E = Cn e seja ωA uma forma sesquilinear em C n, que pelas considerações da Seção 3.4 é da forma ωA(x, y) = 〈x, Ay〉 C para alguma matriz complexa A. Neste caso Ω(Cn, ωA) é o conjunto de todas as matrizes M inverśıveis complexas n× n tais que 〈Mx, AMy〉 C = 〈x, Ay〉 C para todos x, y ∈ Cn. Essa relação nos diz que 〈x, M∗AMy〉 C = 〈x, Ay〉 C para todos x, y ∈ Rn, o que implica M∗AM = A . Acima M∗ = MT . Assim, Ω(Cn, ωA) = {M ∈Mat (C, n), det(M) 6= 0 e M∗AM = A} . Se a matriz A for inverśıvel (ou seja, se ωA for não-degenerada), então podemos escrever também Ω(Cn, ωA) = { M ∈Mat (C, n), det(M) 6= 0 e M−1 = A−1M∗A } . 18.2.4 Os Grupos Ortogonais • Os grupos O(n) e SO(n) Um caso de particular interesse é aquele onde E = Rn e A = 1, ou seja, ωA(x, y) = 〈x, y〉R. Neste caso o grupo Ω(Rn, ωA) é denotado por O(n) e tem-se O(n) := { M ∈ Mat (R, n), M−1 = MT } . O(n) é o grupo das matrizes ditas ortogonais n× n. SeM é uma matriz ortogonal, tem-se queMMT = 1. Dáı, 1 = det(1) = det(MMT ) = det(M) det(MT ) = (det(M))2. Conclúımos que se uma matriz M é ortogonal, vale det(M) = ±1. O(n) possui um subgrupo, denominado SO(n), que é composto pelas matrizes ortogonais com determinante igual a 1: SO(n) := { M ∈Mat (R, n), M−1 = MT e det(M) = 1 } . * Os grupos SO(n) representam generalizações do grupo de rotações do espaço tridimensional para o espaço n- dimensional. • Os grupos O(m, p) e SO(m, p) Um outro caso de particular interesse é aquele onde E = Rn e ω(x, y) = 〈x, η(m, p)y〉 R onde η(m, p) é a matriz JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 880/1730 diagonal η(p, m) :=                     −1 . . . −1 1 . . . 1                     , (18.24) com m elementos −1 e p elementos +1, sendo p+m = n. Neste caso o grupo Ω(Rn, ω) é denotado por O(m, p) e tem-se O(m, p) := { M ∈Mat (R, n), M−1 = η(m, p)MT η(m, p) } . Se M ∈ O(m, p), tem-se que Mη(m, p)MT η(m, p) = 1. Dáı, 1 = det(1) = det (Mη(m, p)MT η(m, p)) = det(M) det(MT ) (det(η(m, p)))2 = (det(M))2. Conclúımos que se M ∈ O(m, p), vale det(M) = ±1. O(m, p) possui um subgrupo, denominado SO(m, p), que é composto pelas matrizes de O(m, p) com determinante igual a 1+: SO(m, p) := { M ∈Mat (R, n), M−1 = η(m, p)MT η(m, p) e det(M) = 1 } . * Certos grupos O(m, p) e SO(m, p) desempenham um papel muito importante em F́ısica, estando ligados ao chamado Grupo de Lorentz, o qual tem importância na Teoria da Relatividade Especial. O grupo de Lorentz é detalhadamente discutido na Seção 18.6, página 910. 18.2.5 Os Grupos Unitários • Os grupos U(n) e SU(n) Mais um caso importante é aquele onde E = Cn e ωA é a forma sesquilinear associada a A = 1, ou seja, ωA(x, y) = 〈x, y〉 C . Neste caso o grupo Ω(Cn, ωA) é denotado por U(n) e tem-se U(n) := { M ∈Mat (C, n), M−1 = M∗ } . U(n) é o grupo das matrizes ditas unitárias n× n. Se M é uma matriz unitária, tem-se que MM∗ = 1. Dáı, 1 = det(1) = det (MM∗) = det(M) det(M∗) = det(M) det(MT) = det(M)det(MT ) = det(M)det(M) = |det(M)|2 . Conclúımos que se M ∈ U(n), vale |det(M)| = 1. U(n) possui um subgrupo, denominado SU(n), que é composto pelas matrizes unitárias com determinante igual a 1: SU(n) := { M ∈Mat (C, n), M−1 = M∗ e det(M) = 1 } . JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 883/1730 Assim, SO(2) = {exp(θJ), onde θ ∈ (−π, π]} . (18.25) Com isso, (18.25) está nos dizendo que todo elemento de SO(2) pode ser escrito como exponencial do seu gerador. Veremos que algo semelhante também se dá nos grupos SO(3) e SU(2). O grupo O(2) é o grupo das matrizes ortogonais 2×2 reais: O(2) = {R ∈ Mat (R, 2)| RT = R−1}. Se R ∈ O(2) então det(R) = ±1. O caso det(R) = 1 corresponde a SO(2), que tratamos acima. Vamos considerar o caso det(R) = −1. Como toda matriz 2 × 2 real, uma matriz genérica R ∈ O(2) com det(R) = −1 é da forma R = ( a b c d ) , onde a, b, c, d ∈ R. Neste caso, como det(R) = −1, teremos R−1 = (−d b c −a ) . Assim, a condição R−1 = RT significa nesse caso     −d b c −a     =     a c b d     , ou seja, c = b e d = −a. Logo, R = ( a b b −a ) . A condição det(R) = −1 implica novamente a2 + b2 = 1. Podemos então escrever a e b na forma a = cos θ, b = − sen θ, com θ ∈ (−π, π]. Assim, R é da forma R =     cos θ − sen θ − sen θ − cos θ     =     1 0 0 −1         cos θ − sen θ sen θ cos θ     . Resumindo: O(2) =         1 0 0 −1     P     cos θ − sen θ sen θ cos θ     , onde P ∈ {0, 1} e θ ∈ (−π, π]     . • O grupo U(1) E. 18.31 Exerćıcio. Mostre que o grupo U(1) := {z ∈ C, |z| = 1} é isomorfo ao grupo SO(2). 6 • O grupo O(1, 1) (o grupo de Lorentz em 1+1 dimensões) Aqui estudaremos com algum detalhe o grupo O(1, 1), também denominado Grupo de Lorentz em 1+1 dimensões. A leitura deste tópico pode servir de introdução à leitura da Seção 18.6 que tratará do Grupo de Lorentz em 3+1 dimensões. Seja M matriz inverśıvel real 2 × 2 na forma M = ( a b c d ) , onde a, b, c, d ∈ R. Tem-se que, M−1 = 1ad−bc ( d −b −c a ) , onde det(M) = ad− bc. Se η := (−1 0 0 1 ) então ηMT η = ( a −c −b d ) , como facilmente se vê. Se M ∈ SO(1, 1), então M−1 = ηMT η e det(M) = 1. Isso significa que ( d −b −c a ) = ( a −c −b d ) . Assim, devemos ter a = d e b = c. A condição det(M) = 1 significa a2 − b2 = 1. Logo, SO(1, 1) = { M ∈ Mat (R, 2)| M = ( a b b a ) com a2 − b2 = 1, a, b ∈ R } . Como se vê, SO(1, 1) é homeomorfo ao conjunto H+ ∪H− formado por duas hipérboles H± := {(x, y) ∈ R2| x = ± √ 1 + y2} . SO(1, 1) tem, portanto, duas componentes conexas, que denotaremos por L↑+ e L ↓ +: L ↑ + := { M ∈Mat (R, 2)| M = (√ 1+b2 b b √ 1+b2 ) , b ∈ R } , L ↓ + := { M ∈Mat (R, 2)| M = ( − √ 1+b2 b b − √ 1+b2 ) , b ∈ R } . Note-se que apenas L↑+ é conexa à identidade e, portanto, apenas a componente L ↑ + é um subgrupo de SO(1, 1). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 884/1730 Parametrizando b ∈ R na forma b = − senh(z), com z ∈ R, constatamos que L ↑ + = { M ∈ Mat (R, 2)| M = ( cosh(z) − senh(z) − senh(z) cosh(z) ) , z ∈ R } , L ↓ + = { M ∈ Mat (R, 2)| M = ( − cosh(z) − senh(z) − senh(z) − cosh(z) ) , z ∈ R } . Os elementos de O(1, 1) que não são de SO(1, 1) têm determinante −1. Assim, são matrizes que satisfazem (−d b c −a ) = ( a −c −b d ) sendo, portanto, da forma ( a b −b −a ) com a2 − b2 = 1. O conjunto de tais matrizes é igualmente homeomorfo ao conjunto H+ ∪H− e consta também de duas componentes conexas, a saber, os conjuntos L ↑ − := { M ∈Mat (R, 2)| M = (√ 1+b2 b −b − √ 1+b2 ) , b ∈ R } , L ↓ − := { M ∈Mat (R, 2)| M = ( − √ 1+b2 b −b √ 1+b2 ) , b ∈ R } . É claro que nem L↑− nem L ↓ − são subgrupos de O(1, 1). Parametrizando b ∈ R novamente na forma b = − senh(z), com z ∈ R, constatamos que L ↑ − = { M ∈Mat (R, 2)| M = ( cosh(z) − senh(z) senh(z) − cosh(z) ) , z ∈ R } , L ↓ − = { M ∈Mat (R, 2)| M = ( − cosh(z) − senh(z) senh(z) cosh(z) ) , z ∈ R } . O grupo O(1, 1) é, portanto, a união de quatro componentes conexas: O(1, 1) = L↑+ ∪ L↓+ ∪ L↑− ∪ L↓− , sendo cada componente disjunta das demais. Dentre elas apenas L↑+ é um grupo. Definindo as matrizes T := (−1 0 0 1 ) ∈ L↓− e P := ( 1 0 0 −1 ) ∈ L↑−, podemos escrever L ↓ + = { M ∈Mat (R, 2)| M = P ( cosh(z) − senh(z) − senh(z) cosh(z) ) T, z ∈ R } , L ↑ − = { M ∈Mat (R, 2)| M = P ( cosh(z) − senh(z) − senh(z) cosh(z) ) , z ∈ R } , L ↓ − = { M ∈Mat (R, 2)| M = ( cosh(z) − senh(z) − senh(z) cosh(z) ) T, z ∈ R } , o que exibe a relação entre as matrizes dessas três componentes conexas e as matrizes de L↑+. E. 18.32 Exerćıcio importante. Mostre que L ↑ + = {M ∈ Mat (R, 2)| M = exp(zM1), z ∈ R} , onde M1 := ( 0 −1 −1 0 ) . 6 * O grupo O(1, 1) é por vezes denominado Grupo de Lorentz em 1+1 dimensões. L↑+ é denominado Grupo de Lorentz próprio ortócrono em 1+1 dimensões. O Grupo de Lorentz em 3+1 dimensões será estudado em detalhe na Seção 18.6, página 910. Para fazermos contacto com a teoria da relatividade restrita, façamos uma outra parametrização de L↑+, definindo v = c tanh(z). Com isso −c < v < c, cosh(z) = γ(v) e senh(z) = vcγ(v), onde γ(v) := (1− (v/c)2)−1/2. Assim, definindo B1(v) :=     γ(v) − vcγ(v) − vcγ(v) γ(v)     =     cosh(z) − senh(z) − senh(z) cosh(z)     , JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 885/1730 teremos L ↑ + = { B1(v), −c < v < c } . B1(v) ∈ L↑+ age em um vetor ( ctx ) como B1(v) ( ctx ) = ( ct′ x′ ) , onde t′ = t− vc2x √ 1− v2c2 , x′ = x− vt √ 1− v2c2 , que são as bem conhecidas transformações de Lorentz da Teoria da Relatividade Restrita. E. 18.33 Exerćıcio. Qual a interpretação f́ısica das matrizes P e T introduzidas acima? 6 E. 18.34 Exerćıcio. Constate que para todos v, v′ ∈ (−c, c) vale B1(v)B1(v ′) = B1 ( v + v′ 1 + v v ′ c2 ) . 6 18.3.2 O Grupo SO(3) Conforme já definimos, SO(3) é o grupo formado por todas as matrizes 3 × 3 reais R tais que RT = R−1 e tais que det(R) = 1. Vamos começar seu estudo mostrando que toda a matriz R 6= 1 de SO(3) representa uma rotação por algum ângulo em torno de algum eixo. A essa interpretação seremos conduzidos pelas duas proposições que seguem. Proposição 18.3 Para cada matriz R ∈ SO(3), R 6= 1, existe um subespaço unidimensional V de R3 formado por vetores que são deixados invariantes por R: R~v = ~v para todo ~v ∈ V . 2 Note que o subespaço V pode não ser o mesmo para matrizes R distintas. Note também que exclúımos R = 1 por razões óbvias: todo vetor de R3 é invariante por 1 e não apenas um subespaço unidimensional. Prova. Seja R 6= 1 uma matriz qualquer de SO(3), fixa daqui por diante. Para x ∈ R, seja p(x) := det(x1 − R), o polinômio caracteŕıstico de R. Se escrevermos explicitamente o determinante da matriz x1 − R (faça!), veremos que p(x) = +x3 +α1x 2 +α2x+α3, onde as constantes αi dependem dos elementos de matriz de R. Como o termo de maior grau em x de p(x) é +x3, conclúımos que limx→∞ p(x) = +∞. Fora isso, é claro que p(0) = det(−R) = − det(R) = −1 (por que?). Esses dois fatos dizem que o polinômio p(x) deve ter um zero para algum x0 > 0. Vamos provar que x0 = 1. Como det(x01 − R) = 0, conclúımos que a matriz R − x01 não possui uma inversa. Portanto, deve existir pelo menos um vetor não-nulo ~v0 ∈ R3 tal que (R − x01)~v0 = 0, ou seja, R~v0 = x0~v0. Como R ∈ SO(3), segue que |~v0|2 = 〈~v0, ~v0〉R = 〈R~v0, R~v0〉R = 〈x0~v0, x0~v0〉R = x20〈~v0, ~v0〉R. Logo x20 = 1 e, como x0 > 0, segue x0 = 1. Assim, R~v0 = ~v0, ou seja, ~v0 é um autovetor de R com autovalor 1. Seja V o subespaço de R3 formado por todos os vetores ~v que são autovetores de R com autovalor 1: V = {~v ∈ R3| R~v = ~v}. Como acabamos de mostrar, V é não-trivial, ou seja, V 6= {0} e sua dimensão pode ser 1, 2 ou 3. Notemos de passagem que se v ∈ V então vale também que RT v = v. De fato, se aplicarmos RT à direita na igualdade v = Rv e lembrarmos que RTR = 1, segue que RT v = v. Notemos também que V ⊥, o subespaço formado por todos os vetores ortogonais a todos os vetores de V , é também deixado invariante por R, ou seja, se u ∈ V ⊥ então Ru ∈ V ⊥. De fato, se v ∈ V e u ∈ V ⊥ 〈Ru, v〉 R = 〈u, RT v〉 R = 〈u, v〉 R = 0 . Como isso vale para todo v ∈ V , conclúımos que Ru ∈ V ⊥, como queŕıamos. Como dissemos, a dimensão de V pode ser igual a 1, 2 ou 3. Vamos mostrar que os dois últimos casos não são posśıveis. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 888/1730 Esse exerćıcio nos diz que as matrizes J1, J2 e J3 formam uma álgebra de Lie, denominada álgebra de Lie so(3) (com letras minúsculas), para lembrar sua associação com o grupo SO(3). E. 18.36 Exerćıcio. Sejam ~α = (α1, α2, α3) ∈ R3 e ~β = (β1, β2, β3) ∈ R3. Usando (18.32), mostre que [ ~α · ~J, ~β · ~J ] = (~α× ~β) · ~J , (18.34) sendo que “×” denota o produto vetorial em R3 e ~α · ~J é uma abreviação sugestiva para α1J1 + α2J2 + α3J3. 6 E. 18.37 Exerćıcio. Verifique que as matrizes J1, J2 e J3 satisfazem J21 = −         0 0 0 0 1 0 0 0 1         =: E1, J 2 2 = −         1 0 0 0 0 0 0 0 1         =: E2 , e J 2 3 = −         1 0 0 0 1 0 0 0 0         =: E3 . (18.35) 6 E. 18.38 Exerćıcio. Verifique que com as matrizes E1, E2 e E3 acima podemos escrever Ra(ϕ) = 1 + (1− cos(ϕ))Ea + sen (ϕ)Ja (18.36) para a = 1, 2 e 3. 6 Com o uso de (18.35) podemos facilmente provar o seguinte fato: para a = 1, 2 ou 3 tem-se Ra(ϕ) = exp(ϕJa) . Vamos mostrar isso. Por (18.35) é evidente que J3a = EaJa = −Ja (verifique!). Logo, para k ∈ N0, J2ka = (−1)k+1Ea, ∀k > 0 e J2k+1a = (−1)kJa, ∀k ≥ 0 . (18.37) Assim, temos para a = 1, 2 ou 3, exp(ϕJa) = 1+ ∞∑ m=1 ϕm m! Jma = 1+ ∞∑ k=1 ϕ2k (2k)! J2ka + ∞∑ k=0 ϕ2k+1 (2k + 1)! J2k+1a (18.37) = 1+( ∞∑ k=1 (−1)k+1ϕ2k (2k)! ) Ea + ( ∞∑ k=0 (−1)kϕ2k+1 (2k + 1)! ) Ja = 1+ (1 − cos(ϕ))Ea + sen (ϕ)Ja (18.36) = Ra(ϕ) , que é o que queŕıamos mostrar. Vamos agora mostrar que todo elemento de SO(3) pode ser escrito como exponencial de uma combinação linear das matrizes Ja. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 889/1730 Proposição 18.5 Seja R ∈ SO(3). Então existe um vetor ~η ∈ R3, ~η = (η1, η2, η3), com |~η| = 1 e um ângulo θ ∈ (−π, π] tais que R = exp ( θ~η · ~J ) , onde ~η · ~J := η1J1 + η2J2 + η3J3. Em particular, toda matriz de rotação R ∈ SO(3) pode ser expressa na forma R = 1+ (1 − cos(θ))(~η · ~J)2 + sen (θ)(~η · ~J) , (18.38) ou seja, escrevendo-se explicitamente, R =                 (1− cos(θ))η21 + cos(θ) (1− cos(θ))η1η2 − sen (θ)η3 (1 − cos(θ))η1η3 + sen (θ)η2 (1− cos(θ))η1η2 + sen (θ)η3 (1− cos(θ))η22 + cos(θ) (1 − cos(θ))η3η2 − sen (θ)η1 (1− cos(θ))η1η3 − sen (θ)η2 (1− cos(θ))η3η2 + sen (θ)η1 (1− cos(θ))η23 + cos(θ)                 . A expressão (18.38) é denominada fórmula de Rodrigues11. Prova. Se R = 1 podemos escolher θ = 0. Vamos supor R 6= 1. Pela Proposição 18.3, existe um subespaço unidimensional VR que é deixado invariante por R. Vamos escolher ~η como sendo um vetor de VR com comprimento igual a 1. É óbvio que R~η = ~η. Pela Proposição 18.4, R representa uma rotação de um ângulo θ (no sentido horário se θ > 0) em torno de ~η. O que faremos para demonstrar nossa proposição é mostrar que exp ( θ~η · ~J ) mantém ~η invariante e roda os vetores perpendiculares a ~η de um ângulo θ (no sentido horário) em torno do eixo definido por ~η. Com isso, podemos identificar R = exp ( θ~η · ~J ) , como queremos. Vamos abaixo calcular de modo mais expĺıcito o que é a matriz exp ( θ~η · ~J ) mas, antes disso, vamos demonstrar que exp ( θ~η · ~J ) ∈ SO(3). Para isso começamos com a observação que ~η · ~J := η1J1 + η2J2 + η3J3 :=         0 −η3 η2 η3 0 −η1 −η2 η1 0         (18.39) é uma matriz anti-simétrica, ou seja, (~η · ~J)T = −~η · ~J . Assim, [ exp ( θ~η · ~J )]T = ∞∑ m=0 θm m! ([ ~η · ~J ]T )m = ∞∑ m=0 (−θ)m m! (~η · ~J)m = exp ( −θ~η · ~J ) = [ exp ( θ~η · ~J )]−1 . Isso provou que exp(θ~η· ~J) é ortogonal, ou seja, sua transposta é igual a sua inversa. Resta-nos mostrar que det ( exp ( θ~η · ~J )) = 1. Como exp ( θ~η · ~J ) é ortogonal, seu determinante é ±1. Assim, como det ( exp ( θ~η · ~J )) depende continuamente de θ 11Benjamin Olinde Rodrigues (1794–1851). Rodrigues foi banqueiro e matemático amador, nascido na França, mas de origem judaico- portuguesa. Seu nome é mais conhecido por uma identidade sobre polinômios de Legendre. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 890/1730 (para isso, vide, por exemplo a expressão (18.42) abaixo), temos que det ( exp ( θ~η · ~J )) é constante para todo θ ∈ (−π, π]. Calculando em θ = 0, teremos det ( exp ( θ~η · ~J )) = det ( exp ( 0~η · ~J )) = det(1) = 1 . Logo, exp ( θ~η · ~J ) ∈ SO(3) para todo θ e todo ~η. Vamos agora expressar de modo mais expĺıcito a matriz exp ( θ~η · ~J ) . Para isso será importante mostrar que ( ~η · ~J )3 = − ( ~η · ~J ) . (18.40) A maneira pedestre de mostrar isso é por verificação expĺıcita. De fato, por (18.39), ( ~η · ~J )2 =         η21 − 1 η1η2 η1η3 η1η2 η 2 2 − 1 η3η2 η1η3 η3η2 η 2 3 − 1         . (18.41) Multiplicando-se novamente por ~η · ~J , obtém-se (18.40). Temos, então, o seguinte: para todo k ∈ N, vale ( ~η · ~J )2k = (−1)k+1 ( ~η · ~J )2 e ( ~η · ~J )2k+1 = (−1)k ( ~η · ~J ) . Logo, exp ( θ~η · ~J ) = 1 + ∞∑ m=1 θm m! ( ~η · ~J )m = 1 + ∞∑ k=1 θ2k (2k)! ( ~η · ~J )2k + ∞∑ k=0 θ2k+1 (2k + 1)! ( ~η · ~J )2k+1 = 1 +( ∞∑ k=1 (−1)k+1θ2k (2k)! ) ( ~η · ~J )2 + ( ∞∑ k=0 (−1)kθ2k+1 (2k + 1)! ) ~η · ~J = 1 + (1− cos(θ))(~η · ~J)2 + sen (θ)(~η · ~J) . Resumindo, exp ( θ~η · ~J ) = 1+ (1− cos(θ))(~η · ~J)2 + sen (θ)(~η · ~J) . (18.42) É um exerćıcio fácil verificar que ( ~η · ~J ) ~η =         0 −η3 η2 η3 0 −η1 −η2 η1 0                 η1 η2 η3         =         0 0 0         . Assim, conclui-se, tanto pela expansão em série de Taylor de exp ( θ~η · ~J ) quando por (18.42) que exp ( θ~η · ~J ) ~η = ~η, JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 893/1730 Vamos agora nos voltar para a condição |a|2 + |b|2 = 1. A mesma significa a21 + a22 + b21 + b22 = 1. Temos então, SU(2) =        a1 + ia2 b1 + ib2 −b1 + ib2 a1 − ia2     , onde (a1, a2, b1, b2) ∈ R4 com a21 + a22 + b21 + b22 = 1    . (18.48) Lembremos que para todo inteiro n ≥ 1, o conjunto de pontos Sn := {(x1, . . . , xn+1) ∈ Rn+1 com x21 + · · ·+ x2n+1 = 1} ⊂ Rn+1 designa a superf́ıcie da esfera unitária de Rn+1. Assim, vemos que SU(2) é homeomorfo a S3, a superf́ıcie da esfera unitária do espaço quadridimensional R4. Isso ilustra o fato que SU(2) é uma variedade diferenciável. Como o produto e a inversa são cont́ınuos em SU(2), o mesmo é um grupo de Lie. Vamos tentar agora parametrizar de outra forma o vetor (a1, a2, b1, b2) ∈ S3 que aparece do lado direito de (18.48). Claramente, a condição a21 + a 2 2 + b 2 1 + b 2 2 = 1 diz que a1, a2, b1 e b2 são números reais contidos no intervalo [−1, 1]. Podemos assim definir um ângulo θ ∈ [−π, π] de forma que a1 = cos θ. Fora isso, para cos(θ) 6= ±1, podemos definir η1 := b2 sen θ , η2 := b1 sen θ , η3 := a2 sen θ . A condição a21 + a 2 2 + b 2 1 + b 2 2 = 1 implica então (verifique!) que η 2 1 + η 2 2 + η 2 3 = 1. Assim, o vetor ~η := (η1, η2, η3) de R 3 é um vetor de comprimento 1. Com esses novos parâmetros θ e ~η podemos reescrever (18.47) como U = cos(θ)1 + i sen (θ)~η · ~σ , onde ~η · ~σ := η1σ1 + η2σ2 + η3σ3 =     η3 η1 − iη2 η1 + iη2 −η3     . Assim, SU(2) = { cos(θ)1 + i sen (θ)~η · ~σ, onde θ ∈ [−π, π] e ~η ∈ R3 com ‖~η‖ = 1} . A importância de se expressar U ∈ SU(2) dessa forma, em termos de θ e ~η, provem da seguinte identidade: cos(θ)1 + i sen (θ)~η · ~σ = exp (iθ~η · ~σ) . Vamos provar isso expandindo o lado direito e verificando que é igual ao lado esquerdo. De fato, pela definição da exponencial de matrizes, exp (iθ~η · ~σ) = ∞∑ m=0 (iθ)m m! (~η · ~σ)m = ∞∑ k=0 (iθ)2k (2k)! (~η · ~σ)2k + ∞∑ k=0 (iθ)2k+1 (2k + 1)! (~η · ~σ)2k+1 , onde, na última linha, apenas fizemos separar a soma em m da primeira linha nos casos m par e m ı́mpar. É um exerćıcio muito fácil (faça!) verificar que (~η · ~σ)2 =     η3 η1 − iη2 η1 + iη2 −η3     2 = 1 . Portanto, (~η · ~σ)2k = 1 e (~η · ~σ)2k+1 = ~η · ~σ. Logo, exp (iθ~η · ~σ) = ( ∞∑ k=0 (iθ)2k (2k)! )1 +( ∞∑ k=0 (iθ)2k+1 (2k + 1)! ) ~η · ~σ = cos(θ)1 + i sen (θ)~η · ~σ , JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 894/1730 que é o que queŕıamos mostrar. Resumindo nossas conclusões, SU(2) = { exp (iθ~η · ~σ) onde θ ∈ [−π, π] e ~η ∈ R3 com ‖~η‖ = 1 } . (18.49) Se tomarmos ~η1 = (1, 0, 0), ~η2 = (0, 1, 0) ou ~η3 = (0, 0, 1), obtemos três subgrupos uniparamétricos distintos de SU(2): U1(θ) := exp(iθσ1) =     cos θ i sen θ i sen θ cos θ     , U2(θ) := exp(iθσ2) =     cos θ sen θ − sen θ cos θ     , U3(θ) := exp(iθσ3) =     eiθ 0 0 e−iθ     , respectivamente. Isso nos permite identificar as matrizes de Pauli σ1, σ2 e σ3 como os geradores desses subgrupos uniparamétricos. As relações (18.44) são as relações satisfeitas por essas matrizes, como elementos de uma álgebra de Lie, que é denominada álgebra de Lie su(2). Com isso, (18.49) está nos dizendo que todo elemento de SU(2) pode ser escrito como exponencial de um elemento de sua álgebra de Lie. Isso constata um teorema geral (vide, por exemplo, [173]) que diz que se um grupo de Lie é compacto e sua álgebra de Lie é semi-simples, a aplicação exponencial da sua álgebra de Lie é sobrejetora no grupo. De fato, tal como SO(3), SU(2) é compacto e su(2) é semi-simples. E. 18.42 Exerćıcio. Mostre que U(2) = { exp (iα1+ iθ~η · ~σ) onde α, θ ∈ [−π, π] e ~η ∈ R3 com ‖~η‖ = 1} . 6 18.3.4 A Relação entre SO(3) e SU(2) O leitor que acompanhou com atenção as exposições precedentes sobre os grupos SO(3) e SU(2) certamente apercebeu-se da existência de uma série de semelhanças entre ambos. Vamos agora precisá-las. Em primeiro lugar, note-se que os geradores de SO(3) são matrizes 3×3 satisfazendo as relações algébricas [Ja, Jb] = εabcJc, enquanto que geradores de SU(2) são matrizes 2 × 2 satisfazendo as relações algébricas [σa, σb] = 2iεabcσc. Se porém definirmos ja := −iσa/2, obtemos [ja, jb] = εabcjc. Seja so(3) := {L ∈Mat (R, 3) : L = α1J1 + α2J2 + α3J3, αk ∈ R, k = 1, 2, 3} a álgebra de Lie (real) associada aos geradores de SO(3) e seja su(2) := {l ∈Mat (C, 2) : l = α1j1 + α2j2 + α3j3, αk ∈ R, k = 1, 2, 3} a álgebra de Lie (real) associada aos geradores de SU(2). É muito fácil constatar que a aplicação linear ϕ : su(2)→ so(3) dada por ϕ(α1j1 + α2j2 + α3j3) = α1J1 + α2J2 + α3J3 é um isomorfismo de álgebras de Lie, ou seja, é bijetora e satisfaz ϕ([la, lb]) = [ϕ(la), ϕ(lb)] para todos la, lb ∈ su(2). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 895/1730 E. 18.43 Exerćıcio importante. Prove as afirmativas acima. 6 E. 18.44 Exerćıcio. Mostre que so(3) coincide com a álgebra de Lie de todas as matrizes reais 3×3 anti-simétricas. (Vide exerćıcio à página 86). 6 E. 18.45 Exerćıcio. Mostre que su(2) coincide com a álgebra de Lie de todas as matrizes complexas 2×2 anti-autoadjuntas e de traço nulo. (Vide exerćıcio à página 86). 6 Assim, as álgebras de Lie so(3) e su(2) são isomorfas. Discutiremos agora que implicações isso traz sobre as relação entre os grupos SO(3) e SU(2). O isomorfismo ϕ definido acima sugere considerar-se a seguinte aplicação φ : SU(2)→ SO(3) dada por φ (exp(l)) := exp (ϕ(l)) , ∀l ∈ su(2) , ou seja, φ ( exp ( θ~η ·~j )) := exp ( θ~η · ~J ) , para todos θ ∈ (−2π, 2π], e ~η ∈ R3 com ‖~η‖ = 1. Que propriedades essa φ possui? Em primeiro lugar, é fácil ver que φ é sobrejetora (por que?), mas não é injetora, pois para U1 := exp ( −i 02~η · ~σ ) = 1 e U2 := exp (−i 2π2 ~η · ~σ) = −1 tem-se φ(U1) = φ(U2) = 1. Verifique! A questão é: como se comporta φ em relação ao produto dos elementos do grupo? A resposta encontra-se na afirmativa da proposição seguinte. Proposição 18.6 A aplicação φ : SU(2)→ SO(3) definida acima é um homomorfismo do grupo SU(2) no grupo SO(3), ou seja, φ(1) = 1 e para todos Ua, Ub ∈ SU(2) vale φ(Ua)φ(Ub) = φ(UaUb). 2 Em verdade, como φ é sobrejetora, a proposição estabelece que φ é um epimorfismo de SU(2) em SO(3). Vide definição à página 94. Prova. Que φ(1) = 1 é trivial. Provemos que φ(Ua)φ(Ub) = φ(UaUb) para todos Ua, Ub ∈ SU(2). Sejam Ua e Ub da forma Ua = exp ( 3∑ k=1 αkjk ) , Ub = exp ( 3∑ k=1 βkjk ) , com αk, βk ∈ R, k = 1, 2, 3, e limitemos provisoriamente os valores dos αk’s e βk’s a uma vizinhança O suficiente- mente pequena de zero de modo que as matrizes a = ∑3 k=1 αkjk e b = ∑3 k=1 βkjk tenham ambas normas menores que 1 2 ln ( 2− √ 2 2 ) . Essa restrição provisória às normas de a e b é útil pois coloca-nos no domı́nio de validade da fórmula de Baker-Campbell-Hausdorff (eq. (7.45) à página 345. Vide também (7.46)). Isso justifica então escrevermos UaUb = e aeb = exp (a ∗ b) , onde a ∗ b está definida em (7.45). Como a série que define a ∗ b é convergente e envolve comutadores múltiplos de elementos da álgebra de Lie su(2), é evidente que a ∗ b é também um elemento de su(2) e, mais que isso, tem-se a ∗ b = 3∑ k=1 γkjk = 3∑ k=1 γk(α1, α2, α3, β1, β2, β3)jk , (18.50) onde cada γk é uma função anaĺıtica das variáveis α1, α2, α3, β1, β2, β3 em um aberto suficientemente pequeno próximo zero. A analiticidade se deve ao fato de que a série que define a ∗ b é absolutamente convergente e envolve, em cada termo, polinômios nas variáveis α e β. E. 18.46 Exerćıcio. Lance um olhar meditativo sobre a fórmula de Baker-Campbell-Hausdorff (7.45) e convença-se da veracidade das afirmações feitas no último parágrafo sobre a analiticidade das funções γk. De modo mais iluminante, mostre usando (7.46) e as relações de comutação (18.34), que os primeiros termos de ~γ = (γ1, γ2, γ3) são ~γ = ~α+ ~β + 1 2 ( ~α× ~β ) + 1 12 ( ~α× ( ~α× ~β ) + ~β × ( ~β × ~α )) + · · · , JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 898/1730 18.4 Generalidades sobre os grupos SU(n) e SO(n) Nesta seção discutiremos algumas qualidades gerais dos grupos SU(n) e SO(n). Para esta seção recomenda-de a leitura prévia de partes do Caṕıtulo 19, página 958. Começaremos com os grupos SU(n) pois seu tratamento é ligeiramente mais simples que o dos grupos SO(n). O caso fisicamente importante do grupo SU(3) será discutido com um pouco de detalhe. 18.4.1 Os Grupos SU(n) Após termos adquirido algum conhecimento sobre o grupo SU(2), vamos estudar alguns aspectos gerais dos grupos SU(n), n ≥ 2. Vimos acima de modo expĺıcito que os elementos de SU(2) podem ser escritos como exponenciais de elementos de sua álgebra de Lie. Veremos que esse fato é também válido para SU(n). Lembremos a definição: para n ≥ 2, SU(n) := {U ∈Mat (C, n)| U∗ = U−1 e det(U) = 1}. Comecemos com a seguinte observação. Proposição 18.7 SU(n) é um subgrupo compacto de GL(C, n). 2 Prova. Provemos primeiramente que SU(n) é um subconjunto (topologicamente) fechado de GL(C, n). Seja Un, n ∈ N, uma seqüência de matrizes de SU(n) que converge em norma a uma matriz U ∈ Mat (C, n), ou seja, limn→∞ ‖Un − U‖C = 0, onde ‖ · ‖C é a norma operatorial de matrizes. Desejamos provar que U ∈ SU(n). Em primeiro lugar, notemos que podemos escrever U∗U = (U − Un + Un)∗(U − Un + Un) = (U − Un)∗(U − Un) + U∗n(U − Un) + (U − Un)∗Un + U∗nUn. Como os Un são unitários, U ∗ nUn = 1 e conclui-se que U∗U − 1 = (U − Un)∗(U − Un) + U∗n(U − Un) + (U − Un)∗Un. Assim ‖U∗U − 1‖C = ‖(U − Un)∗(U − Un) + U∗n(U − Un) + (U − Un)∗Un‖C ≤ ‖(U − Un)∗(U − Un)‖C + ‖U∗n(U − Un)‖C + ‖(U − Un)∗Un‖C ≤ ‖(U − Un)∗‖C‖U − Un‖C + ‖U∗n‖C‖U − Un‖C + ‖(U − Un)∗‖C‖Un‖C ≤ ‖U − Un‖2C + 2‖U − Un‖C . (18.54) (Ao estudante deve ser claro que acima usamos os fatos que, para quaisquer matrizes A, B, complexas n × n, valem ‖A + B‖C ≤ ‖A‖C + ‖B‖C, ‖AB‖C ≤ ‖A‖C‖B‖C, ‖A‖C = ‖A∗‖C e que ‖A‖C = 1 se A é unitária. Se não for claro, justifique esses fatos como exerćıcio ou leia o Caṕıtulo 33). Agora, como o extremo direito da seqüência de desigualdades (18.54) pode ser feito arbitrariamente pequeno para n → ∞, conclúımos que o extremo esquerdo é nulo, ou seja, U∗U = 1. Analogamente, prova-se que UU∗ = 1. Isso estabelece que U é unitário. Para provar que o determinante de U vale 1, notemos que o fato de Un convergir a U na norma operatorial implica que os elementos de matriz da seqüência de matrizes Un convergem aos elementos de matriz de U (por que?). Como o determinante de uma matriz depende continuamente de seus elementos de matriz (por que?), segue que det(U) = limn→∞ det(Un) = 1. Isso estabelece que U ∈ SU(n) e isso prova que SU(n) é um subconjunto topologicamente fechado de GL(C, n), como queŕıamos. Para provarmos que SU(n) é compacto, resta apenas provar que SU(n) é um conjunto limitado14. A condição U∗U = 1 implica Tr(U∗U) = n. Assim, vale n∑ a, b=1 |Uab|2 = n, 14Para a definição da noção de compacidade e suas propriedades, vide Seção 28.3, página 1246. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 899/1730 para todo U ∈ SU(n). Isso mostra que SU(n) é limitado e, portanto, compacto. Seja agora {U(t) ∈ SU(n), t ∈ R}, um subgrupo uniparamétrico de SU(n) (ou seja, U(0) = 1 e U(t)U(t′) = U(t+ t′), sendo t 7→ U(t) cont́ınua). Pela Proposição 19.5, página 966, U(t) = exp(tA) para alguma matriz A. Agora, sejam u, v dois vetores arbitrários de Cn. Temos que, para todo t vale 〈u, v〉 C = 〈U(t)u, U(t)v〉 C . Diferenciando essa igualdade em relação a t, escrevendo-se U(t) = exp(tA) e calculando a derivada em t = 0, tem-se 0 = 〈Au, v〉 C + 〈u, Av〉 C , ou seja, 〈u, (A + A∗)v〉 C = 0. Como isso vale para todo u, v em Cn, segue que A∗ = −A. Fora isso15, como 1 = det(exp(tA)) = exp(tTr(A)), segue que A tem traço nulo. Assim, vimos que os geradores dos subgrupos uniparamétricos de SU(n) são anti-autoadjuntos e têm traço nulo. Podemos nos perguntar se a rećıproca é válida, ou seja, se todas as matrizes anti-autoadjuntas e de traço nulo são geradoras de subgrupos uniparamétricos de SU(n). Para responder isso, precisamos da seguinte proposição: Proposição 18.8 Se A ∈ Mat (C, n) é anti-autoadjunta (ou seja, A∗ = −A) satisfazendo também Tr(A) = 0, então a matriz exp(A) é um elemento de SU(n). 2 Prova. Precisamos provar que exp(A) é unitária e que seu determinante é igual a 1. Pela definição da exponencial de matrizes em termos de uma série de potências (a série de Taylor da função exponencial), sabe-se que exp(M)∗ = exp(M∗) para qualquer matriz n × n complexa M . Assim, exp(A)∗ = exp(A∗) = exp(−A) = exp(A)−1, provando que exp(A) é unitária. Assim, para nossa matriz A, tem-se det(exp(A)) = exp(Tr(A)) = exp(0) = 1, o que prova que exp(A) ∈ SU(n), como queŕıamos. Essa proposição diz-nos que, se A ∈ Mat (C, n) é anti-autoadjunta e tem traço nulo, então U(t) = exp(tA), t ∈ R é um subgrupo uniparamétrico de SU(n). Em resumo, conclúımos que o conjunto de todas as matrizes n × n complexas anti-autoadjuntas e de traço nulo é idêntico ao conjunto de todos os geradores de subgrupos uniparamétricos de SU(n). Como SU(n) é um subgrupo fechado de GL(C, n), segue do Teorema 19.1 que o conjunto de seus geradores é uma álgebra de Lie. Essa álgebra de Lie é dita ser a álgebra de Lie de SU(n), e é denotada por su(n) (assim, com letras minúsculas). Como vimos, su(n) coincide com o conjunto de todas as matrizes n × n complexas anti-autoadjuntas de traço nulo. De passagem, notemos que o fato de que o conjunto de todas as matrizes n×n complexas anti-autoadjuntas de traço nulo forma uma álgebra de Lie real já fora visto independentemente nos exerćıcios da página 86. Provemos agora uma outra proposição, a qual essencialmente diz-nos que todo elemento de SU(n) pode ser obtido como exponencial de um elemento de su(n). No caso de SU(2) isso foi provado explicitamente, quando mostramos que todo elemento de SU(2) é da forma exp(iθ~η · ~σ). Proposição 18.9 Todo elemento U de SU(n) pode ser escrito na forma U = eA, onde A ∈Mat (C, n) é anti-autoadjunta (ou seja, A∗ = −A) e de traço nulo (ou seja, Tr(A) = 0). 2 Prova. Seja U ∈ SU(n). Como toda matriz unitária, U é normal, pois vale UU∗ = U∗U(= 1). Uma das conseqüências do Teorema Espectral para matrizes diz-nos que toda matriz normal pode ser diagonalizada por uma matriz unitária (vide Teorema 6.15 e as páginas que o antecedem). Assim, existe V , matriz unitária, tal que U = V DV ∗, onde D = diag (u1, . . . , un), e onde os uk são números complexos (os autovalores de U). Da condição UU∗ = 1 segue imediatamente que DD∗ = 1, o que implica que cada uk é um número complexo de módulo 1: |uk|2 = 1. Assim, podemos escrever uk = eiλk , onde λk ∈ R, sendo que cada λk é determinado a menos de um termo 2πm, com m inteiro. Note-se que, como U tem determinante 1, segue que 1 = det(U) = det(V DV ∗) = det(D) = exp ( i ∑n k=1 λ k ) . Assim, ∑n k=1 λ k = 2πm0, com m0 inteiro. Podemos redefinir, digamos, λn, subtraindo-lhe 2πm0. Com essa nova escolha teremos n∑ k=1 λk = 0 . (18.55) 15Aqui usamos a Proposição 6.14, página 253, ou a Proposição 7.7, página 333. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 900/1730 Definamos agora a matriz L = diag (iλ1, . . . , iλn). Note-se que, como os λk são reais, vale L ∗ = −L. É claro que D = eL e também que U = exp(A), onde A = V LV ∗. É agora elementar constatar que A∗ = −A. Fora isso, por (18.55) segue que Tr(A) = Tr(V LV ∗) = Tr(L) = i ∑n k=1 λ k = 0. Isso completa a prova. A Proposição 18.9 diz-nos que a exponenciação é uma aplicação sobrejetora de su(n) em SU(n). Isso é um caso particular de um teorema mais geral que diz que isso é válido para qualquer grupo de Lie compacto, conexo e cuja álgebra de Lie seja de dimensão finita. E. 18.48 Exerćıcio. Pelo que vimos su(2) coincide com a álgebra de Lie real de todas as matrizes complexas 2 × 2, anti-autoadjuntas e de traço zero. Mostre que as matrizes iσ1, iσ2 e iσ3 formam uma base nesse espaço de matrizes. Conclua que todo elemento de SU(2) é da forma exp(iα1σ1 + iα2σ2 + iα3σ3) com αk ∈ R. 6 A Proposição 18.9 tem o seguinte corolário simples: Corolário 18.1 O grupo SU(n) é conexo por caminhos e, portanto, é um espaço conexo. 2 Prova. Pelo que vimos, se U ∈ SU(n), então U é da forma U = eA, para alguma A ∈ su(n). Logo U pertence ao subgrupo uniparamétrico de SU(n) gerado por A: {exp(tA), t ∈ R}. Esse subgrupo conecta continuamente U à identidade 1 (que corresponde a t = 0). 18.4.2 O Grupo SU(3) O grupo SU(3) é de grande importância na F́ısica das Part́ıculas Elementares, estando associado à uma simetria aproxi- mada, dita de “sabor”, e a uma simetria exata, dita de “cor”. Não nos deteremos nesses aspectos aqui, e remetemos o estudante aos bons livros sobre F́ısica das Part́ıculas Elementares e Teoria Quântica de Campos (por exemplo, [202]-[203]). O grupo SU(3) é um grupo a 32 − 1 = 8 parâmetros. Pelo que vimos, su(3) coincide com o espaço das matrizes complexas 3 × 3, anti-autoadjuntas e de traço zero. Para o estudo do grupo SU(3) no contexto da f́ısica das part́ıculas elementares é conveniente introduzir-se uma base expĺıcita nesse espaço. Como toda matriz anti-autoadjunta pode ser escrita como iλ, onde λ é autoadjunta, basta-nos procurar uma base no espaço das matrizes autoadjuntas de traço zero. Comummente adota-se as chamadas Matrizes de Gell-Mann16 λi, i = 1, . . . , 8, que são as seguintes matrizes: λ1 =         0 1 0 1 0 0 0 0 0         , λ2 =         0 −i 0 i 0 0 0 0 0         , λ3 =         1 0 0 0 −1 0 0 0 0         , λ4 =         0 0 1 0 0 0 1 0 0         , λ5 =         0 0 −i 0 0 0 i 0 0         , λ6 =         0 0 0 0 0 1 0 1 0         , λ7 =         0 0 0 0 0 −i 0 i 0         , λ8 = 1√ 3         1 0 0 0 1 0 0 0 −2         . 16Murray Gell-Mann (1929–). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 903/1730 2. Se n é ı́mpar, o conjunto de autovalores de R é do tipo {1} ∪ {e±iθk , k = 1, . . . , (n− 1)/2, sendo θk ∈ R}. Em ambos os casos −1 pode ser autovalor e, se o for, o é com multiplicidade algébrica par. Seja o autovalor eiθk . Há dois casos a considerar. Caso I. eiθk 6= ±1, de modo que eiθk é não-real e, portanto, distinto de e−iθk . Seja vk ∈ Cn um autovetor de R com autovalor eiθk : Rvk = eiθkvk, normalizado de modo que ‖vk‖2 C = 〈vk, vk〉 C = 1. Segue que Rvk = e−iθkvk, ou seja, vk é um autovetor de R com autovalor e−iθk . ComoR é unitária, segue que autovetores que correspondem a autovalores distintos são ortogonais (em Cn). Logo, 〈vk, vk〉 C = 0 e, portanto, 〈vk, vk〉 R = 〈vk, vk〉 C = 0 . (18.56) Escrevamos vk separando componente a componente suas partes real e imaginária: vk = ak + ibk, com ak, bk ∈ Rn. As relações Rvk = eiθkvk e Rvk = e−iθkvk tornam-se Rak = (cos θk)a k − ( sen θk)bk, Rbk = ( sen θk)a k + (cos θk)b k. Note-se que, como sen θk 6= 0, essas duas relações implicam que não se pode ter ak = 0, pois isso implicaria bk = 0 e vice-versa. Porém, ak e bk são vetores ortogonais em Rn. De fato, 〈ak, bk〉 R = 1 4 〈(vk + vk), (vk − vk)〉 R = 1 4 ( 〈vk, vk〉 R − 〈vk, vk〉 R + 〈vk, vk〉 R − 〈vk, vk〉 R ) = 1 4 ( 〈vk, vk〉 C − 〈vk, vk〉 C + 〈vk, vk〉 C − 〈vk, vk〉 C ) por (18.56) = 1 4 (0− 1 + 1− 0) = 0 . Assim, conclúımos que no subespaço real gerado pelos vetores ortogonais não-nulos ak e bk, a matriz R age como a matriz     cos θk sen θk − sen θk cos θk     , elemento de SO(2). É importante notar também que os vetores ak e bk são também ortogonais entre si para k’s diferentes. Isso é mostrado na proposição seguinte. Proposição 18.13 Se vj = aj + ibj e vk = ak + ibk são vetores de Cn com aj , ak, bj , bk ∈ Rn e se valerem 〈vj , vk〉 C = 0 e 〈vj , vk〉 C = 0, então tem-se 〈aj , ak〉 R = 〈aj , bk〉 R = 〈bj , ak〉 R = 〈bj , bk〉 R = 0. 2 Prova. De 〈vj , vk〉 C = 0 segue facilmente que 〈aj , ak〉 R + 〈bj , bk〉 R = 0 e 〈bj , ak〉 R − 〈aj , bk〉 R = 0. Como vj = aj − ibj, tem-se de 〈vj , vk〉 C = 0 que 〈aj , ak〉 R − 〈bj , bk〉 R = 0 e 〈bj , ak〉 R + 〈aj , bk〉 R = 0. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 904/1730 Disso, o resultado desejado segue imediatamente. O fato demonstrado nessa proposição mostra que os subespaços gerados por pares aj , bj são ortogonais em Rn. Na base formada por esses vetores, R tem a forma de blocos diagonais     cos θj sen θj − sen θj cos θj     . Resta-nos ainda discutir o que se passa com os autovalores reais. Caso II. eiθk = ±1. Como comentamos, o autovalor −1 tem multiplicidade algébrica par em Cn. Como R é unitária em Cn, R é simples (vide definição à página 250), conclúımos que a multiplicidade geométrica desse autovalor em Cn é igualmente par. Os autovalores reais de R correspondem a autovetores reais (por que?). Assim, há um subespaço real de dimensão par onde R age como −1. Como a dimensão é par, podemos escrever R nesse subespaço como uma série de blocos diagonais como    cos θj sen θj − sen θj cos θj     , mas para θj = π. Para o autovalor +1 a conclusão é a mesma, exceto que se n for ı́mpar a multiplicidade geométrica é ı́mpar. Assim, R age nesse subespaço como uma série de blocos diagonais como     cos θj sen θj − sen θj cos θj     , mas para θj = 0 e um bloco 1× 1 com elemento de matriz 1. A conclusão é a seguinte: para R ∈ SO(n) existe uma matriz ortogonal17 V tal que R = V BV −1, onde B é a seguinte matriz: quando n é par, ou seja, n = 2m, para algum m > 0 inteiro, B é a matriz bloco-diagonal dada por B =                                        cos θ1 sen θ1 − sen θ1 cos θ1 0 · · · 0 0 cos θ2 sen θ2 − sen θ2 cos θ2 0 ... . . . 0 0 cos θm sen θm − sen θm cos θm                                        , (18.57) que é formada por m = n/2 blocos 2× 2, como indicado acima, sendo os demais elementos de matriz nulos. Quando n é 17A matriz é ortogonal pois faz a mudança de base para a base dos vetores aj , bj e dos autovetores de autovalor ±1, os quais são todos ortogonais entre si, como provamos acima. Um fato crucial, como se vê. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 905/1730 ı́mpar, ou seja, n = 2m+ 1, para algum m > 0 inteiro, B é a matriz bloco-diagonal dada por B =                                                cos θ1 sen θ1 − sen θ1 cos θ1 0 · · · 0 0 0 cos θ2 sen θ2 − sen θ2 cos θ2 0 0 ... . . . ... 0 0 cos θm sen θm − sen θm cos θm 0 0 0 · · · 0 1                                                , (18.58) que é formada por m = (n − 1)/2 blocos 2 × 2, como indicado acima, sendo o elemento Bnn igual a 1, e os demais elementos de são matriz nulos. Definamos agora (tanto para o caso em que n é par ou ı́mpar) Jk := ∂ ∂θk R ∣ ∣ ∣ ∣ θ1=···=θm=0 . É claro que cada Jk é a matriz anti-simétrica composta pelo bloco 0 1 −1 0 colocado na k-ésima posição, os demais elementos de matriz sendo iguais a zero. Deve ser também claro que JkJl = JlJk para todos k, l = 1, . . . , m e que B = exp (θ1J1 + · · ·+ θmJm) . E. 18.51 Exerćıcio. Complete os detalhes. 6 Do comentado acima, temos então que R = V BV −1 = exp (A) , onde A := V (θ1J1 + · · ·+ θmJm)V −1. Agora, como V é ortogonal e as Jk são anti-simétricas, é elementar verificar que A T = −A. Isso completa a prova da Proposição 18.12. A Proposição 18.12 diz-nos que a exponenciação é uma aplicação sobrejetora de so(n) em SO(n). Isso é um caso particular de um teorema mais geral que diz que isso é válido para qualquer grupo de Lie compacto, conexo e cuja álgebra de Lie seja de dimensão finita. A Proposição 18.12 tem os dois seguintes corolários simples: JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 908/1730 sendo que J1, J2 e J3 são os geradores de SO(3), definidos em (18.29)-(18.31), página 887. Usando a forma das matrizes Jk dada em (18.29)-(18.31), é fácil constatar as seguintes relações de comutação entre os geradores acima: [ja, jb] = 3∑ c=1 εabc jc , [pa, pb] = 0 , [ja, pb] = 3∑ c=1 εabc pc . (18.59) E. 18.59 Exerćıcio. Verifique! 6 As relações (18.59) representam as relações de comutação da álgebra de Lie e3 do grupo E3. Note que p1, p2 e p3 formam uma sub-álgebra Abeliana de e3 e que essa sub-álgebra é um ideal de e3. Esse fato reflete a propriedade que o subgrupo de translações é um subgrupo normal de E3. • Os geradores do grupo Euclidiano E2 De maneira análoga podemos tratar o caso (mais simples) do grupo E2. Os elementos de SO(2)sR 2 podem ser parametrizados na forma         cos θ − sen θ x1 sen θ cos θ x2 0 0 1         , θ ∈ (−π, π], x1, x2 ∈ R. Seus geradores serão j1 :=         0 −1 0 1 0 0 0 0 0         , p1 :=         0 0 1 0 0 0 0 0 0         , p2 :=         0 0 0 0 0 1 0 0 0         . Como é fácil de verificar, as relações de comutação entre esses geradores são [j1, p1] = p2, [j1, p2] = −p1, [p1, p2] = 0. Um elemento genérico dessa álgebra de Lie é da forma I(J, t) :=                J t 0 0 0                , onde J =     0 −θ θ 0     e t =     t1 t2     , com −π < θ ≤ π e t1, t2 ∈ R. É um exerćıcio fácil (faça-o) constatar que para todo k ∈ N, tem-se I(J, t)k = I ( Jk, Jk−1t ) . JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 909/1730 Conseqüentemente, vale que exp (I(J, t)) = 1 + ∞∑ k=1 1 k! I(J, t)k = 1 + ∞∑ k=1 1 k! I ( Jk, Jk−1t ) =                R t′ 0 0 1                , onde R := eJ =     cos θ − sen θ sen θ cos θ     e t′ = f(J)t , sendo f a função anaĺıtica inteira definida pela série de Taylor f(w) := 1 + ∞∑ k=2 1 k! wk−1, w ∈ C . (18.60) É fácil constatar que f(w) =    ew − 1 w , w 6= 0 , 1, w = 0 . A matriz f(J) pode ser calculada facilmente usando-se o fato que, para M = ( 0 −1 1 0 ) , valem M2k = (−1)k1 e M2k+1 = (−1)kM , k ∈ N0, de onde se extrai f(J) := 1+ ∞∑ k=2 1 k! Jk−1 = 1 + ∞∑ m=1 1 (2m)! J2m−1 + ∞∑ m=1 1 (2m+ 1)! J2m = ∞∑ m=1 (−1)mθ2m−1 (2m)! M + ∞∑ m=0 (−1)mθ2m (2m+ 1)! 1 = cos θ − 1 θ M + sen θ θ 1 =         sen θ θ −cos θ − 1 θ cos θ − 1 θ sen θ θ         . (18.61) Notemos que det f(J) = 2 ( 1−cos θ θ2 ) 6= 0 para −π < θ ≤ π. Assim, f(J) é inverśıvel e se escolhermos t = f(J)−1x, para qualquer x = ( x1x2 ) ∈ R2, teremos exp ( I(J, f(J)−1x) ) =                R x 0 0 1                =         cos θ − sen θ x1 sen θ cos θ x2 0 0 1         . JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 910/1730 Isso prova que todo elemento do grupo SO(2)sR2 pode ser escrito como exponencial de um elemento da sua própria álgebra de Lie. Essa afirmação é igualmente válida para todo os grupos SO(n)sRn. A demonstração segue passos análogos aos de acima pois, como observamos na Seção 18.4.3, página 901, os elementos de SO(n) podem ser escritos em uma base conveniente na forma de blocos de matrizes de SO(2). Isso implicará que também no caso geral a matriz f(J) é inverśıvel. Deixamos os detalhes da demonstração como exerćıcio ao leitor. 18.6 O Grupo de Lorentz Para a leitura desta seção uma certa familiaridade com os rudimentos da teoria da relatividade restrita é recomendável, mas não totalmente indispensável. 18.6.1 O Espaço-Tempo, a Noção de Intervalo e a Estrutura Causal É um fato elementar da natureza ser posśıvel descrever qualquer evento idealmente pontual e de duração instantânea por uma coleção de quatro números que especificam sua posição espacial e seu instante de tempo, medidos em algum sistema de referência. A coleção de todos os eventos pontuais de duração instantânea, é denominada espaço-tempo, noção introduzida por Minkowski20. Assim, é natural (pelo menos na ausência de campos gravitacionais, que podem alterar a topologia global do espaço-tempo) identificar o mesmo com o espaço matemático R4. Assim descrito, cada evento pode ser especificado em um sistema de referência que adote coordenadas espaciais Cartesianas, por uma quádrupla ordenada (x1, x2, x3, x4), onde convencionamos que os três primeiros números são coordenadas espaciais do evento e o último sua coordenada temporal. O leitor deve ser advertido que muitos autores convencionam escrever as coordenadas espaço-temporais de um evento na forma (x0, x1, x2, x3), onde x0 é a coordenada temporal. Isso alteraria a forma das matrizes que serão manuseadas abaixo, mas não a essência dos resultados que apresentaremos. Na Mecânica Clássica, a primeira lei de Newton21 afirma existirem certos sistemas de referência dotados da seguinte propriedade: se um corpo encontra-se isolado do restante do universo, ou seja, se sobre ele não atuam forças externas, então em relação a esse sistema de referência esse corpo se move com velocidade constante. Tais sistemas de referência são denominados sistemas de referência inerciais, pois neles vale o prinćıpio de inércia. É muito fácil concluir que se um sistema de referência se move com velocidade constante em relação a um sistema de referência inercial, então ele é também um sistema de referência inercial. Sistemas de referência inerciais desempenham um papel central pois neles as Leis da F́ısica assumem um caracter universal. É um postulado fundamental da F́ısica que suas leis básicas são as mesmas em todos os sistemas de referência inerciais. Na mesma linha, é um postulado fundamental da F́ısica que também suas constantes fundamentais, tais como a velocidade da luz c, a constante de Planck22 ~, a constante de gravitação universal G e outras tenham também o mesmo valor em todos os sistemas de referência inerciais. Mais que isso, os sistemas de referência inerciais concordam quanto às relações de causa e efeito entre todos os eventos ocorridos no espaço-tempo. Essa série de prinćıpios aqui mal-delineados é por vezes denominada prinćıpio da relatividade. O prinćıpio da relatividade tem sua origem nos trabalhos de Galilei23 sobre a dinâmica, mas foi com a Teoria da Relatividade de Einstein24 que suas reais conseqüências foram exploradas em sua máxima extensão. Ao realizarmos transformações entre sistemas de coordenadas inerciais, as coordenadas dos eventos transformam- se linearmente. Esse postulado é familiar se nos lembramos da ação do grupo de translações, da ação do grupo de rotações no espaço tridimensional ou das transformações de Galilei da Mecânica Clássica (não-relativista). Assim, cada transformação entre sistemas de coordenadas inerciais deve ser representada na forma Lx+ t, onde L é uma matriz real 4× 4 e x e t são vetores de R4. Aqui, x e t são representados na forma de um vetor coluna, como x = ( x1 x2 x3 x4 ) . O vetor t representa uma translação (tanto no espaço quanto no tempo) entre os sistemas de coordenadas. Cada matriz L ∈ Mat (R, 4) deve depender das velocidades relativas entre os sistemas inerciais cuja transformação descreve, da direção dessas velocidades e dos ângulos relativos entre os eixos Cartesianos espaciais dos dois sistemas. L deve 20Hermann Minkowski (1864–1909). A expressão “espaço-tempo” provem do alemão “Raumzeit”. 21Isaac Newton (1643–1727). 22Max Karl Ernst Ludwig Planck (1858–1947). 23Galileu Galilei (1564–1642). 24Albert Einstein (1879–1955). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 913/1730 É uma crença da F́ısica atual que essas relações de causalidade devem ser as mesmas para todos os sistemas de referência inerciais, pois os mesmos descrevem as mesmas leis f́ısicas e devem perceber as mesmas relações de causa e efeito entre os eventos que compõem o universo. E. 18.61 Exerćıcio. Mais alguns dias de meditação. 6 Com isso, podemos introduzir a seguinte definição: dizemos que uma transformação linear L, que representa uma transformação entre dois sistemas de referência, preserva a estrutura causal do espaço-tempo se a mesma satisfizer todas as três condições seguintes: 1. I(Lx, Ly) = 0 sempre que I(x, y) = 0, 2. I(Lx, Ly) < 0 sempre que I(x, y) < 0, 3. I(Lx, Ly) > 0 sempre que I(x, y) > 0. Em palavras, L preserva o tipo de intervalo que separa todos os eventos do espaço-tempo, levando todos os intervalos do tipo luz em intervalos do tipo luz, levando todos os intervalos do tipo tempo em intervalos do tipo tempo e levando todos os intervalos do tipo espaço em intervalos do tipo espaço. Notemos que a condição que impõe que I(Lx, Ly) = 0 sempre que I(x, y) = 0 é a condição da invariância da velocidade da luz (já mencionada acima), mas as demais representam algo diferente: a invariância das relações de causalidade por mudança de sistemas de referência inerciais. Um pouco mais abaixo exploraremos as conseqüências matemáticas que essas imposições têm sobre as transformações L e concluiremos que, sob as hipóteses acima (e sob uma hipótese adicional de ausência de dilatações), vale uma con- seqüência mais forte, a saber, que I(Lx, Ly) = I(x, y) para todos os eventos x e y. Assim, transformações que preservam a estrutura causal e não envolvem dilatações preservam o valor do intervalo entre dois eventos quaisquer do espaço-tempo. Por fim, apenas a t́ıtulo de ilustração, exemplifiquemos como seria uma transformação que preserva os intervalos de tipo luz mas não os demais, preservando, portanto, a velocidade da luz mas violando a estrutura causal. Consideremos um espaço-tempo bidimensional, onde cada evento é descrito por uma coordenada espacial x1 e uma temporal t. Seja a matriz L = ( 0 c c−1 0 ) . O intervalo entre os eventos x = ( x1 t ) e 0 = ( 0 0 ) seria I(x, 0) = x21 − c2t2. Porém, pela transformação L teŕıamos ( x′1 t′ ) = L ( x1 t ) = ( ct c−1x1 ) . Assim, I(Lx, L0) = (x′1) 2 − c2(t′)2 = c2t2 − x21 = − I(x, 0). Logo, como os intervalos I(Lx, L0) e I(x, 0) diferem por um sinal, teŕıamos para quaisquer eventos x e y 1. I(Lx, Ly) = 0 sempre que I(x, y) = 0, 2. I(Lx, Ly) < 0 sempre que I(x, y) > 0, 3. I(Lx, Ly) > 0 sempre que I(x, y) < 0. Portanto, intervalos tipo luz seriam levados em intervalos tipo luz, mas intervalos tipo espaço seriam levados em intervalos tipo tempo e vice-versa. Como se vê por esse exemplo, em transformações que violam a estrutura causal deve haver algo como uma permutação entre coordenadas espaciais e temporais. E. 18.62 Exerćıcio. São tais transformações fisicamente aceitáveis? 6 • Dilatações Vamos agora discutir uma classe de transformações que preservam a estrutura causal: as dilatações. Para λ ∈ R, λ 6= 0, a matriz D(λ) := λ1 simplesmente transforma cada x ∈ R4 em λx, ou seja, D(λ) representa uma dilatação ou mudança de escala das coordenadas espaço-temporais de eventos. É evidente que I(D(λ)x, D(λ)y) = λ2I(x, y), de modo que dilatações são transformações lineares que preservam a estrutura causal. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 914/1730 São as dilatações aceitáveis enquanto mudanças de sistemas de referência inerciais? Essa é uma questão muito interessante e sutil e demanda uma certa discussão. Claramente, mudanças de escala podem ocorrer naturalmente no caso de tratarmos de dois sistemas de referência que adotam sistemas métricos diferentes, como no caso em que um sistema mede distâncias em metros e um outro em jardas (mas de modo que as medidas de tempo em um e outro sejam tais que ambos atribuem o mesmo valor numérico para c). Essas situações são triviais e poderiam ser contornadas se ambos os sistemas de referência concordassem no uso de uma mesma escala de distâncias. Mas para que isso seja posśıvel é preciso que haja objetos f́ısicos, em repouso em ambos os sistemas de referência, que possuam as mesmas dimensões. Podeŕıamos, por exemplo, adotar como unidade de distância o “tamanho médio” do átomo de Hidrogênio28, ou o comprimento de onda de uma linha de emissão de um certo átomo ou molécula, fixos em cada sistema de referência. Mas o que garante que o tamanho médio de um átomo de hidrogênio parado na Terra é o mesmo que o de um átomo de hidrogênio parado em uma galáxia distante que se move em relação a nós com uma certa velocidade? A prinćıpio, nada garante, mas a crença que sistemas de referência inerciais descrevem a mesma f́ısica envolve também a crença que certas escalas básicas de distância e de tempo, como o tamanho médio de um átomo em repouso, são as mesmas em todos os sistemas de referência inerciais. Por exemplo, o tamanho médio do átomo de hidrogênio em repouso depende de propriedades f́ısicas que regem a interação entre o próton e o elétron que o constituem (a lei de Coulomb29), das leis da Mecânica que regem seus movimentos (as leis da Mecânica Quântica), assim como dos valores das cargas elétricas e das massas de repouso dessas part́ıculas. Essas grandezas e leis devem ser as mesmas em quaisquer sistemas de referência inerciais. Intimamente associada a isso está a questão dos valores das massas de repouso das part́ıculas elementares. Isso se deve ao fato seguinte. A F́ısica Quântica ensina-nos que se m0 é a massa de repouso de uma part́ıcula elementar, digamos um elétron, então a quantidade ~/(m0c) tem dimensão de comprimento (verifique!). Esse é o chamado comprimento de onda Compton30 da part́ıcula de massa de repouso m0. Assim, para qualquer part́ıcula de massa de repouso m0 há uma escala de distância a ela associada. É parte da crença associada ao prinćıpio da relatividade que as massas em repouso das part́ıculas elementares, como elétrons, quarks etc., são as mesmas quer na Terra quer em uma galáxia distante que se move em relação a nós com velocidade constante. Até onde se sabe, essa hipótese tem corroboração experimental, pois sua violação levaria a conseqüências observacionais em relação ao comportamento da matéria que nunca foram verificadas quer em observações astronômicas quer em experimentos com aceleradores de part́ıculas feitos na Terra. Como ~ e c são constantes f́ısicas, devem também ser as mesmas em quaisquer sistemas de referência inerciais e, portanto, o comprimento de onda Compton de, digamos, um elétron em repouso deve ser o mesmo em qualquer sistema de referência inercial e com ele podeŕıamos estabelecer uma escala de distâncias universal. Em um universo em que não houvessem escalas de distância ou de massa naturais, como por exemplo no caso de universos em que todas as part́ıculas elementares têm massa nula e não formam estados ligados (como átomos) que possuam alguma escala de distância t́ıpica, não haveria maneira de sistemas de referência inerciais concordarem com escalas espaciais e temporais e, áı, a inclusão de dilatações seria inevitável nas transformações entre sistemas de referência. Esse não é o caso do universo em que vivemos, pois nele sabidamente habitam part́ıculas massivas. Assim, apesar de as dilatações satisfazerem a condição de não violarem a estrutura causal do espaço-tempo, as mesmas não devem ser consideradas como transformações leǵıtimas de coordenadas espaço-temporais entre sistemas de referência inerciais no nosso universo, pois partimos da crença que esses sistemas podem sempre concordar quanto a certas escalas básicas de certos objetos f́ısicos em repouso, tais como as massas de repouso de certas part́ıculas elementares e seus comprimentos de onda Compton. E. 18.63 Exerćıcio. Mais meditação. 6 • A convenção que c = 1 Daqui por diante adotaremos a convenção simplificadora que c = 1. Isso pode ser obtido pela escolha de um sistema de unidades métricas conveniente. Essa convenção, muito empregada atualmente em textos de f́ısica teórica31, tem a 28A noção de “tamanho médio” de um átomo pode ser definida na Mecânica Quântica, mas não entraremos em detalhes aqui. 29Charles Augustin de Coulomb (1736–1806). 30Arthur Holly Compton (1892–1962). Compton recebeu o prêmio Nobel de F́ısica de 1927 “for his discovery of the effect named after him”. 31Em textos teóricos de Mecânica Quântica e Teoria Quântica de Campos, adota-se também ~ = 1. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 915/1730 vantagem de “limpar” as expressões matemáticas de fatores que dependam de c. Admitidamente, há uma certa “preguiça” na adoção dessa convenção, mas a mesma traz vantagens. De qualquer forma, os fatores c omitidos podem ser facilmente recuperados por considerações de análise dimensional. • Notação matricial. A métrica de Minkowski É muito conveniente escrever o intervalo entre dois eventos x e y com uso da seguinte notação matricial: I(x− y) = (x1 − y1)2 + (x2 − y2)2 + (x3 − y3)2 − (x4 − y4)2 = 〈(x− y), η(x− y)〉R , onde η := η(3, 1) =             1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 −1             =                1 00 0 0 0 0 −1                . (18.62) E. 18.64 Exerćıcio. Verifique. 6 A matriz η é freqüentemente denominada métrica de Minkowski. 18.6.2 A Invariância do Intervalo No que vimos acima, aprendemos que o postulado da invariância da velocidade de propagação da luz quando de uma transformação entre sistemas de referência inerciais implica que se x e y são dois eventos tais que I(x, y) = 〈(x− y), η(x− y)〉 R = 0 , (18.63) então tem-se também I(Lx, Ly) = 〈L(x− y), ηL(x− y)〉 R = 0 (18.64) para qualquer transformação linear L ∈Mat (R, 4) que represente uma mudança entre sistemas de referência inerciais. Nesta seção iremos provar uma afirmação, o Teorema 18.7, adiante, que generaliza ainda mais o descrito no último parágrafo, a saber, provaremos que se L ∈ Mat (R, 4) representa uma mudança entre sistemas de referência inerciais que preserva a estrutura causal e não envolve dilatações (definições adiante) então I(x, y) = I(Lx, Ly) para quaisquer eventos x e y, mesmo aqueles para os quais I(x, y) 6= 0. Esse fato releva a importância da noção de intervalo na teoria da relatividade: o mesmo representa uma grandeza invariante por transformações de sistemas de referência do tipo descrito acima. Dessa propriedade de invariância extrairemos todas as informações importantes sobre as transformações de Lorentz. • Transformações lineares e a estrutura causal Vamos aqui provar um teorema de importância central no entendimento da relação entre transformações L ∈ Mat (R, 4) e sua relação com a estrutura causal do espaço-tempo. Teorema 18.7 Seja L um elemento de Mat (R, 4) que representa uma mudança entre sistemas de referência inerciais que preserva os intervalos de tipo luz. Então, ηLT ηL = − ( LT ηL ) 44 1 = ±| det(L)|1/21 . (18.65) Se além disso L preserva a estrutura causal, então, ηLT ηL = − ( LTηL ) 44 1 = | det(L)|1/21 . (18.66) JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 918/1730 Essa última expressão naturalmente conduz ao seguinte. Seja P := L × R4 o conjunto de todos os pares ordenados (L, t) com L ∈ L e t ∈ R4. Então P é um grupo com o produto definido por (L′, t′) · (L, t) := (L′L, L′t+ t′). Como se vê, esse produto faz de P o produto semi-direto LsR4. O produto semi-direto de grupos foi definido na Seção 2.2.5.2, página 106. E. 18.65 Exerćıcio. Verifique que o produto acima é de fato associativo. Identifique o elemento neutro e determine a inversa de cada par (L, t) ∈ P. 6 Esse grupo, que combina transformações de Lorentz e translações, é denominado grupo de Poincaré34 em homenagem ao eminente matemático francês que também foi um dos pioneiros da teoria da relatividade35. O grupo de Poincaré é o grupo mais geral de transformações afins do espaço-tempo que mantêm os intervalos invariantes. Mais adiante (página 929) vamos retornar ao grupo de Poincaré para analisar sua estrutura enquanto grupo de Lie. Antes, porém, precisamos nos concentrar plenamente no grupo de Lorentz. 18.6.4 Alguns Subgrupos do Grupo de Lorentz Antes de e com o propósito de estudarmos a estrutura do grupo de Lorentz, vamos identificar alguns de seus subgrupos mais importantes. • Troca de paridade e reversão temporal As seguintes matrizes são elementos do grupo de Lorentz P1 :=             −1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1             , P2 :=             1 0 0 0 0 −1 0 0 0 0 1 0 0 0 0 1             , P3 :=             1 0 0 0 0 1 0 0 0 0 −1 0 0 0 0 1             , (18.73) e P :=             −1 0 0 0 0 −1 0 0 0 0 −1 0 0 0 0 1             , T :=             1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 −1             . (18.74) E. 18.66 Exerćıcio importante. Verifique que as cinco matrizes acima são membros do grupo de Lorentz, ou seja, satisfazem LηLTη = 1. 6 As matrizes P , P1, P2 e P3 implementam trocas de paridade, ou seja, reversão da orientação dos eixos de coordenadas espaciais de pontos de R4. A matriz T implementa uma reversão temporal, ou seja, inversão da coordenada temporal de pontos de R4. 34Jules Henri Poincaré (1854–1912). 35Vários historiadores da ciência apontaram para o fato que Poincaré, assim como Lorentz, antecedeu Einstein em alguns aspectos. Poincaré foi o primeiro (em 1905, o ano da publicação do trabalho seminal de Einstein, mas independente deste) a estudar o caráter de grupo das transformações de Lorentz, tendo provado que toda transformação de Lorentz é combinação de rotações com um “boost”, fato que estabeleceremos no Teorema 18.8, mais adiante. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 919/1730 É bastante evidente que (T )2 = (P )2 = (P1) 2 = (P2) 2 = (P3) 2 = 1 e que P = P1P2P3. As matrizes T, P1, P2, P3 geram um subgrupo do grupo de Lorentz que implementa reversões temporais e de paridade. • Os subgrupos Rot e SRot Se R é uma matriz 4× 4 da forma R :=                r0 0 0 0 0 0 0 1                , onde r0 é uma matriz 3× 3 pertencente a O(3), então é fácil verificar que R é um elemento do grupo de Lorentz, ou seja, satisfaz RηRT η = 1. E. 18.67 Exerćıcio. Verifique isso, usando os fatos que r0r T 0 = 1 e que RT :=                (r0) T 0 0 0 0 0 0 1                = R−1. 6 É fácil constatar que o conjunto das matrizes da forma de R acima forma um subgrupo do grupo de Lorentz. Esse subgrupo será designado aqui36 por Rot. E. 18.68 Exerćıcio. Mostre que Rot é isomorfo ao grupo O(3): Rot ≃ O(3). 6 Se R é da forma acima, é evidente também que det(R) = det(r0). Logo, Rot tem um subgrupo SRot de matrizes R com det(R) = 1 da forma R :=                r0 0 0 0 0 0 0 1                , onde r0 é uma matriz 3× 3 pertencente a SO(3). E. 18.69 Exerćıcio. Mostre que SRot é isomorfo ao grupo SO(3): SRot ≃ SO(3). 6 E. 18.70 Exerćıcio. Mostre que se R ∈ Rot mas R 6∈ SRot então existe matriz R′ ∈ SRot com R = PR′. 6 36Essa notação não é uniforme na literatura. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 920/1730 E. 18.71 Exerćıcio. Mostre que se R ∈ Rot mas R 6∈ SRot então existe matriz R′′ ∈ SRot com R = P1R′′. 6 As matrizes de SRot implementam rotações puras (sem troca de paridade) nas coordenadas espaciais de R4. • Os “boosts” de Lorentz Um conjunto muito importante de matrizes de Lorentz é formado pelos chamados “boosts”37 de Lorentz na direção 1. Tais matrizes são da forma B1(v) :=             γ(v) 0 0 −vγ(v) 0 1 0 0 0 0 1 0 −vγ(v) 0 0 γ(v)             , (18.75) onde γ(v) := 1√ 1− v2 e v ∈ (−1, 1). E. 18.72 Exerćıcio muito importante. Verifique que as matrizes B1(v) acima são membros do grupo de Lorentz, ou seja, satisfazem B1(v)ηB1(v) T η = 1 para todo v ∈ (−1, 1). 6 Outro fato de grande importância é o seguinte: o conjunto de todas as matrizes B1(v) com v ∈ (−1, 1) forma um subgrupo do grupo de Lorentz, denominado subgrupo dos boosts de Lorentz (na direção 1) e que designaremos aqui por B1. Isso decorre do seguinte: 1. Para v = 0 B1(0) = 1. 2. Para todo v ∈ (−1, 1) B1(v) −1 = B1(−v). 3. Para todos v, v′ ∈ (−1, 1) B1(v ′)B1(v) = B1 ( v′ + v 1 + v′v ) . (18.76) E. 18.73 Exerćıcio muito importante. Verifique essas três afirmações. 6 Observe-se que o item 3, acima, está intimamente associado à regra relativista de composição de velocidades. Segue também de (18.76) que B1 é um subgrupo Abeliano: B1(v ′)B1(v) = B1(v)B1(v ′) para todos v′, v ∈ (−1, 1). E. 18.74 Exerćıcio. Mostre que det(B1(v)) = 1 para todo v ∈ (−1, 1) e, portanto, B1 ⊂ SO(3, 1). 6 Analogamente aos boosts de Lorentz na direção 1, há os boosts de Lorentz nas direções 2 e 3, representados por 37Do inglês to boost: impulsionar, propelir, impelir, empurrar. Esse vocábulo é geralmente usado em F́ısica para denominar transformações entre sistemas de coordenadas inerciais que envolvam apenas mudanças de velocidades. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 923/1730 explicitamente, tem-se L−1 =                1 00 0 0 0 0 −1                               lT b aT L44                               1 00 0 0 0 0 −1                =                lT −b −aT L44                , o que leva à constatação que (L−1)44 = L44. Proposição 18.16 Se L e L′ são dois elementos quaisquer do grupo de Lorentz O(3, 1) então tem-se que sinal((LL′)44) = sinal(L44)sinal(L ′ 44). 2 Prova. Sejam L e L′ duas transformações de Lorentz que, como em (18.A.1), representamos na forma de blocos L =                l a bT L44                , L′ =                l′ a′ b′ T L′44                , (18.83) Vamos formar o produto L′′ = LL′ e estudar o sinal do elemento L′′44 da matriz resultante. Pela regra de produto de matrizes teremos L′′44 = L44L ′ 44 + b Ta′. E. 18.77 Exerćıcio. Verifique. 6 O produto de matrizes bTa′ representa também o produto escalar b · a′ dos vetores b e a′ de R3 (por que?). Assim, L′′44 = L44L ′ 44 + b · a′. (18.84) Há dois casos a considerar: o caso em que sinal(L44) = sinal(L ′ 44) e o caso em que sinal(L44) 6= sinal(L′44). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 924/1730 1. Caso em que sinal(L44) = sinal(L ′ 44). Por (18.84) tem-se L′′44 ≥ L44L′44 − |b · a′|. Sabemos que b · a′ = ‖b‖ ‖a′‖ cos θ, onde ‖b‖ é o comprimento de b, ‖a′‖ é o comprimento de a′ e θ é o ângulo que esses dois vetores formam entre si. É óbvio, portanto, que |b · a′| ≤ ‖b‖ ‖a′‖ (desigualdade de Cauchy). Assim, L′′44 ≥ L44L′44 − ‖b‖ ‖a′‖. (18.85) Pela Proposição 18.21, ‖b‖ = |α| e ‖a′‖ = |α′|. Além disso, L44 = ± √ 1 + α2 e L′44 = ± √ 1 + α′2. Assim, por (18.85), L′′44 ≥ √ 1 + α2 √ 1 + α′2 − |α| |α′| > 0. Portanto, sinal(L′′44) = +1 = sinal(L44) sinal(L ′ 44), como queŕıamos provar. 2. Caso em que sinal(L44) 6= sinal(L′44). Por (18.84) tem-se L′′44 ≤ L44L′44 + |b · a′|. Sabemos que b · a′ = ‖b‖ ‖a′‖ cos θ, onde ‖b‖ é o comprimento de b, ‖a′‖ é o comprimento de a′ e θ é o ângulo que esses dois vetores formam entre si. É óbvio, portanto, que |b · a′| ≤ ‖b‖ ‖a′‖ (desigualdade de Cauchy). Assim, L′′44 ≤ L44L′44 + ‖b‖ ‖a′‖. (18.86) Pela Proposição 18.21, ‖b‖ = |α| e ‖a′‖ = |α′|. Além disso, L44 = ± √ 1 + α2 e L′44 = ∓ √ 1 + α′2 (pois sinal(L44) 6= sinal(L′44)). Assim, por (18.86), L′′44 ≤ − √ 1 + α2 √ 1 + α′2 + |α| |α′| < 0. Portanto, sinal(L′′44) = −1 = sinal(L44) sinal(L′44), como queŕıamos provar. • Os subgrupos próprio, ortócrono e restrito do grupo de Lorentz Os conjuntos de transformações de Lorentz que satisfazem as condições Ia, Ib, IIa ou IIb acima são obviamente conjuntos disjuntos. Não é dif́ıcil mostrar (mas não o faremos aqui) que cada um é um conjunto conexo. Portanto, o grupo de Lorentz L = O(3, 1) possui quatro componentes conexas. Seguindo a convenção, detonaremos essas quatro componentes da seguinte forma: 1. L↑+ := {L ∈ L| det(L) = +1 e sinal(L44) = +1}, 2. L↑− := {L ∈ L| det(L) = −1 e sinal(L44) = +1}, 3. L↓+ := {L ∈ L| det(L) = +1 e sinal(L44) = −1}, 4. L↓− := {L ∈ L| det(L) = −1 e sinal(L44) = −1}. Note-se também que apenas L↑+ contém a identidade 1. L↑− contém a operação de troca de paridade P . L↓+ contém a operação de troca de paridade e inversão temporal PT . L↓− contém a operação de inversão temporal T . Os conjuntos L↑−, L ↓ + e L ↓ − não são subgrupos de L. Porém, pelas Proposições 18.15 e 18.16, é muito fácil constatar as seguintes afirmações: 1. L↑+ é um subgrupo de L, denominado grupo de Lorentz próprio ortócrono ou grupo de Lorentz restrito. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 925/1730 2. L↑ := L↑+ ∪ L↑− é um subgrupo de L, denominado grupo de Lorentz ortócrono. 3. L+ := L ↑ + ∪ L↓+ é um subgrupo de L, denominado grupo de Lorentz próprio. 4. L0 := L ↑ + ∪L↓− é um subgrupo de L, denominado grupo de Lorentz ortócoro. Note-se que os elementos de ambos os conjuntos L↑+ e L ↓ + satisfazem det(L) = 1. Portanto, o grupo de Lorentz próprio L+ := L ↑ + ∪ L↓+ coincide com SO(3, 1). Em L↑ não ocorrem reversões temporais38. Note também que SRot é um subgrupo de L↑+. • A relevância de L+, L↑ e L↑+ na F́ısica É uma crença da F́ısica atual que L↑+ representa uma simetria da natureza (na ausência de campos gravitacionais). Essa crença não se estende aos grupos L+ e L ↑. O problema com esses últimos grupos é que os mesmos envolvem operações de troca de paridade (representada pela matriz P ) ou de reversão temporal (representada pela matriz T ). É um fato bem estabelecido experimentalmente que nas chamadas interações fracas da f́ısica das part́ıculas elementares a troca de paridade (representada por matrizes como P ou P1) não é uma transformação de simetria da natureza. No contexto da Teoria Quântica de Campos é um fato teórico bem estabelecido que a chamada transformação CPT39 é uma transformação de simetria. Violações dessa simetria não foram empiricamente observadas na F́ısica das Part́ıculas Elementares. Por isso, a constatação que a simetria CP é violada, fenômeno observado em certos processos de decaimento de part́ıculas, indica fortemente que a reversão temporal também não seria uma simetria da natureza. Entretanto, evidências experimentais diretas de que a simetria de reversão temporal é violada não foram ainda encontradas, por serem de dif́ıcil constatação. Para mais informações a respeito de simetrias e suas violações na F́ısica das Part́ıculas Elementares, vide por exemplo [122] ou outros livros introdutórios sobre o assunto. • L↑+ é um subgrupo normal de L Vamos aqui provar a seguinte proposição sobre L↑+: Proposição 18.17 L↑+ é um subgrupo normal do grupo de Lorentz. 2 Prova. Tudo o que temos que fazer é provar que se L ∈ L↑+ e G ∈ L, então G−1LG ∈ L↑+. Isso equivale a provar que det(G−1LG) = 1 e que sinal((G−1LG)44) = 1. Como det(L) = 1, tem-se obviamente que det(G−1LG) = det(G−1) det(L) det(G) = det(G−1) det(G) = det(G−1G) = det(1) = 1. Analogamente, pela Proposição 18.16 vale sinal((G−1LG)44) = sinal((G −1L)44) sinal(G44) = sinal((G −1)44) sinal(L44) sinal(G44) = sinal((G−1)44) sinal(G44) = sinal(G44) 2 = 1, onde usamos a Proposição 18.15 na penúltima igualdade. Isso completa a prova. E. 18.78 Exerćıcio. Mostre que o grupo quociente L/L↑+ é isomorfo ao grupo gerado por P1 e T . 6 38Essa a razão da uso da flecha apontando para cima no śımbolo L↑, indicando que o tempo corre na mesma direção nos sistemas de referência inerciais transformados por L↑. 39A chamada transformação CPT envolve as operações sucessivas de troca de carga, ou part́ıcula-antipart́ıcula, (denotada por C), de paridade (denotada por P) e de reversão temporal (denotada por T). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 928/1730 radores, Ma e Jb, com a, b = 1, 2, 3, satisfazem as seguintes relações de comutação: [Ja, Jb] = 3∑ k=1 εabcJc , (18.89) [Ma, Mb] = − 3∑ k=1 εabcJc , (18.90) [Ja, Mb] = 3∑ k=1 εabcMc . (18.91) 6 É claro de (18.89)-(18.91) que os seis geradores Ma e Jb formam uma álgebra de Lie, a álgebra de Lie do grupo de Lorentz L↑+. Sabemos que não há mais geradores independentes pois, como provamos, todo elemento do grupo de Lorentz L↑+ é produto de boosts e rotações. De (18.90) percebemos o fato notável que os três geradores dos subgrupos de boost por si só não formam uma álgebra de Lie! Para tal, é preciso incluir os geradores dos subgrupos de rotação! Isso releva uma relação insuspeita, mas profunda, entre os boosts (que fisicamente representam transformações entre sistemas de referência inerciais com velocidades relativas não-nulas) e as rotações espaciais, pois indica que as rotações espaciais podem ser geradas a partir de boosts. Isso é uma caracteŕıstica especial da f́ısica relativista (vide a comparação com o grupo de Galilei, abaixo) e está relacionada a alguns fenômenos f́ısicos, como a chamada precessão de Thomas40, importante na discussão do chamado fator giromagnético do elétron. Vide qualquer bom livro sobre Mecânica Quântica Relativista (por ex. [164]). • Revisitando o Teorema 18.8 Como vimos no Teorema 18.8, página 922, toda L ∈ L↑+ é da forma L = RaB1(v)Rb, com Ra, Rb ∈ SRot. Escrevendo v = tanh θ, ficamos com L = RaB1(θ)Rb ou, usando o gerador M1, L = Ra exp(θM1)Rb. Isso, por sua vez pode ser reescrito como L = Ra exp(θM1)R T aR = exp(θRaM1R T a )R, onde R := RaRb ∈ SRot. Vamos agora escrever Ra na forma Ra = exp(J), onde J = ∑3 k=1 αkJk para certos αk’s reais. Pela expressão (7.38), página 341 (vide também a série completa em (7.37)), teremos RaM1R T a = exp(J)A exp(−J) = M1 + [J, M1] + 1 2! [J, [J, M1]] + 1 3! [J, [J, [J, M1]]] + · · · , sendo a série do lado direito convergente. O fato importante a notar é que, por (18.91), os comutadores múltiplos [J, · · · [J, M1]] são combinações lineares de M1, M2 e M3. A conclusão disso está expressa no seguinte teorema. Teorema 18.9 Toda L ∈ L↑+ é da forma L = exp(M) exp(J), onde J = ∑3 k=1 βkJk e M = ∑3 k=1 γkMk, sendo que os βk’s e γk’s são números reais. 2 A interpretação desse teorema é que toda transformação de Lorentz (de L↑+) pode ser obtida como uma rotação (definida por exp(J) ∈ SRot) seguida de um boost em uma certa direção (que é definida pelas componentes de M). Invertendo ordens na prova acima, o leitor se convence facilmente que todo L ∈ L↑+ também pode ser escrito como L = exp(J′) exp(M′), para outros J′ = ∑3 k=1 β ′ kJk e M ′ = ∑3 k=1 γ ′ kMk. Por fim, advertimos o estudante do fato que, por (18.90), o conjunto das matrizes da forma exp ( ∑3 k=1 a ′ kMk ) , ak ∈ R, não formam um subgrupo de L↑+. • O grupo de Galilei E. 18.82 Exerćıcio. Mostre que as transformações de Galilei41 da Mecânica Clássica podem ser representadas como um 40Llewellyn Hilleth Thomas (1903–1992). Thomas é também autor, junto com Fermi (Enrico Fermi, 1901–1954.), do chamado modelo de Thomas-Fermi, amplamente empregado na F́ısica Atômica. 41Galileu Galilei (1564–1642). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 929/1730 grupo de matrizes 4× 4, da forma G(r0, ~v) :=                r0 −v1 −v2 −v3 0 0 0 1                , onde r0 é uma matriz 3 × 3 pertencente a O(3) e vj ∈ (−∞, ∞). Mostre que tais matrizes formam um grupo de Lie, determinando também G(r0, ~v) −1 e a regra de produto G(r0, ~v)G(r ′ 0, ~v ′). 6 Determine seus três subgrupos de boost, seus três subgrupos de rotação e os seis geradores desses subgrupos. Em seguida calcule as relações de comutação desses seis geradores. Compare com o que ocorre com o grupo de Lorentz. E. 18.83 Exerćıcio. Constate que o grupo de Galilei é isomorfo ao grupo O(3)sR3. 6 18.7 O Grupo de Poincaré O chamado grupo de Poincaré (em 3+1 dimensões) é definido como sendo o grupo P := O(3, 1)sR4. Seus elementos são, portanto, pares ordenados (L, x) com L ∈ O(3, 1) e x ∈ R4, sendo o produto dado por (L, x) · (L′, x′) = (LL′, Lx′+x). Sua ação no espaço-tempo R4 é interpretada como uma transformação de Lorentz seguida de uma translação. Há um subgrupo de GL(R, 5) que é isomorfo a P. Sejam as matrizes reais 5× 5 P (L, x) :=                L x 0 1                , com L ∈ O(3, 1) e x ∈ R4 . Então, tem-se P (L, x)P (L′, x′) := P (LL′, Lx′ + x) . E. 18.84 Exerćıcio importante. Mostre isso. 6 Assim, o conjunto de matrizes { P (L, x) ∈ GL(R, 5), com L ∈ O(3, 1) e x ∈ R4 } forma um subgrupo de GL(R, 5) que é isomorfo a P. Também denotaremos esse grupo por P. E. 18.85 Exerćıcio. Prove essa última afirmativa. 6 O chamado grupo de Poincaré próprio ortócrono, denotado por P↑+ é o grupo P ↑ + := L ↑ +sR 4. • Os geradores do grupo de Poincaré De maneira totalmente análoga ao que fizemos no grupo Euclidiano, podemos determinar os geradores do grupo P↑+. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 930/1730 Este possui 10 geradores. Seis da forma mk :=                Mk 0 0 0                ou jk :=                Jk 0 0 0                com k = 1, 2, 3, onde Mk e Jk são as matrizes 4× 4 definidas em (18.87) e (18.88), respectivamente, e quatro da forma pk :=                0 xk 0 0                com k = 1, . . . , 4, onde x1 :=             1 0 0 0             , x2 :=             0 1 0 0             , x3 :=             0 0 1 0             , x4 :=             0 0 0 1             . As relações de comutação associadas ao grupo de Poincaré são: [ja, jb] = 3∑ k=1 εabc jc , (18.92) [ma, mb] = − 3∑ k=1 εabc jc , (18.93) [ja, mb] = 3∑ k=1 εabc mc , (18.94) [pa, pb] = 0, (18.95) [ja, pb] = (1 − δb4) 3∑ k=1 εabc pc , (18.96) [ma, pb] = − (δab p4 + δb4 pa) . (18.97) Aqui, os ı́ndices dos m’s e j’s variam de 1 a 3 e os ı́ndices dos p’s variam de 1 a 4. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 933/1730 para z ∈ R. Assim, f(M) é inverśıvel e se escolhermos t = f(M)−1x, para qualquer x =     x1 x2     ∈ R2 teremos exp ( I(M, f(M)−1x) ) =                L x 0 0 1                =         cosh z − senhz x1 − senhz cosh z x2 0 0 1         . Isso prova que todo elemento do grupo P↑+ em 1+1 dimensões pode ser escrito como exponencial de um elemento da sua própria álgebra de Lie. 18.8 SL(2, C) e o Grupo de Lorentz Nesta seção discutiremos com algum detalhe a relação entre SL(2, C) (introduzido na Seção 18.3.5, página 896) e o Grupo de Lorentz em 3+1 dimensões, relação esta de grande importância em F́ısica, especialmente no estudo da equação de Dirac42 para o elétron e na Teoria Quântica de Campos. • Automorfismos de SL(2, C) Com o propósito de preparar a discussão sobre a relação entre SL(2, C) e o Grupo de Lorentz, vamos em primeiro lugar discutir alguns automorfismos do grupo SL(2, C). Seja τ := −iσ2 =     0 −1 1 0     ∈ SL(2, C). Definimos ϕτ : SL(2, C)→ SL(2, C) por ϕτ (A) := τAτ −1. Então, ϕτ é um automorfismo de SL(2, C). De fato, vê-se trivialmente que ϕτ é bijetora e que ϕτ (AB) = ϕτ (A)ϕτ (B) para todos A, B ∈ SL(2, C) (prove isso!). Para uma matriz M ∈Mat (C, 2) denotamos por M a matriz obtida tomando-se o complexo conjugado dos elementos de matriz de M : ( M ) ij = Mij . Sabe-se que det(M) = det(M), portanto, se A ∈ SL(2, C) então A ∈ SL(2, C). Assim, seja ϕ1 : SL(2, C)→ SL(2, C) definida por ϕ1(A) := A. Então, ϕ1 é também um automorfismo de SL(2, C). De fato, vê-se trivialmente que ϕ1 é bijetora e que ϕ1(AB) = ϕ1(A)ϕ1(B) para todos A, B ∈ SL(2, C) (prove isso!). Note que ϕ1(ϕ1(A)) = A, ou seja, ϕ1 ◦ ϕ1 é a identidade. O grupo SL(2, C) possui um outro automorfismo de interesse. Se det(A) = 1 é fácil ver que igualmente tem-se det ( (A∗)−1 ) = 1. Definimos então ϕ2 : SL(2, C)→ SL(2, C) por ϕ2(A) := (A ∗)−1 = (A−1)∗. Novamente, é fácil ver que ϕ2 é bijetora e que e que ϕ2(AB) = ϕ2(A)ϕ2(B) para todos A, B ∈ SL(2, C) (prove isso!). 42Paul Adrien Maurice Dirac (1902–1984). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 934/1730 Há uma relação entre os automorfismos ϕτ , ϕ1 e ϕ2. Se A ∈ SL(2, C) é da forma A =     a b c d     , uma conta simples (faça!) mostra que (A∗)−1 =     d −c −b a     . Dáı, é fácil constatar que (A∗)−1 = τAτ−1 (faça essa constatação!). Conclúımos assim que ϕ2 = ϕτ ◦ ϕ1. Portanto, vale também que ϕ2 ◦ ϕ1 = ϕτ . (18.98) Todos esses fatos serão usados na Seção 18.8, onde discutiremos em detalhe a importante e surpreendente relação entre SL(2, C) e o Grupo de Lorentz. • SL(2, C) e o espaço de Minkowski Por Herm (C, 2) designamos o subespaço (real) de Mat (C, 2), formado por todas as matrizes complexas 2 × 2 e Hermitianas: Herm (C, 2) := {M ∈ Mat (C, 2)| M∗ = M}. É fácil ver que existe uma correspondência biuńıvoca entre Herm(C, 2) e R4 (e, portanto, entre Herm (C, 2) e o espaço-tempo de Minkowski43 quadridimensional). De fato, como1, σ1, σ2, σ3 formam uma base em Mat (C, 2), podemos escrever toda matriz M ∈ Herm(C, 2) na forma M = m41 +m1σ1 +m2σ2 +m3σ3, = m4 +m3 m1 − im2 m1 + im2 m4 −m3     , com m4, m1, m2, m3 ∈ C. Porém, como as matrizes de Pauli e 1 são auto-adjuntas, a condição de M ser Hermitiana, ou seja, M∗ = M , significa m41+m1σ1 +m2σ2 +m3σ3 = m41+m1σ1 +m2σ2 +m3σ3, ou seja, mk ∈ R, k = 1, . . . , 4. Logo, Herm (C, 2) =     m41+ 3∑ k=1 mkσk, =     m4 +m3 m1 − im2 m1 + im2 m4 −m3     com m1, m2, m3, m4 ∈ R     . (18.99) Antes de prosseguirmos, façamos algumas observações sobre a relação entre Herm (C, 2) e SL(2, C). Se A é uma matriz qualquer de Mat (C, 2) e M ∈ Herm (C, 2), é fácil constatar que AMA∗ também é um elemento de Herm (C, 2). De fato (AMA∗)∗ = AMA∗, provando que AMA∗ é Hermitiana. É claro que isso também vale para A ∈ SL(2, C). Nesse caso, porém, tem-se a seguinte proposição. Proposição 18.18 Se A ∈ SL(2, C) é tal que AMA∗ = M para toda M ∈ Herm (C, 2), então A = ±1. 2 Prova. Como AMA∗ = M para toda M ∈ Herm (C, 2) e 1 ∈ Herm (C, 2), segue que A∗ = A−1. Logo, AMA−1 = M para toda M ∈ Herm(C, 2), ou seja, AM = MA para toda M ∈ Herm (C, 2). Ocorre, porém, que toda matriz Q ∈ Mat (C, 2) pode ser escrita como Q = Q1 + iQ2 com Q1 := 1 2 (Q+Q∗), Q2 := 1 2i (Q−Q∗) onde Q1 e Q2 são ambas Hermitianas (verifique!). Logo, como A comuta com todas as matrizes Hermitianas, A comuta com todas as matrizes de Mat (C, 2). Isso só é posśıvel se A for um múltiplo da matriz identidade: A = λ1 (vide Proposição 2.3, página 103). Como det(A) = 1, segue que λ2 = 1, ou seja, A = ±1, que é o que queŕıamos mostrar. Essa proposição tem a seguinte conseqüência: 43Hermann Minkowski (1864–1909). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 935/1730 Proposição 18.19 Se A, B ∈ SL(2, C) são tais que AMA∗ = BMB∗ para todas as matrizes M ∈ Herm (C, 2), então A = ±B. 2 Prova. A relação AMA∗ = BMB∗ implica CMC∗ = M , onde C = B−1A ∈ SL(2, C). Pela proposição anterior, C = ±1, terminando a prova. Seja x ∈ R4, x = ( x1 x2 x3 x4 ) , e seja M(x) := x41+ x1σ1 + x2σ2 + x3σ3 (18.100) o elemento correspondente de Herm (C, 2). É fácil ver que M : R4 → Herm (C, 2) é bijetora e linear: M(αx + βy) = αM(x) + βM(y) para todos α, β ∈ R e todos x, y ∈ R4. E. 18.87 Exerćıcio. Mostre que as quatro componentes do vetor x ∈ R4 podem ser recuperadas de M(x) pelas seguintes expressões: x4 = 1 2 Tr (1M(x)) = 1 2 Tr (M(x)) e xi = 1 2 Tr (σiM(x)), i = 1, 2, 3. 6 Em resumo, denotando σ4 = 1, tem-se xµ = 1 2 Tr (σµM(x)), µ = 1, . . . , 4 . (18.101) É um exerćıcio fácil e importante para o que segue verificar que − det(M(x)) = − det     x4 + x3 x1 − ix2 x1 + ix2 x4 − x3     = x21 + x 2 2 + x 2 3 − x24 = 〈x, ηx〉R, onde η é a matriz 4 × 4 definida em (18.62). Como se vê, surge (milagrosamente!) a métrica do espaço-tempo de Minkowski do lado direito, o que indica a existência de uma conexão insuspeita entre a relatividade restrita e a teoria das matrizes Hermitianas 2× 2. Vamos explorar as conseqüências desse fato. Em primeiro lugar, notemos que para dois vetores x, y ∈ R4 quaisquer tem-se a seguinte identidade44: 〈x, ηy〉 R = 1 4 [〈(x+ y), η(x + y)〉 R − 〈(x− y), η(x− y)〉 R ] . E. 18.88 Exerćıcio. Verifique isso expandindo o lado direito. 6 Assim, podemos escrever 〈x, ηy〉 R = −1 4 [det(M(x+ y))− det(M(x− y))] . (18.102) Seja agora A um elemento de SL(2, C). Se M ∈ Herm (C, 2), como já observamos, AMA∗ também é um elemento de Herm (C, 2). Como A(BMB∗)A∗ = (AB)M(AB)∗ é fácil ver (faça!) que α : SL(2, C)×Herm (C, 2) → Herm (C, 2) definida por α(A, M) := AMA∗ é uma ação à esquerda de SL(2, C) sobre Herm (C, 2). 44Chamada de identidade de polarização. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 938/1730 Do fato de ϕτ , ϕ1 e ϕ2 serem automorfismos, segue igualmente que Φ1(±A) := L[A], (18.116) Φ2(±A) := L̇[A], (18.117) Φ3(±A) := Lc[A], (18.118) Φ4(±A) := L̇c[A] (18.119) são isomorfismos de SL(2, C)/{−1, 1} em L↑+. Isso claramente significa que as inversas Φ−1i : L↑+ → SL(2, C)/{−1, 1}, i = 1, . . . , 4, são representações de L↑+ em C 2. A representação Φ−12 é por vezes denominada complexo conjugada e a representação Φ −1 4 é por vezes denominada contra-gradiente. • Spinores Em termos f́ısicos, se tivermos uma transformação de Lorentz L ∈ L↑+ podemos implementá-la em C2 de quatro formas, de acordo com cada uma das quatro representações Φ−1i dadas acima. Quantidades f́ısicas vivendo em C 2 e que se transformem por transformações de Lorentz de acordo com alguma dessas quatro representações são denominadas spinores. Há, portanto, quatro tipos de spinores. De acordo com uma convenção (que, segundo Haag [71], foi introduzida por Van der Waerden em [201]) costuma-se denotar suas componentes da seguinte forma: 1. As componentes de spinores Ψ ∈ C2 que se transformam de acordo com Φ−11 são denotados por ı́ndices inferiores: Ψr, r = 1, 2. 2. As componentes de spinores Ψ ∈ C2 que se transformam de acordo com Φ−12 são denotados por ı́ndices inferiores com um ponto: Ψṙ, r = 1, 2. 3. As componentes de spinores Ψ ∈ C2 que se transformam de acordo com Φ−13 são denotados por ı́ndices superiores com um ponto: Ψṙ, r = 1, 2. 4. As componentes de spinores Ψ ∈ C2 que se transformam de acordo com Φ−14 são denotados por ı́ndices superiores: Ψr, r = 1, 2. Spinores com ponto e sem (em inglês: “dotted spinors” e “undotted spinors”, respectivamente) podem ser relacionados por conjugação complexa. E. 18.93 Exerćıcio. Justifique essa afirmativa. 6 Para U ∈ SU(2), vale U = τUτ−1 (verifique), de modo que, no que concerne ao grupo de rotações, a diferença entre “undotted spinors” e “dotted spinors” é uma rotação de π em torno do eixo 2. Para um boost B(v, ~η) = exp((tanh v) ~η · ~σ) ∈ SL(2, C) com ~η = (η1, η2, η3) teremos B(v, ~η) = B(v, ~ηr), onde ~ηr = (η1, −η2, η3). Isso pois σ1 = σ1, σ3 = σ3 mas σ2 = −σ2. Logo, B(v, ~η) = τB(−v, ~η)τ−1. Assim, no que concerne aos boosts de Lorentz, a diferença entre “undotted spinors” e “dotted spinors” é uma reversão temporal (representada aqui pela troca v → −v) seguida de rotação de π em torno do eixo 2. Todas as considerações acima sobre “undotted spinors” e “dotted spinors” são de relevância na Mecânica Quântica relativista, particularmente para a célebre equação de Dirac para o elétron46. • Formas invariantes de spinores A seguinte proposição é freqüentemente empregada na teoria dos spinores. 46Para um artigo clássico sobre o assunto, vide: O. Laporte and G. E. Uhlenbeck. “Application of spinor analysis for the Maxwell and Dirac equations”. Phys. Rev. 37, 1380 (1931). Outra referência clássica é [201]. Vide também qualquer bom livro moderno sobre Teoria Quântica de Campos. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 939/1730 Proposição 18.20 Seja τ := −iσ2 =     0 −1 1 0     ∈ SL(2, C). Então, para todo A ∈ SL(2, C) tem-se AT τA = τ . 2 Prova. Seja A = exp(α1σ1 +α2σ2 +α3σ3) ∈ SL(2, C), com αk ∈ C, k = 1, 2, 3. Então, AT = exp(α1σ1 −α2σ2 +α3σ3), pois σT1 = σ1, σ T 3 = σ3 mas σ T 2 = −σ2. Assim, AT τ = −iATσ2 = −iσ2 ( σ2A Tσ2 ) = τ exp (σ2 [α1σ1 − α2σ2 + α3σ3]σ2) = τ exp(−α1σ1 − α2σ2 − α3σ3) = τA−1 onde, na penúltima igualdade, usamos as propriedades de anti-comutação das matrizes de Pauli. Isso completa a prova. Uma conseqüência dessa proposição é que se definirmos, para ψ, φ ∈ C2, a forma bilinear (simplética) ωτ (ψ, φ) := 〈ψ, τφ〉 R , teremos ωτ (Aψ, Aφ) = ωτ (ψ, φ) para todo A ∈ SL(2, C). Apesar de invariante por SL(2, C), a forma bilinear ωτ acima não é interessante para a F́ısica Quântica, pois não é um produto escalar (tem-se, por exemplo, ωτ (ψ, ψ) = 0 ∀ψ ∈ C2) e, portanto, não existe uma interpretação probabiĺıstica associada à mesma. Para que a simetria L↑+ implementada por SL(2, C) represente uma simetria de um sistema quântico cujo espaço de Hilbert é C2, devemos procurar um produto escalar em C2 que seja invariante por SL(2, C). Veremos, porém, que um tal produto escalar não existe. Vamos estudar a forma mais geral de um produto escalar em C2. Como já observamos à página 170 e anteriores, a forma mais geral de um produto escalar em C2 é 〈ψ, Mφ〉 C , onde M é auto-adjunta e positiva. Toda matriz 2× 2 auto- adjunta é da forma M(p) para algum p ∈ R4 (M(p) foi definida em (18.100), página 935)). Vamos descobrir para quais p ∈ R4 tem-se M(p) > 0. Para que essa condição seja satisfeita os dois autovalores λ1 e λ2 de M(p) devem ser positivos. Calculando por (18.100) o traço e o determinante de M(p) , tem-se det(M(p)) = λ1λ2 = (p4) 2 − (p1)2 − (p2)2 − (p3)2 e Tr(M(p)) = λ1 + λ2 = 2p4. É fácil ver dáı que λ1 = p4 + ‖~p‖ e λ2 = p4 − ‖~p‖ onde ~p = (p1, p2, p3). Logo, M(p) > 0 se e somente se p4 > ‖~p‖. Seja V+ := {p ∈ R4| p4 > ‖~p‖}. É fácil verificar (faça-o) que V+ é mantido invariante por L↑+. Para ψ, φ ∈ C2 e p ∈ V+, definamos o produto escalar 〈ψ, φ〉p := 〈ψ, M(p)φ〉C . Teremos, para todo A ∈ SL(2, C), 〈Aψ, Aφ〉p := 〈ψ, A∗M(p)Aφ〉C = 〈ψ, M (L[A∗]p) φ〉C = 〈ψ, φ〉L[A∗]p , onde, acima, usamos (18.104). No caso do subgrupo SU(2), o produto escalar invariante corresponde a p ∈ V+ com Lp = p para L ∈ SRot. Tais p’s são da forma p = (0, 0, 0, p4), p4 > 0. Assim, 〈ψ, φ〉C é, a menos de um múltiplo positivo, o único produto escalar invariante em C2 para SU(2). Mas vemos acima que que não há produto escalar invariante para todo o grupo SL(2, C) em C2, já que não há vetor em V+ que seja invariante para todo L ∈ L↑+. Fisicamente falando, a simetria de Lorentz L↑+ não pode, portanto, ser implementada em espaços de Hilbert bidimensionais, apenas a simetria de rotação. Adiante, discutiremos como implementar a simetria de Lorentz (e a de Poincaré) em campos de spinores, aumentando a dimensão do espaço de Hilbert dos estados. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 940/1730 Apêndices 18.A Prova do Teorema 18.8 Aqui a demonstração do Teorema 18.8, página 922, será apresentada. Seja L um elemento do grupo de Lorentz O(3, 1), representada como matriz da forma (18.78). Vamos definir vetores coluna (ou seja, matrizes 3× 1) a e b por a :=         L14 L24 L34         , b :=         L41 L42 L43         . É evidente que podemos escrever L na forma de blocos L =                l a bT L44                , (18.A.1) onde bT , a transposta de b, é o vetor linha (matriz 1× 3) dado por bT = ( L41, L42, L43 ) e l é a matriz 3× 3 dada por l :=         L11 L12 L13 L21 L22 L23 L31 L32 L33         . Vamos agora considerar duas matrizes Ra e Rb pertencentes a SRot, ou seja, Ra :=                ra 0 0 0 0 0 0 1                , Rb :=                rb 0 0 0 0 0 0 1                , com ra e rb matrizes 3× 3 pertencentes a SO(3). Precisamos estudar a forma da matriz RaLRTb . A regra de produto de JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 943/1730 A matriz L′ = RaLR T b é certamente um elemento do grupo de Lorentz O(3, 1), pois Ra, L e R T b o são. Assim, L ′ satisfaz L′η(L′)T η = 1. Calculemos o lado esquerdo dessa igualdade: L′η(L′)T η =                salt(s b)T α 0 0 β 0 0 L44                               1 00 0 0 0 0 −1                               sblTt (s a)T β 0 0 α 0 0 L44                               1 00 0 0 0 0 −1                =                salt(s b)T α 0 0 β 0 0 L44                               1 00 0 0 0 0 −1                               sblTt (s a)T −β 0 0 α 0 0 −L44                =                salt(s b)T α 0 0 β 0 0 L44                               sblTt (s a)T −β 0 0 −α 0 0 L44                =                 f g −gT L244 − β2                 , onde f = salt(lt) T (sa)T +         −α2 0 0 0 0 0 0 0 0         JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 944/1730 e g = −βsalt(sb)T         1 0 0         + L44α         1 0 0         . E. 18.95 Exerćıcio importante. Verifique as expressões acima. Sugestão: exerça a virtude da Paciência. 6 Como mencionamos, L′η(L′)T η = 1. Portanto, devemos ter f = 1, (18.A.9) g = 0 e (18.A.10) L244 − β2 = 1 (18.A.11) (por que?). Logo, salt(lt) T (sa)T =         1 + α2 0 0 0 1 0 0 0 1         , (18.A.12) βsalt(s b)T         1 0 0         = L44α         1 0 0         . (18.A.13) Devido à forma de sa e sb em (18.A.5) e (18.A.7) essas relações implicam lt(lt) T =         1 + α2 0 0 0 1 0 0 0 1         , (18.A.14) βlt         1 0 0         = L44α         1 0 0         . (18.A.15) E. 18.96 Exerćıcio. Certo? 6 Das relações acima extrairemos várias conclusões sobre a estrutura do grupo de Lorentz. A primeira é a seguinte proposição: Proposição 18.21 Para qualquer transformação de Lorentz L vale L244 − β2 = 1, (18.A.16) L244 − α2 = 1 (18.A.17) JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 945/1730 e, conseqüentemente, α2 = β2. (18.A.18) Fora isso, a2 = α2 = β2 = b2, onde a2 e b2 são os módulos ao quadrado dos vetores a e b, respectivamente, ou seja, a2 = (L14) 2 + (L24) 2 + (L34) 2 e b2 = (L41) 2 + (L42) 2 + (L43) 2. Portanto, L244 = 1 + (L14) 2 + (L24) 2 + (L34) 2 = 1 + (L41) 2 + (L42) 2 + (L43) 2. 2 Prova. (18.A.16) é o mesmo que (18.A.11). Para provar (18.A.17), notemos que, pela Proposição 18.14, LT é também uma transformação de Lorentz. Logo, para LT a relação (18.A.16) significa L244−α2 = 1, pois ao passarmos de L para LT o elemento L44 não muda, mas ocorre a troca α↔ β. (18.A.18) segue de (18.A.16) e (18.A.17). Para provar que a2 = α2, notemos que, por (18.A.4), o vetor ( α 0 0 ) é obtido de a por uma rotação ta ∈ SO(3), que não altera o comprimento de vetores. De modo análogo prova-se que b2 = β2. Segue dessa proposição que, para prosseguirmos, teremos que considerar dois casos: o caso α = β = 0 e o caso em que α 6= 0 e β 6= 0. Caso α = β = 0 Como comentamos, nesse caso temos a = b = 0. Podemos adotar sa = sb = ta = tb = 1 e, portanto, L é simplesmente da forma L =                l 0 0 0 0 0 0 L44                . Com α = 0 e sa = sb = ta = tb = 1, a relação (18.A.14) reduz-se a llT = 1, ou seja, l ∈ O(3). Como det(L) = ±1 e det(l) = ±1 há quatro situações a considerar: Ia. det(L) = 1 e det(l) = 1. Nessa situação tem-se l ∈ SO(3) e L44 = 1. Portanto, L ∈ SRot. Ib. det(L) = 1 e det(l) = −1. Nessa situação l ∈ O(3) mas l 6∈ SO(3) e L44 = −1. Assim L é da forma L = P1TR com R ∈ SRot. (Justifique). IIa. det(L) = −1 e det(l) = 1. Nessa situação l ∈ SO(3) e L44 = −1. Assim L é da forma L = TR com R ∈ SRot. (Justifique). IIb. det(L) = −1 e det(l) = −1. Nessa situação l ∈ O(3) mas l 6∈ SO(3) e L44 = 1. Assim L é da forma L = P1R com R ∈ SRot. (Justifique). Resumindo, vimos para o caso a = b = 0 que nas quatro situações posśıveis L consiste apenas de uma simples rotação, seguida eventualmente de uma inversão de paridade (Ib e IIb) e/ou de uma reversão temporal (Ib e IIa.). Como veremos, o caso α 6= 0 e β 6= 0 envolve também um “boost de Lorentz”, ou seja, uma mudança de entre dois sistemas de referência inerciais com uma velocidade relativa eventualmente não-nula. Caso α 6= 0 e β 6= 0 JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 948/1730 Ia. Escolhendo det(RaLR T b ) = +1 e ω = + √ 1 + α2, (18.A.23) fica L = (Ra) T             √ 1 + α2 0 0 α 0 1 0 0 0 0 1 0 α 0 0 √ 1 + α2             Rb. (18.A.25) Ra e Rb são elementos de SRot ≃ SO(3), temos det(Ra) = det(Rb) = 1. Logo, neste caso temos det(L) = 1. Fora isso L44 ≥ 1. É conveniente escrever (18.A.25) de outra forma. Como α é um número real arbitrário, vamos definir v ∈ (−1, 1) por v := − α√ 1 + α2 , de modo que α = − v√ 1− v2 . (18.A.26) Teremos             √ 1 + α2 0 0 α 0 1 0 0 0 0 1 0 α 0 0 √ 1 + α2             =             γ(v) 0 0 −vγ(v) 0 1 0 0 0 0 1 0 −vγ(v) 0 0 γ(v)             =: B1(v), onde γ(v) := 1√ 1− v2 . Como se vê, chegamos dessa forma aos boosts de Lorentz B1(v) utilizando apenas as propriedades definidoras do grupo de Lorentz. Compare com o estudo do grupo O(1, 1), página 883. Com essa parametrização, (18.A.25) fica L = (Ra) TB1(v)Rb, (18.A.27) para Ra, Rb ∈ SRot. Ib. Escolhendo det(RaLR T b ) = +1 e ω = − √ 1 + α2, (18.A.23) fica RaLR T b =             − √ 1 + α2 0 0 α 0 1 0 0 0 0 1 0 α 0 0 − √ 1 + α2             . (18.A.28) Logo, usando-se as matrizes P1 e T definidas em (18.73) e (18.74), segue P1RaLR T b T =             √ 1 + α2 0 0 α 0 1 0 0 0 0 1 0 α 0 0 √ 1 + α2             , (18.A.29) JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 949/1730 como facilmente se verifica. Dáı, lembrando que T e Rb comutam (por que?), conclui-se que nesse caso temos L = (P1Ra) T             √ 1 + α2 0 0 α 0 1 0 0 0 0 1 0 α 0 0 √ 1 + α2             RbT. (18.A.30) Assim, com a parametrização (18.A.26), L = (P1Ra) TB1(v)RbT, (18.A.31) para Ra, Rb ∈ SRot. Por fim, note-se que neste caso temos det(L) = 1 com L44 ≤ −1 (por que?). IIa. Escolhendo det(RaLR T b ) = −1 e ω = + √ 1 + α2, (18.A.23) fica RaLR T b =             √ 1 + α2 0 0 α 0 1 0 0 0 0 1 0 −α 0 0 − √ 1 + α2             . (18.A.32) Assim, TRaLR T b =             √ 1 + α2 0 0 α 0 1 0 0 0 0 1 0 α 0 0 √ 1 + α2             , (18.A.33) como facilmente se verifica. Nesse caso, então, L = T (Ra) T             √ 1 + α2 0 0 α 0 1 0 0 0 0 1 0 α 0 0 √ 1 + α2             Rb. (18.A.34) Assim, com a parametrização (18.A.26), L = T (Ra) TB1(v)Rb, (18.A.35) para Ra, Rb ∈ SRot. Por fim, note-se que neste caso temos det(L) = −1 com L44 ≤ −1 (por que?). JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 950/1730 IIb. Escolhendo det(RaLR T b ) = −1 e ω = − √ 1 + α2, (18.A.23) fica RaLR T b =             − √ 1 + α2 0 0 α 0 1 0 0 0 0 1 0 −α 0 0 √ 1 + α2             . (18.A.36) Assim, RaLR T b P1 =             √ 1 + α2 0 0 α 0 1 0 0 0 0 1 0 α 0 0 √ 1 + α2             , (18.A.37) como facilmente se verifica. Nesse caso, então, L = (Ra) T             √ 1 + α2 0 0 α 0 1 0 0 0 0 1 0 α 0 0 √ 1 + α2             P1Rb. (18.A.38) Assim, com a parametrização (18.A.26), L = (Ra) TB1(v)P1Rb, (18.A.39) para Ra, Rb ∈ SRot. Por fim, note-se que neste caso temos det(L) = −1 e L44 ≥ 1 (por que?). A demonstração do Teorema 18.8 está assim completa. 18.B Um Isomorfismo entre SL(2, C) / {1, −1} e L↑+ Esta seção é de autoria de Daniel A. Cortez Vamos provar que a aplicação Φ1 : SL(2, C)/{1, −1} → L↑+ definida por Φ1(±A) := L[A] (18.B.40) é um isomorfismo entre os grupos SL(2, C)/{1, −1} e L↑+. Para isso, começaremos resolvendo dois dos exerćıcios propostos à página 936. O primeiro deles afirma que L[A] = L[B] se e somente se A = ±B. Isso pode ser visto facilmente a partir da Proposição 18.19. De fato, se L[A] = L[B], então para qualquer x ∈ R4, vale que L[A]x = L[B]x. Usando (18.104), resulta M−1(AM(x)A∗) = M−1(BM(x)B∗). Portanto, AM(x)A∗ = BM(x)B∗ e, como M(x) ∈ Herm(C, 2) para qualquer x ∈ R4, segue da Proposição 18.19 que A = ±B. Por outro lado, é claro que se A = ±B, então L[A] = L[B], como se pode constatar, por exemplo, a partir de (18.105). Note que o resultado desse exerćıcio implica JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 953/1730 Para provar (b), usamos o resultado acima e os fatos já mencionados. Conseqüentemente, Tr(σjσkσℓ) = Tr[σj(δkℓ1 + iǫkℓmσm) ] = iǫkℓmTr(σjσm) = 2iǫkℓmδjm = 2iǫkℓj = 2iǫjkℓ . Finalmente, para provar (c), usamos novamente (a). Com efeito, Tr(σiσkσjσℓ) = Tr[ (δik1 + iǫikmσm)(δjℓ1 + iǫjℓnσn) ] = δikδjℓTr1− ǫikmǫjℓnTr(σmσn) = 2δikδjℓ − 2ǫikmǫjℓnδmn = 2δikδjℓ − 2ǫikmǫjℓm . Aplicando a bem conhecida identidade ǫikmǫjℓm = δijδkℓ − δiℓδkj , obtemos Tr(σiσkσjσℓ) = 2δikδjℓ − 2δijδkℓ + 2δiℓδkj , completando a prova do lema. Retornemos agora à prova do item (a) da Proposição 18.24. Como é bem sabido, podemos escrever e− z 2 σ1 = cosh z 2 1− σ1 senhz 2 . (18.B.46) Para calcular os elementos de matriz L [ e− z 2 σ1 ] µν , com µ, ν = 1, 2, 3, 4, usamos a relação (18.105), lembrando que σ4 ≡ 1. Assim, com o aux́ılio de (18.B.46), temos L [ e− z 2 σ1 ] 44 = 1 2 Tr [( cosh z 2 1− σ1 senhz 2 )( cosh z 2 1− σ1 senhz 2 )∗ ] = 1 2 Tr ( cosh2 z 2 1− 2 cosh z 2 senh z 2 σ1 + senh 2 z 2 σ21 ) = 1 2 ( cosh2 z 2 + senh2 z 2 ) Tr1 = cosh2 z 2 + senh2 z 2 = cosh z , (18.B.47) onde usamos que σ21 = 1, Trσ1 = 0 e cosh2 x+ senh2x = cosh 2x. Calculemos agora L [e− z2 σ1]4j com j = 1, 2, 3. Usando (18.105) e (18.B.46), obtemos L [ e− z 2 σ1 ] 4j = 1 2 Tr [( cosh z 2 1− σ1 senhz 2 ) σj ( cosh z 2 1− σ1 senhz 2 )∗ ] = 1 2 Tr ( − cosh z 2 senh z 2 σjσ1 − senh z 2 cosh z 2 σ1σj + senh 2 z 2 σ1σjσ1 ) . Aplicando o Lema 18.1, resulta imediatamente que L [ e− z 2 σ1 ] 4j = −2δj1 cosh z 2 senh z 2 = −δj1 senhz , (18.B.48) JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 954/1730 onde a identidade 2 senh(x) cosh(x) = senh(2x) foi usada. O cálculo de L [ e− z 2 σ1 ] j4 , j = 1, 2, 3 é feito de forma semelhante. Explicitamente, L [ e− z 2 σ1 ] j4 = 1 2 Tr [ σj ( cosh z 2 1− σ1 senhz 2 )( cosh z 2 1− σ1 senhz 2 )∗ ] = 1 2 Tr [ σj ( cosh2 z 2 + senh2 z 2 ) − 2 cosh z 2 senh z 2 σjσ1 ] = −2δj1 cosh z 2 senh z 2 = −δj1 senhz . (18.B.49) Observe que novamente utilizamos o Lema 18.1 para o cálculo do traço. Resta, finalmente, o cômputo de L [ e− z 2 σ1 ] ij , com i, j = 1, 2, 3. Esse também pode ser feito de forma simples com o aux́ılio do Lema 18.1. De fato, L [ e− z 2 σ1 ] ij = 1 2 Tr [ σi ( cosh z 2 1− σ1 senhz 2 ) σj ( cosh z 2 1− σ1 senhz 2 )∗ ] = 1 2 Tr   σi   cosh 2 z 2 σj − cosh z 2 senh z 2 (σjσ1 + σ1σj) ︸ ︷︷ ︸ 2δj11 + senh2 z2σ1σjσ1 = 1 2 cosh2 z 2 Tr(σiσj) + 1 2 senh2 z 2 Tr(σiσ1σjσ1) ︸ ︷︷ ︸ 4δ1iδ1j−2δij = δij cosh 2 z 2 + senh2 z 2 (2δ1iδ1j − δij) = δij + 2δ1iδ1j senh 2 z 2 , (18.B.50) onde a identidade fundamental cosh2 x − senh2x = 1 foi utilizada na última igualdade. Observe da relação acima que quando i = j = 1, obtém-se L [ e− z 2 σ1 ] 11 = 1 + 2 senh2 z 2 = ( cosh2 z 2 − senh2 z 2 ) + 2 senh2 z 2 = cosh2 z 2 + senh2 z 2 = cosh z , (18.B.51) caso contrário, L [ e− z 2 σ1 ] ij = δij . Usando as expressões (18.B.47)-(18.B.51), podemos escrever explicitamente a forma completa da matriz L [ e− z 2 σ1 ] µν para µ, ν = 1, 2, 3, 4. Não é dif́ıcil constar (faça!) que L [ e− z 2 σ1 ] µν =             cosh z 0 0 − senhz 0 1 0 0 0 0 1 0 − senhz 0 0 cosh z             . Comparando com (18.B.43), vemos que L [ e− z 2 σ1 ] = B1(z), provando o item (a) da proposição. JCABarata. Curso de F́ısica-Matemática Versão de 19 de março de 2010. Caṕıtulo 18 955/1730 A prova da segunda parte da proposição segue, essencialmente, a mesma idéia da primeira, embora seja um pouco mais trabalhosa. Em primeiro lugar, observamos que e−i θ 2~η·~σ ∈ SL(2, C) em virtude de (18.B.45). Assim, L [ e−i θ 2~η·~σ ] está bem definida e podemos calcular seus elementos de matriz usando a fórmula (18.105). Antes disso, porém, é conveniente expressarmos e−i θ 2 ~η·~σ usando a identidade e−i θ 2 ~η·~σ = cos θ 2 1− i~η · ~σ sen θ 2 . Assim, de acordo com (18.105), lembrando sempre que σ4 ≡ 1, temos L [ e−i θ 2 ~η·~σ ] 44 = 1 2 Tr [( cos θ 2 1− i~η · ~σ sen θ 2 )( cos θ 2 1− i~η · ~σ sen θ 2 )∗ ] = 1 2 Tr [ cos2 θ 2 1+ (~η · ~σ)2 sen 2 θ 2 ] . Escrevendo ~η · ~σ = ηjσj e usando o Lema 18.1, resulta L [ e−i θ 2 ~η·~σ ] 44 = 1 2 cos2 θ 2 Tr1 + 1 2 sen 2 θ 2 ηkηjTrσkσj = cos2 θ 2 + sen 2 θ 2 ηkηjδkj = cos2 θ 2 + sen 2 θ 2 ηkηk = 1 , (18.B.52) uma vez que ηkηk = ~η 2 = 1. Prosseguindo, devemos agora calcular os elementos de matriz L [ e−i θ 2 ~η·~σ ] 4j , com j = 1, 2, 3. Como sempre, o cálculo é feito com base na expressão (18.105) e com o aux́ılio do Lema 18.1. Assim, L [ e−i θ 2 ~η·~σ ] 4j = 1 2 Tr [( cos θ 2 1− iηkσk sen θ 2 ) σj ( cos θ 2 1− iηℓσℓ sen θ 2 )∗ ] = 1 2 i cos θ 2 sen θ 2 ηℓ Tr(σjσℓ) ︸ ︷︷ ︸ 2δjℓ −1 2 i cos θ 2 sen θ 2 ηk Tr(σkσj) ︸ ︷︷ ︸ 2δkj + 1 2 sen 2 θ 2 ηkηℓ Tr(σkσjσℓ) ︸ ︷︷ ︸ 2iǫkjℓ = i cos θ 2 sen θ 2 ηj − i cos θ 2 sen θ 2 ηj + i sen 2 θ 2 ηkηℓǫkjℓ = 0 , (18.B.53) uma vez que ηkηℓ é simétrico pela troca de k com ℓ e ǫkjℓ é anti-simétrico. O cálculo de L [ e−i θ 2~η·~σ ] j4 é bastante análogo ao realizado acima e é deixado como exerćıcio para o leitor. O resultado obtido deverá ser L [ e−i θ 2 ~η·~σ ] j4 = 0 , (18.B.54)
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved