P. 1
matematica_mod2

matematica_mod2

4.5

|Views: 923|Likes:
Published by api-3797204
Estatística, combinatória e probabilidade. Editado pela USP
Estatística, combinatória e probabilidade. Editado pela USP

More info:

Published by: api-3797204 on Oct 17, 2008
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

05/09/2014

pdf

text

original

Nome do Aluno

Or gani zador es
Antôni o Car l os Br ol ezzi
El vi a Mur eb Sal l um
Mar tha S. Montei r o
El abor ador as
Cr i sti na Cer r i
Li sbeth K. Cor dani
Matemática
2
módul o
GOVERNO DO ESTADO DE SÃO PAULO
Governador: Geraldo Alckmin
Secretaria de Estado da Educação de São Paulo
Secretário: Gabriel Benedito Issac Chalita
Coordenadoria de Estudos e Normas Pedagógicas – CENP
Coordenadora: Sonia Maria Silva
UNIVERSIDADE DE SÃO PAULO
Reitor: Adolpho José Melfi
Pró-Reitora de Graduação
Sonia Teresinha de Sousa Penin
Pró-Reitor de Cultura e Extensão Universitária
Adilson Avansi Abreu
FUNDAÇÃO DE APOIO À FACULDADE DE EDUCAÇÃO – FAFE
Presidente do Conselho Curador: Selma Garrido Pimenta
Diretoria Administrativa: Anna Maria Pessoa de Carvalho
Diretoria Financeira: Sílvia Luzia Frateschi Trivelato
PROGRAMA PRÓ-UNIVERSITÁRIO
Coordenadora Geral: Eleny Mitrulis
Vice-coordenadora Geral: Sonia Maria Vanzella Castellar
Coordenadora Pedagógica: Helena Coharik Chamlian
Coordenadores de Área
Biologia:
Paulo Takeo Sano – Lyria Mori
Física:
Maurício Pietrocola – Nobuko Ueta
Geografia:
Sonia Maria Vanzella Castellar – Elvio Rodrigues Martins
História:
Kátia Maria Abud – Raquel Glezer
Língua Inglesa:
Anna Maria Carmagnani – Walkyria Monte Mór
Língua Portuguesa:
Maria Lúcia Victório de Oliveira Andrade – Neide Luzia de Rezende – Valdir Heitor Barzotto
Matemática:
Antônio Carlos Brolezzi – Elvia Mureb Sallum – Martha S. Monteiro
Química:
Maria Eunice Ribeiro Marcondes – Marcelo Giordan
Produção Editorial
Dreampix Comunicação
Revisão, diagramação, capa e projeto gráfico: André Jun Nishizawa, Eduardo Higa Sokei, José Muniz Jr.
Mariana Pimenta Coan, Mario Guimarães Mucida e Wagner Shimabukuro
Cartas ao
Aluno
Car ta da
Pró-Reitoria de Graduação
Caro aluno,
Com muita alegria, a Universidade de São Paulo, por meio de seus estudantes
e de seus professores, participa dessa parceria com a Secretaria de Estado da
Educação, oferecendo a você o que temos de melhor: conhecimento.
Conhecimento é a chave para o desenvolvimento das pessoas e das nações
e freqüentar o ensino superior é a maneira mais efetiva de ampliar conhecimentos
de forma sistemática e de se preparar para uma profissão.
Ingressar numa universidade de reconhecida qualidade e gratuita é o desejo
de tantos jovens como você. Por isso, a USP, assim como outras universidades
públicas, possui um vestibular tão concorrido. Para enfrentar tal concorrência,
muitos alunos do ensino médio, inclusive os que estudam em escolas particulares
de reconhecida qualidade, fazem cursinhos preparatórios, em geral de alto
custo e inacessíveis à maioria dos alunos da escola pública.
O presente programa oferece a você a possibilidade de se preparar para enfrentar
com melhores condições um vestibular, retomando aspectos fundamentais da
programação do ensino médio. Espera-se, também, que essa revisão, orientada
por objetivos educacionais, o auxilie a perceber com clareza o desenvolvimento
pessoal que adquiriu ao longo da educação básica. Tomar posse da própria
formação certamente lhe dará a segurança necessária para enfrentar qualquer
situação de vida e de trabalho.
Enfrente com garra esse programa. Os próximos meses, até os exames em
novembro, exigirão de sua parte muita disciplina e estudo diário. Os monitores
e os professores da USP, em parceria com os professores de sua escola, estão
se dedicando muito para ajudá-lo nessa travessia.
Em nome da comunidade USP, desejo-lhe, meu caro aluno, disposição e vigor
para o presente desafio.
Sonia Teresinha de Sousa Penin.
Pró-Reitora de Graduação.
Car ta da
Secretaria de Estado da Educação
Caro aluno,
Com a efetiva expansão e a crescente melhoria do ensino médio estadual,
os desafios vivenciados por todos os jovens matriculados nas escolas da rede
estadual de ensino, no momento de ingressar nas universidades públicas, vêm se
inserindo, ao longo dos anos, num contexto aparentemente contraditório.
Se de um lado nota-se um gradual aumento no percentual dos jovens aprovados
nos exames vestibulares da Fuvest — o que, indubitavelmente, comprova a
qualidade dos estudos públicos oferecidos —, de outro mostra quão desiguais
têm sido as condições apresentadas pelos alunos ao concluírem a última etapa
da educação básica.
Diante dessa realidade, e com o objetivo de assegurar a esses alunos o patamar
de formação básica necessário ao restabelecimento da igualdade de direitos
demandados pela continuidade de estudos em nível superior, a Secretaria de
Estado da Educação assumiu, em 2004, o compromisso de abrir, no programa
denominado Pró-Universitário, 5.000 vagas para alunos matriculados na terceira
série do curso regular do ensino médio. É uma proposta de trabalho que busca
ampliar e diversificar as oportunidades de aprendizagem de novos conhecimentos
e conteúdos de modo a instrumentalizar o aluno para uma efetiva inserção no
mundo acadêmico. Tal proposta pedagógica buscará contemplar as diferentes
disciplinas do currículo do ensino médio mediante material didático especialmente
construído para esse fim.
O Programa não só quer encorajar você, aluno da escola pública, a participar
do exame seletivo de ingresso no ensino público superior, como espera se
constituir em um efetivo canal interativo entre a escola de ensino médio e
a universidade. Num processo de contribuições mútuas, rico e diversificado
em subsídios, essa parceria poderá, no caso da estadual paulista, contribuir
para o aperfeiçoamento de seu currículo, organização e formação de docentes.
Prof. Sonia Maria Silva
Coordenadora da Coordenadoria de Estudos e Normas Pedagógicas
Apresentação
da área
[...] a Matemática procura compreender os modelos que permeiam o mundo que
nos rodeia assim como a mente dentro de nós. […] Assim é necessário colocar a
ênfase:
— em procurar soluções e não apenas em memorizar procedimentos;
— em explorar modelos e não apenas em memorizar fórmulas;
— em formular conjecturas e não apenas em fazer exercícios.
[...] com essas ênfases, os estudantes terão a oportunidade de estudar a Matemá-
tica como uma disciplina exploradora, dinâmica, que se desenvolve, em lugar de ser
uma disciplina que tem um corpo rígido, absoluto, fechado, cheio de regras que
precisam ser memorizadas.
Shoenfeld (1992)
1
Este curso de Matemática com duração de 4 meses está sendo oferecido a
alunos do último ano do ensino médio da rede pública como um incentivo
para continuarem seus estudos em direção ao ensino superior. Embora não
cubra todo o programa do ensino médio, pretende-se estimular o interesse dos
alunos pelos diversos temas de Matemática por meio de abordagens variadas.
Serão estudados tópicos sobre Números, Estatística, Probabilidade e Aná-
lise Combinatória, Geometria Plana e Espacial, Geometria Analítica, Sistemas
Lineares e Funções, privilegiando o entendimento das possíveis facetas de
um mesmo assunto, a análise de resultados obtidos e a interligação entre os
diversos conteúdos.
Escolhas foram feitas de modo a priorizar sua formação, a discussão de
idéias e a percepção de que a Matemática é uma disciplina viva que pode ser
construída, e não um amontoado de fórmulas prontas para serem decoradas e
usadas. Lembrando que realmente aprendemos quando trabalhamos o conhe-
cimento, analisando-o de várias maneiras e usando-o com critério, considera-
remos, sempre que possível, aplicações em problemas reais e interdisciplinares.
Acreditando que o intercâmbio entre vocês, alunos do ensino médio, e os
alunos da USP, que serão os seus professores, venha a aumentar a sua predis-
posição para o ensino superior, desejamos a todos bons estudos!
Coordenação da área de Matemática
1
SCHOENFELD A. H. “Learning to think mathematically: Problem solving, metacognition and sense
making in mathematics”. In: D. A. Grouws (Ed.). Handbook of research on mathematicas teaching and
learning. p. 334-370. Nova Iorque: MacMillan, 1992.
Uma das ferramentas mais utilizadas hoje em dia pelos cientistas, analistas
econômico-sociais, profissionais liberais, jornalistas etc. é a Estatística, que
descreve os dados observados e desenvolve a metodologia para a tomada de
decisão em presença da incerteza. O verbete estatística foi introduzido no
século XVIII, tendo origem na palavra latina status (Estado), e serviu inicial-
mente a objetivos ligados à organização político-social, como o fornecimento
de dados ao sistema de poder vigente. Hoje em dia, os modelos de aplicação
da Teoria Estatística se estendem por todas as áreas do conhecimento, como
testes educacionais, pesquisas eleitorais, análise de riscos ambientais, finan-
ças, controle de qualidade, análises clínicas, data mining, índices de desen-
volvimento, modelagem de fenômenos atmosféricos etc. Podemos informal-
mente dizer que a Teoria Estatística é uma ferramenta que ajuda a tomar deci-
sões com base na evidência disponível, decisões essas afetadas por margens
de erro, calculadas através de modelos de probabilidade.
No entanto, a probabilidade se desenvolveu muito antes de ser usada em
aplicações da Teoria Estatística. Um dos marcos consagrados na literatura
probabilística foi a correspondência entre B. Pascal (1623-1662) e P. Fermat
(1601-1665), onde o tema era a probabilidade de ganhar em um jogo com dois
jogadores, sob determinadas condições. Isso mostra que o desenvolvimento da
teoria de probabilidades começou com uma paixão humana, que são os jogos
de azar, mas evoluiu para uma área fortemente teórica, em uma perspectiva de
modelar a incerteza, derivando probabilidades a partir de modelos matemáti-
cos. A análise combinatória deve grande parte de seu desenvolvimento à ne-
cessidade de resolver problemas probabilísticos ligados à contagem, mas hoje
há diversas áreas em que seus resultados são fundamentais para o desenvolvi-
mento de teorias, como, por exemplo, a área de sistemas de informação.
Esta apostila tratará das três áreas descritas na introdução: estatística, pro-
babilidade e combinatória. Para o desenvolvimento dos temas, foi difícil a
escolha da ordem e do conteúdo, limitados que fomos pelo tempo disponível
para o desenvolvimento de cada assunto. Optamos por fazer um tratamento
sucinto de dados, através da estatística descritiva, por oferecer algumas no-
ções de probabilidade, a fim de trabalhar situações ligadas à incerteza, bem
como apresentar elementos de análise combinatória, visando desenvolver o
raciocínio para solucionar certos tipos de problemas de contagem dando me-
nos ênfase ao uso de fórmulas.
Apresentação
do módulo
Uni dade 1
Estatística descritiva
Cada vez mais os meios de comunicação nos apresent am
gráf i cos e medi das est at íst i cas resumi das de nat ureza
descrit iva. Esse é um mat erial de apoio que deve ser ut ilizado
para aprender os conceit os com base em not ícias de nosso
próprio cot idiano. Os gráficos e as est at íst icas descrit ivas
normalment e não são um fim em si mesmos, mas const it uem
uma part e import ant e do processo de análise.
A Estatística é um veículo para que os indivíduos, de modo geral, desen-
volvam a capacidade de aproveitar as fontes disponíveis de informação para
expressar e construir suas próprias idéias. Além disso, como já dissemos, es-
sas noções são parte integrante de todas as áreas do conhecimento e certa-
mente serão de grande utilidade para o curso universitário, qualquer que seja
a área de interesse do estudante, pois praticamente todas as carreiras universi-
tárias contêm uma disciplina de Estatística, a qual tornou-se um suporte para o
desenvolvimento do conhecimento.
Esta seção tem como objetivo mostrar aos alunos como se trabalha um
conjunto de dados simples, quer sejam de natureza numérica quer sejam de
natureza qualitativa. Esses dados normalmente constituem uma amostra de
determinada população de interesse de alguma área científica, econômica,
social etc. É muito difícil uma pesquisa envolver todos os elementos de uma
determinada população (o Censo faz isso), por motivos vários, e é por isso
que se recorre às amostras (que são subconjuntos de populações).
POPULAÇÃO
Conjunto de todos os indivíduos (ou elementos) de interesse.
AMOSTRA
Qualquer subconjunto de uma população.
ANÁLISE DE DADOS
Vamos iniciar a análise descritiva propondo uma tarefa para a classe: cada
um deverá medir o palmo de sua mão direita (em cm) com uma régua e regis-
trar o valor inteiro mais próximo. Se a leitura da régua informar uma medida
com 5 como o primeiro decimal (ex. 18,5 cm), vamos propor um arredonda-
mento rápido, mas grosseiro: considere 19 cm, se o dia de seu nascimento for
par, e 18 cm, se for impar. A classe pode discutir esse critério, pensando com
Or gani zador es
Antôni o Carl os
Br ol ezzi
El vi a Mur eb
Sal l um
Mar tha S.
Montei ro
El abor ador a
Li sbeth K. Cor dani
Ia
x\1vx\1ic\
Tabela 1
19 18 23 20 20 21 20 20 19 20
F F M F M M F M F M
20 20 21 21 20 21 19 17 19 19
M M M F F M F F F F
21 21 20 20 21 22 20 21 18 20
M M M F M M M M F F
o(a) professor(a) outras formas de arredondamento. Sempre que falarmos aqui
da variável palmo, estaremos subentendendo que a medida é dada em cm. Os
dados abaixo reproduzem as medidas do palmo da mão direita de uma amos-
tra (que pertence a uma determinada população) de 30 adultos e está também
representada a variável sexo (categorias M para masculino e F para feminino).
Estes mesmos dados estão representados no chamado Gráfico de pontos
que se encontra a seguir. Observe como foi feita a marcação e marque o valor
do palmo da sua mão direita na linha assinalada no gráfico (respeitando a or-
dem numérica). Todos os alunos deverão informar seu valor em voz alta e, à
medida que cada valor for informado, toda a classe marca tal valor na linha
acima do gráfico já construído – quando houver repetições, sigam a sugestão
do gráfico já feito, isto é, coloquem os valores um sobre o outro. Comparem o
gráfico obtido com os dados da classe com o proveniente dos dados da Tabela 1.
Na situação a seguir, os mesmos dados de palmo da Tabela 1 foram sepa-
rados por sexo e os gráficos de pontos têm a seguinte forma:
Neste exemplo estamos trabalhando com duas características, comprimento
do palmo da mão (palmo) e sexo. Em estatística, chamamos essas caracterís-
ticas de variáveis e, portanto, temos aqui duas variáveis já definidas: uma
delas, palmo, tem a classificação numérica (ou quantitativa) e a outra, sexo,
é classificada como qualitativa, apresentando duas categorias, ou seja mas-
culino (M) e feminino (F). Vamos registrar os valores de palmo e as categorias
I-
xóuuio ii
de sexo em tabelas de freqüências e devem ser registrados, nas tabelas dispo-
níveis, os valores obtidos na classe (f denota freqüência absoluta = número
de pessoas). As variáveis numéricas podem ser classificadas como contínuas
(provenientes de mensuração) ou discretas (provenientes de contagem), en-
quanto que as qualitativas podem ser classificadas como ordinais (ordem im-
plícita) ou nominais (sem ordem implícita).
Vimos então duas maneiras de representar o conjunto de valores da variá-
vel numérica palmo: através do gráfico de pontos e através de tabelas de fre-
qüências. Também a variável qualitativa sexo foi contemplada, tanto na repre-
sentação da tabela de freqüências, separando quantos indivíduos eram do sexo
masculino e quantos eram do feminino, quanto na construção do gráfico de
pontos para a variável palmo, em que houve uma estratificação para cada
categoria da variável qualitativa sexo (M e F). Compare os valores de palmo
para cada categoria de sexo.
SEXO
M
F
f
16
14
PALMO
17
18
19
20
21
22
23
freqüência f
1
2
5
12
8
1
1
Tabela 2
PALMO
17
18
19
20
21
22
23
freqüência f
P PP PPREENCHA REENCHA REENCHA REENCHA REENCHA
SEXO
M
F
f
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Colet e os valores da variável palmo da mão esquerda de t odos os colegas e t rabalhe
com a diferença ent re as medidas (mão esquerda – mão di rei t a mão esquerda – mão di rei t a mão esquerda – mão di rei t a mão esquerda – mão di rei t a mão esquerda – mão di rei t a). Const rua o gráfico
de pont os para as diferenças e a t abela de freqüências. Repare que você t rabalhou com
medi das nos mesmos i ndi víduos – i sso si gni f i ca que você t rabal hou com dados
emparelhados (ou pareados). Discut a e compare o comport ament o do palmo da mão
direit a e da mão esquerda at ravés das diferenças.
Considerando novamente a variável palmo, além de usarmos todos os
valores em um gráfico ou em uma tabela, podemos caracterizar o comporta-
mento dos dados a partir de um (ou mais) valores que a caracterizem – são as
chamadas medidas-resumo.
Medidas-resumo de variáveis numéricas podem ser de dois t ipos: de p osi ção p osi ção p osi ção p osi ção p osi ção e de
var i ab i l i d ad e var i ab i l i d ad e var i ab i l i d ad e var i ab i l i d ad e var i ab i l i d ad e.
Há várias medidas de posição, assim chamadas porque podem ser assina-
ladas no mesmo eixo de representação dos pontos (por exemplo, podem ser
Io
x\1vx\1ic\
17 18 18 19 19 19 19 19 20 20
20 20 20 20 20 20 20 20 20 20
21 21 21 21 21 21 21 21 22 23
A classe deverá fazer a média dos valores obtidos da variável PALMO de
todos os seus alunos.
Tanto no caso dos dados da Tabela 1 como naqueles da Tabela 2, não houve
nenhuma perda de informação e os valores da média são idênticos. Se a tabela
de freqüências disponível fosse a Tabela 4 (que apresentaremos adiante) então
haveria perda de informação, pois os dados estariam compactados em classes e
o cálculo da média seria feito com o ponto médio de cada classe como valor de
X – assim, com perda de informação, a média obtida não seria necessariamente
igual à anterior. Não vamos aqui explorar esse conteúdo para o cálculo de me-
didas descritivas, uma vez que com os recursos computacionais atuais não é
necessário dividir os dados em classes com esse objetivo. No entanto, veremos
uma aplicação gráfica com a Tabela 4, cujos dados estão divididos em classes.
A mediana da variável palmo é um valor que divide o conjunto dos valo-
res dessa variável em duas partes: metade dos valores é inferior (ou igual) à
mediana e a outra metade apresenta valores maiores (ou iguais) à mediana.
Para encontrar a mediana é então necessário ordenar os valores da variável e
verificar o valor que ocupa a posição central. Se o número de elementos for
par, e esse é o caso do exemplo (com n = 30), toma-se para mediana a média
aritmética entre os dois valores centrais – neste caso será a média entre o 15
o
e o 16
o
elementos. Ordenando os dados de palmo do menor para o maior
(pode ser também ao contrário), tem-se:
X ≅ = [(1. 17 + 2. 18 + 5. 19 + 12 . 20 + 8 . 21 + 1. 22 + 1. 23) / 30 ] 20 cm
Tabela 3
X
X
n
i
i
n
=

1
(1)
onde f
i
é a freqüência do valor X
i
, n é a soma de f
i
e a média é evidentemente
igual à anterior:
(2)
X
f X
n
i i
i
k
=
=

.
1
representadas no gráfico de pontos). Começaremos pelas chamadas de ten-
dência central: a média, a mediana e a moda.
A média (aritmética) da variável palmo é obtida através da somatória de todos
os valores de palmo dividida por 30 (dados da Tabela 1). A notação usual é:
onde X é a representação para palmo (cada um pode escolher a sua represen-
tação), é a notação usual para média de X e n é o número de elementos.
Fazendo então o cálculo, vem:
= [(17 + 18 + 18 +……….+ 22 + 23) / 30] 20 cm
(aqui o result ado é uma dízima periódica e vamos t rabalhar com est e valor aproximado)
Com os valores apresentados sob a forma de tabela de freqüências, a ex-
pressão para a média aritmética fica:
X
X

Média aritmética de palmo = =
I,
xóuuio ii
O 15
o
valor é 20 e o 16
o
valor também é 20. Portanto, a mediana da variável
palmo é 20 cm. Verifiquem a mediana da variável palmo do conjunto da classe.
A terceira medida de tendência central é a moda, que é definida como
sendo o valor mais freqüente. No nosso exemplo é bem claro o valor da moda,
pois o valor mais freqüente é 20 cm. Nem sempre a moda é tão evidente e há
situações com mais de uma moda.
Depois de calcular a média, a mediana e a moda, posicionem esses valores
no gráfico de pontos, feito inicialmente com os dados da classe. É fácil então
entender por que elas se chamam medidas de tendência central – elas resumem
os dados como se estivessem procurando um “equilíbrio” entre eles. Os dados
da Tabela 1 mostram uma certa simetria, situação em que média, mediana e
moda praticamente coincidem (rigidamente falando, a média não é exatamente
20 e sim 20,033...). Vejam qual a situação dos dados obtidos por vocês.
Há o costume de resumir um conjunto de dados pelo valor de alguma
medida de tendência central – a média é geralmente a mais utilizada, embora
em certos casos ela não reflita o comportamento dos dados. Como exemplo
disso, pode-se citar o caso em que ocorre um valor muito extremo em relação
aos demais: a média será afetada fortemente por ele e então se deslocará em
sua direção, não sendo, portanto, a melhor opção para resumir tais dados.
Neste caso, a mediana é mais eficiente.
Se temos uma discussão em uma empresa entre patrões e empregados, por
exemplo, onde os salários são em sua grande parte (80%) iguais a um salário
mínimo, e os demais mais do que 50 salários mínimos, o salário médio dará
uma idéia distorcida do poder aquisitivo dos membros da empresa. Nesse
caso, a mediana, que será igual a um salário mínimo, será mais informativa.
Calculem, por exemplo, a média dos valores 1, 2, 5, 7 e 10: a resposta será 5.
Se o número 10 for substituído pelo valor 100, a média será 23, de onde se
percebe o quanto ela é influenciada pelo valor extremo 100. A mediana nos
dois casos é 5, o que mostra que ela é uma medida “robusta” em relação a
valores extremos.
Outras medidas descritivas de posição são: valor máximo, valor mínimo, 1
o
quartil (Q1) e 3
o
quartil (Q3). As duas primeiras são auto-explicativas e passa-
remos rapidamente pela definição das outras duas: o 1
o
quartil é como se fosse
a mediana da primeira metade dos dados e o 3
o
quartil é como se fosse a medi-
ana da segunda metade dos dados. As quatro medidas acima mais a mediana
são suficientes para construir um gráfico de variáveis numéricas conhecido
como boxplot ou gráfico de caixas, ou, ainda, gráfico dos cinco pontos. O leitor
interessado irá encontrar a sua construção nas referências desta apostila.
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Calcule as medidas de posição para as diferenças (mão esquerda - mão direit a). Discut a.
No entanto, apesar de as medidas de posição ajudarem na compreensão
do comportamento dos dados, elas são incompletas para caracterizar o com-
portamento das variáveis, como mostra o próximo exemplo.
Exemplo 1: Imagine que 3 pessoas da família A apresentem para a variável
palmo os valores 19, 23 e 24 e que 3 pessoas da família B apresentem os valores
22, 22 e 22. Vamos calcular a média dessa variável para ambas as famílias:
Média da família A =
A
= [(19 + 23 + 24) / 3] = 22
Média da família B =
B
= [(22+22+22) / 3] = 22
X
X
I8
x\1vx\1ic\
Concluímos então que ambas as famílias apresentam a mesma média. Será
que isso basta? Vamos continuar trabalhando com esses dados. Marque os
valores da variável palmo de cada família na linha abaixo (isto é, faça um
gráfico de pontos), e note a diferença de comportamento entre os mesmos.
Você deve ter percebido que na família B todos os valores estão concen-
trados e na família A os valores estão dispersos. Esse aspecto não é percebido
se calcularmos somente a média, pois, como vimos, ela é igual para ambas as
famílias. Isso mostra que devemos complementar a medida de posição com
mais alguma coisa a fim de caracterizar as famílias quanto à variável palmo.
Voltaremos a este exemplo oportunamente.
Há uma idéia permeando esta discussão que diz respeito à diferença de
comportamento entre os dois grupos: é a idéia de variabilidade. Medidas des-
critivas de variabilidade representam a dispersão dos dados e podem ser defi-
nidas também por medidas resumo das variáveis numéricas em estudo. Fala-
remos aqui da amplitude, variância e desvio padrão.
A amplitude é a medida mais simples de variabilidade e é obtida através da
diferença entre os valores máximo e mínimo da variável em estudo, ou seja:
AMPLITUDE = MÁXIMO – MÍNIMO (3)
Para os dados da Tabela 1, a amplitude é igual a 23 – 17 = 6 cm (ser tão
simples é, ao mesmo tempo, uma vantagem – fácil de aprender e de aplicar –, e
uma desvantagem – só trabalha com os valores extremos, ignorando o resto).
Uma medida de dispersão mais rica de informação do que a amplitude,
deveria utilizar todos os dados disponíveis e uma idéia poderia ser o cálculo
das diferenças entre cada valor e a média. Só que tais diferenças, ao serem
somadas (para se obter uma dispersão total), dão como resultado o valor zero,
qualquer que seja o conjunto de dados (experimente!), o que inviabilizaria o
seu uso. Um modo de contornar esse problema seria considerar essas diferen-
ças ao quadrado e outro seria considerar o módulo das diferenças. Cada um
deles levará a uma medida de dispersão: considerando o quadrado, tem-se a
Variância e considerando o módulo tem-se o Desvio Médio Absoluto (este
não será discutido aqui – ver referências). A Variância é uma média dos qua-
drados das diferenças e calcula-se através da expressão:
Aqui é bom frisar que o intuitivo seria fazer esta média com n no denomina-
dor – questões teóricas, fora do escopo deste texto, nos levam a usar (n – 1),
principalmente em casos onde estamos usando amostras. Quanto à unidade
associada à variância, ela não é a mesma unidade dos dados originais e sim o
quadrado dela – neste exemplo, a unidade da variância é cm
2
. Com os dados
da Tabela 1 temos:
Variância 1,48 cm
2

Variância =
18 25
Variância (4) =


=


= =
∑ ∑
( ) ( ) X
n
X X
n
i
i
n
i
i
n

2
1
2
1
1 1
média
[(19 – 20)
2
+ (18 – 20)
2
+(23 – 20)
2
+ … + (18 – 20)
2
+ (20 – 20)
2
]
(30 – 1)
Iu
xóuuio ii
No entanto, é desejável termos características da variável apresentadas na
mesma unidade dos dados coletados, o que neste caso significa ter uma medi-
da de variabilidade em cm. Define-se, então, uma medida resumo para varia-
bilidade, o Desvio Padrão, que é a raiz quadrada da variância.
Com os dados da Tabela 1, temos Desvio Padrão 1,22 cm (resgatando a
unidade de medida original, que era cm).
Exemplo 1 (cont.): continuando com a análise das famílias A e B, verifique
que a amplitude da família A é 5 cm e que a da família B é 0 cm. Isso já dá
uma boa idéia da diferença entre as famílias, diferença esta que não havia sido
detectada pela média! Daí a importância do cálculo de medidas de variabili-
dade, as quais, acopladas com a média (ou com outras medidas de posição),
permitem uma boa caracterização das variáveis de interesse.
Neste caso, a amplitude já seria suficiente para caracterizar a variabilida-
de, uma vez que temos somente 3 valores. Mas vamos aproveitá-los para o
cálculo do desvio padrão e, para isso, precisamos calcular primeiro a variância.

A:Variância
A
= = = =
A:Variância
A
= 7 cm
2
D.P.
A
= 2,65 cm e D.P.
B
= 0 cm. 7 ≅
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
No caso da t abela de freqüências com os dados da T TT TTab ab ab ab abel a 1, el a 1, el a 1, el a 1, el a 1, como seria feit o o cálculo
da variância? Recalcule e compare com o valor obt ido ant eriorment e.
Verifique que a variância dos dados da família B é igual a zero. A partir da
variância podemos calcular os desvios-padrão (D.P.). Assim:
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Calcule as medidas de variabilidade para as diferenças (mão esquerda - mão direit a).
Discut a.
Quando a variável apresenta uma certa simetria, o intervalo [média – 1
desvio padrão; média + 1 desvio padrão] contém aproximadamente 70% dos
dados; o intervalo [média – 2 desvios padrão; média + 2 desvios padrão]
contém aproximadamente 95% dos dados e o intervalo [média – 3 desvios
padrão; média + 3 desvios padrão] contém aproximadamente 99% dos dados.
Este é um resultado que possibilita ter idéia da amplitude dos dados quando se
conhece a média e o desvio padrão dos mesmos.
Exemplo 2: com os dados da Tabela 1 vamos verificar o que foi dito acima. A
média ( ) é 20 e vamos considerar o desvio padrão como sendo 1,2. Daí vem:
a) – 1 D.P. = 20 – 1,2 = 18,8 + 1 D.P. = 20 + 1,2 = 21,2
b) – 2 D.P. = 20 – 2. 1,2 = 17,6 + 2 D.P. = 20 + 2 . 1,2 = 22,4
c) – 3 D.P. = 20 – 3.1,2 = 16,4 + 3 D.P. = 20 + 3 . 1,2 = 23,6
X
X
X
X
X
X
X
(5)
=
Desvio Padrão Variância
(19 - 22)
2
+ (23 - 22)
2
+ (24 - 22)
2
(-3)
2
+ ( 1)
2
+ (2)
2
9 + 1 + 4
3 -1 3-1 2
:o
x\1vx\1ic\
Para verificar quantos são os valores que estão nos intervalos de interesse,
podemos nos reportar à Tabela 3, que representa os dados da Tabela 1 de
modo ordenado. Verifica-se assim que:
- no intervalo em a, (18,8; 21,2), encontramos 25 valores na Tabela 3 (83%).
- no intervalo em b, (17,6; 22,4), encontramos 28 valores na Tabela 3 (93%).
- no intervalo em c, (16,4; 23,6), encontramos 30 valores na Tabela 3 (100%).
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Para os dados colet ados em classe det ermine a porcent agem dos valores que pert encem
a cada um dos int ervalos definidos acima. Compare com os result ados do Exemplo 2.
Voltando à análise gráfica, vamos terminar a abordagem descritiva com
mais três gráficos, um para variáveis qualitativas e dois deles para variáveis
numéricas. O primeiro será o chamado Gráfico de Setores (informalmente
chamado de gráfico em pizza) que mostramos a seguir e que representa a
proporção de homens e mulheres nos dados apresentados na Tabela 1. Faça,
no espaço em branco, um gráfico de setores utilizando as freqüências da va-
riável (sexo) coletada em classe.
O próximo gráfico é utilizado para variáveis numéricas, como a variável
palmo, em que os valores estão dispostos em classes, numa tabela de freqüên-
cias (Tabela 4). A Tabela 2 é também uma tabela de freqüências, porém, os
dados não estão dispostos em classes, como na Tabela 4. Então, com os da-
dos da Tabela 1, vamos construir uma tabela de freqüências a partir de classes
(ou intervalos), construídas de preferência com a mesma amplitude, com suas
respectivas freqüências. A Tabela 4 dará origem ao gráfico denominado His-
tograma: um gráfico cuja abscissa é formada pelas classes justapostas e cuja
ordenada é formada pelas freqüências absolutas correspondentes a cada clas-
se. Este gráfico pode também ser construído com as freqüências relativas (%)
ou com densidades, mas essas abordagens não serão desenvolvidas aqui.
P PP PPREENCHA REENCHA REENCHA REENCHA REENCHA
freqüência f
1
7
20
2
PALMO
16|–18
18|–20
20|–22
22|–24
Tabela 4
Obs.: O símbolo 16 |-18 significa
i nt erval o f echado à esquerda: o
valor à esquerda, 16, est á incluído
na classe e o valor à direit a, 18, não
est á i ncl uído na cl asse (é equi va-
l ent e à not ação [16, 18[, vi st a na
apost ila 1).
PALMO freqüência f
Const rua a t abela com os dados colet ados na classe
:I
xóuuio ii
O último gráfico que veremos neste tópico é aquele que relaciona duas
variáveis numéricas: diagrama de dispersão, que nada mais é do que a repre-
sentação em um eixo de coordenadas cartesianas de pares associados a duas
variáveis numéricas. A Tabela 5 mostra mais duas variáveis coletadas na amos-
tra dos trinta adultos: a altura e o peso. Normalmente (mas não obrigatoria-
mente) o gráfico de dispersão das variáveis peso e altura mostra um compor-
tamento crescente (aproximadamente linear), com a possível interpretação de
que peso e altura são diretamente proporcionais.
C CC CConst rua um hist ograma para
os dados da variável p al mo p al mo p al mo p al mo p al mo
colet ados na classe.
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Const rua a t abela de freqüências das diferenças ent re as medidas da mão esquerda e da
mão direit a e o correspondent e hist ograma. Use as freqüências relat ivas na ordenada.
Sexo Sexo Sexo Sexo Sexo Peso (Kg) Peso (Kg) Peso (Kg) Peso (Kg) Peso (Kg) Al t ura (m) Al t ura (m) Al t ura (m) Al t ura (m) Al t ura (m)
M 94 1,85
M 99 1,92
M 84 1,75
M 88 1,88
F 70 1,66
F 65 1,58
M 73 1,75
F 72 1,76
F 59 1,60
F 70 1,65
F 80 1,75
M 85 1,75
M 85 1,82
M 85 1,73
F 69 1,72
M 85 1,86
F 66 1,73
M 83 1,72
F 72 1,70
M 83 1,71
F 67 1,63
F 69 1,71
M 99 1,89
M 83 1,81
F 64 1,70
M 94 1,89
F 72 1,74
F 69 1,70
M 83 1,72
M 88 1,79
Tabela 5
::
x\1vx\1ic\
Vê-se acima o gráfico de dispersão das variáveis (peso(x), altura(y)) e,
neste caso, os valores foram separados pela variável sexo. É possível ampliar
o estudo das relações entre duas variáveis numéricas, quer ajustando uma
função, como, por exemplo, uma reta neste caso (ou mesmo duas, uma para o
SEXO masculino e outra para o SEXO feminino), quer calculando a “força”
da relação entre as variáveis através de algum coeficiente (por exemplo, o
coeficiente de correlação linear de Pearson). No entanto, essas abordagens
não serão feitas neste texto, e as referências bibliográficas podem ser consul-
tadas para este fim.
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Colet e na sua classe os dados de alt ura e peso e const rua o gráfico de dispersão com
essas variáveis. Faça sem separar por sexo e depois faça com a separação. Coment e e
compare com o gráfico de dispersão aqui apresent ado.
Finalizando, gostaríamos de mencionar um gráfico de dispersão especial
em que a abscissa é o tempo (anos, meses, dias etc) e a ordenada é o valor da
variável de interesse (cotação do dólar, risco-país,
acompanhamento das marés, vendas de eletrodo-
mésticos etc.) em cada instante: são as chamadas
Séries de Tempo usadas para descrever o compor-
tamento de variáveis ao longo do tempo. A área de
economia é uma das que mais fazem uso das Séries
de Tempo, principalmente para variáveis associa-
das ao mercado financeiro. A seguir, apresentamos
uma Série de Tempo (Folha de São Paulo, 24 de
maio de 2004) que mostra o crescimento dos veí-
culos convertidos para o Gás Natural Veicular (GNV)
no Brasil ao longo dos anos (com ** significando o
valor de uma previsão).
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Colet e os dados do risco-país (você sabe o que é isso?) do primeiro dia út il de cada mês,
de j aneiro de 2004 at é o mês at ual, e const rua o gráfico de Série de Tempo. Você achará
esses dados em jornais de circulação nacional. Coment e o aspect o do gráfico ao longo
do t empo.
Para outros dados, como, por exemplo, dados da Pesquisa Domiciliar ou
mesmo alguns relativos ao Censo, consulte o site www.ibge.gov.br.
Mais do que um arcabouço técnico, o racio-
cínio estatístico é uma forma de pensar e, asso-
ciado ao Cálculo de probabilidades, permite a
investigação de certas regularidades, de padrões
de comportamento, com conclusões tomadas
levando em conta um risco associado. Se estivermos interessados em saber
qual a probabilidade de obter 10 Caras em 10 lançamentos independentes de
uma moeda honesta temos um problema de probabilidade a ser resolvido (e a
resposta é exata: (1/2)
10
). Por outro lado, se temos em mãos uma moeda e
queremos saber se ela é honesta, podemos, por exemplo, jogá-la 10 vezes
(jogadas independentes uma da outra) e observar o resultado. Se o resultado
for 10 Caras, o que podemos concluir sobre a “honestidade” da moeda? Tere-
mos uma conclusão tão precisa quanto a obtida na resposta anterior? A res-
posta é não, pois qualquer que seja nossa decisão sobre a moeda, temos um
risco associado (ou seja, posso dizer que ela não é honesta – e ela ser honesta
– ou posso dizer que ela é honesta – e ela não ser honesta). O primeiro exem-
plo refere-se a um problema de probabilidade e o segundo é um problema
estatístico. De fato, neste segundo exemplo temos uma informação de uma
amostra (resultado de 10 lances de uma moeda) e queremos tirar uma conclu-
são para a população (probabilidade de Cara) – esta operação é chamada de
inferência estatística, e é construída levando-se em conta uma margem de
erro na conclusão, obtida através de raciocínio probabilístico. Na seção ante-
rior vimos como trabalhar com amostras, sob o ponto de vista de análise de
dados. Não abordaremos aqui nesta apostila a análise inferencial (que pode
ser vista nas referências bibliográficas) e passaremos a desenvolver noções
básicas de probabilidade.
Como já comentamos na introdução, a área de probabilidade começou a ser
desenvolvida para responder questões propostas em jogos de azar, desde o sé-
culo XVII, mas a área desenvolveu-se muitíssimo desde então. O termo pro-
babilidade faz parte do senso comum e as pessoas vivem o cotidiano calculan-
do tacitamente algumas probabilidades: desde situações de sua vida pessoal
(organizando-se para chegar ao trabalho no horário, levando em conta as cir-
cunstâncias do tráfego; agasalhando-se ao sair de casa se a previsão do tempo
indicar uma frente fria; não tomando determinados remédios que possam ter
efeitos colaterais em parte das pessoas etc) até tomadas de decisão em sua vida
profissional (abrir um negócio, aplicar dinheiro na Bolsa de Valores etc.).
Trabalharemos aqui algumas noções elementares do cálculo de probabili-
dades, para começar a pensar a incerteza. Antes mesmo de definir o termo
probabilidade, vamos caracterizar três situações distintas:
Uni dade 2
Probabilidade
Or gani zador es
Antôni o Carl os
Br ol ezzi
El vi a Mur eb
Sal l um
Mar tha S.
Montei ro
El abor ador a
Li sbeth K. Cor dani
:a
x\1vx\1ic\
Normalmente as pessoas sugerem como resposta o valor 50% (1/2) para a
Situação A, e argumentam que esta resposta se deve ao fato de os valores
possíveis serem dois (Cara ou Coroa) e os favoráveis apenas um (Cara), o que
produziria o quociente 1/2. Quando se passa à Situação B, em que há também
dois valores possíveis (germinar, não germinar) a resposta imediata é igual à
anterior, mas após uma pequena discussão, perguntando se elas comprariam
uma saca de sementes, em que a probabilidade de germinação por semente
fosse igual a 1/2, imediatamente percebem que não faz sentido aplicar a mes-
ma regra. Geralmente alguém sugere fazer um experimento plantando um
número grande de sementes, para observar quantas germinam. Já com a Situ-
ação C, começam a perceber que os três problemas têm naturezas diferentes e
que nem a primeira situação nem a segunda poderiam ajudar a responder a
pergunta formulada na terceira situação.
A resposta 1/2 para a pergunta da Situação A deve-se, possivelmente, ao
costume de ser usada uma moeda para decidir qual time começa jogando
determinada partida – isso “atestaria” a qualidade de “honestidade” intrínseca
da moeda, dando a mesma chance para qualquer dos dois resultados. Está
aqui então implícita a premissa que deve ser colocada para que a resposta
dada à Situação A seja verdadeira: ambos os resultados (Cara e Coroa) têm a
mesma chance de ocorrer, o que naturalmente levaria ao cálculo da probabili-
dade de Cara no lançamento de uma moeda honesta uma vez, através da cha-
mada definição clássica de probabilidade:
Si t uação A: Si t uação A: Si t uação A: Si t uação A: Si t uação A: qual a probabilidade de
sai r Cara no l ançament o de uma
moeda uma vez?
Si t uação C: Si t uação C: Si t uação C: Si t uação C: Si t uação C: qual a probabilidade de
o Brasil ganhar a próxima Copa do
Mundo de fut ebol?
Si t uação B: Si t uação B: Si t uação B: Si t uação B: Si t uação B: qual a probabilidade de
u ma semen t e g er mi n ar ao ser
plantada?
Para a situação B, ao se fazer o experimento com as sementes, toma-se
como probabilidade o valor para o qual tende a freqüência relativa de semen-
tes germinadas (aqui está implícita a noção de limite, que não será explorada
neste texto) após um número muito grande de ensaios. Assim temos a defini-
ção freqüentista de probabilidade:
Esta definição leva em conta um resultado (Lei dos Grandes Números –
Bernoulli, séc. XVII) que diz que à medida que os ensaios vão aumentando
número de casos favoráveis
número de casos possíveis
P(Cara) =


número de sementes germinadas
número de sementes plantadas
P(germinar)




:-
xóuuio ii
(sementes idênticas plantadas sob as mesma condições), a freqüência relativa
vai se estabilizando e aproximando-se do valor teórico da probabilidade de
germinar.
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Jogue uma moeda 10 vezes e marque a freqüência relat iva de Caras. Repit a para 20
lances, 30 lances, 40 lances e 50 lances. Coloque as freqüências observadas como
ordenadas num gráfico em que a abscissa seja o número de t ent at ivas. Compare com o
result ado dos colegas. Coment e.
Nessa tabela os valores 200 e 200 significam o total de funcionários tanto
do sexo masculino quanto do feminino, sem levar em conta opinião. De modo
análogo, 190 e 210 representam a quantidade de sim e não, respectivamente,
sem levar em conta o sexo. Os valores internos representam conjuntamente
sexo e opinião – por exemplo, há 140 funcionários que são do sexo feminino
e que responderam sim.
Op i ni ão Op i ni ão Op i ni ão Op i ni ão Op i ni ão
Sexo Sexo Sexo Sexo Sexo
M MM MM 50 150 200 200 200 200 200
F FF FF 140 60 200 200 200 200 200
t o t al t o t al t o t al t o t al t o t al 190 190 190 190 190 210 210 210 210 210 400 400 400 400 400
si m si m si m si m si m n ão n ão n ão n ão n ão t o t al t o t al t o t al t o t al t o t al
Bem diferente dessas duas abordagens é a Situação C, sobre a probabili-
dade de o Brasil ganhar a próxima Copa do Mundo de futebol. Neste caso,
não é razoável pensar nem em aplicar a definição clássica (que teria que su-
por que as possibilidades têm igual chance de ocorrer) e nem a definição
freqüentista (pois não há como gerar dados através de repetição). A resposta
será de caráter individual, baseada tanto em desempenhos anteriores (regis-
tros históricos) da seleção brasileira e das demais participantes, como no co-
nhecimento do estágio atual das mesmas e ainda em um “sentimento” particu-
lar, que pode mudar de indivíduo para indivíduo. O caráter subjetivo desta
situação sugere a definição de probabilidade subjetiva, que é a opinião indivi-
dual sobre determinado resultado, a qual pode ou não ser baseada em infor-
mação anterior (informação a priori). Assim, podemos chamar genericamen-
te de p a Probabilidade (Brasil ganhar a próxima Copa do Mundo de Fute-
bol) – alguém pode colocar 0,8 (80%) ou 0,30 (30%) ou qualquer outro valor
entre 0 e 1 (ou entre 0% e 100%) .
O que há de comum entre essas três abordagens é que, para todos, a pro-
babilidade (p) é um número entre 0 e 1 que goza de algumas propriedades e,
em cada situação, devemos verificar o processo mais adequado para calculá-
la. Resumindo, temos que 0 p 1.
Exemplo 3: havia um boato na empresa MEX de que os funcionários estariam
descontentes com o salário. O diretor de RH resolveu fazer uma pesquisa
entre os seus 400 funcionários, os quais foram chamados a responder sim ou
não à seguinte pergunta:
Você aceita uma redução de jornada com redução de salário?
Os resultados foram registrados na chamada tabela de contingência como
segue:
≤ ≤
:o
x\1vx\1ic\
O gerente faz um sorteio aleatório de uma viagem entre todos os 400
funcionários. Por sorteio aleatório entende-se um processo em que todos os
elementos têm igual probabilidade de serem sorteados – por exemplo, nume-
rar todos os funcionários, colocar os números em uma urna e sortear um ele-
mento da urna. Este sorteio é encarado como um processo normalmente de-
nominado de experimento.
Vamos olhar os resultados possíveis dentro de três perspectivas: a) sexo
do sorteado; b) opinião do sorteado; c) sexo e opinião do sorteado. Na primei-
ra perspectiva, o conjunto de todos os resultados possíveis seria {M,F}. Na
segunda, o conjunto de todos os resultados possíveis seria {SIM, NÃO} –
nessas duas primeiras perspectivas estamos somente interessados no compor-
tamento marginal do elemento sorteado, ou seja, quero saber algo sobre a
variável sexo ou algo sobre a variável opinião. A terceira perspectiva é relaci-
onada ao elemento sorteado sob o ponto de vista de sexo conjuntamente com
opinião e o conjunto de todos os resultados possíveis seria {M SIM, M NÃO,
F SIM, F NÃO}. Esses elementos descritos no último conjunto são os compo-
nentes do interior da tabela deste exemplo.
Trabalhar com probabilidades pode ser simplificado se usarmos os dados
dispostos em tabelas, ou ainda se considerarmos diagramas de árvore. Vamos
considerar o experimento de sortear ao acaso um funcionário dentre os 400
funcionários (já descrevemos o sorteio) e como o sorteio é aleatório (por su-
posição) todos os funcionários têm a mesma chance de serem sorteados. En-
tão, nesse caso, para o cálculo de probabilidades, faz sentido pensar na defi-
nição clássica já vista anteriormente e é este esquema que vamos adotar. Va-
mos responder, uma a uma, às seis perguntas seguintes, sempre com referên-
cia ao sorteio do funcionário e você, em alguns casos, poderá se reportar
implicitamente a elementos da teoria de conjuntos (como, por exemplo, as
noções de união e intersecção):
1 – qual a probabilidade de o sorteado ser do sexo feminino?
2 – qual a probabilidade de o sorteado ter dito não?
3 – qual a probabilidade de o sorteado dizer não ou ser do sexo feminino?
4 – qual a probabilidade de o sorteado ter dito não e ser do sexo feminino?
5 – qual a probabilidade de o sorteado ter dito sim e ser do sexo feminino?
6 – qual a probabilidade de o sorteado ser do sexo feminino dado que respon-
deu não?
Respostas:
1 – P(F) = ? Resposta: P(F) = (200/400) = 1/2 = 0,5 (ou 50%)
2 – P(NÃO) = ? Resposta: P(NÃO) = (210/400) = 0,525 (ou 52,5%)
As respost as às quest ões 1 e 2 foram obt idas diret ament e dos valores marginais, ou seja,
200 funcionários do sexo feminino ent re os 400 funcionários e 210 funcionários que
responderam não à pergunt a ent re os 400 funcionários.
3 –P ( NÃO ou F) = ? (União )
Resposta: P (NÃO ou F)= (210 + 200 – 60)/400 = (350/400)= (7/8) =
= 0,875 (ou 87,5%)
U
:,
xóuuio ii
A respost a à quest ão 3 foi obt ida at ravés da verificação de quant os funcionários podem
ser ou NÃO ou F, ou mesmo ambos, ou seja, é a união ent re os funcionários NÃO com os
funcionários F. Vej a que são ret irados da soma os 60 funcionários que foram cont ados
duas vezes.
A respost a à quest ão 4 foi obt ida diret ament e do valor do int erior da t abela, ou sej a,
dent re os 400 funcionários, 60 responderam não e ao mesmo t empo são do sexo feminino.
A quest ão 5 t em raciocínio análogo. Verifique!
A respost a à quest ão 6 levou em cont a a informação, ou sej a, podemos pensar que,
quando foi feit o o sort eio o diret or olhou o result ado e avisou: o funcionário sort eado
respondeu não! Com essa informação, o t ot al de funcionários diminuiu de 400 para 210,
que é o t ot al marginal para as respost as não e ent ão o denominador para o cálculo da
probabilidade fica sendo 210 e o numerador é igual ao número mulheres na cat egoria
não (60).
Vamos agora dar uma forma alternativa à resposta da questão – P (F |
NÃO) – através da definição de probabilidade condicional (sabendo que =
condicionado a)
P (F | NÃO) = [ P (F e NÃO)] / (P(NÃO)] (8)
4 – P(NÃO e F) = ? (Intersecção )
Resposta: P(NÃO e F) = (60/400) = 0,15 (ou 15%).
U
5 – P(SIM e F) = ? Resposta: P (SIM e F) = (140/400) = 0,35 (35%)
Antes de passarmos a discutir a próxima questão, vamos voltar à questão
3, que trata da probabilidade da união de dois eventos. Genericamente, para
dois eventos A e B, a probabilidade de A ou B (A união B) é dada por
P(A B) = P(A) +P(B) – P(A B)
Evidentemente, se a intersecção for vazia, temos que a probabilidade as-
sociada é nula, e dizemos que A e B são eventos disjuntos. Vem então que, se
A e B forem eventos disjuntos (ou mutuamente exclusivos),
P(A B) = P(A) + P(B)
Como responder à questão 6? Aqui surge uma linguagem nova: dado que.
Isso significa que queremos um valor de probabilidade, mas temos alguma
informação adicional (dado que = sabendo que). A notação que usaremos
para dado que será uma barra vertical | , como a seguir:
6 – P (F dado NÃO) = P (F | NÃO) = ?
Resposta: P (F | NÃO) = (60/210) 0,286 (ou 28,6%).
(6)
(7)

U
U
U
:8
x\1vx\1ic\
Com os resultados já calculados, e com P (F e NÃO) = P (NÃO e F) (veri-
fique!), vem
P (F | NÃO) = [0,15 / 0,525] 0,286 (ou 28,6%),
com resposta igual à já obtida diretamente da tabela.
Através da expressão (6) podemos derivar uma expressão formal para a
probabilidade conjunta, como nas questões 4 e 5, ou seja:

Verifique que P (NÃO | F)
é igual a (60/ 200) = 0,30
(ou 30%)!
(9)
P(NÃO e F) = P(F e NÃO) = P(F |NÃO).P(NÃO) = P(NÃO |F).P(F)
P(SIM e F) = P(F e SIM ) = P(F |SIM).P(SIM) = P(SIM |F).P(F)
Vamos retomar a questão 6 para introduzir um novo conceito: indepen-
dência entre eventos. Nessa questão, calculamos a probabilidade condicional
de o sorteado ser do sexo feminino sabendo que a resposta foi não, isto é, P (F
| NÃO). O resultado foi aproximadamente 0,286 ou, em termos percentuais,
28,6%, o que significa que sabendo que a resposta foi não, a probabilidade de
o sorteado ser do sexo feminino é de 28,6%. Na questão 1, vimos que a proba-
bilidade de o sorteado ser do sexo feminino é de 50%, o que mostra que quan-
do damos a informação de que a resposta foi não, a probabilidade de ser do
sexo feminino diminui substancialmente (de 50% para 28,6%). Isso significa
que os eventos resposta não e sexo feminino são dependentes, pois a informa-
ção de que um ocorreu muda a probabilidade de o outro ocorrer.
Voltando à explicação dada na questão 6, quando o diretor avisou que o
funcionário sorteado tinha respondido não, os funcionários do sexo feminino
já viram suas chances diminuírem, pois com resposta não havia 150 homens
e somente 60 mulheres, ou seja, repetindo, saber que a resposta do funcioná-
rio sorteado foi não diminuiu a chance do sorteado ser do sexo feminino. Sob
o ponto de vista da pesquisa que deu origem à tabela, é fácil ver então que as
mulheres, diferentemente dos homens, aceitam, em sua maioria, a redução de
jornada com redução de salário.
De um mod o g er al , d i zemos q ue d oi s event os A e B são
i ndependent es i ndependent es i ndependent es i ndependent es i ndependent es quando a informação de que B ocorreu não alt era
a probabilidade da ocorrência de A, ist o é, (P(A|B) = P(A)) (P(A|B) = P(A)) (P(A|B) = P(A)) (P(A|B) = P(A)) (P(A|B) = P(A)). No caso
descrit o acima, os event os F FF FF e NÃO NÃO NÃO NÃO NÃO são dependent es.
(10)
A última afirmação implica que se A e B forem eventos independentes,
então
pois, de acordo com a definição de independência, P(A|B) = P(A). A expres-
são (11) pode ser usada como alternativa à definição (10) para verificar se
dois eventos são independentes.
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Com os dados do Exemplo 3 most re, usando a expressão (11), que os event os NÃO e F
são dependent es (ou não são independent es).
(11) P(A B) = P(A) . P(B)
U
:u
xóuuio ii
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Most re que dois event os disjunt os não são independent es.
Ao conjunto de todos os resultados possíveis associados a um experimen-
to dá-se o nome de Espaço Amostral (S) e os subconjuntos do espaço amostral
são chamados de Eventos (ver pág. 26). Se o experimento relacionar-se a
características numéricas contínuas – por exemplo, o tempo de duração de
uma lâmpada sorteada ao acaso de um lote de lâmpadas –, o espaço amostral
poderia ser descrito como {t | t 0}. Contudo, nesta apostila só abordaremos
situações numéricas discretas.

T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Usando os dados do Exemplo 3, most re que:
P(SIM) = 1 – P(NÃO) e que P(M) = 1 – P(F). Ou sej a,
P(A) = 1 – P(A AA AA
c cc cc
) )) )), para A U A AA AA
c cc cc
= S (esp aço amost ral ). = S (esp aço amost ral ). = S (esp aço amost ral ). = S (esp aço amost ral ). = S (esp aço amost ral ).
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
- descreva um espaço amost ral associado ao lançament o de uma moeda duas vezes;
- descreva um espaço amost ral associado aos gols de uma part ida de fut ebol;
- descreva um espaço amost ral associado à colet a de peso de recém-nascidos.
Em seguida, faremos uma representação ainda do mesmo problema dos
funcionários, em que um deles é sorteado, através do diagrama de árvore, o
que muitas vezes torna mais fácil a visualização dos resultados e das respecti-
vas probabilidades.
Podemos começar o diagrama por uma ou por outra característica – va-
mos começar pela opinião. Partindo do princípio de que o sorteado ou é do
sexo feminino ou do sexo masculino, construiremos dois ramos iniciais partin-
do do mesmo ponto e depois prosseguimos com os outros ramos referentes à
característica sexo (M ou F), conforme segue:
P(SIM e M) = (190/400).(50/190)
= 0,125 (ou 12,5%)
P(SIM e F) = (190/400).(140/190)
= 0,35 (ou 35%)
P(NÃO e M) = (210/400).(150/210)
= 0,375 (ou 37,5%)
P(NÃO e F) = (210/400).(60/210)
= 0,15 (ou 15%)
M
F
M
F
SIM
NÃO
190/400
210/400
50/190
140/190
150/210
60/210
P(M | SIM)
,o
x\1vx\1ic\
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
No espaço a seguir, faça um diagrama de árvore iniciando pela caract eríst ica sexo.
Verifique que o conj unt o dos result ados associados aos caminhos const it ui o espaço
amost ral já vist o.
O diagrama de árvore tem todos os ramos e probabilidades associados ao
experimento de sortear um indivíduo da tabela inicialmente apresentada. Os
ramos iniciais, antes do “traço” vertical, representam eventos marginais da
tabela e as probabilidades também podem ser chamadas de marginais. Como
já havia sido visto na questão 2, P(NÃO) = (210/400) = 0,525. Como com
relação à OPINIÃO há somente duas possibilidades, podemos encontrar a
P(SIM) pelo complementar, ou seja, P(SIM) = 1 – P(NÃO) = 1 – 0,525 = 0,475
(= 190/400). Depois do “traço”, os eventos são considerados condicionais e
devem levar em conta a ocorrência antes do “traço”. Assim, o valor 50/190 é
P(M|SIM). O valor da probabilidade pedida na questão 6 é obtido diretamente
no último ramo após o traço, ou seja, P(F|NÃO) = 60/210 0,286 (28,6%).
Ainda observando a árvore, vemos que ao percorrer os caminhos, desde o
nó inicial, temos quatro resultados, SIM M, SIM F, NÃO M e NÃO F, cujas
probabilidades podem ser obtidas através do produto dos ramos correspon-
dentes. Na verdade, isso não é novidade, pois as relações vistas anteriormente
permitem fazê-lo, ou seja, cada probabilidade pode ser calculada pelo produ-
to entre uma probabilidade marginal e uma condicional. De fato, temos, por
exemplo, para cálculo de P(NÃO e F) o produto (210/400).(60/210) = 0,15
(ou 15%, valor já obtido como resposta à questão 4).
Veremos a seguir uma aplicação do diagrama de árvore para um problema
da área financeira.
Exemplo 4
(FUVEST 2000). Um investidor quer aplicar 120 mil reais. Seu corretor lhe
oferece um investimento em duas fases, com as seguintes regras:
I) Na primeira fase do investimento, ocorrerá um entre os dois eventos seguin-
tes: com probabilidade p, o investidor ganha metade do que investiu; com
probabilidade (1-p), o investidor perde 1/3 do que investiu.

,I
xóuuio ii
II) Na segunda fase do investimento, a quantia final da primeira fase será
reinvestida, de forma independente da primeira fase. Neste novo investimen-
to, ocorrerá um dentre os dois eventos seguintes: com probabilidade 1/2, o
investidor ganha a quarta parte do que foi reinvestido; com probabilidade 1/2,
o investidor perde metade do que foi reinvestido.
a) Se o investidor aplicar seu dinheiro desta forma, com que valores pode
ficar ao término do investimento? Qual a probabilidade, em função de p, de
ficar com cada um desses valores?
b) Uma revista especializada informa que, neste investimento, a probabilida-
de de perder dinheiro é de 70%. Admitindo como correta a informação da
revista, calcule p.
Vamos resolver esse problema aplicando o diagrama de árvore:
Ganha: (1/2)p
Perde: (1/2)p
Ganha: (1/2)p (1-p)
Perde: (1/2)p (1-p)
225.000
90.000
100.000
40.000
180.000
80.000
p
(1-p)
1/2
1/2
1/2
1/2
Quantia inicial: R$ 120.000,00
Observação: A premissa de que a segunda fase é independente da primeira
fase permite colocar na segunda parte dos ramos os valores 1/2 e 1/2 direta-
mente.
Resposta:
a) O investidor pode ficar com qualquer dos seguintes valores (e respectivas
probabilidades): R$ 225 000,00 [(½)p], R$ 90 000,00 [(½)p], R$ 100 000,00
[½(1-p)] ou R$ 40 000,00 [½(1-p)].
b) Levando em conta as quatro possibilidades, o investidor só não perde na
primeira delas. Como, segundo a revista, a probabilidade de perder é de 70%,
a probabilidade de não perder (complementar!) é de 30% e temos então que
(½) p = 0,30. Portanto p = 0,60.
Outra maneira de chegar a este resultado é igualar a probabilidade de
perder a 70%, ou seja,
P(perder) = [(½)p+ (½)(1-p)+( ½)(1-p)] = 0,70,
o que produz o resultado p = 0,60 (confira!).
,:
x\1vx\1ic\
Os exemplos analisados neste tópico de probabilidades procuraram dar
sentido aos conceitos, através de esquemas simples quer seja com tabelas ou
através de diagramas de árvore, sempre no contexto discreto. No entanto,
para experimentos mais sofisticados, ainda no âmbito do discreto, por exem-
plo, o caso em que o número de ramos se torna proibitivo, temos que recorrer
a técnicas de contagem para o cálculo de probabilidades e a área de análise
combinatória, que será desenvolvida na próxima seção, fornecerá elementos
para que esses cálculos sejam facilitados. O leitor, interessado em probabili-
dades associadas a experimentos em que a característica medida é contínua,
achará material nas referências bibliográficas.
A seguir, temos um resumo dos principais resultados descritos nesta seção
para eventos genéricos A e B (associados a um espaço amostral S).
Pr ob ab i l i d ad e d a Uni ão Pr ob ab i l i d ad e d a Uni ão Pr ob ab i l i d ad e d a Uni ão Pr ob ab i l i d ad e d a Uni ão Pr ob ab i l i d ad e d a Uni ão
P(A ou B) = P(A B) = P(A) +P(B) – P(A B)
Pr ob ab i l i d ad e Cond i ci onal Pr ob ab i l i d ad e Cond i ci onal Pr ob ab i l i d ad e Cond i ci onal Pr ob ab i l i d ad e Cond i ci onal Pr ob ab i l i d ad e Cond i ci onal
P(A | B) = P(A B) / P(B) para P (B) 0
Pr ob ab i l i d ad e Conj unt a Pr ob ab i l i d ad e Conj unt a Pr ob ab i l i d ad e Conj unt a Pr ob ab i l i d ad e Conj unt a Pr ob ab i l i d ad e Conj unt a
P(A B) = P(A|B) . P(B) = P(B|A) . P(A)
Se A e B são i ndep endent es ent ão Se A e B são i ndep endent es ent ão Se A e B são i ndep endent es ent ão Se A e B são i ndep endent es ent ão Se A e B são i ndep endent es ent ão
P(A B) = P(A) . P(B)

U
U
U
U
U
Qual é a chance de se ganhar na Loto ou na Mega-Sena? E na Loteria
Esportiva? Calcular a probabilidade de se ganhar num jogo de azar passa
muitas vezes por conhecer todos os elementos com os quais se está lidando e
depois quais desses são os elementos “ganhadores”. Por exemplo, se uma
moeda é lançada duas vezes, sucessivamente, temos quatro possíveis resulta-
dos: (cara, cara), (coroa, cara), (cara, coroa) e (coroa, coroa). Se “ganhamos”
quando obtivermos exatamente duas caras, então, se a moeda for honesta, só
temos uma chance em quatro de ganhar. Neste caso foi fácil contar quantos
são os casos possíveis (espaço amostral) e quantos são os (eventos) favorá-
veis. E se fossem 50 lançamentos? E no caso de jogos como da Loto ou da
Mega-Sena, quantas são todas as combinações possíveis de números?
Assim, para a resolução de problemas desse tipo, é essencial conhecer a
quantidade de elementos de determinados conjuntos, sem ter que, efetiva-
mente, listá-los e contá-los. Em outras situações concretas também é necessá-
rio saber o número de elementos de determinados conjuntos.
Uni dade 3
Combinatória*
Quant os carros podem ser lacrados na cidade de
São Paulo com placas com 3 let ras e 4 algarismos?
Problemas relacionados à contagem de elementos de um conjunto são trata-
dos numa área da matemática conhecida como Análise Combinatória, ou ape-
nas Combinatória. O estudo de problemas desse tipo é muito antigo e chamou
a atenção de muitos matemáticos importantes como L. Euler (1707-1783) e B.
Pascal (1625-1662), entre outros. Essa área tem tido um grande crescimento
nas últimas décadas, devido ao desenvolvimento da ciência da computação.
Problemas de enumeração (contagem) aparecem com muita freqüência em
teoria dos grafos, em análise de algoritmos etc. Muitos problemas importan-
tes podem ser modelados matematicamente usando a teoria dos grafos (pro-
blemas de pesquisa operacional, de armazenamento de informações em ban-
cos de dados nos computadores e também problemas matemáticos teóricos,
como o famoso problema das 4 cores, que veremos mais adiante).
O nosso principal objetivo aqui será o de estudar algumas técnicas e con-
ceitos que permitam a contagem de certos tipos de conjuntos finitos. Veremos
*Parcialmente baseado no material de Cerri, C.; Druck, I. F. e Pereira, A. L. Combinatória Sem Fórmulas,
do Projeto Pró-Ciências da Fapesp (2002) e do Projeto PEC-Construindo Sempre-PEB II, USP-SEE
(2003).
Or gani zador es
Antôni o Carl os
Br ol ezzi
El vi a Mur eb
Sal l um
Mar tha S.
Montei ro
El abor ador a
Cr i sti na Cer r i
,a
x\1vx\1ic\
que muitos problemas de contagem podem ser tratados usando apenas alguns
princípios básicos. Vamos enfatizar a compreensão plena do problema trata-
do e o reconhecimento da técnica adequada em cada caso, não as fórmulas,
que são muito úteis, mas resolvem apenas tipos especiais de problemas.
Vamos começar discutindo um problema simples de contagem. Em um car-
dápio de um restaurante italiano estão listados 5 tipos de massas e 7 tipos de
molhos distintos. Quantos pedidos distintos podem ser feitos? É fácil obter a
resposta: 35. Foi utilizado um princípio básico de contagem: para cada tipo de
massa escolhida tem-se 7 molhos diferentes para escolher, e assim, temos 5 x 7
diferentes pratos.
Vamos retomar o problema das placas de carros na cidade de São Paulo.
Quantas placas de automóveis podem ser formadas usando-se três letras (in-
clusive K, Y e W) e quatro algarismos? Veja o esquema abaixo de uma placa
de automóvel:
Para formar uma placa, temos que escolher uma letra entre 26 para colo-
car na primeira posição. Escolhida essa letra, temos 26 escolhas possíveis
para a segunda posição. Então temos 26 x 26 = 676 possibilidades de preen-
chimento das duas primeiras letras da placa. Mas ainda temos que preencher
mais uma casa com uma letra. Assim podemos ter 26 x 26 x 26 = 17.576
maneiras de preencher a placa com 3 letras. Falta ainda colocar os 4 algaris-
mos. Em cada posição temos 10 escolhas de algarismos. Então temos 10 x 10
x 10 x 10 x 10 = 10.000 possibilidades. Portanto, no total teremos 175.760.000
placas. Como para cada carro temos apenas uma placa, esta é a quantidade de
carros que podem ser lacrados na cidade de São Paulo!
Neste caso, esta técnica de efetuar a contagem foi eficiente.
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Você fará um exame cuj a prova é compost a de 10 quest ões de múlt ipla escolha com 5
alt ernat ivas por quest ão cada uma. Quant os são os gabarit os possíveis?
Vejamos mais um exemplo.
Uma bandeira é formada por quatro listras que
devem ser coloridas com até 4 cores, por exemplo,
amarelo, vermelho, branco e preto, não devendo
ter listras adjacentes com a mesma cor. De quantos
modos a bandeira pode ser colorida?
Podemos pintar a primeira listra com 4 cores
diferentes e a segunda listra com 3 cores. Mas 3
cores podem ser usadas para pintar a terceira listra,
pois pode-se repetir a cor usada na primeira listra.
E finalmente podemos usar 3 cores para pintar a
quarta listra. Portanto temos 4 x 3 x 3 x 3 = 108
bandeiras diferentes.
Nos problemas acima, usamos um princípio
básico de contagem que pode ser escrito, na forma
geral, da seguinte maneira.
1
a
2
a
3
a
1
o
2
o
3
o
4
o
let ra let ra let ra algarismo algarismo algarismo algarismo
1
a
2
a
3
a
4
a
list ra list ra list ra list ra
,-
xóuuio ii
Pr i ncíp i o d a Mul t i p l i cação Pr i ncíp i o d a Mul t i p l i cação Pr i ncíp i o d a Mul t i p l i cação Pr i ncíp i o d a Mul t i p l i cação Pr i ncíp i o d a Mul t i p l i cação
Se uma decisão d
1
pode ser t omada de p
1
maneiras e se, uma vez t omada a decisão d
1
, a
decisão d
2
puder ser t omada de p
2
maneiras, ent ão o número de maneiras de se t omarem
as decisões d
1
e d
2
é p
1
x p
2
maneiras.
Facilmente, o princípio acima pode ser generalizado para uma quantidade
finita de decisões.
Agora, usando o princípio da multiplicação, resolva alguns problemas de
contagem.
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Em uma est ant e exist em 5 livros em espanhol, 6 em francês e 3 em inglês. De quant as
maneiras posso escolher 2 livros sem escolher dois da mesma língua?
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
- Quant os números nat urais de 3 algarismos dist int os exist em? (Prest e at enção: as
decisões envolvidas podem ser t omadas em várias ordens. Qual é a mais convenient e?)
- Quant os números nat urais pares de 3 algarismos dist int os exist em? (Qual a dificuldade
maior dest e problema?)
Um outro princípio elementar de contagem diz respeito ao número de
elementos da união de conjuntos.
Um problema de contagem muito interessante é o seguinte: ao se colorir
um mapa, pode-se usar a mesma cor mais de uma vez, desde que dois países
que têm fronteira comum sejam pintados de cores diferentes. Usando no má-
ximo 4 cores, de quantas maneiras se pode colorir um mapa formado pelos
seguintes países: Brasil, Uruguai, Argentina e Paraguai? E um mapa formado
por Brasil, Uruguai, Argentina, Paraguai e Chile? E pelos países Brasil, Ar-
gentina, Paraguai e Bolívia?
Usando no máximo 3 cores, seria possível pintar um mapa formado pelos
países Brasil, Uruguai, Argentina e Paraguai? E o mapa formado por Brasil,
Argentina, Paraguai e Bolívia?
O Prob l ema das 4 Cores O Prob l ema das 4 Cores O Prob l ema das 4 Cores O Prob l ema das 4 Cores O Prob l ema das 4 Cores.
Na resolução do problema ant erior, você percebeu que, em alguns casos, não se pode usar
menos de 4 cores para pint ar um det erminado mapa. Mas, fazendo alguns t est es, percebe-se
que é possível pint ar vários mapas com at é 4 cores. Será possível pint ar qualquer mapa com
at é 4 cores? Est e at raent e problema pode ser formulado mat emat icament e, já que “mapas”
não deixam de ser subdivisões do plano que não se sobrepõem. O Problema das 4 Cores,
como é conhecido hoje, foi propost o pela primeira vez em 1852, por Francis Gut hrie. Cont udo,
só foi publicado em 1878, após t er sido est udado por vários mat emát icos da época. Em 1879,
Kempe apresent ou a primeira “demonst ração” da conj ect ura, cuj o erro foi descobert o por
Heawood, que provou que o result ado era verdadeiro para 5 cores. Finalment e, depois de
muit os anos e esforços, o result ado foi provado em 1977 por K. Appel e W. Haken. Porém, a demonst ração fez uso de
mais de 1200 horas de processament o (isso mesmo, comput ador!), o que provocou grandes discussões sobre a
validade da prova. Recent ement e, em 1997, N. Robert son, D. Sanders, P. Seymour e R. Thomas encont raram uma
resolução mais simples, mas ainda dependent e do auxílio de comput adores.
Pr i ncíp i o da Adi ção Pr i ncíp i o da Adi ção Pr i ncíp i o da Adi ção Pr i ncíp i o da Adi ção Pr i ncíp i o da Adi ção
Se A e B são dois conj unt os disj unt os, com p e q element os respect ivament e, ent ão
A B possui p+q element os. U
,o
x\1vx\1ic\
O problema das 4 cores é um típico problema de Teoria dos Grafos. Um
“grafo” é um tipo de diagrama com vértices e linhas. Podemos fazer um es-
quema do problema das 4 cores usando um diagrama do tipo,
onde cada vértice é um país. Uma linha ligando os vértices significa que os
países têm fronteiras em comum. Um outro problema fascinante deste tipo é o
Problema das Sete Pontes de Königsberg, que foi resolvido por L. Euler em
1735. Como este é um assunto bastante vasto, não o discutiremos aqui. Se
você ficou interessado, leia sobre o problema na Revista do Professor de Ma-
temática (Alguns problemas clássico sobre grafos, n. 12, 1988) ou no site
http://www.prof2000.pt/users/agnelo/pontesh.htm.
Voltemos aos problemas de contagem.
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
- De quant os modos 3 pessoas podem se sent ar em 5 cadeiras em fila? (Respost a 60)
- Quant os números de quat ro dígit os são maiores que 2400 e
(a) t êm t odos os dígit os diferent es? (Respost a 3864)
(b) não t êm dígit os iguais a 3, 5 ou 6? (Respost a 1567)
(c) sat isfazem às duas condições acima simult aneament e? (Respost a 560)
- Quant os subconjunt os possuem um conjunt o de n element os? (Respost a 2
n
)
Discut a com seus colegas o raciocínio usado em cada resolução, pois às vezes obt ém-se
a respost a corret a por mét odos incorret os.
Vamos fazer algumas generalizações. Consideremos n objetos distintos. De
quantas maneiras n objetos diferentes podem ser ordenados? De quantas for-
mas podemos permutá-los? A resposta é fácil agora: n(n-1).(n-2)...3.2.1=n! Se,
por outro lado, desejamos saber de quantos modos podemos ordenar m objetos
dentre os n, logo m n, a resposta é de
maneiras.
ELIMINANDO REPETIÇÕES
Vamos ver agora outros tipos de problemas de contagem.
Quantas comissões de 4 alunos podem ser formadas numa classe de 7
alunos?
Para o primeiro lugar da comissão temos 7 escolhas, para o segundo lugar
6 escolhas, para o terceiro lugar 5 escolhas e para o quarto lugar 4 escolhas, o
que nos dá, pelo princípio da multiplicação, 7.6.5.4 = 840 escolhas de 4 alu-
nos. Entretanto, 840 não é a quantidade total de comissões! Note que a co-
missão formada pelos alunos A, B, C e D é a mesma daquela formada por B,
D, C e A. Precisamos saber quantas vezes cada comissão foi contada repe-
tidamente. Fixemos 4 alunos (uma comissão). De quantas maneiras podemos
formá-la? Chamando um aluno por vez, para a primeira chamada temos 4
opções, para a segunda 3, para a terceira 2 e para a quarta apenas 1. Logo
≤ n n n n m
n
n m
( ) ( )...( )
!
( )!
− ⋅ − − + =

1 2 1
,,
xóuuio ii
10
2 2 3
!
! ! !
840
24
35 =
4
2
12
!
!
=
podemos chamar os alunos de 4.3.2.1=24 maneiras diferentes. Assim temos
que, das 840 escolhas, cada grupo de 24 representa a mesma comissão. Portanto,
o total de comissões será de .
A seguir, vamos ver outra situação onde se deve usar a divisão para elimi-
nar repetições e efetuar a contagem.
Um anagrama é um código formado pela permutação das letras de uma
palavra, podendo ou não originar palavras com significado.
Quantos são os anagramas da palavra CASA?
Se as 4 letras fossem distintas então teríamos 4! = 24 anagramas. Neste
caso, estamos pensando que A C S A é diferente de A C S A. Só que temos a
mesma palavra A C S A. Assim, como cada anagrama foi contado duas vezes
(que é o número de permutações dos dois A’s) temos na verdade anagra-
mas diferentes.
Quantos são os anagramas da palavra MATEMATICA?
Se as 10 letras fossem todas diferentes, uma aplicação simples do princí-
pio da multiplicação forneceria 10! anagramas. Entretanto, podemos permu-
tar os 2 T’s, os 2 M’s e, ignorando o acento, também os 2 A’s. Isso significa que
cada anagrama está sendo contado 2!2!3! vezes. Portanto, existem
anagramas distintos.
Vamos analisar mais uma situação.
Qual é o número de rodas de ciranda distintas que
podem ser formadas com 6 crianças?
Temos certamente 6! filas de crianças. Entretanto, quan-
do organizadas em um círculo, duas filas formam a mesma
roda de ciranda se houver coincidência das crianças após
uma rotação de uma das rodas (ver o diagrama a seguir).
Podíamos dizer que tais filas são “equivalentes”.
Dessa forma, 6 filas distintas originam
uma mesma roda de ciranda. Portanto, o
número de rodas de ciranda é
6
6
5
!
! =
Em cada situação anterior, a divisão foi utilizada aqui para eliminar as
repetições. Identificando os elementos que são “iguais” podemos, usando a
divisão, eliminá-los da contagem.
Examinando mais detalhadamente os últimos exemplos, percebemos que
podemos dar um tratamento mais geral para situações onde a divisão é usada
para eliminar repetições em problemas de contagem.
Considere a seguinte situação: um conjunto A contém elementos de diver-
sos tipos distintos, digamos, tipo 1, tipo 2, tipo 3, ... tipo k. Se o número de
elementos de cada tipo é n
k
, então o número total de elementos de A é (n
1
+ n
2
+...+ n
k
), ou seja, a soma do número de elementos de cada tipo. Em particular,
se o número de elementos de cada tipo é sempre igual a m, então o número de
elementos de A é obviamente k.m.
,8
x\1vx\1ic\
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
- Em uma classe de 15 alunos, quant as filas formada por 7 alunos podem ser formadas?
E quant as comissões?
- Se o conjunt o C possui 9 element os, quant os são os subconjunt os de C com 4 element os?
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Uma comissão formada por 3 homens e 3 mulheres deve ser escolhida em um grupo de
8 homens e 5 mulheres. Quant as comissões podem ser formadas? (Respost a 560)
Qual seria a respost a se um dos homens não aceit asse part icipar da comissão se nela
est ivesse det erminada mulher? (Respost a 434)
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
De quant os modos 9 crianças podem formar uma roda de ciranda de modo que duas
dessas crianças permaneçam junt as? (Respost a 2!.7!)
E de modo que 4 dessas crianças permaneçam j unt as? (Respost a 3!.5!)
FAZENDO GENERALIZAÇÕES
Do que discutimos até aqui podemos ver que alguns problemas de contagem
são muito semelhantes e envolvem sempre o mesmo tipo de raciocínio e cálculo.
Numa escolha de m objetos dentre n objetos distintos, no qual m < n, a
ordem em que fazemos a escolha determina objetos diferentes. Em todas essas
situações, o número de escolhas possíveis é n(n-1).(n-2)...(n-m+1). Por serem
muito freqüentes recebem um nome especial: arranjo simples de m elementos
em n, ou como é mais comum, arranjo de n elementos tomados m a m. Uma
notação bastante usada para indicar esse resultado é
Em outras situações, temos que fazer uma escolha de m objetos dentre n
objetos, onde m < n, e a ordem em que fazemos a escolha não determina obje-
tos diferentes. Se a ordem fosse relevante, obteríamos n(n-1).(n-2)...(n-m+1)
coleções de objetos. Só que essa quantidade de coleções é maior do que a
correta, já que as coleções estão sendo contadas várias vezes. Para eliminar
essas repetições usamos, então, a divisão, como nos exemplos vistos anterior-
mente. O número de coleções é:
Como também essa situação é bastante comum, ela recebe um nome espe-
cial: combinação simples de m elementos em n, ou ainda, combinação de n
elementos tomados m a m. E o resultado é denotado por
C
n
m n m
n
m
n
m
=

=






!
!( )!
Agora, se o número total n de elementos de A e o número m de objetos de
cada tipo são conhecidos, então o número de tipos distintos é . Ocorre
que, como nos exemplos anteriores, em muitas situações, estamos interessa-
dos em calcular o número de tipos de elementos distintos.
Agora, usando este novo “princípio” e tudo que já discutimos, você certa-
mente poderá resolver mais problemas de contagem.
k
m
n
=
A
n
n m
n
m
=

!
( )!
n n n n m
m m m
( ) ( )...( )
( ) ( )...
− ⋅ − − +
− ⋅ − ⋅
1 2 1
1 2 2 1
,u
xóuuio ii
Apesar dos problemas ant eriores aparecerem com freqüência, a pont o de t erem um
nome especial (e uma fórmula), os problemas de cont agem não são, em geral, do t ipo
arranj o ou combinação. Por isso, quando se deparar com um problema de cont agem,
não se preocupe de imediat o em qual fórmula usar. Em geral, muit a engenhosidade e
várias fórmulas serão ut ilizadas para resolvê-los.
DESAFI OS
Vamos propor alguns problemas de contagem de diferentes graus de difi-
culdade. Ao tentar resolvê-los, lembre-se: problemas de aparência simples
podem ser difíceis. Para resolvê-los procure fazer uma representação. Lem-
bre-se que o objetivo é o de contar o número de objetos de uma certa classe.
Tente identificar precisamente quando um objeto pertence à classe e quando
dois deles devem ser considerados distintos. Examine quantas decisões você
deve tomar para executar a contagem.
Caso ainda não esteja claro como proceder, tente outras estratégias. Tente
dividir em subcasos que você saiba resolver. Pode ser útil “esquecer” algumas
das condições exigidas para que um objeto pertença à coleção. Isso, em geral,
dará origem a uma classe maior que a desejada. É necessário, portanto, ex-
cluir posteriormente os objetos “indesejados”. Depois que, aparentemente, o
problema foi resolvido, repense na sua solução, veja se você não está contan-
do alguns casos mais de uma vez ou está se esquecendo de algum.
1. No quadro abaixo, de quantos modos é possível formar a palavra MATEMATICA,
partindo de M e indo sempre para a direita ou para baixo?
M MM MM
M MM MM A AA AA
M MM MM A AA AA T TT TT
M MM MM A AA AA T TT TT E EE EE
M MM MM A AA AA T TT TT E EE EE M MM MM
M MM MM A AA AA T TT TT E EE EE M MM MM A AA AA
M MM MM A AA AA T TT TT E EE EE M MM MM A AA AA T TT TT
M MM MM A AA AA T TT TT E EE EE M MM MM A AA AA T TT TT I II II
M MM MM A AA AA T TT TT E EE EE M MM MM A AA AA T TT TT I II II C CC CC
M MM MM A AA AA T TT TT E EE EE M MM MM A AA AA T TT TT I II II C CC CC A AA AA
2. Um vagão de metrô tem 10 bancos individuais, sendo 5 de frente e 5 de
costas. De 10 passageiros, 4 preferem sentar de frente, 3 preferem sentar de
costas e os demais não têm preferência. De quantas maneiras os passageiros
podem sentar, respeitando as preferências? (Resposta 43200)
3. Quantos números inteiros entre 100 e 999 são ímpares e possuem três dígi-
tos distintos? (Resposta 320).
O TRIÂNGULO DE PASCAL
Num jogo de moedas, jogam-se 4 moedas simultaneamente. Se o vence-
dor for o que conseguir obter exatamente 3 caras e 1 coroa, quantas são as
possíveis combinações ganhadoras?
ao
x\1vx\1ic\
Vamos denotar por K a face “cara” da moeda e por C a face “coroa”.
Assim, temos KKKC, KKCK, KCKK e CKKK combinações vencedoras. Na
verdade, já vimos este tipo de problema: esta é a quantidade de anagramas
formados por KKKC. Assim, temos exatamente combinações. Mas se
as combinações ganhadoras são as com exatamente 2 caras e 2 coroas? Neste
caso são combinações. Note também que o número de combinações
com exatamente 3 coroas é também 4.
4
3
4
!
!
=
4
2 2
6
!
! !
=
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Num t ipo de j ogo, 5 moedas idênt icas são lançadas simult aneament e. Cada j ogador,
ant es de j ogar as moedas, declara qual o número exat o de caras e coroas que vai obt er.
Ganha aquele que acert ar o result ado. Qual das combinações é a melhor escolha?
Você já notou que se n é o número de moedas a serem jogadas e se m é o
número de caras (ou coroas) que se deseja, então o número de combinações
“vencedoras” é exatamente:
É claro que se m é o número de caras (ou coroas), então n-m é o número
de coroas (ou caras) e assim temos facilmente que,
Esses números aparecem em muitas situações e possuem várias relações
surpreendentes. Tais relações foram observadas por vários matemáticos como
o árabe Al-Karaji (fins do século X) e Niccoló Fontana de Brescia, conhecido
por Tartaglia (1499-1557).
Colocando os valores acima na forma de triângulo e convencionando que 0! = 1,
temos:
C
n
m
n
m m n
n
n m
C
m
m
n
n m
=






=

=







=

!
!( )!

C
n
m n m
n
m
n
m
=

=






!
!( )!
0
0
1
0
1
1
2
0
2
1
2
2
































































3
0
3
1
3
2
3
3
4
0






























4
1
4
2
4
3
4
4



























5
0
5
1
5
2
5
3
5
4































5
5
6
0
6
1
6
2
6
33
6
4
6
5
6
6

























aI
xóuuio ii
Foi B. Pascal (1623-1662) quem popularizou este “triângulo” quando pu-
blicou, em 1654, um tratado mostrando a relação dos coeficientes de (a+b)
n
com os valores que aparecem nas linhas do triângulo. Apesar de ser conheci-
do antes, o triângulo aritmético passou a ser conhecido como o Triângulo de
Pascal.
Calculando os valores em cada linha e coluna, temos:
Triângulo de Pascal
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 32 21 7 1
... ...
Note algumas propriedades interessantes. Se selecionarmos uma linha n
qualquer e adicionamos ao elemento da coluna p o elemento da coluna p+1 o
resultado está na (n+1)-linha e (p+1)-coluna. Veja neste exemplo.
1. Michael Stifel (1486-1567) é considerado como o maior algebrista alemão do século XVI.
1 3 + 3 1
1 4 6 4 1
C C C C
n n n n
n
n n n n
n 0 1 2
0 1 2
+ + + + =






+






+






+ +





... ...

= 2
n
Esta relação é também conhecida como a Relação de Stifel
1
.
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Most re que, de fat o, vale sempre que
C C
n
m
n
n
n
m
C
n
m
n
m
n
m
+ =






+
+






+
+
+






=
+
+
+ 1
1
1
2
1
1

Retornemos ao jogo de moedas. Sabemos que quando lançamos n moe-
das, o número total de resultados possíveis é 2
n
. Vimos que cada combinação
de m caras (ou coroas) aparece vezes. Portanto, somando-se todas as com-
binações temos que:
Vamos agora representar os resultados dos lançamentos das moedas de
outra maneira.
C
n
m
a:
x\1vx\1ic\
Se jogarmos 2 moedas, temos 4 resultados possíveis. Se usarmos o símbo-
lo de soma e a propriedade distributiva, todas as combinações possíveis po-
dem ser representadas por:
KK + KC + CK + CC = (K + C) (K + C)
Mas neste jogo, KC = CK, isto é, ambas são combinações “vencedoras”.
Então:
KK + 2KC + CC = (K + C) (K + C)
No caso de jogarmos 3 moedas, sabemos que existem 8 possíveis resulta-
dos, mas as combinações KKC, KCK e CKK são “iguais” para o nosso propó-
sito. Assim também são “iguais” as combinações: CCK, CKC, KCC. Portanto:
KKK + 3 KKC + 3 KCC+ CCC = (K + C) (K + C) (K + C)
Podemos ainda simplificar a notação e escrever as seqüências de K ou C
na forma de potência. Por exemplo, escrevemos KKK da forma K
3
.
Assim:
K
3
+ 3 K
2
C + 3 KC
2
+ C
3
= (K + C)
3
Mas isso pode ser feito sempre. Se jogarmos n moedas e se as combina-
ções que têm o mesmo número de K (caras) e C (coroas) são identificadas, ou
seja, são “iguais”, então cada combinação aparece vezes. Portanto, em
geral, temos que:
Esta é a conhecida fórmula do Binômio de Newton. Isaac Newton (1642-
1727) mostrou como desenvolver expressões do tipo (a+b)
r
, com r racional, e
assim a fórmula acabou sendo conhecida com o seu nome. Contudo, o desen-
volvimento de uma expressão do tipo (a+b)
n
já era conhecida e usada antes.
n
m






( ) ... K C
n
K
n
K C
n
K C
n
n
n n n n
+ =






+






+






+ +


− −
0 1 2 1
1 1 2






+







KC
n
n
C
n n 1
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Usando o desenvolviment o acima, dê uma expressão para (1+x)
n
Observe que as linhas do Triângulo de Pascal são os coeficientes da ex-
pressão do binômio.
T TT TTENTE ENTE ENTE ENTE ENTE F FF FFAZER AZER AZER AZER AZER
Qual é o coeficient e do t ermo a
11
b
6
no desenvolviment o (a+b)
17
?
Há muito mais a ser explorado no Triângulo de Pascal. As relações numé-
ricas que aparecem surpreendem. Convidamos você a ler mais sobre isso em
[MORGADO] (ver referência). Você certamente ficará impressionado.
a,
xóuuio ii
Bibliografia
BUSSAB, W.O.; MORETTIN, P. A. Estatística Básica. São Paulo: ed. Saraiva,
2002.
CARNEIRO, V.C. Colorindo Mapas. Revista do Professor de Matemática. São
Paulo: SBM, n. 29, 31-35, 1995.
CERRI, C.; DRUCK, I. F.; PEREIRA, A. L. Combinatória Sem Fórmulas. Pro-
jeto Pró-Ciências, São Paulo: Fapesp, 2002.
CERRI, C.; DRUCK, I .F. Combinatória Sem Fórmulas. Projeto PEC – Cons-
truindo Sempre – PEB II, São Paulo: USP-SEE, 2003.
EVES, H. Introdução à História da Matemática.3. ed. Tradução de H.
Domingues. Campinas: ed. Unicamp, 2002.
IEZZI, G. et al. Matemática: Ciência e Aplicações., v. 1, 2 e 3. São Paulo: ed.
Atual, 2001.
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de Probabilidade e Estatística.
São Paulo: Edusp, 2004.
MACHADO, A. S. Matemática na escola do segundo grau. vol 1, 2 e 3. São
Paulo: ed. Atual, 1996.
MORGADO et al. Análise Combinatória e Probabilidades. Rio de Janeiro:
SBM, 1991.
PAIVA, M. Matemática.2. ed. vol 1, 2 e 3. São Paulo: ed. Moderna, 2003.
Sobre os aut ores
Cri sti na Cerri
Docente do Instituto de Matemática e Estatística (IME) da USP, fez Licen-
ciatura e Mestrado em Matemática na USP. Seu doutorado, na área de Análise
Funcional, foi realizado na USP e na University of New Mexico nos EUA.
Participa de projetos de capacitação e atualização de professores e foi coorde-
nadora da área de Matemática do Programa Construindo Sempre USP-SEESP.
Li sbeth K. Cordani
Licenciada e bacharela em Matemática (USP), mestra em Estatística (USP)
e doutora em Educação (USP). Docente (aposentada) do IME-USP, atualmen-
te é professora titular do CEUN-IMT. Tem oferecido oficinas de Estatística e
participado de projetos para professores universitários e do Ensino Médio.
Anot ações
Anot ações
Anot ações
Anot ações
Anot ações

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->