Professional Documents
Culture Documents
Dissertação Mestrado - Versão Final Oficial
Dissertação Mestrado - Versão Final Oficial
Montes Claros
Julho de 2019
c 2019, Pedro Humberto de Almeida Mendonça Gonzaga.
Todos os direitos reservados.
105 f. : il.
Bibliografia: f. 96-98.
vi
“Começo e recomeço,
esse sempre foi o meu tropeço.”
(Marcos Giovanny)
vii
Resumo
Suponha um sistema de filas do tipo FCFS (first come first served) com tempos entre
chegadas sucessivas e tempos de atendimento não determinísticos. Deseja-se saber qual o
modelo mais adequado para a análise desse sistema (se Markov ou Erlang), assim como a
estimação dos parâmetros e determinação de distribuições a partir de amostras da população.
Para isso, conhecimentos sobre Processos Estocásticos, Inferência Estatística e Teoria das
Filas foram necessários. A Teoria de Filas é um ramo da teoria das probabilidades que se
iniciou por volta de 1909 com Agner K. Erlang, matemático e engenheiro de telecomuni-
cações dinamarquês, quando decidiu aplicar tais conhecimentos na resolução de problemas
de tráfego de telefonia. Fornecem as denominadas medidas de desempenho de sistemas ou
processos de filas que expressam a funcionalidade ou operacionalidade dos mesmos. Neste
trabalho, o leitor conhecerá as potencialidades do software R, que possui ótimas ferramen-
tas e recursos que auxiliam tanto a especificação do melhor modelo, quanto a estimação
dos parâmetros e obtenção das medidas de desempenho. Com o intuito de demonstrar a
aplicabilidade dos conhecimentos adquiridos, foi analisado o processo de filas nas baias de
ônibus/locais de embarque e desembarque localizadas no centro da cidade Montes Claros,
Estado de Minas Gerais.
viii
Abstract
Consider a queuing system of type FCFS (first come, first served) in which one the
inter-arrival and service time are nondeterministic. The objective is to know the most appro-
priate model for the analysis of this system (Markov or Erlang), as well as the estimation
of parameters and the determination of distributions from population samples. This work
required knowledge from Stochastic Processes, Statistical Inference and Queue Theory. The
Queue Theory is a branch of probability theory that became an area of research interest after
the 1909’s with Agner K. Erlang, a Danish mathematician and telecommunications engineer,
when he decided to apply such expertise in solving telephony traffic problems. This back-
ground provides the so-called performance measures, that allows to express the operability
or functionality of the system. In this work, the reader will know the potential of software R,
wich has great tools and features for specifying the best model, estimating the parameters and
reaching the performance measures. In order to demonstrate the knowledge acquired during
this study, was analyzed the process of queuing at bus stalls/embarkation and disembarkation
sites in city Montes Claros, Minas Gerais State.
ix
Lista de Figuras
x
6.1 Histograma de 5000 amostras de tamanho 10 de uma distribuição exponencial
de parâmetro 2,5) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.2 Resultado comparativo caso múltiplo vs não múltiplo . . . . . . . . . . . . . . 92
6.3 Layout do restaurante universitário. . . . . . . . . . . . . . . . . . . . . . . . . 94
xi
Lista de Tabelas
6.1 Valores obtidos por simulação para as medidas de desempenho de uma fila M/M/1. 90
6.2 Análise estatística dos dados coletados. . . . . . . . . . . . . . . . . . . . . . 95
xii
Sumário
Agradecimentos vi
Resumo viii
Abstract ix
Lista de Figuras x
1 Introdução 1
1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Fundamentação Teórica 5
2.1 Teoria da Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.1 Variáveis aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.2 Expectâncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.3 Distribuições de probabilidade . . . . . . . . . . . . . . . . . . . . 9
2.2 Processos Estocásticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.1 Cadeias de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.2 Processos de nascimento e morte . . . . . . . . . . . . . . . . . . . 25
2.3 Teoria das Filas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3.1 Principais características de uma fila . . . . . . . . . . . . . . . . . 29
2.3.2 Medidas de desempenho . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.3 Fórmulas de Little . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3.4 Modelos determinísticos . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.5 Modelos markovianos . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.3.6 Modelos de Erlang . . . . . . . . . . . . . . . . . . . . . . . . . . 38
xiii
2.4 Inferência Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.4.1 Teste de hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.4.2 O p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.4.3 Testes de ajustamento . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.4.4 Método dos momentos . . . . . . . . . . . . . . . . . . . . . . . . 48
2.4.5 Estimadores de máxima verossimilhança . . . . . . . . . . . . . . . 49
2.5 O software R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.5.1 O que é o R? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.5.2 O ajustamento de distribuições no R e o pacote fitdistrplus . . . . . 52
2.5.3 O pacote KScorrect . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.5.4 O pacote queueing . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3 Metodologia 59
3.1 Apresentação do Sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.2 Análise do Sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4 Resultados e Discussão 68
4.1 Praça Coronel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.2 Praça Dr. Carlos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5 Considerações Finais 84
5.1 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Referências Bibliográficas 96
xiv
Anexo A Resultados das simulações no restaurante universitário 103
xv
Capítulo 1
Introdução
Como discorrem Gross & Harris (2008), um sistema de filas pode ser descrito, basi-
camente, como clientes chegando para receber um determinado serviço, esperando na fila,
caso não haja atendimento imediato, e deixando o sistema após serem servidos. O termo “cli-
ente” é usado num sentido geral, não implicando, necessariamente, ser um cliente humano.
Por exemplo, o termo cliente pode ser usado para se referir a um programa de computador
esperando para ser executado, a um carro aguardando por conserto em uma oficina, dentre
outros.
Estudar o comportamento de filas é algo que se torna extremamente motivante pelo
fato delas estarem presente no cotidiano das pessoas. De fato, praticamente todo mundo já
teve de enfrentar o transtorno de passar horas em uma fila, seja no trânsito, nos aeroportos,
supermercados, em alguma casa lotérica, caixas eletrônicos, etc.
Tanto pelo ponto de vista do cliente quanto pelo da empresa, esse tempo de espera
é altamente indesejável; afinal, onde existe insatisfação do cliente, existe prejuízo para a
empresa. Então, por que ele existe? De fato, acabar com esse tempo de espera não é uma
tarefa fácil por diversas razões. Entre elas destacam-se: falta de servidores, limite de espaço
insuficiente para atendimento, falta de recursos, etc.
Muitos executivos já vêm até investindo na chamada “psicologia de filas” que procura
tornar o mais agradável possível (ou menos entediante) a experiência do cliente durante o
tempo de espera na fila. Richard Larson, pesquisador de operações do MIT, por muitos
considerado o maior especialista em filas do mundo, observa que “muitas vezes a psicologia
das filas é mais importante do que as estatísticas da espera em si.” Veja (Stone, 2012).
Porém, melhorar a experiência de enfileiramento para seus clientes é impossível sem
o aspecto analítico dos sistemas de gerenciamento de fila. Este trabalho utiliza a Teoria das
Filas para especificar o melhor modelo, e fornecer análises precisas para sistemas de filas
determinísticos, markovianos e Erlang utilizando apenas o software R.
1
1. I NTRODUÇÃO 2
Liberdade 1: A liberdade para estudar como o programa funciona, sendo possível acessar
o código fonte e alterá-lo como quiser;
Liberdade 2: A liberdade de redistribuir cópias, de modo que se possa ajudar os outros com
isso;
Liberdade 3: A liberdade para alterar e distribuir cópias, permitindo com que outros tenham
a chance de se beneficiar com essas mudanças. Acessar o código fonte é um pré-
requisito.
1.1 Objetivos
Este trabalho possui como objetivo apresentar um estudo sobre como especificar o me-
lhor modelo de filas, a partir da estimação dos parâmetros e escolha da melhor distribuição, e
fornecer análises precisas para sistemas de filas determinísticos, markovianos ou Erlang uti-
lizando apenas o software R. Nesse sentido, será mostrado como os recursos do R facilitam
o processo de ajustamento de distribuições por meio de um exemplo de aplicação para um
caso real.
Ferreira (2017), apresentou uma abordagem quantitativa e qualitativa, por meio de téc-
nicas de simulação, de um estudo que demonstrou a viabilidade da implantação de corredores
exclusivos no centro da cidade de Montes Claros, Estado de Minas Gerais.
Os dados volumétricos de chegadas dos ônibus nas baias, assim como os dados dos
tempos de embarque e desembarque colhidos no trabalho de Ferreira (2017) foram utilizados
neste trabalho. Deseja-se analisar o precesso de filas nas baias de ônibus/locais de embarque
e desembarque localizadas na rua Camilo Prates.
1.2 Motivação
A motivação do autor para realização deste estudo surgiu quando o mesmo iniciou seus
estudos sobre teoria das filas por meio do livro de Fogliatti & Mattos (2007), em meados de
2014, para realização de seu trabalho de conclusão do curso de engenharia elétrica. Ao fi-
nal do referido livro, mais especificamente no último capítulo, as autoras apresentam alguns
exemplos de aplicações de análises de filas em casos reais. Nesses capítulos algumas con-
siderações sobre a especificação do modelo mais adequado ao problema sob análise, assim
como a estimação dos parâmetros e determinação das distribuições, a partir de amostras da
população, são realizadas. Porém, a descrição de técnicas para a realização desses temas não
1 https://cran.r-project.org/web/packages/lattice/index.html
2 https://cran.r-project.org/web/packages/ggplot2/index.html
1. I NTRODUÇÃO 4
são o objetivo do livro supracitado. Ricci (2005) publicou um artigo descrevendo um passo
a passo de como o R é útil no processo de ajustamento de distribuições. Ele apresesentou
ferramentas e pacotes do R que facilitam muito o processo de escolha das distribuições can-
didatas, estimação dos parâmetros a partir dos dados da amostra, avaliação da qualidade do
ajuste e aplicação dos testes de ajustamento. Por tais razões, manifestou-se o interesse no
tema do presente trabalho, o qual procura descrever técnicas para escolha do modelo mais
adequado ao sistema de filas sob análise, utilizando apenas o software R.
Capítulo 2
Fundamentação Teórica
Para o alcance dos objetivos deste trabalho, conhecimentos sobre Processos Estocás-
ticos, Inferência Estatística e Teoria das Filas tornam-se altamente necessários e o leitor
poderá revisá-los a seguir.
Definição 1 A cada variável aleatória X, associa-se uma função chamada função de distri-
buição acumulada, ou fda, denotada por FX (x) e definida por
Teorema 1 Uma função F(x) é uma fda se, e somente se, forem obedecidas as seguintes
condições:
5
2. F UNDAMENTAÇÃO T EÓRICA 6
c) F(x) é contínua à direita; isto é, para cada número x0 , limx↓x0 F(x) = f (x0 ).
Uma variável aleatória X pode ser contínua ou discreta e um outro conceito importante
é o de função de densidade de probabilidade (fdp), caso X seja contínua e função de pro-
babilidade (fp), se X for discreta. Ambas, tanto a fdp como a fp estão relacionadas com as
probababilidades pontuais de variáveis aleatórias.
Como no caso em que X é uma variável aleatória contínua ocorre P(X = x) = 0, então
utiliza-se a ideia de intervalo fechado, pois P(a < X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b).
Por exemplo, a área total delimitada pela curva y = f (x), também conhecida como a “Curva
de Gauss”, que consta na Figura 2.1, e pelo eixo x é igual a 1. E a área compreendida
entre as retas x = a e x = b (sombreada na figura) dá a probabilidade de X estar entre a e b
(P{a ≤ X ≤ b}).
Definição 3 A função de probabilidade (fp) de uma variável aleatória discreta X é dada por
para todo x.
2. F UNDAMENTAÇÃO T EÓRICA 7
Existem duas exigências para uma fdp ou fp, que são nada mais que consequências de
suas próprias definições.
Teorema 2 Uma função fX (x) é uma fdp (ou fp) de uma variável aleatória X se, e somente
se,
2.1.2 Expectâncias
Entende-se por valor esperado, esperança ou expectância de uma variável aleatória
como sendo, meramente, o seu valor médio. Pode ser entendido como uma média central ou
o valor que se espera obter que resuma o comportamento de uma variável aleatória.
a) Se X = K então E(X) = K
b) E(KX) = KE(X)
c) E(X.Y ) = E(X).E(Y ).
Definição 5 A função geradora de momentos, MX (t), de uma variável aleatória X, com fda
FX , é definida para todos os valores de t por:
R ∞ etx f (x) dx, se X for contínua
−∞ X
MX (t) = E etX = . (2.5)
∑ etx P(X = x), se X for discreta
x
d tX
MX0 (t) = E e
dt
d tX
=E (e )
dt
= E X etX
(n)
MX (0) = E X n , n≥1
Definição 6 Para cada número inteiro n, o n-ésimo momento de X (FX (x)), µn0 , é:
µn0 = E X n
µn = E(X − µ)n
onde µ = µ10 = E X
Definição 7 Seja X uma variável aleatória, a variância de X, denotada por Var X é definida
como segue:
Tanto a variância quanto o desvio padrão são medidas de dispersão que, basicamente,
dizem o quão longe os dados de alguma distribuição estão da média. Dessa forma, a inter-
pretação relacionada à variância é de que quanto maior for seu valor, mais dispersa e variável
é a distribuição de X. O desvio padrão, por sua vez, possui a mesma interpretação, porém
tem a vantagem de que a sua unidade de medida é a mesma da variável original X, enquanto
que a unidade de medida da variância é o quadrado da unidade original.
Uma forma alternativa para a variância é estabelecida da seguinte forma:
a) Se X = K então Var X = 0
b) Var KX = K 2Var X
discretas e contínuas. Tais distribuições possuem fundamental espaço na Teoria das Filas,
em especial nos modelos de Markov e os de Erlang, (Gross & Harris, 2008).
Neste trabalho são estudadas somente distribuições paramétricas, que são distribuições
dependentes de valores dos parâmetros. Sendo assim, a fim de manter o controle desses
parâmetros, será usada a mesma notação adotada em Casella & Berger (2002), na qual tais
parâmetros são precedidos por um "|"(dado que).
1, com probabilidade p
X= 0≤ p≤1 .
0, com probabilidade 1 − p
Uma variável aleatória que satisfaça a condição acima tem distribuição de Bernoulli de
parâmetro p, onde X = 1 é entendido como “sucesso” e X = 0 é entendido como “fracasso”.
Um experimento aleatório que possa ser modelado pela distribuição de Bernoulli é
denominado “experimento de Bernoulli” ou “ensaio de Bernoulli”. Como por exemplo, no
lançamento de uma moeda, pode-se considerar p como a probabilidade de sair cara, sucesso
quando o resultado for cara (X = 1) e fracasso quando o resultado sair coroa (X = 0 ).
A média e a experança de uma variável aleatória de Bernoulli são dadas, facilmente,
por:
EX = 1p + (1 − p) 0 = p
VarX = (1 − p)2 p + (0 − p)2 (1 − p) = p(1 − p)
A variável aleatória
n
Y = ∑ Xi
i=1
a definição abaixo.
Teorema 5 Seja X uma variável aleatória binomial, dados os parâmetros n e p, então seu
valor esperado será EX = np e sua variância VarX = np(1 − p).
Definição 9 Uma variável aleatória X, assumindo valores nos números inteiros não negati-
vos, tem distribuição de Poisson com parâmetro λ se sua função de probabilidade for dada
por:
λ x e−λ
P(X = x|λ ) = x = 0, 1, 2, . . . . (2.9)
x!
2. F UNDAMENTAÇÃO T EÓRICA 12
∞
yi
ey = ∑ . (2.10)
i=0 i!
E(X) = λ e Var(X) = λ .
Uma importante propriedade da distribuição de Poisson é que ela pode ser usada como
aproximação da distribuição Binomial quando os parâmetros binomiais n é muito grande
(n → ∞) e p muito pequeno (p → 0).
Para isso, suponha que X é uma variável aleatória binomial com parâmetros n e p e
seja λ = np. Partindo da Equação 2.8 e substituindo p = λ /n:
n!
P(Y = y|n, p) = py (1 − p)1−y
(n − y)! y!
n.(n − 1) . . . . . (n − y + 1) y
= p (1 − p)n−y
y!
n.(n − 1) . . . . . (n − y + 1) λ y λ n−y
= 1−
y! n n
λ −y
y n
n.(n − 1) . . . . . (n − y + 1) λ λ
= 1− 1− .
ny y! n n
Como,
λ n λ y
n.(n − 1) . . . . . (n − y + 1)
lim 1 − ≈ e−λ , lim ≈1 e lim 1 − ≈ 1.
n→∞ n n→∞ ny n→∞ n
Assim, consecutivamente,
λy
fY (y) ≈ e−λ .
y!
Veja Meyer (1965) e Ross (2010) para uma maior abordagem com exemplos.
2. F UNDAMENTAÇÃO T EÓRICA 13
Como será visto, a função gama possui fundamental importância no estudo da Teoria
das Filas.
Pode-se mostrar, por indução, que a função gama obedece a uma interessante relação
de recorrência. Seja α = n,
Por consequência da definição 10, algumas relações úteis são satisfeitas. Veja alguns
exemplos:
b) Γ(1) = 1,
√
c) Γ(1/2) = π,
Definição 11 Seja uma variável aleatória contínua X, que assuma somente valores não
negativos. X terá distribuição de probabilidade gama, se sua fdp for dada por:
1
f (x|α, β ) = xα−1 e−x/β , 0 < x < ∞, α > 0, β > 0. (2.13)
Γ(α) β α
Essa é uma distribuição de suma importância para os objetivos deste trabalho, pois,
como será visto, possui vasta utilidade no estudo da Teoria das Filas, pelo fato de dar origem
a outras distribuições como a exponencial, qui-quadrado e Erlang.
Conforme Casella & Berger (2002), o α é conhecido como o parâmetro de forma,
uma vez que possui maior influência no pico da distribuição, equanto que o β recebe o
nome de parâmetro de escala, já que a maior parte de sua influência ocorre na dispersão da
distribuição.
E(X) = α β e Var(X) = α β 2 .
2. F UNDAMENTAÇÃO T EÓRICA 14
1
f (x|α = 1, β ) = xα−1 e−x/β
Γ(α) β α
1
= e−x/β
β
Z b
1 −x/β 1 −x/β
Z ∞
e dx = limb→∞ e dx = limb→∞ 1 − e−b/β = 1.
0 β 0 β
Teorema 8 Seja X uma variável aleatória exponencial com parâmetro β , seu valor espe-
rado e sua variância são dados por:
1 1
E(X) = e Var(X) = 2 . (2.18)
λ λ
Com relação a Ross (1996), a utilidade da distribuição exponencial vem do fato de ela
possuir uma propriedade denominada “ausência de memória” ou “memoryless”, onde uma
variável aleatória X é dita ser sem memória, se
(Hillier & Lieberman, 2001, p. 824) afirmam que essa é uma propriedade bastante
incomum para uma distribuição probabilística, uma vez que a única distribuição contínua
com essa propriedade é a exponencial.
Essa ausência de memória da distribuição exponencial é verificada, de modo razoavel-
mente fácil, utilizando a definição de probabilidade condicional:
P{A ∩ B}
P{A|B} = . (2.20)
P{B}
Observe:
Veja, agora, uma especial classe da distribuição gama, em que o parâmetro de forma,
α, Equação 2.13, se restringe apenas a números inteiros positivos.
Precisamente, tem-se que:
1
α =keβ = , (2.21)
kµ
2. F UNDAMENTAÇÃO T EÓRICA 16
1 1
E(X) = e Var(X) = . (2.23)
µ k µ2
Assim como a exponencial, a distribuição Erlang também pode ser parametrizada com
o seu parâmetro da taxa, que aqui neste trabalho, para evitar ambiguidades com o parâmetro
da taxa da distribuição exponencial, foi escolhida a letra hebraica τ para representá-la. Basta
lembrar que tanto τ quanto 1/λ representam o parâmetro de escala β na Equação 2.13.
Considera-se µ = τ/k, fazendo com que a fdp seja dada em função dos parâmetros k e τ;
como consta na Equação 2.24. 2
τ k xk−1 e−τ x
f (x|k, τ) = ,0≤x<∞ . (2.24)
(k − 1)!
Para essa parametrização, o valor esperado e a variância de X serão dados por:
Conforme Gross & Harris (2008), os diversos valores assumidos por k definem tais
distribuições como Erlang tipo-k ou distribuição Ek . Esse parâmetro k é também chamado
de parâmetro de forma, enquanto que o µ é tido como o parâmetro de escala. A Figura
2.2, onde t representa o tempo, ilustra alguns exemplos dessas distribuições para diferentes
valores assumidos por k.
2 Nota: Sempre que essa parametrização for utilizada, o leitor será notificado. Caso contrário, considere a
Nota-se que a medida que o valor de k cresce, mais a distribuição Erlang se torna
simétrica e fechada em torno da média. Se k → ∞, a distribuição se torna determinística com
média µ.
Posto isso, seja X uma variável aleatória qui-quadrado com m graus de liberdade, pela
Equação 2.13, segue que sua fdp é dada por:
1
Γ(m/2) 2m/2
x(m/2)−1 e−x/2 , se x > 0 ;
f (x|m) = (2.26)
0, caso contrário.
2. F UNDAMENTAÇÃO T EÓRICA 18
Taylor & Karlin (1998) apresentam alguns exemplos: nas situações mais comuns,
pode-se citar o resultado de sucessivos lançamentos de uma moeda (representado por Xt )
em sucessivos instantes de tempo t, ou, também, sucessivas obervações de determinadas ca-
racterísticas em uma população. Em outras situações, t pode representar, por exemplo, a
distância entre um ponto qualquer de um fio e uma origem arbitrária enquanto Xt representa
o número de defeitos nesse fio no intervalo (0,t].
2. F UNDAMENTAÇÃO T EÓRICA 19
onde Ti é a variável aleatória que denota a quantidade de tempo que o processo se mantém
no estado i antes de fazer uma transição para um estado diferente. Trata-se de uma variável
aleatória sem memória e, assim, deve ser exponencialmente distribuída. Veja Ross (2000,
p. 294).
As probabilidades P{Xt+1 = j|Xt = i} são condicionais e representam a chance da
2. F UNDAMENTAÇÃO T EÓRICA 20
variável aleatória X assumir o estado j após t + 1 passos de transições, dado que a mesma
assumiu o estado i após t passos de transições. Essas probabilidades recebem o nome de
“probabilidades de transição de estados” ou “probabilidades de transição de 1 passo” e
podem ser escritas como Pi j .
tal que n = 0, 1, 2, . . . , .
(n)
A Equação 2.31 simplifica a notação para Pi j :
(n)
Pi j = P{Xt+n = j|Xt = i}. (2.31)
Essa matriz P = Pi j é denominada “matriz de probabilidade de transição” ou “ma-
triz de Markov” ou, simplesmente, matriz de transição. Com isso, claramente, satisfará às
condições de matrizes descritas a seguir:
Pi j ≥ 0 para i, j = 0, 1, 2, . . . , (2.33)
∞
∑ Pi j = 1 para i = 0, 1, 2, . . . . (2.34)
j=0
e, assim, para uma cadeia de Markov com espaço de estado finito, pode-se pensar em
P(n)como sendo a n-ésima potência de P. Isto é, obtém-se a matriz de transição de n passos
multiplicando a matriz P por ela mesma n vezes.
2. F UNDAMENTAÇÃO T EÓRICA 22
(ii) Se o estado i se comunica com o estado j, então o estado j se comunica com o estado i.
Definição 18 Dois estados que se comunicam são ditos estar na mesma classe. Uma cadeia
de Markov é dita irredutível se houver apenas uma classe, ou seja, se todos os estados se
comunicarem entre si.
2.2.1.3 Periodicidade
Definição 19 Define-se como o período do estado i, d(i), o maior divisor comum (m.d.c) de
(n)
todos os inteiros n ≥ 1, para os quais Pii > 0.
2. F UNDAMENTAÇÃO T EÓRICA 23
Para elucidar a definição acima, seja uma cadeia de Markov de 4 estados (0, 1, 2 e 3),
representada pela matriz de probabilidade de transição P seguinte:
0 1 2 3
0 1 0 0 0
P= 1 0.8 0 0.2 0 .
2 0 0.8 0 0.2
3 0 0 0 1
fi0j = 0,
(2.41)
finj = P{Xn = i, Xk 6= k, k = 1, . . . , n − 1|X0 = i} .
Seja
∞
(n)
fi j = ∑ fi j (2.42)
n=1
2. F UNDAMENTAÇÃO T EÓRICA 24
onde fi j representa a probabilidade de sempre existir a transição para o estado j, dado que o
processo inicia no estado i.
Assume-se que o estado j é recorrente se f j j = 1, caso contrário, tem-se um estado
transiente. Ross (1996).
Claramente fii1 = Pii . O teorema 9 estabelece um critério para dizer se um estado i é
recorrente ou transiente.
(n)
Caso ∑∞
n=1 Pii < ∞, o estado i é transiente.
De acordo com Ross (1996), o estado i, sendo recorrente, é considerado como recor-
rente positivo se µii < ∞ e como recorrente nulo caso µii = ∞.
Assim como no caso da recorrência, a recorrência positiva é uma propriedade de classe,
sendo que um estado aperiódico e recorrente positivo é chamado de estado ergódico. Embora
existam estados que não são recorrentes positivos, pode ser provado que em uma cadeia de
Markov de estado finito todos os estados recorrentes são recorrentes positivos.
2. F UNDAMENTAÇÃO T EÓRICA 25
Definição 20 “Se uma cadeia é irredutível, aperiódica e recorrente, ela é dita ser Ergódica.
Se é irredutível, aperiódica e recorrente positiva, ela é dita Fortemente Ergódica.” (Atuncar,
2011, p. 40).
(n)
π j = limn→∞ Pj j , j ≥ 0,
∞
π j = ∑ π j Pi j , j ≥ 0,
i=0
∞ (2.45)
∑ π j = 1.
j=0
π = π.P (2.46)
Isso significa que após se contar o número de vezes em que o processo “entra” em
um estado e o número de vezes que o mesmo “sai” deste mesmo estado por um tempo t
muito grande, o sistema tenderá a entrar em equilíbrio. Logo, a partir do momento em que o
processo se encontrar no regime estacionário, a soma do que “entrar” no estado tenderá a ser
igual à soma do que “sair”. Basicamente, as duas taxas λn e µn , precisam ser iguais. Sendo
assim, na Figura 2.3, o fluxo do que entra em um nó deve ser igual ao fluxo do que sai desse
mesmo nó.
Um procedimento muito utilizado na literatura de filas é conhecido como balanço de
fluxo. Nesse método, o fluxo é definido como o produto da probabilidade estacionária pela
taxa de transição. Defina Pn (t) = P{N(t) = n} e Pn = P{N = n} como as probabilidades que
existam n clientes no sistema no tempo t e no estado estacionário, respectivamente. Isto é,
limt→∞ Pn (t) = Pn . Observe abaixo, o que Gross & Harris (2008) chamam de equações de
balanço.
Estado 0: Perceba, através do diagrama de fluxo, Figura 2.3, que existe uma entrada vindo
do estado 1 e uma saída para o mesmo. Veja Equação 2.47:
µ1 P1 = λ0 P0 . (2.47)
Estado 1: Perceba, também observando o diagrama de fluxo, que existe uma entrada
vindo do estado 0 e outra do estado 2. E uma saída para 2 e outra para 0. Equação 2.48:
Estado 2: De modo análogo a equação estacionária para o estado 2 fica como mostra em
(2.49):
Estado n: Sendo assim, em (2.50) tem-se uma equação para qualquer estado:
λ0
P1 = P0 , (2.51)
µ1
2. F UNDAMENTAÇÃO T EÓRICA 28
(λ1 + µ1 )P1 − λ0 P0 λ1 µ1 P1 − λ0 P0 λ1 λ1 λ0
P2 = = P1 + = P1 → P2 = P0 . (2.52)
µ2 µ2 µ2 µ2 µ2 µ1
λ2 λ2 λ1 λ0
P3 = P2 → P3 = P0 . (2.53)
µ3 µ3 µ2 µ1
O que parece estar emergindo para o seguinte padrão:
λn−1 λn−2 λ0
Pn = . . . P0 . (2.54)
µn µn−1 µ1
O leitor pode verificar a Equação 2.54 por indução matemática.
Então Pn é dado por:
n
λi−1
Pn = P0 ∏ n≥1 . (2.55)
i=1 µi
1
P0 = (2.56)
1 + ∑n≥1 ∏ni=1 λµi−1
i
desde que a soma do denominador de 2.56 seja convergente. Fogliatti & Mattos (2007).
Para facilitar o estudo, neste trabalho será usada a notação proposta por Kendall (1953),
atualmente padronizada pela literatura de filas. Consiste em uma série de símbolos e barras
do tipo A/B/c/k/z, que representam o processo de chegadas (A), processo de atendimento (B),
número de servidores em paralelo (c), capacidade do sistema (k) e disciplina de atendimento
(Z), sendo essas as principais características de uma fila.
Tanto o processo de chegada (A) quanto o processo de atendimento (B) são represen-
tados por distribuições estatísticas. Essas distribuições e seus respectivos símbolos estão
listados a seguir:
• U: distribuição uniforme.
(Magalhães, 1996, p. 05).
É válido ressaltar que em muitos casos, apenas os três primeiros símbolos são usados.
Adotou-se, por convenção, a omissão das letras k e z caso o sistema tenha capacidade infinita
e disciplina de fila do tipo FCFS (first come, first served). Por exemplo, uma fila M/M/1
significa chegada exponencial, serviço exponencial, um único servidor, capacidade infinita e
atendimento por ordem de chegada.
Veja a seguir uma visão geral sobre as principais disciplinas de atendimento e as res-
pectivas siglas que são utilizadas para representá-las.
• FCFS (first come, first served): primeiro a chegar é o primeiro a ser atendido. Exem-
plos: Filas nos caixas de supermercados e a venda de ingressos no cinema.
• LCFS (last come, first served): último a chegar é o primeiro a ser atendido. Exemplos:
Utilização de estoques verticais ou horizontais, como o carregamento de contêineres
em navios.
• PRI (priority service) ou COM PRIORIDADE: os atendimentos são feitos com prio-
ridades estabelecidas. Exemplos: Internação hospitalar e tarefas a serem processadas
por um computador.
• SIRO (service in random order) ou ALEATÓRIO: os atendimentos são feitos sem qual-
quer preocupação com a ordem de chegada. Exemplo: Contemplação de consórcios e
a seleção de ganhadores em concursos públicos.
para o caso de as chegadas e saídas acontecerem de forma aleatória no tempo, elas formarão
um processo estocástico e serão descritas por alguma distribuição estatística. Dentre as mais
usadas, destacam-se a exponencial, Erlang e hiperexponencial.
A hipótese mais comum para esses processos é que exista o que Magalhães (1996)
chama de “renovação”, ou seja, os intervalos entre chegadas e os tempos de serviço acon-
tecem de forma independente e identicamente distribuídos. Normalmente, o processo de
Poisson é um dos mais utilizados para modelar as chegadas em um sistema, uma vez que
proporciona facilidades no tratamento matemático proporcionadas pela “falta de memória”
da distribuição exponencial.
Para (Fogliatti & Mattos, 2007, p.09), “a capacidade do sistema é o número máximo de
usuários que o mesmo comporta (incluindo fila e atendimento) e pode ser finita ou infinita”.
Caso a capacidade total do sistema estiver ocupada, um novo usuário não poderá entrar
e será perdido ou desviado para outro centro de serviço. Como exemplo de um sistema com
capacidade finita tem-se um posto de vistoria de carros que admite um número máximo de
carros aguardando pelo serviço. Já para capacidade infinita, pode-se citar um porto onde
navios chegam para descarregamento aguardando, se necessário, no mar.
λ
ρ= . (2.57)
cµ
Caso ρ > 1(λ > c µ), a taxa de chegadas ao sistema excede a taxa de serviço e pode-se
esperar que à medida que o tempo passa, mais a fila crescerá tendendo ao infinito a menos
que em algum momento clientes sejam impedidos de entrar. No caso em que ρ = 1, ainda
assumindo que em nenhum momento clientes sejam impedidos de entrar, a aleatoriedade
impedirá que o sistema fique vazio e a fila cresçerá sem limite. Assim, para se atingir o
estado estacionário é necessário que ρ seja estritamente menor que 1, ou seja, o número
mínimo de servidores paralelos necessários para garantir uma solução de estado estacionário
pode ser calculado imediatamente encontrando-se o menor valor para c tal que λ /(c µ) < 1.
Retomando o raciocínio da Seção 2.2.2, na qual foram definidas as probabilidades
Pn (t) = P{N(t) = n} e Pn = P{N = n}. Considerando um sistema de filas no estado estacio-
nário com uma quantidade c de servidores, é possível obter duas medidas de grande interesse
no estudo de filas, que são o número médio de usuários no sistema (L) e na fila (Lq ). Essas
medidas são obtidas através do valor médio ou valor esperado, E[N], definido pela Equação
2.4 na Seção 2.1.2. Observe as Equações abaixo.
∞
L = E[N] = ∑ n Pn , (2.58)
0
∞
Lq = E[Nq ] = ∑ (n − c) Pn . (2.59)
n=c+1
Para uma explicação mais intuitiva, imagine a situação em que um usuário chega em
um sistema de atendimento do tipo FCFS e espera em média W para ser atendido e deixar
o sistema. Ao sair, o mesmo olha para trás e observa quantos usuários ficaram no sistema.
2. F UNDAMENTAÇÃO T EÓRICA 33
Logo, ele deve “enxergar” em média L usuários presentes, aqueles que chegaram durante
seu tempo de serviço mais os que chegaram durante seu tempo de espera na fila. Cada um
desses L usuários levou em média λ1 para chegar e, assim, é possível escrever L( λ1 ) = W ou
L = λW , (Magalhães, 1996, p.29).
Assim sendo, valem as seguintes relações dadas nas equações a seguir; que são as
denominadas fórmulas de Little:
L = λW, (2.60)
Lq = λWq . (2.61)
Considere o caso trivial de uma taxa constante de chegadas a uma estação única que
processa a uma taxa de serviço constante. Essas chegadas espaçadas regularmente serão
servidas na disciplina FCFS (First Come, First Served). Como λ é a taxa de chegada por
unidade de tempo e µ a taxa de saída, então o tempo entre chegadas será 1/λ e o tempo
entre saídas será 1/µ. Assuma que no tempo t = 0 não haja elementos no sistema e que a
taxa de chegada λ seja maior que a taxa de saída µ; ou seja, 1/λ < 1/µ.
Gross & Harris (2008) abordam que com o sistema nessas características supracitadas,
a fila cresceria e se estenderia para além de algum limite, cada sucessivo elemento esperaria
mais do que o elemento anterior, até que esperaria para sempre. Para evitar isso, torna-se
necessário haver uma recusa forçada assim que o sistema atinja um determinado número de
elementos; que é a capacidade do mesmo.
Para efeitos didáticos, considere a capacidade do sistema como K = K − 1, então a no-
tação ficará da seguinte forma: D/D/1/K − 1/FCFS. Isso significa que o k-ésimo elemento
2. F UNDAMENTAÇÃO T EÓRICA 34
será recusado.
Medidas de desempenho
De acordo com Gross & Harris (2008), os tempos entre chegadas sucessivas e os tem-
pos de atendimento no modelo M/M/1 seguem distribuições exponenciais. As taxas de che-
gadas (ingresso) ao sistema e de atendimento são constantes e dadas respectivamente por
2.68:
λn = λ , ∀ n ≥ 0 e µn = µ, ∀ n ≥ 1 . (2.68)
Existe um único posto de atendimento (c = 1), não há espaço reservado para a fila de
espera e a disciplina de filas é do tipo FCFS.
Substituindo a equação 2.68 nas equações 2.57 e 2.55, obtém-se Pn para o modelo
M/M/1:
n
λ
Pn = P0 . (2.69)
µ
De modo análogo, substituindo 2.68 nas equações 2.57 e 2.56, obtém-se:
1
P0 = n
. (2.70)
∑∞
n=0 ρ
Por se tratar de uma progressão geométrica infinita, sabe-se que
∞
1
∑ ρn = 1 − ρ , (2.71)
n=0
2. F UNDAMENTAÇÃO T EÓRICA 37
então:
1 1
P0 = n
= 1
→ P0 = 1 − ρ . (2.72)
∑∞
n=0 ρ 1−ρ
Pn = ρ n (1 − ρ) . (2.73)
Medidas de desempenho
Abrindo o somatório:
∞
∑ nρ n = ρ + 2ρ 2 + 3ρ 3 + . . .
n=0
∞ (2.75)
2 n−1
= ρ(1 + 2ρ + 3ρ + . . . ) = ρ ∑ nρ .
n=1
ρ(1 − ρ) ρ λ
L= 2
= →L= . (2.77)
(1 − ρ) 1−ρ µ −λ
De forma similar, lembrando que Nq é a variável aleatória que corresponde ao números
de clientes na fila no regime estacionário e c = 1, encontra-se uma elegante fórmula para Lq .
2. F UNDAMENTAÇÃO T EÓRICA 38
∞ ∞ ∞ ∞
Lq = E[Nq ] = ∑ (n − c) Pn = ∑ (n − 1)Pn = ∑ nPn − ∑ Pn
n=c+1 n=1 n=1 n=1
(2.78)
ρ ρ2
= L − (1 − P0 ) = −ρ = .
1−ρ 1−ρ
ρ2 λ2
Lq = = . (2.79)
1−ρ µ(µ − λ )
L ρ 1
W= →W = = . (2.80)
λ λ (1 − ρ) µ − λ
De modo análogo, encontra-se o tempo médio de espera na fila (Wq ) substituindo 2.79
em 2.61
Lq ρ ρ
Wq = →W = = . (2.81)
λ µ(1 − ρ) µ − λ
T = T1 + T2 + . . . + Tk (2.82)
O leitor pode verificar a prova desse teorema em Fogliatti & Mattos (2007). Essa soma
torna possível tirar proveito da propriedade markoviana da distribuição exponencial, uma
vez que a distribuição Erlang não é markoviana.
O segundo motivo é o fato de que a distribuição Erlang, visto que possui dois parâme-
tros, fornece mais flexibilidade em modelagem do que a distribuição exponencial, que possui
apenas um parâmetro. Assim, a família Erlang fornece uma maior flexibilidade no ajuste de
uma distribuição empírica a dados reais do que a família exponencial.
Existem dois casos opostos no ajuste de distribuições empíricas com a distribuição
Erlang, afinal, como foi discutido anteriormente, com o parâmetro k = 1 tem-se a distribuição
exponencial e quando k → ∞, a distribuição Erlang se torna determinística (Figura 2.2).
Ainda de acordo com Hillier & Lieberman (2001), o valor para k pode ser escolhido após
estimar os valores da média e variância da distribuição empírica a partir das fórmulas dadas
para média e variância em 2.23.
Voltando ao primeiro motivo, o Teorema 11 torna possível formular um processo
de nascimento e morte modificado em termos de fases com tempos exponenciais. Isto é,
consideram-se tarefas compostas por uma sequência de k fases, onde cada fase é exponen-
cialmente distribuída com média 1/(µ k), tendo, assim, um modelo Erlang tipo-k. Desse
modo, as propriedades benéficas da distribuição exponencial são preservadas. No entanto,
Gross & Harris (2008) salientam a desvantagem de que ao usar o conceito de fases aumenta-
se a quantidade de estados e, por conseguinte, a complexidade do sistema.
Gross & Harris (2008) apresentam algumas implicações desse tipo de modelo. São
elas:
No modelo M/Ek /1, os tempos entre chegadas sucessivas são exponencialmente dis-
tribuídos e os tempos de atendimento são realizados apenas por um servidor seguindo uma
2. F UNDAMENTAÇÃO T EÓRICA 40
distribuição Erlang tipo-k. Neste sistema, o tempo de serviço é composto por uma sequên-
cia de k fases, onde cada fase é exponencialmente distribuída com parâmetro kµ, logo cada
fase terá média 1/(k µ). Assim, pelo Teorema 11, a função de serviço geral (tempo para
completar o serviço) é uma Erlang com média 1/µ e parâmetros k e µ.
Na Subseção 2.1.3 foram apresentadas as fórmulas para o cálculo da variância de al-
gumas distribuições estatísticas; dentre elas a exponencial e a Erlang. Analisando a fórmula
para o cálculo da variância de uma distribuição Erlang com parâmetros k e µ e a compa-
rando com a fórmula para o cálculo da variância de uma distribuição exponencial, também
com parâmetro µ, percebe-se que os tempos de atendimento no modelo M/Ek /1 possuem
uma variação menor em relação ao modelo M/M/1.
Uma boa maneira para vislumbrar tal fato, assim como abordam Fogliatti & Mattos
(2007), é mediante o cálculo do coeficiente de variação (CV), definido como a razão entre o
desvio padrão e a média. Ele revela o prolongamento da variabilidade em relação à média
da distribuição.
Para o modelo M/M/1, tem-se:
p
M β2
CV = =1 . (2.83)
β
Enquanto que para o modelo M/Ek /1,
q
1
Ek k µ2 1
CV = 1
=√ . (2.84)
µ k
Já para o modelo determinístico, M/D/1:
o
CV D = 1
=0 . (2.85)
µ
E, assim, a seguinte relação entre os tempos de serviço para esses modelos é satisfeita:
CV D ≤ CV Ek ≤ CV M . (2.86)
Veja, na Figura 2.4, os gráficos de uma família Erlang com média 1/µ para diferentes
valores de k.
2. F UNDAMENTAÇÃO T EÓRICA 41
Desse modo, entre os casos extremos dos modelos modelos determinísticos (CV = 0) e
markovianos (CV = 1), os modelos de Erlang soam como um caso intermediário no quesito
variabilidade de dados.
Medidas de desempenho As duas maneiras mais utilizadas pela literatura de filas para
desenvolver as fórmulas para o cálculo das principais medidas de desempenho vem de dois
outros modelos de fila: O modelo M/G/1 e o modelo M[K] /M/1. Isso se deve ao fato de o
modelo M/Ek /1 ser um caso especial desses dois modelos.
Uma vez que esses modelos não serão abordados, por fugirem ao escopo deste traba-
lho, serão apenas apresentadas as fórmulas para o cálculo das principais medidas de desem-
penho.
Para o leitor que desejar se aprofundar, recomenda-se Allen (1990) e Zukerman (2013)
para o modelo M/G/1, onde as fórmulas de Pollaczek-Khintchine são apresentadas de forma
didádica e minuciosa. E para o modelo M[X] /M/1 recomenda-se Gross & Harris (2008) e
Fogliatti & Mattos (2007).
2. F UNDAMENTAÇÃO T EÓRICA 42
1+k λ2
Lq = × . (2.87)
2k µ (µ − λ )
1+k λ
W= × . (2.88)
2k µ (µ − λ )
1
W = Wq + . (2.89)
µ
L=λW . (2.90)
• O réu é culpado.
O ponto de vista significativo dessa definição é o de que uma hipótese faz uma afirma-
ção sobre a população. Tem-se, então, uma hipótese que se deseja testar, em contraste com
uma hipótese complementar. O objetivo do teste de hipóteses é decidir, com base em uma
amostra da população, qual dessas hipóteses traz a afirmação verdadeira.
Tem-se, portanto, a seguinte definição para hipótese nula e hipótese alternativa:
Definição 22 Denomina-se hipótese nula (H0 ) e hipótese alternativa (H1 ) as duas hipóteses
complementares em um teste de hipótese.
H0 : θ ∈ Ω e H1 : θ ∈ Ωc
A região onde a hipótese nula é aceita é a região de aceitação, enquanto que o comple-
mento (as caldas da distribuição) é a região crítica. O valor do Erro tipo 1 é dado pelo nível
da região de rejeição.
O segundo passo baseia-se em encontrar uma estatística de teste, que nada mais é
que uma função da amostra (variável aleatória) que calcula um valor que será usado para
decidir se a hipótese nula será rejeitada. Existem diversos métodos de escolhas de estatísticas
2. F UNDAMENTAÇÃO T EÓRICA 45
de testes e regiões de rejeição, que são consoantes às necessidades que se possa ter. Elas
são usadas para calcular o valor p; o chamado nível de significância observado (p-valor),
(DeGroot & Schervish, 2012, p. 539). O procedimento é simples: após calculada, essa
estatística de teste é comparada com os limites da região de rejeição. Caso o resultado esteja
dentro da região crítica, rejeita-se H0 . Similarmente, um experimentador que deseja um nível
de significância α para a sua pesquisa, rejeitará a hipótese nula se e somente se o p-valor for
menor ou igual a α.
2.4.2 O p-valor
O p-valor consiste no menor nível de significância para o qual a hipótese nula seria
rejeitada. Para Conover (1999), o resultado de um teste de hipóteses torna-se bem mais
significativo quando o p-valor é, também, declarado. Isso se deve ao fato de que, uma vez
que o p-valor tenha sido determinado, a conclusão de rejeitar ou não a hipótese nula (H0 ), em
qualquer nível de significância, α, especificado, implicará na comparação do p-valor com α.
Considerando tobs como o valor calculado para a estatística de teste T , em um teste
unilateral à direita, o p-valor será dado pela probabilidade P{T ≥ tobs }, enquanto que, para
um teste unilateral à esquerda, o p-valor será dado pela probabilidade P{T ≤ tobs }. Para os
testes bilaterais, Conover (1999) afirma que o p-valor é considerado como o dobro do p-valor
calculado para qualquer uma das duas regiões de rejeição, à direita ou à esquerda. Quando as
regiões de rejeição possuem probabilidades diferentes e a distribuição nula de T é discreta,
construir níveis de significância com, exatamente, a mesma probabilidade para ambas as
caudas torna-se impossível. Sendo assim, em casos como esses, para evitar ambiguidades,
considera-se o p-valor para testes bilaterais, como o dobro da probabilidade unilateral para a
cauda da distribuição nula, na qual o valor observado cai.
Admita que seja retirada uma amostra aleatória de tamanho n de uma população sub-
dividida em k diferentes grupos e sejam pi=1 , pi=2 , . . . , pi=k as probabilidades de que um
elemento dessa amostra, selecionado ao acaso, pertença ao grupo i. Por se tratar de proba-
bilidade, pi satisfaz pi ≥ 0 ∀ i = 1, . . . , k e ∑ki=1 pi = 1. Seja, também, os seguintes números
específicos p0i=1 , p0i=2 , . . . , p0i=k , tal que pi 0 ≥ 0 ∀ i = 1, . . . , k e ∑ki=1 pi 0 = 1.
As seguintes hipóteses serão testadas para cada elemento da amostra:
H0 : pi = pi 0 para i = 1, . . . k
(2.91)
H1 : pi 6= pi 0 para pelo menos um valor de i.
k
(Ni − ei )2
Q= ∑ . (2.92)
i=1 ei
possui a propriedade de que sendo H0 verdade e o tamanho da amostra n → ∞, então
Q converge para a distribuição qui-quadrado (x2 ) com k − 1 graus de liberdade.
Logo, pelo exposto, percebe-se, de modo intuitivo, que à medida que Q for se tornando
maior que determinado valor c, a hipótese H0 vai sendo rejeitada. Esse valor é especificado
pelo nível de significância desejado pelo pesquisador. Se for desejado realizar um teste com
nível de significância α, então o valor especificado para c será o quantil 1 − α da distribuição
qui-quadrado (x2 ) com k − 1 graus de liberdade.
2. F UNDAMENTAÇÃO T EÓRICA 47
Número de observações ≤ x
Fn (x) = ; −∞ < x < ∞ (2.93)
n
Mais precisamente,
Note que Fn (x) é uma função de passo; à medida que x aumenta, Fn (x) aumenta um
passo de tamanho 1n para cada observação da amostra. Desse modo, Fn (x) registra a propor-
ção de valores da amostra menores ou iguais a x, enquanto que F(x) indica a probabilidade
de uma observação Xi ser menor ou igual a x. Portanto, pela lei dos grandes números, segue
que quando n → ∞, Fn (x) converge para F(x) permitindo com que Fn (x) possa ser usada para
estimar F(x).
Tal estimativa é dada por uma estatística de teste que mede, verticalmente, a maior
distância entre essas duas funções. Essa estatística de teste calcula dois valores: D+ e D− ,
que indicam as maiores distâncias verticais entre Fn (x) e F(x) quando, respectivamente,
Fn (x) é maior que F(x) e quando Fn (x) é menor que F(x). Formalmente, tem-se que D+ =
2. F UNDAMENTAÇÃO T EÓRICA 48
supX {Fn (x)−F(x)} e D− = supX {F(x)−Fn (x)}. Tem-se, então, a bem conhecida estatística
de teste D; introduzida por Kolmogorov (1933):
Nessa perspectiva, conforme DeGroot & Schervish (2012), sempre que a função de
distribuição acumulada F(x) for desconhecida, a função de distribuição acumulada da amos-
tra, Fn (x), pode ser considerada para estimar F(x).
Como pontos negativos para o teste Kolmogorov, verifica-se em Conover (1999) que
o mesmo só pode ser aplicado quando a distribuição indicada na hipótese nula estiver com-
pletamente especificada. Conforme D’Agostino (1986), isso acontece pelo fato de que es-
timar os parâmetros populacionais a partir dos dados da amostra traz a estatística do teste
Kolmogorov Smirnov, D, mais próxima da distribuição nula do que estaria caso os parâ-
metros populacionais fossem especificados. Por outro lado, esse teste, diferentemente do
qui-quadrado, possui a valiosa vantagem de ser aplicável a amostras pequenas.
1 k 1
m1 = ∑ Xi , µ10 = EX 1
k i=1
1 k 2
m2 = ∑ Xi , µ10 = EX 2
k i=1 (2.96)
..
.
1 k n
mn = ∑ Xi , µ10 = EX n
k i=1
O estimador de máxima verossimilhança será o valor que maximiza essa função. Veja
a Definição dada por Casella & Berger (2002):
Definição 24 “Para cada ponto amostral x, seja θ̃ (x) um valor de parâmetro no qual L(θ |x)
atinge seu máximo como uma função de θ , com x mantido fixo. Um estimador de máxima
verossimilhança (EMV) do parâmetro θ com base em uma amostra X é θ̃ (X).”
Trata-se de um bom estimador. Existem, no entanto - ainda consoante Casella & Berger
(2002)-, apenas dois incovenientes. O primeiro reside no fato de encontrar o valor máximo,
que em diversos casos trata-se apenas de um simples problema de cálculo diferencial, mas
em certos momentos, mesmo em densidades comuns surgem dificuldades. O segundo in-
coveniente é devido a sua sensibilidade numérica. Existem circunstâncias em que pequenas
diferenças nos dados produzem EMV bem diferentes, tornando seu uso suspeito.
2.5 O software R
Uma das maiores metas deste trabalho foi demonstrar a eficácia do R em análise de
filas. Deseja-se mostrar que, de forma gratuita, simples e interativa, é possível obter análises
precisas de um sistema de fila, desde a especificação do modelo até a aquisição das medidas
de desempenho.
Por tais razões, na próxima Seção são abordadas as principais características do R,
respondendo questões como: O que é o R e como usá-lo?
Posteriormente, nas Seções 2.5.2, 2.5.3 e 2.5.4 são apresentados três pacotes muito im-
portantes em inferência estatística e teoria das filas: os pacotes fitdistrplus, KScorrect
e queueing. Sendo que, na mesma Seção do primeiro pacote citado, um procedimento no
ajuste de distribuições é apresentado.
2. F UNDAMENTAÇÃO T EÓRICA 50
2.5.1 O que é o R?
R é um software livre para computação estatística e gráficos. Ele compila e roda em
uma ampla variedade de plataformas, dentre as quais UNIX, Windows e MacOS, (R Core
Team, 2018). Crawley (2007) o define como uma linguagem de alto nível e um ambiente
para análise de dados e gráficos, sendo que possui grande influência da linguagem e ambiente
S que foi desenvolvida por Becker, Chambers e Wilks nos laboratórios Bell.
Mesmo sendo gratuito, o R fornece um enorme suporte tanto em análise estatística
(modelagem linear e não linear, testes estatísticos clássicos, análise de séries temporais, clas-
sificação, agrupamento, ...) como em análises gráficas. Muitos usuários começam a usar o R
por sua facilidade gráfica, sendo este um dos seus pontos mais fortes.
O R está disponível sob os termos da Free Software Foundation’s GNU General Public
License em forma de código fonte.
Para utilizar o R, o usuário também pode realizar o download do RStudio, um ambiente
de desenvolvimento integrado para R. O R e o RStudio podem ser instalados e executados
separadamente e trabalhar conjuntamente com ambos é uma opção de agregar facilidades ao
uso do R.
Ao executar o RStudio pela primeira vez, encontra-se um ambiente de desenvolvi-
mento constituído, basicamente, por quatro janelas. Observe a Figura 2.6:
objetos que foram criados; a janela número 4 é subdividida em abas: na aba “files” é possível
navegar pelos arquivos do computador, a aba “packages” lista os pacotes instalados, sendo
possível carregá-los ou mesmo removê-los com apenas um clique, pela aba “help” o usuário
obtém ajuda sobre diversas funções e pacotes do R e na aba “plot” os gráficos gerados são
visualizados.
No R é usado o conceito de pacotes, que são constituídos por três partes básicas, (Ju-
nior, 2011):
1. R-base: são os pacotes que já vêm instalados quando se inicia o programa pela pri-
meira vez. O “coração” do R.
>\citation(nome do pacote)
Para acessar o manual de algum pacote, uma opção é entrar com o comando help:
Essa metodologia é sustentada por Delignette-Muller & Dutang (2015), que, na docu-
mentação do seu pacote, o fitdistrplus, também orienta plotar os gráficos da distribuição
empírica como o histograma, a função de distribuição acumulada (fda) e as funções de pro-
babilidades pontuais (fdp e fp) para escolha das distribuições candidatas.
O pacote fitdistrplus fornece funções para ajustes de distribuições univariadas para
diferentes tipos de dados, sejam eles contínuos censurados ou não censurados, sejam eles
discretos. Permite diversificados métodos de estimação, como o método dos momentos e de
máxima verosimilhança estudados na fundamentação teórica.
Para utilizar o pacote fitdistrplus é necessário instalá-lo e carregá-lo, sendo que a ins-
talação de alguns outros pacotes é exigida, como o MASS, survival e o npsurv. É altamente
recomendável ler a documentação do pacote digitando help(fitdistrplus) no console.
Os gráficos dos histogramas e das funções densidade e acumulada são obtidos por
meio da função plotdist() do pacote fitdistrplus. Porém, o usuário pode escolher trabalhar
de uma forma mais livre utilizando ferramentas fornecidas por pacotes do R-base, como o
2. F UNDAMENTAÇÃO T EÓRICA 53
pacote graphics para gráficos e o stats que contém funções para cálculos estatísticos e
geração de números aleatórios.
É de suma importância, também, o cálculo de medidas estatísticas descritivas, como
média, variância, desvio padrão, assimetria e curtose. Estas duas últimas para saber quão
simétrica e espalhada é a distribuição. Para tal finalidade, existem funções no R como
skewness() e kurtosis() do pacote fbasics (que precisa ser instalado) ou a função
descdist do fitdistrplus. A média e variância são calculadas com comandos simples como
mean() e var().
Em face dos conhecimentos adquiridos por meio do cálculo de medidas descritivas e
observação dos gráficos, o usuário possuirá um leque de informações para uma boa esco-
lha das distribuições candidadas. Damodaran (2007) resume esse processo de escolha no
fluxograma apresentado na Figura 2.7.
Uma vez selecionada uma ou mais distribuições candidatas, o próximo passo é estimar
os parâmetros. Como este trabalho considera amostras independentes e igualmente distribuí-
das, pode-se utilizar o método de máxima verossimilhança, apresentado na Subseção 2.4.5,
que é calculado por meio da função fitdist().
Para avaliar a qualidade do ajuste, o pacote fitdistrplus fornece diferentes tipos de
funções. As funções qqcomp() e ppcomp() plotam, respectivamente, os gráficos quantil-
quantil (Q-Q) e probabilidade-probabilidade (P-P), enquanto que as funções denscomp() e
cdfcomp() plotam, respectivamente, o gráfico das fda’s e fdp’s das distribuições candida-
tas. O detalhe é que as plotagens dessas funções são sobrepostas às distribuições empíricas
permitindo, assim, uma ótima capacidade visual analítica. Tal método de sobreposição é
abordado em (Wilks, 2006, p. 112).
Ainda consoante Wilks (2006), os gráficos Q-Q e P-P consistem em uma técnica grá-
fica que verifica se dois conjuntos de dados vêm de populações com a mesma distribuição.
Esses gráficos são constituídos de dois eixos: o eixo x (horizontal) e o eixo y (vertical), onde
os quantis (no caso do gráfico Q-Q ) ou as probabilidades acumuladas (no caso do gráfico
P-P) são as cooordenadas desses eixos. Uma linha de 45 graus é plotada e quanto mais
próximas dessa linha forem os pontos das coordenadas, maior é a evidência de aderência.
Apenas para exemplificar, supondo que uma amostra aleatória de tamanho 100, gerada
no R, de uma distribuição binomial de parâmetros n = 2000 e p = 0, 2 seja a distribuição
empírica. Deseja-se verificar a aderência com uma distribuição de Poisson de parâmetro
λ = 400. Lembre-se que foi mostrado na Subseção 2.1.3, que a distribuição de Poisson
pode ser usada como aproximação da distribuição Binomial quando os parâmetros binomiais
n é muito grande (n → ∞) e p muito pequeno (p → 0). Veja na Figura 2.8 como essa
aproximação é evidenciada.
2. F UNDAMENTAÇÃO T EÓRICA
Por fim, a aplicação dos testes de aderência se dá pela função gofstat(). Para o
caso contínuo, essa função executa, por padrão, os testes Kolmogorov-Smirnov, Cramer-von
Mises e Anderson-Darling. Enquanto que no caso discreto, ela aplica o teste qui-quadrado.
O pacote stats também oferece esses recursos por meio de funções como
chisq.test() para o teste do qui-quadrado e ks.test() para o teste Kolmogorov-
Smirnov.
Convém enfatizar o fato de que, não é razoável rejeitar ou aceitar uma hipótese de
aderência apenas se baseando nos resultados desses testes. Com relação a Casella & Berger
(2002) e Delignette-Muller & Dutang (2015), essa decisão deve ser tomada com base em
todo o conjunto, aqui neste trabalho demonstrado, da análise realizada nos dados.
Todas as funções e pacotes destacados nesta Seção possuem diversos detalhes que
valem a pena serem apreciados. Para isso, o uso do comando help(nome da função ou
do pacote ) no console (ou mesmo a busca pela documentção na Internet) serve para todos
os pacotes e funções acima citados.
denominadas por “Dsim ”. Essa distribuição é comparada com o “Dobs ”, que é a estatística de
teste Kolmogorov obtida através da amostra de dados reais.
O p-valor é calculado dividindo o número de Dsim obtidos pelo número de replicações
realizadas. Acrescenta-se uma unidade ao numerador e ao denominador para evitar resulta-
dos sem sentido com muitas casas decimais. Veja Equação abaixo.
onde em x é colocado vetor contendo a amostra e cdf recebe a string da função acumulada
da distribuição que se deseja testar. Mais detalhes na documentação do pacote.
O uso do pacote queueing é simples. Para criar a entrada de um modelo, basta utilizar
a função NewInput.model, digitando, por exemplo:
para criar um modelo M/M/1 com taxas de 0.25 chegadas por unidade de tempo (λ = 0.25)
e de 1 atendimento por unidade de tempo (µ = 1). O valor de n é dado para o cálculo de
2. F UNDAMENTAÇÃO T EÓRICA 58
> plot(n,pn(y),type="l",ylim=c(0,0.6),ylab="",col="green").
> summary(y).
Metodologia
59
3. M ETODOLOGIA 60
por Ferreira (2017) foi de caráter descritivo, dissertativo e comparativo, realizando análises
qualitativas e quantitativas dos cenários de tráfego de ônibus de transporte público local.
Mais precisamente, foram realizadas simulações referentes a dois tipos de cenários:
com corredores mistos (cenário atual) e corredores exclusivos. No primeiro caso, os ônibus
trafegam juntamente com outros tipos de veículos e pedestres. Já no segundo, nos corredores
exclusivos, os ônibus transitam de forma segregada do tráfego geral; sem nenhuma interfe-
rência. Nas simulações do cenário envolvendo os corredores mistos, foram utilizados os
dados coletados de todos os veículos. Enquanto que no cenário para corredores exclusivos,
foram utilizados somente os dados coletados de vans e ônibus.
Foram feitas quatro tipos de coletas:
Os pontos P1, P2, . . ., P6 situados nas ruas Doutor Santos e Camilo Prates correspon-
dem aos locais de coleta de dados que os pesquisadores se posicionaram. Ferreira (2017)
classificou todos os tipos de movimentos possíveis e a explicação de cada um deles consta
no quadro da Figura 3.2.
3. M ETODOLOGIA 62
1 1
CV Ek = √ → k = , (3.1)
k (CV Ek )2
onde CV é o coeficiente de variação da amostra coletada.
Também foram utilizados os critérios de máxima verossimilhança e momentos como
forma de comparação.
Para a avaliação da qualidade do ajuste, foi realizada análise gráfica conforme expli-
cado na Seção 2.5.2.
Depois de encontrar um nível aceitável de confiança que o modelo é markoviano ou
Erlang, aplicou-se os testes de ajustamento; Kolmogorov-Sminorv para os dados dos tempos
de atendimento e o teste qui-quadrado para os dados do número de chegadas ao sistema.
Diante do exposto, a metodologia aplicada para especificar o melhor modelo e, conse-
quentemente, fornecer análises precisas do mesmo, consistiu nos seguintes passos:
Antes de tudo, 4 considerações precisam ser feitas. A primeira consiste em notar que
os dados coletados referentes aos tempos de embarque e desembarque estão em segundos,
enquanto que o número de chegadas de ônibus foram contados a cada 15 minutos. Existem,
portanto, dois impasses: os dados estão em unidades de medidas distintas (minutos e se-
gundos) e são poucos dados para aplicar o teste de aderência qui-quadrado pelo fato de que,
como visto na Subseção 2.4.3.1, não é eficiente para amostras pequenas.
Sendo assim, optou-se por realizar uma convenção gerando números aleatórios que
representem o número de chegadas a cada minuto, de modo que o total de chegadas a cada
15 minutos seja igual aos dados da Tabela 3.2. Ou seja, tinha-se em mãos o clássico problema
de programação: "gere N números aleatórios de modo que a soma entre eles dê Soma.
Não é um problema tão trivial quanto parece, uma vez que apenas “mandar” o R gerar
amostras de tamanho 15 e depois verificar se a soma dos dados é igual ao valor desejado
3. M ETODOLOGIA 66
pode durar um tempo infinito, por se tratar de um processo randômico. As linhas do código,
em linguagem R, que geraram esses números aleatórios constam a seguir:
A<-c(8, 13, 13, 14, 15, 11, 16, 11) #A recebe amostra de tamanho 8.
n<-15
B<-c()#B receberá a nova amostra de tamanho 120.
for (j in 1:length(A)) {
arrival<-vector("numeric", length = 15)
sum<-A[j]
for (i in 1:sum) {
home<-abs(floor((runif(1,1,(n+0.99999)))))
arrival[home]<-arrival[home]+1
}#a casa sorteada recebe a chegada em cada loop.
B<-c(B,arrival)
}
print(B) #Imprime vetor com nova amostra.
Foi considerada, também, uma situação de fila infinita, com disciplina FIFO, supondo que
os ônibus que chegam e encontram as três baias ocupadas se acumulam.
Capítulo 4
Resultados e Discussão
Após a importação dos dados para o R em forma de data.frame [Veja Peng (2016)],
foram aplicadas as técnicas apresentadas na Metodologia. Veja a seguir como foi realizada a
análise do problema apresentado na Seção anterior.
68
4. R ESULTADOS E D ISCUSSÃO 69
Tabela 4.1. Cálculo das Medidas Descritivas para os tempos de embarque e desembar-
que praça Coronel.
Estatísticas Resumidas Resultados
Média 0,755
Mediana 0,683
Desvio Padrão Estimado 0,432
Assimetria Estimada 0,83
Curtose Estimada 2,813
Máximo 1,583
Mínimo 0,283
Fonte: Próprio autor. Adaptada pelo RStudio.
Percebe-se uma assimetria levemente positiva, o que, pela Figura 2.7, apresentada na
página 54, obtém-se uma suspeita tanto para o modelo exponencial quanto para o modelo de
Erlang.
4. R ESULTADOS E D ISCUSSÃO 71
Isso foi confirmado pelo teste de Kolmogorov-Smirnov, que foi realizado utilizando
a função ks.test() do pacote stats, onde o valor para a estatística de teste D10 = 0, 3129,
menor que o valor crítico tabelado de Lilliefors (1969), D10;0,05 = 0, 325, para um nível
de significância α = 0, 05 , foi obtido. O p-valor obtido pela função LcKS() do pacote
KScorrect também foi maior que 5 por cento; p.value = 0, 07.
Já para o modelo gama, os parâmetros da forma, k, e da taxa, τ, estimados pelo método
dos momentos foram k = 3, 384 e τ = 4, 482, respectivamente. Enquanto que pelo método
da máxima verossimilhança, os resultados encontrados foram k = 3, 505 e τ = 4, 642. Esses
valores foram calculados pela função fitdist().
Para estimar os parâmetros pelos dados da amostra, o método analítico, a Equação 3.1
foi utilizada encontrando o valor k = 3, 045 para o parâmetro da forma e, para o parâmetro
da taxa, utilizando a Equação 2.25, o valor τ = 4, 034 foi encontrado.
4. R ESULTADOS E D ISCUSSÃO 72
Com a posse desses resultados, foram então plotados, na Figura 4.4, os gráficos so-
brepostos das fda’s das distribuições empírica e teórica para diferentes valores de k inteiro,
percebendo um melhor ajuste com k = 3. Observe:
A Figura 4.5 mostra um resultado comparativo dos três métodos de estimação; analí-
tico, momentos e máxima verossimilhança para k = 3 fixo.
4. R ESULTADOS E D ISCUSSÃO 73
Figura 4.5. Fda’s da distribuição empírica e erlang tipo 3 para métodos de estimação.
Como se pode ver, o parâmetro encontrado pelo método analítico foi o que evidenciou
maior nível de aderência.
A Figura 4.6 mostra uma ilustração dos gráficos das fda’s e fdp’s das distribuições
Erlang e exponencial estimadas sobrepostos aos dados da distribuição empírica.
4. R ESULTADOS E D ISCUSSÃO 74
Figura 4.6. Fda’s e Fdp’s dos modelos estimados sobrepostos à distribuição empírica.
Praça Coronel.
De fato, tudo indica que o modelo Erlang apresenta maior aderência que o exponen-
cial. Aplicando o teste de Kolmogorov-Smirnov para verificar aderência com uma Erlang
de parâmetros k = 3 e τ = 4, 034, foi obtido o valor D10 = 0, 162, menor que o valor crítico
tabelado de Tadikamalla (1990); D10;0,05 = 0, 269.
Sendo assim, dos resultados alcançados, verifica-se que o sistema sob análise pode ser
representado pelo modelo M/E3 /3, com λ = 0, 875 ônibus por minuto e µ = 1, 324 ônibus
por minuto.
Por não existirem fórmulas exatas para as medidas de desempenho desse tipo de mo-
delo, optou-se por realizar uma consulta em dados tabelados. Esses resultados podem ser
encontrados em Hillier & Lo (1972), que realizaram um projeto computacional para obter e
tabular resultados das medidas de desempenho de sistemas do tipo Em /Ek /c, onde m e k são
os parâmetros de forma da distribuição Erlang para os tempos entre chegadas e os tempos de
serviço, respectivamente, e c é o número de servidores (canais de serviços em paralelo).
Para tomar proveito dessa tabela, basta utilizar os valores de m = 1, k = 3, c = 3 e ρ.
4. R ESULTADOS E D ISCUSSÃO 75
0, 875
ρ= ≈ 0, 22. (4.1)
3 ∗ 1, 324
Considerando ρ = 0, 2, as seguintes medidas de desempenho foram obtidas por meio
da tabela de Hillier & Lo (1972):
P0 ≈ 0, 55.
Pf ila ≈ 0, 02.
L ≈ 0, 6.
Lq ≈ 0, 005.
Wq ≈ 0, 005 minuto.
W ≈ 0, 691 minuto.
Com base nos valores obtidos, observa-se um sistema com baixa taxa de ocupação,
rara formação de filas e um tempo médio de permanência na baia de aproximadamente W −
Wq = 0, 686 minuto ≈ 41 segundos; o que conforme Ferreira (2017) está dentro dos padrões
recomendados.
4. R ESULTADOS E D ISCUSSÃO 76
Veja na Figura 4.7, os resultados, encontrados por Hillier & Lieberman (2001), das
probabilidades de estado para o sistema em questão.
Figura 4.8. FDA e FP teóricas e empíricas do número de chegada de ônibus praça Dr.
Carlos.
No teste qui-quadrado, o valor observado Xobs 2 = 1, 85, menor que o valor crítico
2
X2,5% = 5, 99, foi obtido; não oferecendo indícios para rejeição da hipótese de que os dados
da amostra possuem boa aderência com a distribuição de Poisson de parâmetro λ = 0, 875.
Os dados coletados referentes aos tempos de embarque e desembarque, convertidos
para minutos, ofereceram taxa de µ = 0, 446 embarques e desembarques por minuto. A
Figura 4.9 apresenta o gráfico das fda’s e fp’s para a amostra dos tempos de embarque e
desembarque.
4. R ESULTADOS E D ISCUSSÃO 78
Figura 4.9. FDA e FDP tempos de embarque e desembarque praça Dr. Carlos.
Tabela 4.2. Cálculo das Medidas Descritivas para os tempos de embarque e desembar-
que praça Doutor Carlos.
Estatísticas Resumidas Resultados
Média 2,24
Mediana 1,875
Desvio Padrão Estimado 1,235
Assimetria Estimada 2,061
Curtose Estimada 8,141
Máximo 5,383
Mínimo 1,067
Fonte: Próprio autor. Adaptada pelo RStudio.
Novamente, percebe-se uma assimetria positiva, o que, conforme visto, obtém-se uma
suspeita tanto para o modelo exponencial quanto para o modelo de Erlang. Porém, dessa
vez, com certa presença de outliers devido ao alto valor de curtose observado; o que pode
prejudicar a qualidade de ajustamento, (Sematech, 2012).
4. R ESULTADOS E D ISCUSSÃO 79
Para o modelo Gama, assim como na praça Coronel, foi realizada a estimação dos
parâmetros por três métodos; o analítico, momentos e máxima verossimilhança. Os parâ-
metros da forma, k, e da taxa, τ, estimados pelo método dos momentos foram k = 3, 655 e
τ = 1, 632, respectivamente. Enquanto que pelo método da máxima verossimilhança, os re-
sultados encontrados foram k = 4, 889 e τ = 2, 183. Já pelo método analítico, foram obtidos
os valores k = 3, 29 e τ = 1, 469.
Utilizando a mesma metodologia da Subseção anterior, foi escolhido k = 3 e τ = 1, 469.
Novamente o modelo Erlang aparenta possuir um melhor ajuste. Veja na Figura 4.11 o
histograma da distribuição empírica sobreposto aos modelos estimados.
4. R ESULTADOS E D ISCUSSÃO 80
Figura 4.12. Resultado da simulação Monte Carlo para modelo exponencial praça Dr.
Carlos.
Para o modelo Erlang, a estatística de teste obtida foi D10 = 0, 224, menor que o valor
crítico tabelado de Tadikamalla (1990); D10;0,05 = 0, 269 .
Assim, pelo conjunto de todas as análises gráficas, cálculo das medidas descritivas e
os testes de ajustamento, o modelo exponencial não parece ter uma boa qualidade de ajuste
em comparação com o modelo Erlang. O que confirma o fato de o coeficiente de variação
calculado para os tempos de atendimento não estar tão próximo de 1; CV ≈ 0, 55.
Em face dos resultados alcançados, optou-se pela escolha do modelo M/E3 /3, com
λ = 0, 446 ônibus por minuto e µ = 1, 324 ônibus por minuto.
Tem-se, portanto, o seguinte valor para ρ:
ρ ≈ 0, 63.
P0 ≈ 0, 12.
4. R ESULTADOS E D ISCUSSÃO 82
Pf ila ≈ 0, 41.
L ≈ 2, 5.
Lq ≈ 0, 54.
Wq ≈ 0, 65 minuto.
W ≈ 2, 96 minuto.
Considerações Finais
5.1 Conclusão
A análise do sistema apresentado na Metodologia foi realizada com o propósito de
demonstrar como as técnicas de ajustamento de distribuições são aplicadas na especificação
do melhor modelo de filas.
A hipótese de aderência ao modelo Poisson foi bem aceita tanto para os dados volumé-
tricos de chegadas de ônibus na praça Coronel Ribeiro, quanto para a praça Doutor Carlos
Versiani.
Quanto aos tempos de embarque e desembarque na praça Coronel, tanto o modelo ex-
ponencial, quanto o modelo de Erlang mostraram razoável aderência, porém, ao avaliar a
84
5. C ONSIDERAÇÕES F INAIS 85
qualidade do ajuste, por meio de análises gráficas, e aplicar os testes de ajustamento estuda-
dos, o modelo Erlang estimado mostrou melhor aderência.
Já em relação aos tempos de embarque e desembarque na praça Doutor Carlos Versiani,
a hipótese de que os dados seguem o modelo Erlang foi bem aceita. É válido destacar que o
modelo exponencial não ofereceu boa aderência, uma vez que os resultados das análises grá-
ficas não indicaram um bom ajustamento, assim como o valor crítico do teste de ajustamento
Kolmogorov-Smirnov, para esse modelo, foi maior que o valor tabelado por Lilliefors (1969)
e o p-valor, obtido pela função LcKS, foi menor que 5 por cento. Isso evidenciou o fato de o
coeficiente de variação da amostra calculado não estar tão próximo de 1; CV ≈ 0, 55.
Ao observar in loco as baias de ônibus em momentos aleatórios de horários de pico,
o autor pôde constatar uma realidade compatível com os resultados obtidos no Capítulo 4.
Foram notados baixos tempos de permanência dos ônibus na baia da praça Coronel Ribeiro
e uma forte tendência em sempre haver cerca de 2 ônibus ocupando a baia da praça Doutor
Carlos.
Os resultados obtidos para os tempos médios de permanência nas baias se mostraram
condizentes com a média dos tempos de embarque e desembarque coletados por Ferreira
(2017). As médias das amostras apresentadas na Tabela 3.1 foram iguais a 45, 3 segundos
para a praça Coronel Ribeiro e 134, 3 para a praça Doutor Carlos Versiani, enquanto que os
tempos médios de permanência nas baias obtidos no Capítulo 4 foram iguais a 41 segundos
para a praça Coronel e 2, 317 minutos = 139 segundos para a praça Doutor Carlos.
Foi constatada, também, uma baixíssima probabilidade de haver formação de filas na
praça Coronel, Pf ila ≈ 0.02, e uma probabilidade relativamente alta para a praça Doutor
Carlos, Pf ila ≈ 0.41, tendo em vista que o tipo de sistema em questão (baias de ônibus) não
pode admitir filas.
Em virtude dos dados encontrados, fica evidenciada a existência do problema no pre-
cesso de filas nas baias de ônibus/locais de embarque e desembarque localizadas no corredor
Camilo Prates, tornando necessária a execução de alguma medida corretiva.
Acredita-se que apenas aumentar o número de linhas de ônibus para melhor suprir a
alta demanda de passageiros na praça Doutor Carlos pode não ser uma medida eficaz para
resolver o problema por completo, uma vez que, como abordado anteriormente, o tráfego
congestionado e a falta de infraestrutura adequada é que têm tornado ineficiente o serviço
de transporte público na cidade, não o contrário. O que foi notado nas observações in loco
é que, por muitas vezes, a fila de veículos que se acumulam no semáforo logo à frente à
praça Doutor Carlos é o que impede os ônibus conseguirem deixar a baia por completo,
mesmo após todo o processo de embarque e desembarque dos mesmos. Vale lembrar, que
a viabilidade de implantação de corredores exclusivos foi demonstrada por Ferreira (2017),
ficando esta como sugestão de medida corretiva pelo autor e orientador deste trabalho.
5. C ONSIDERAÇÕES F INAIS 86
Publicações e Apresentações em
Eventos
Neste Capítulo, são apresentados artigos desenvolvidos pelo autor e seu orientador no
decurso deste trabalho.
87
6. P UBLICAÇÕES E A PRESENTAÇÕES EM E VENTOS 88
mero de chegadas. Na primeira, foi gerada uma amostra de tamanho 50 para o número de
chegadas por minuto seguindo uma distribuição de Poisson com média de aproximadamente
0, 3 chegadas por minuto e outra amostra aleatória para o tempo de atendimento seguindo
uma distribuição exponencial com média de 2 minutos. Na segunda simulação foi feito o
mesmo procedimento propondo uma taxa de chegada de aproximadamente 50% maior. Por
fim, foram comparadas as medidas de desempenho para os dois exemplos.
6.1.1 Resultados
A primeira amostra gerada para o número de chegadas no sistema, com taxa desejada
de 0, 28, foi a seguinte:
0 0 0 1 0 0 1 0 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 1 2 0 1 0 0 0 0 0 0 0
0 0 0 0 1 0 0 1 1 0 0 0 1 0 0 0
Isso significa que nos três primeiros minutos não houve chegada, no minuto 4 houve 1
chegada, no quinto e sexto também não, no sétimo 1 e assim por diante.
Pode-se verificar um total de 15 chegadas ocorridas e, assim, uma primeira amostra, de
tamanho 15, gerada para os tempos de atendimento, com média de 2 minutos, foi a seguinte:
0.15 1.29 2.55 1.91 2.07 1.62 2.16 3.26 0.37 0.29 2.97 1.2 3.44 1.03
5.68
0 0 0 1 1 0 1 1 0 0 1 0 1 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 1 2 2 1 1 0 0
0 0 1 0 0 1 1 2 0 0 0 0 0 1 1
A amostra gerada para os tempos de atendimento de cada uma das chegadas acima,
com taxa de 2 minutos, foi:
0.8 1.45 5.61 1.44 0.07 1.25 0.11 0.21 0.41 6.84 3.2 0.47 2.94 0.18
3.5 1.08 3.88 1.93 5.22 1.03 0.64 2.92 0.82
6.2.1 Resultados
Os resultados obtidos encontram-se na Tabela 6.1, em que os valores entre parênteses
são os teóricos para uma fila M/M/1 com taxa de chegadas λ = 0, 4 e taxa de serviço µ = 2:
Tabela 6.1. Valores obtidos por simulação para as medidas de desempenho de uma fila
M/M/1.
λ µ ρ P0 L W Lq Wq
0,401 2 0,2 0,8 0,25 0,625 0,05 0,125
(0,4) 2 (0,2) (0,8) (0,25) (0,625) (0,05) (0,125)
6.3.1 Resultados
Os resultados encontrados para o algoritmo do sistema determinístico se mostraram
satisfatórios.
A Figura 6.2 mostra o resultado para dois tipos de exemplos: um com tempo de an-
tendimento múltiplo do tempo entre chegadas, µ1 = m λ1 , e outro com tempo de atendimento
não múltiplo do tempo entre chegadas; µ1 6= m λ1 , onde m > 0 é inteiro.
Perceba que para o primeiro caso, µ1 = m λ1 , o tempo de recusa ti é igual a 20. Observe
que após esse tempo, o número de clientes se mantém em 5 eternamente, condizendo com a
Equação 2.64.
6. P UBLICAÇÕES E A PRESENTAÇÕES EM E VENTOS 93
Já no segundo caso, µ1 6= m λ1 , o tempo de recusa é igual a 27. Note que após este
momento, n(t) fica oscilando entre 3 e 4 ((k − 1 e k − 2) para sempre; o que condiz com a
Equação 2.65.
As outras medidas calculadas para os dois exemplos encontram-se a seguir:
Tempo de Recusa: 20
O usuario 10 foi o primeiro a ser rejeitado pelo sistema
Primeira saida no sistema apos a primeira recusa ocorreu no tempo 22
Primeira chegada no sistema apos a primeira recusa ocorreu no tempo 22
Duracao do ciclo: 4 unidades de tempo.
Tempo de Recusa: 27
O usuario 9 foi o primeiro a ser rejeitado pelo sistema
Primeira saida no sistema apos a primeira recusa ocorreu no tempo 28
Primeira chegada no sistema apos a primeira recusa ocorreu no tempo 30
Duracao do ciclo: 15 unidades de tempo.
O sistema analisado está restrito à análise do intervalo entre chegadas (IEC), tempo
para servir nos buffets (TSB) e tempo de permanência no salão (TP).
6. P UBLICAÇÕES E A PRESENTAÇÕES EM E VENTOS 95
6.4.1 Resultados
Com o auxílio da ferramenta Input Analyzer (analisador de dados de entrada) do soft-
ware Arena R , foi realizada a análise estatística dos dados, onde foram calculadas medidas
como média, mediana e desvio padrão das variáveis em estudo supracitadas, assim como a
melhor distribuição candidata.
Onde:
IEC - Intervalo entre chegadas.
TSB1 - Tempo para servir buffet A em minutos.
TSB2 - Tempo para servir buffet B em minutos.
TP - Tempo permanência do salão em minutos.
Casella, G. & Berger, R. L. (2002). Statistical inference, volume 2. Duxbury Pacific Grove,
CA.
Erlang, A. K. (1909). The theory of probabilities and telephone conversations. Nyt. Tidsskr.
Mat. Ser. B, 20:33--39.
96
R EFERÊNCIAS B IBLIOGRÁFICAS 97
Fishman, G. (1995). Monte Carlo: concepts, algorithms, and applications. Springer Science
& Business Media.
Gross, D. & Harris, C. M. (2008). Fundamentals of queueing theory. John Wiley & Sons, 4
edição.
Hillier, F. S. & Lo, F. D. (1972). Tables for multiple-server queueing systems involving
erlang distributions. Relatório técnico, STANFORD UNIV CALIF.
Kendall, D. G. (1953). Stochastic processes occurring in the theory of queues and their analy-
sis by the method of the imbedded markov chain. The Annals of Mathematical Statistics,
pp. 338--354.
Lilliefors, H. W. (1967). On the kolmogorov-smirnov test for normality with mean and
variance unknown. Journal of the American statistical Association, 62(318):399--402.
Moraes, F. G.; Silva, G. F. & Rezende, T. A. (2011). Introdução à teoria das filas. Universi-
dade Federal do Mato Grosso.
R Core Team (2018). R: A language and environment for statistical computing. Disponível
em: https://www.r-project.org/about.html. [Acesso em: 23-Maio-2019].
99
A. ROTINAS PARA F ILAS D ETERMINÍSTICAS 100
Algorithm 4 ALGORITMO PARA MODELO MM1 - Parte 1: Gera amostra dos número de
chegadas por instantes de tempo.
1: errocheg ← 1
2: while errocheg > 0.02 do . Loop gera amostra de número de chegadas
3: chegada ← vpois(ncheg, lambda) . Variável chegada recebe um vetor de poisson
de tamanho ncheg e média lambda declarados pelo usuário.
4: media ← media(chegada)
5: errocheg ← modulo(lambda − media) . Enquanto essa diferença for maior que
0.02, repete o loop.
6: end while
Algorithm 5 ALGORITMO PARA MODELO MM1 - Parte 2: Gera amostra dos tempos de
atendimentos.
1: natend ← 0
2: for i in chegada do . Este loop calcula a quantidade de chegadas e atribui à variável
natend.
3: natend ← natend + i
4: end for
5: erroatend ← 1
6: while errocheg > 0.001 do . Este loop gera amostra dos tempos de atendimentos.
7: atendimento ← vexp(natend, mi) . Variável atendimento recebe um vetor
exponencial de tamanho ncheg e média mi declarados pelo usuário.
8: media ← media(atendimento) . Calcula a média dessa amostra.
9: erroatend ← modulo(mi − media) . Enquanto essa diferença for maior que 0.001,
repete o loop.
10: end while
101
B. ROTINAS PARA MODELOS MARKOVIANOS 102
103
A. R ESULTADOS DAS SIMULAÇÕES NO RESTAURANTE UNIVERSITÁRIO 104
105