You are on page 1of 120

ANÁLISE DE SISTEMAS DE FILAS NO SOFTWARE R

PEDRO HUMBERTO DE ALMEIDA MENDONÇA GONZAGA

ANÁLISE DE SISTEMAS DE FILAS NO SOFTWARE R

Dissertação apresentada ao Programa de Pós-


-Graduação em Modelagem Computacional
e Sistemas do Departamento de Ciência da
Computação da Universidade Estadual de
Montes Claros - Unimontes como requisito
parcial para a obtenção do grau de Mestre em
Modelagem Computacional e Sistemas.

O RIENTADOR : N ILSON L UIZ C ASTELUCIO B RITO

Montes Claros
Julho de 2019
c 2019, Pedro Humberto de Almeida Mendonça Gonzaga.
Todos os direitos reservados.

Gonzaga, Pedro Humberto de Almeida Mendonça

G642a Análise de Sistemas de Filas no Software R


[manuscrito] / Pedro Humberto de Almeida Mendonça
Gonzaga. — 2019.

105 f. : il.
Bibliografia: f. 96-98.

Dissertação (mestrado) – Universidade Estadual de


Montes Claros - Unimontes, Programa de Pós-Graduação
em Modelagem Computacional e Sistemas/PPGMCS,
2019.

Orientador: Prof. Dr. Nilson Luiz Castelucio Brito

1. Teoria das Filas. 2. R (linguagem de programação de


computador). 3. Inferência Estatística. 4. Processos
Estocásticos. I. Brito, Nilson Luiz Castelucio.
II. Universidade Estadual de Montes Claros. III. Título

Catalogação Biblioteca Central Professor Antônio Jorge


À minha mãe Mara, que nunca me deixou desistir. À minha filha Alice, que, sem
sombra de dúvidas, é minha maior motivação. À minha irmã Brisa, minha incentivadora.
Ao meu amado pai, Erasmo Umberto Gonzaga Júnior (in memoriam).
Agradecimentos

Agradeço, sobretudo, a Deus pela força inspiradora.


Agradeço ao meu orientador Nilson, que sempre foi um excelente guia durante todo
esse árduo caminho na busca pelo conhecimento.
À Michelly Ferreira, pela disponibilização dos dados.
Ao programa PPGMCS, aos professores, amigos, colegas e a todos que de alguma
forma contribuíram com a realização deste trabalho.

vi
“Começo e recomeço,
esse sempre foi o meu tropeço.”
(Marcos Giovanny)

vii
Resumo

Suponha um sistema de filas do tipo FCFS (first come first served) com tempos entre
chegadas sucessivas e tempos de atendimento não determinísticos. Deseja-se saber qual o
modelo mais adequado para a análise desse sistema (se Markov ou Erlang), assim como a
estimação dos parâmetros e determinação de distribuições a partir de amostras da população.
Para isso, conhecimentos sobre Processos Estocásticos, Inferência Estatística e Teoria das
Filas foram necessários. A Teoria de Filas é um ramo da teoria das probabilidades que se
iniciou por volta de 1909 com Agner K. Erlang, matemático e engenheiro de telecomuni-
cações dinamarquês, quando decidiu aplicar tais conhecimentos na resolução de problemas
de tráfego de telefonia. Fornecem as denominadas medidas de desempenho de sistemas ou
processos de filas que expressam a funcionalidade ou operacionalidade dos mesmos. Neste
trabalho, o leitor conhecerá as potencialidades do software R, que possui ótimas ferramen-
tas e recursos que auxiliam tanto a especificação do melhor modelo, quanto a estimação
dos parâmetros e obtenção das medidas de desempenho. Com o intuito de demonstrar a
aplicabilidade dos conhecimentos adquiridos, foi analisado o processo de filas nas baias de
ônibus/locais de embarque e desembarque localizadas no centro da cidade Montes Claros,
Estado de Minas Gerais.

Palavras-chave: Teoria das Filas, Software R, Inferência Estatística, Processos Estocásti-


cos.

viii
Abstract

Consider a queuing system of type FCFS (first come, first served) in which one the
inter-arrival and service time are nondeterministic. The objective is to know the most appro-
priate model for the analysis of this system (Markov or Erlang), as well as the estimation
of parameters and the determination of distributions from population samples. This work
required knowledge from Stochastic Processes, Statistical Inference and Queue Theory. The
Queue Theory is a branch of probability theory that became an area of research interest after
the 1909’s with Agner K. Erlang, a Danish mathematician and telecommunications engineer,
when he decided to apply such expertise in solving telephony traffic problems. This back-
ground provides the so-called performance measures, that allows to express the operability
or functionality of the system. In this work, the reader will know the potential of software R,
wich has great tools and features for specifying the best model, estimating the parameters and
reaching the performance measures. In order to demonstrate the knowledge acquired during
this study, was analyzed the process of queuing at bus stalls/embarkation and disembarkation
sites in city Montes Claros, Minas Gerais State.

Keywords: Queuing Theory, Software R, Statistical Inference, Stochastic Processes.

ix
Lista de Figuras

2.1 Curva de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6


2.2 Família de distribuições Ek com média 3. . . . . . . . . . . . . . . . . . . . . . 17
2.3 Diagrama de Fluxo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.4 Uma família de distribuições Erlang com média 1/µ . . . . . . . . . . . . . . 41
2.5 Teste bilateral com representação do nível de significância = 5 %. . . . . . . . . 44
2.6 RStudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.7 Método de escolha das distribuições candidatas. . . . . . . . . . . . . . . . . . 54
2.8 Gráficos P-P e Q-Q. Distribuição empírica: binomial de parâmetros n = 2000 e
p = 0.2. Distribuição teórica: Poisson de parâmetro λ = 400. . . . . . . . . . 55

3.1 Ilustração das ruas em estudo e pontos de embarque e desembarque. . . . . . . 61


3.2 Descrição dos tipos de movimentos . . . . . . . . . . . . . . . . . . . . . . . . 62

4.1 FDA e FP teóricas e empíricas do número de chegada de ônibus praça Coronel. 69


4.2 FDA e FDP tempos de embarque e desembarque praça Coronel . . . . . . . . . 70
4.3 Frequência relativa acumulada e modelo exponencial praça Coronel. . . . . . . 71
4.4 Fda’s da distribuição empírica e Erlang tipos 2, 3 e 4. . . . . . . . . . . . . . . 72
4.5 Fda’s da distribuição empírica e erlang tipo 3 para métodos de estimação. . . . 73
4.6 Fda’s e Fdp’s dos modelos estimados sobrepostos à distribuição empírica. Praça
Coronel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.7 Probabilidades de existir N usuários no sistema - Praça Coronel. . . . . . . . . 76
4.8 FDA e FP teóricas e empíricas do número de chegada de ônibus praça Dr. Carlos. 77
4.9 FDA e FDP tempos de embarque e desembarque praça Dr. Carlos. . . . . . . . 78
4.10 Fda e Fdp do modelo exponencial sobreposto à distribuição empírica. Praça Dr.
Carlos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.11 Fdp’s dos modelos estimados. Praça Dr. Carlos. . . . . . . . . . . . . . . . . . 80
4.12 Resultado da simulação Monte Carlo para modelo exponencial praça Dr. Carlos. 81
4.13 Probabilidades de existir N usuários no sistema - Praça Dr. Carlos . . . . . . . 83

x
6.1 Histograma de 5000 amostras de tamanho 10 de uma distribuição exponencial
de parâmetro 2,5) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.2 Resultado comparativo caso múltiplo vs não múltiplo . . . . . . . . . . . . . . 92
6.3 Layout do restaurante universitário. . . . . . . . . . . . . . . . . . . . . . . . . 94

xi
Lista de Tabelas

3.1 Tempos de embarque e desembarque - Rua Camilo Prates. . . . . . . . . . . . 63


3.2 Número de chegadas de ônibus - Rua Camilo Prates. . . . . . . . . . . . . . . 63

4.1 Cálculo das Medidas Descritivas para os tempos de embarque e desembarque


praça Coronel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2 Cálculo das Medidas Descritivas para os tempos de embarque e desembarque
praça Doutor Carlos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

6.1 Valores obtidos por simulação para as medidas de desempenho de uma fila M/M/1. 90
6.2 Análise estatística dos dados coletados. . . . . . . . . . . . . . . . . . . . . . 95

A.1 Simulações do processo variando a quantidade de replicações. . . . . . . . . . 103


A.2 Taxa de utilização dos recursos do sistema. . . . . . . . . . . . . . . . . . . . . 103
A.3 Simulação do tempo médio das filas com 4 atendentes. . . . . . . . . . . . . . 104
A.4 Simulação da taxa de utilização com 4 atendentes. . . . . . . . . . . . . . . . . 104

B.1 Distribuição exponencial com média desconhecida . . . . . . . . . . . . . . . 105


B.2 Distribuição Gama com parâmetros desconhecidos . . . . . . . . . . . . . . . 105

xii
Sumário

Agradecimentos vi

Resumo viii

Abstract ix

Lista de Figuras x

Lista de Tabelas xii

1 Introdução 1
1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Fundamentação Teórica 5
2.1 Teoria da Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.1 Variáveis aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.2 Expectâncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.3 Distribuições de probabilidade . . . . . . . . . . . . . . . . . . . . 9
2.2 Processos Estocásticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.1 Cadeias de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.2 Processos de nascimento e morte . . . . . . . . . . . . . . . . . . . 25
2.3 Teoria das Filas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3.1 Principais características de uma fila . . . . . . . . . . . . . . . . . 29
2.3.2 Medidas de desempenho . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.3 Fórmulas de Little . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3.4 Modelos determinísticos . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.5 Modelos markovianos . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.3.6 Modelos de Erlang . . . . . . . . . . . . . . . . . . . . . . . . . . 38

xiii
2.4 Inferência Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.4.1 Teste de hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.4.2 O p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.4.3 Testes de ajustamento . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.4.4 Método dos momentos . . . . . . . . . . . . . . . . . . . . . . . . 48
2.4.5 Estimadores de máxima verossimilhança . . . . . . . . . . . . . . . 49
2.5 O software R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.5.1 O que é o R? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.5.2 O ajustamento de distribuições no R e o pacote fitdistrplus . . . . . 52
2.5.3 O pacote KScorrect . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.5.4 O pacote queueing . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3 Metodologia 59
3.1 Apresentação do Sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.2 Análise do Sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

4 Resultados e Discussão 68
4.1 Praça Coronel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.2 Praça Dr. Carlos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

5 Considerações Finais 84
5.1 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

6 Publicações e Apresentações em Eventos 87


6.1 Algoritmo para análise de sistemas estocásticos M/M/1 . . . . . . . . . . . 87
6.1.1 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
6.2 Simulação em filas M/M/1 utilizando o pacote queueing . . . . . . . . . . . 89
6.2.1 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
6.3 Um algoritmo para modelo determinístico D/D/1/k-1 . . . . . . . . . . . . 91
6.3.1 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
6.4 Simulação do sistema de serviço em um restaurante universitário . . . . . . 93
6.4.1 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

Referências Bibliográficas 96

A Rotinas para Filas Determinísticas 99

B Rotinas para modelos markovianos 101

xiv
Anexo A Resultados das simulações no restaurante universitário 103

B Tabelas resumidas para valores críticos do Teste Kolmogorov 105

xv
Capítulo 1

Introdução

Como discorrem Gross & Harris (2008), um sistema de filas pode ser descrito, basi-
camente, como clientes chegando para receber um determinado serviço, esperando na fila,
caso não haja atendimento imediato, e deixando o sistema após serem servidos. O termo “cli-
ente” é usado num sentido geral, não implicando, necessariamente, ser um cliente humano.
Por exemplo, o termo cliente pode ser usado para se referir a um programa de computador
esperando para ser executado, a um carro aguardando por conserto em uma oficina, dentre
outros.
Estudar o comportamento de filas é algo que se torna extremamente motivante pelo
fato delas estarem presente no cotidiano das pessoas. De fato, praticamente todo mundo já
teve de enfrentar o transtorno de passar horas em uma fila, seja no trânsito, nos aeroportos,
supermercados, em alguma casa lotérica, caixas eletrônicos, etc.
Tanto pelo ponto de vista do cliente quanto pelo da empresa, esse tempo de espera
é altamente indesejável; afinal, onde existe insatisfação do cliente, existe prejuízo para a
empresa. Então, por que ele existe? De fato, acabar com esse tempo de espera não é uma
tarefa fácil por diversas razões. Entre elas destacam-se: falta de servidores, limite de espaço
insuficiente para atendimento, falta de recursos, etc.
Muitos executivos já vêm até investindo na chamada “psicologia de filas” que procura
tornar o mais agradável possível (ou menos entediante) a experiência do cliente durante o
tempo de espera na fila. Richard Larson, pesquisador de operações do MIT, por muitos
considerado o maior especialista em filas do mundo, observa que “muitas vezes a psicologia
das filas é mais importante do que as estatísticas da espera em si.” Veja (Stone, 2012).
Porém, melhorar a experiência de enfileiramento para seus clientes é impossível sem
o aspecto analítico dos sistemas de gerenciamento de fila. Este trabalho utiliza a Teoria das
Filas para especificar o melhor modelo, e fornecer análises precisas para sistemas de filas
determinísticos, markovianos e Erlang utilizando apenas o software R.

1
1. I NTRODUÇÃO 2

A abordagem analítica de filas iniciou-se há mais de cem anos, em Copenhague. Em


1909, o matemático e engenheiro de comunicações dinamarquês Agner. K. Erlang publi-
cou o trabalho intitulado “The Theory of Probabilities and Telephone Conversation”, o qual
abordava sobre a aplicação da teoria das probabilidades em problemas de tráfego de telefo-
nia. Erlang é considerado o pai da Teoria das Filas, (Erlang, 1909).
A Teoria das Filas analisa o fenômeno de formação de filas e suas características atra-
vés de conceitos de processos estocásticos e de matemática aplicada. Ela proporciona mo-
delos matemáticos que preveem o comportamento de um determinado sistema cuja demanda
cresce aleatoriamente. Fornece as denominadas medidas de desempenho, que expressam a
operacionalidade ou funcionalidade do mesmo. Dentre essas medidas, podem-se citar: nú-
mero médio de elementos na fila e no sistema, tempo médio de espera na fila e no sistema,
dentre outras.
R é uma linguagem de alto nível e ambiente para computação estatística e análise de
dados e gráficos. Compila e roda em praticamente todas as plataformas e sistemas operaci-
onais existentes, tais como: UNIX, Windows, MacOS, etc. Além disso, ele possui grande
influência da linguagem e ambiente S, desenvolvida por Jonh Chambers nos laboratórios
Bell.
Para tomar proveito das potencialidades da linguagem R, utiliza-se o Software R e sua
maior vantagem vem do fato de ser livre, o que é ideal para estudantes e pesquisadores. O
R passou a ser muito utilizado depois que a linguagem S foi desenvolvida, sendo uma das
principais limitações desta o fato de que só estava disponível em um pacote comercial; o
S-PLUS, (Peng, 2016, p. 06).
No R, o usuário possui um alto poder de liberdade, afinal, pelo fato de ser livre, as 4
liberdades de um software livre são garantidas, (GNU, 2019):

Liberdade 0: A liberdade de usar o programa como quiser; para qualquer propósito;

Liberdade 1: A liberdade para estudar como o programa funciona, sendo possível acessar
o código fonte e alterá-lo como quiser;

Liberdade 2: A liberdade de redistribuir cópias, de modo que se possa ajudar os outros com
isso;

Liberdade 3: A liberdade para alterar e distribuir cópias, permitindo com que outros tenham
a chance de se beneficiar com essas mudanças. Acessar o código fonte é um pré-
requisito.

Outra grande vantagem do R é a sua sofisticada capacidade gráfica. Essa capacidade


tem sido um de seus pontos mais fortes, sendo aprimorada com o surgimento cada vez mais
1. I NTRODUÇÃO 3

alto de pacotes de visualização como o lattice 1 e o ggplot2 2 . A facilidade de uso também é


muito grande. Com pouco tempo, o usuário já adquire um alto controle sobre, praticamente,
todos os aspectos de plotagem de gráficos.
O R possui uma alta frequência de publicações na forma de novos pacotes, recursos
e correções de bugs. Para ter consciência disso, basta visitar o site oficial e perceber a
numerosa quantidade de contribuições para diversos tipos de finalidades, (R Core Team,
2018).

1.1 Objetivos
Este trabalho possui como objetivo apresentar um estudo sobre como especificar o me-
lhor modelo de filas, a partir da estimação dos parâmetros e escolha da melhor distribuição, e
fornecer análises precisas para sistemas de filas determinísticos, markovianos ou Erlang uti-
lizando apenas o software R. Nesse sentido, será mostrado como os recursos do R facilitam
o processo de ajustamento de distribuições por meio de um exemplo de aplicação para um
caso real.
Ferreira (2017), apresentou uma abordagem quantitativa e qualitativa, por meio de téc-
nicas de simulação, de um estudo que demonstrou a viabilidade da implantação de corredores
exclusivos no centro da cidade de Montes Claros, Estado de Minas Gerais.
Os dados volumétricos de chegadas dos ônibus nas baias, assim como os dados dos
tempos de embarque e desembarque colhidos no trabalho de Ferreira (2017) foram utilizados
neste trabalho. Deseja-se analisar o precesso de filas nas baias de ônibus/locais de embarque
e desembarque localizadas na rua Camilo Prates.

1.2 Motivação
A motivação do autor para realização deste estudo surgiu quando o mesmo iniciou seus
estudos sobre teoria das filas por meio do livro de Fogliatti & Mattos (2007), em meados de
2014, para realização de seu trabalho de conclusão do curso de engenharia elétrica. Ao fi-
nal do referido livro, mais especificamente no último capítulo, as autoras apresentam alguns
exemplos de aplicações de análises de filas em casos reais. Nesses capítulos algumas con-
siderações sobre a especificação do modelo mais adequado ao problema sob análise, assim
como a estimação dos parâmetros e determinação das distribuições, a partir de amostras da
população, são realizadas. Porém, a descrição de técnicas para a realização desses temas não
1 https://cran.r-project.org/web/packages/lattice/index.html
2 https://cran.r-project.org/web/packages/ggplot2/index.html
1. I NTRODUÇÃO 4

são o objetivo do livro supracitado. Ricci (2005) publicou um artigo descrevendo um passo
a passo de como o R é útil no processo de ajustamento de distribuições. Ele apresesentou
ferramentas e pacotes do R que facilitam muito o processo de escolha das distribuições can-
didatas, estimação dos parâmetros a partir dos dados da amostra, avaliação da qualidade do
ajuste e aplicação dos testes de ajustamento. Por tais razões, manifestou-se o interesse no
tema do presente trabalho, o qual procura descrever técnicas para escolha do modelo mais
adequado ao sistema de filas sob análise, utilizando apenas o software R.
Capítulo 2

Fundamentação Teórica

Para o alcance dos objetivos deste trabalho, conhecimentos sobre Processos Estocás-
ticos, Inferência Estatística e Teoria das Filas tornam-se altamente necessários e o leitor
poderá revisá-los a seguir.

2.1 Teoria da Probabilidade


2.1.1 Variáveis aleatórias
Entende-se por variável aleatória uma função que associa os elementos de um espaço
amostral Ω nos números reais, (Casella & Berger, 2002).
Pode-se definir, por exemplo, uma variável aleatória X como sendo a soma dos resul-
tados de um experimento que consiste no lançamento de dois dados ou a quantidade de caras
em outro experimento que consiste no lançamento de uma moeda 25 vezes.

Definição 1 A cada variável aleatória X, associa-se uma função chamada função de distri-
buição acumulada, ou fda, denotada por FX (x) e definida por

FX (x) = PX (X ≤ x). (2.1)

Cada fda satisfaz certas propriedades de probabilidades. São elas:

Teorema 1 Uma função F(x) é uma fda se, e somente se, forem obedecidas as seguintes
condições:

a) limx→−∞ F(x) = 0 e limx→∞ F(x) = 1.

b) F(x) é uma função não decrescente de x.

5
2. F UNDAMENTAÇÃO T EÓRICA 6

c) F(x) é contínua à direita; isto é, para cada número x0 , limx↓x0 F(x) = f (x0 ).

Uma variável aleatória X pode ser contínua ou discreta e um outro conceito importante
é o de função de densidade de probabilidade (fdp), caso X seja contínua e função de pro-
babilidade (fp), se X for discreta. Ambas, tanto a fdp como a fp estão relacionadas com as
probababilidades pontuais de variáveis aleatórias.

Definição 2 A função densidade de probabilidade ou fdp, fX (x), de uma variável aleatória


contínua X é a função que satisfaz
Z x
FX (x) = fX (t)dt (2.2)
−∞
para todo x.

Como no caso em que X é uma variável aleatória contínua ocorre P(X = x) = 0, então
utiliza-se a ideia de intervalo fechado, pois P(a < X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b).
Por exemplo, a área total delimitada pela curva y = f (x), também conhecida como a “Curva
de Gauss”, que consta na Figura 2.1, e pelo eixo x é igual a 1. E a área compreendida
entre as retas x = a e x = b (sombreada na figura) dá a probabilidade de X estar entre a e b
(P{a ≤ X ≤ b}).

Figura 2.1. Curva de Gauss

Fonte: Moraes et al. (2011)

Definição 3 A função de probabilidade (fp) de uma variável aleatória discreta X é dada por

fX (x) = P(X = x) (2.3)

para todo x.
2. F UNDAMENTAÇÃO T EÓRICA 7

Existem duas exigências para uma fdp ou fp, que são nada mais que consequências de
suas próprias definições.

Teorema 2 Uma função fX (x) é uma fdp (ou fp) de uma variável aleatória X se, e somente
se,

a) fX (x) ≥ 0 para todo x


R∞
b) A soma de todos os valores é igual a 1, isto é, ∑x fX (x) = 1 ou −∞ f X (x) = 1.

2.1.2 Expectâncias
Entende-se por valor esperado, esperança ou expectância de uma variável aleatória
como sendo, meramente, o seu valor médio. Pode ser entendido como uma média central ou
o valor que se espera obter que resuma o comportamento de uma variável aleatória.

Definição 4 A esperança ou média de uma variável aleatória X, denotada por E(X), é:



R ∞ x. f (x)dx, se X for contínuo
−∞ X
E(X) = . (2.4)
∑∞ x .P(X = x), se X for discreto
i=1 i

Algumas importantes propriedades do valor esperado de uma variável aleatória são


dadas no Teorema 3. A demonstração de todas elas são dadas em Meyer (1965).

Teorema 3 Sejam X e Y duas variáveis aleatórias independentes e K uma constante.

a) Se X = K então E(X) = K

b) E(KX) = KE(X)

c) E(X.Y ) = E(X).E(Y ).

d) Sejam n variáveis aleatórias X1 , . . . , Xn → E(X1 + . . . + Xn ) = E(X1 ) + . . . + E(Xn )

2.1.2.1 Momentos e funções geradoras de momentos

Um outro conceito de grande importância no estudo de expectâncias são os momentos


de uma variável aleatória. Esses momentos são obtidos por meio de sucessivas diferencia-
ções das funções geradoras de momentos.
2. F UNDAMENTAÇÃO T EÓRICA 8

Definição 5 A função geradora de momentos, MX (t), de uma variável aleatória X, com fda
FX , é definida para todos os valores de t por:

R ∞ etx f (x) dx, se X for contínua
−∞ X
MX (t) = E etX = . (2.5)
∑ etx P(X = x), se X for discreta
x

A derivada primeira de MX (t) será:

d  tX 
MX0 (t) = E e
dt 
d tX
=E (e )
dt
= E X etX
 

Calculando essa derivada primeira em t = 0, tem-se:

MX0 (0) = E[X e0 ] = EX

De modo análogo, ao se calcular a n-ésima derivada em t = 0, será encontrado o se-


guinte resultado:

(n)
MX (0) = E X n , n≥1

Veja Ross (2010).


Posto isso, definem-se os momentos de uma variável aleatória assim como em (Casella
& Berger, 2002, p. 59).

Definição 6 Para cada número inteiro n, o n-ésimo momento de X (FX (x)), µn0 , é:

µn0 = E X n

O n-ésimo momento central de X, µn0 , é:

µn = E(X − µ)n

onde µ = µ10 = E X

Assim, de modo genérico, os valores esperados E X, E X 2 , . . . , E X n são chamados de


momentos, enquanto que E(X − µ), E(X − µ)2 , . . . , E(X − µ)n são os momentos centrais da
variável aleatória X.
2. F UNDAMENTAÇÃO T EÓRICA 9

Um momento bastante útil em análise de dados, talvez o mais importante consoante


Casella & Berger (2002), é o segundo momento central, mais conhecido como variância.

Definição 7 Seja X uma variável aleatória, a variância de X, denotada por Var X é definida
como segue:

Var X = E[X − EX]2 . (2.6)

A raiz quadrada positiva de Var X é denominada desvio padrão de X.

Tanto a variância quanto o desvio padrão são medidas de dispersão que, basicamente,
dizem o quão longe os dados de alguma distribuição estão da média. Dessa forma, a inter-
pretação relacionada à variância é de que quanto maior for seu valor, mais dispersa e variável
é a distribuição de X. O desvio padrão, por sua vez, possui a mesma interpretação, porém
tem a vantagem de que a sua unidade de medida é a mesma da variável original X, enquanto
que a unidade de medida da variância é o quadrado da unidade original.
Uma forma alternativa para a variância é estabelecida da seguinte forma:

Var X = E[X − EX]2 = E[X 2 − 2 X EX + (EX)2 ]


= EX 2 − 2 (EX)2 + E (EX)2 (2.7)
= EX 2 − (EX)2 .

Assim como o valor esperado EX, algumas importantes propriedades da variância de


uma variável aleatória são dadas no Teorema 4. A demonstração de todas elas são dadas em
Meyer (1965).

Teorema 4 Sejam X e Y duas variáveis aleatórias independentes e K uma constante.

a) Se X = K então Var X = 0

b) Var KX = K 2Var X

c) Var (X +C) = Var X

d) Sejam X1 , . . . , Xn n variáveis aleatórias independetes, então


Var (X1 + . . . + Xn ) = Var X1 + . . . +Var Xn .

2.1.3 Distribuições de probabilidade


Com o objetivo de fornecer um melhor embasamento teórico, para a sustentação no
estudo dos próximos capítulos, torna-se necessária a apresentação de algumas distribuições
2. F UNDAMENTAÇÃO T EÓRICA 10

discretas e contínuas. Tais distribuições possuem fundamental espaço na Teoria das Filas,
em especial nos modelos de Markov e os de Erlang, (Gross & Harris, 2008).
Neste trabalho são estudadas somente distribuições paramétricas, que são distribuições
dependentes de valores dos parâmetros. Sendo assim, a fim de manter o controle desses
parâmetros, será usada a mesma notação adotada em Casella & Berger (2002), na qual tais
parâmetros são precedidos por um "|"(dado que).

2.1.3.1 A distribuição binomial

Considere uma variável aleatória X com dois resultados possíveis:


1, com probabilidade p
X= 0≤ p≤1 .
0, com probabilidade 1 − p

Uma variável aleatória que satisfaça a condição acima tem distribuição de Bernoulli de
parâmetro p, onde X = 1 é entendido como “sucesso” e X = 0 é entendido como “fracasso”.
Um experimento aleatório que possa ser modelado pela distribuição de Bernoulli é
denominado “experimento de Bernoulli” ou “ensaio de Bernoulli”. Como por exemplo, no
lançamento de uma moeda, pode-se considerar p como a probabilidade de sair cara, sucesso
quando o resultado for cara (X = 1) e fracasso quando o resultado sair coroa (X = 0 ).
A média e a experança de uma variável aleatória de Bernoulli são dadas, facilmente,
por:

EX = 1p + (1 − p) 0 = p
VarX = (1 − p)2 p + (0 − p)2 (1 − p) = p(1 − p)

Defina, agora, uma variável aleatória Y como sendo:

Y = o número total de sucessos em n tentativas de Bernoulli.

Seja uma sequência de n ensaios de Bernoulli idênticos e independentes, cada um deles


com probabilidade de sucesso p. Defina as variáveis aleatórias X1 , . . . , Xn como

1, com probabilidade p
Xi = .
0, com probabilidade 1-p
2. F UNDAMENTAÇÃO T EÓRICA 11

A variável aleatória
n
Y = ∑ Xi
i=1

tem distribuição binomial de parâmetros n e p.


Pode-se demonstrar que uma sequência de n ensaios de Bernoulli com exatamente y
sucessos possui probabilidade py (1 − p)n−y de ocorrer. Veja Casella & Berger (2002). Uma
vez que existem np dessas sequências (número de ordenações de sucesso e fracasso), segue


a definição abaixo.

Definição 8 Uma variável aleatória discreta, Y , terá distribuição binomial de parâmetros n


e p se sua função de probabilidade for dada por:
 
n y
P(Y = y|n, p) = p (1 − p)n−y , y = 0, 1, . . . , n. (2.8)
y

Teorema 5 Seja X uma variável aleatória binomial, dados os parâmetros n e p, então seu
valor esperado será EX = np e sua variância VarX = np(1 − p).

2.1.3.2 A distribuição de Poisson

Tratando-se de modelos probabilísticos, a distribuição de Poisson representa uma das


importantes distribuições de probabilidades discretas, sendo seu número de aplicações bas-
tante extenso, podendo servir como modelo para uma série de diferentes tipos de experimen-
tos.
Na modelagem de um fenômeno no qual se deseja saber a probabilidade de que um
número específico de ocorrências acontença em um determinado intervalo de tempo ou es-
paço, como por exemplo, a probabilidade de ocorrer determinado número de chegadas de
clientes em um banco, a distribuição de Poisson costuma ser uma ótima escolha. A variável
aleatória X é o número de ocorrências de um evento ao longo de algum intervalo com parâ-
metro λ > 0, também chamado de “parâmetro de intensidade”, recebe o nome de “variável
aleatória de Poisson”. Todo experimento aleatório com essas características é denominado
“processo de Poisson”.

Definição 9 Uma variável aleatória X, assumindo valores nos números inteiros não negati-
vos, tem distribuição de Poisson com parâmetro λ se sua função de probabilidade for dada
por:

λ x e−λ
P(X = x|λ ) = x = 0, 1, 2, . . . . (2.9)
x!
2. F UNDAMENTAÇÃO T EÓRICA 12

Verifica-se a alínea b) do Teorema 2, isto é, ∑∞


x=0 f X (x) = 1, lembrando da expansão
de Taylor:


yi
ey = ∑ . (2.10)
i=0 i!

Teorema 6 Se X tiver distribuição de Poisson com parâmetro λ , então

E(X) = λ e Var(X) = λ .

A demonstração do teorema 6 encontra-se em Meyer (1965) e, com isso, uma inte-


ressante propriedade da distribuição de Poisson é notada: seu valor esperado é igual a sua
variância.

2.1.3.3 A distribuição de Poisson como aproximação da distribuição binomial

Uma importante propriedade da distribuição de Poisson é que ela pode ser usada como
aproximação da distribuição Binomial quando os parâmetros binomiais n é muito grande
(n → ∞) e p muito pequeno (p → 0).
Para isso, suponha que X é uma variável aleatória binomial com parâmetros n e p e
seja λ = np. Partindo da Equação 2.8 e substituindo p = λ /n:

n!
P(Y = y|n, p) = py (1 − p)1−y
(n − y)! y!
n.(n − 1) . . . . . (n − y + 1) y
= p (1 − p)n−y
y!
n.(n − 1) . . . . . (n − y + 1) λ y λ n−y
   
= 1−
y! n n
λ −y
y  n  
n.(n − 1) . . . . . (n − y + 1) λ λ
= 1− 1− .
ny y! n n

Como,

λ n λ y
   
n.(n − 1) . . . . . (n − y + 1)
lim 1 − ≈ e−λ , lim ≈1 e lim 1 − ≈ 1.
n→∞ n n→∞ ny n→∞ n

Assim, consecutivamente,

λy
fY (y) ≈ e−λ .
y!

Veja Meyer (1965) e Ross (2010) para uma maior abordagem com exemplos.
2. F UNDAMENTAÇÃO T EÓRICA 13

2.1.3.4 Distribuição gama

Como será visto, a função gama possui fundamental importância no estudo da Teoria
das Filas.

Definição 10 A função gama, denotada por Γ, é definida pela seguinte integral:


Z ∞
Γ(α) = xα−1 e−x dx, α > 0. (2.11)
0

Pode-se mostrar, por indução, que a função gama obedece a uma interessante relação
de recorrência. Seja α = n,

Γ(n) = (n − 1)! onde n ∈ N. (2.12)

Por consequência da definição 10, algumas relações úteis são satisfeitas. Veja alguns
exemplos:

a) Γ(n + 1) = n Γ(n) = n!,

b) Γ(1) = 1,

c) Γ(1/2) = π,

d) Γ(n) = (n − 1) Γ(n − 1).

DeGroot & Schervish (2012) apresentam algumas demonstrações interessantes.

Definição 11 Seja uma variável aleatória contínua X, que assuma somente valores não
negativos. X terá distribuição de probabilidade gama, se sua fdp for dada por:

1
f (x|α, β ) = xα−1 e−x/β , 0 < x < ∞, α > 0, β > 0. (2.13)
Γ(α) β α
Essa é uma distribuição de suma importância para os objetivos deste trabalho, pois,
como será visto, possui vasta utilidade no estudo da Teoria das Filas, pelo fato de dar origem
a outras distribuições como a exponencial, qui-quadrado e Erlang.
Conforme Casella & Berger (2002), o α é conhecido como o parâmetro de forma,
uma vez que possui maior influência no pico da distribuição, equanto que o β recebe o
nome de parâmetro de escala, já que a maior parte de sua influência ocorre na dispersão da
distribuição.

Teorema 7 Se X tiver distribuição gama com parâmetros α e β , então:

E(X) = α β e Var(X) = α β 2 .
2. F UNDAMENTAÇÃO T EÓRICA 14

2.1.3.5 A distribuição exponencial

Considere o caso especial da distribuição gama, em que o parâmetro α = 1. Sendo


assim, substituindo esse valor de α na Equação 2.13 e lembrando a relação Γ(1) = 1, tem-se
que:

1
f (x|α = 1, β ) = xα−1 e−x/β
Γ(α) β α
1
= e−x/β
β

Definição 12 Uma variável aleatória contínua X, cuja função densidade de probabilidade,


com β > 0, é dada por: 
 1 e−x/β , se x ≥ 0
f (x|β ) = β (2.14)
0, se x < 0

é dita ser uma variável aleatória exponencial com parâmetro β .

A alínea b) do Teorema 2 é verificada por:

Z b
1 −x/β 1 −x/β
Z ∞
e dx = limb→∞ e dx = limb→∞ 1 − e−b/β = 1.
0 β 0 β

Note que a fda de X é dada por:


Z x
1 −t/β
FX (x|β ) = PX (X ≤ x) = e dt = 1 − e−x/β , x ≥ 0. (2.15)
0 β

Teorema 8 Seja X uma variável aleatória exponencial com parâmetro β , seu valor espe-
rado e sua variância são dados por:

E(X) = β e Var(X) = β 2 . (2.16)

Costuma-se adotar a substituição λ = 1/β na Equação 2.14, permitindo que a fdp de


X seja dada em relação a λ (o chamado “parâmetro da taxa”), da seguinte forma: 1

f (x| λ ) = λ e−x λ , 0 ≤ x < ∞ , λ > 0. (2.17)


1 Nota: Essa parametrização será sempre utilizada em todo este trabalho.
2. F UNDAMENTAÇÃO T EÓRICA 15

Para essa parametrização, o valor esperado e a variância de X serão iguais a 1/λ e


1/λ 2 , respectivamente.

1 1
E(X) = e Var(X) = 2 . (2.18)
λ λ

2.1.3.6 A propriedade de ausência de memória

Com relação a Ross (1996), a utilidade da distribuição exponencial vem do fato de ela
possuir uma propriedade denominada “ausência de memória” ou “memoryless”, onde uma
variável aleatória X é dita ser sem memória, se

P{X > s + t|X > t} = P{X > s} ∀t ≥ 0. (2.19)

(Hillier & Lieberman, 2001, p. 824) afirmam que essa é uma propriedade bastante
incomum para uma distribuição probabilística, uma vez que a única distribuição contínua
com essa propriedade é a exponencial.
Essa ausência de memória da distribuição exponencial é verificada, de modo razoavel-
mente fácil, utilizando a definição de probabilidade condicional:

P{A ∩ B}
P{A|B} = . (2.20)
P{B}
Observe:

P{X > s + t, X > t}


P{X > s + t|X > t} =
P{X > t}
P{X > s + t}
= (uma vez que s > 0)
P{X > t}
e−λ (s+t)
= (pela Equação 2.15)
e−λ t
= e−λ s = P{T > s}.

2.1.3.7 A distribuição Erlang

Veja, agora, uma especial classe da distribuição gama, em que o parâmetro de forma,
α, Equação 2.13, se restringe apenas a números inteiros positivos.
Precisamente, tem-se que:

1
α =keβ = , (2.21)

2. F UNDAMENTAÇÃO T EÓRICA 16

onde k é um número inteiro qualquer e µ uma constante arbitrária positiva.


Consecutivamente, substituindo 2.21 na Equação 2.13, tem-se a seguinte definição:

Definição 13 Uma variável aleatória contínua X, cuja função densidade de probabilidade


é dada por:
(k µ)k k−1 −kµx
f (x|k, µ) = x e , 0 ≤ x < ∞, (2.22)
(k − 1)!
é dita ser uma variável aleatória de Erlang com parâmetros k e µ.

Analogamente, substituindo 2.21 nas fórmulas da média e variância dadas no Teorema


7 para a distribuição gama, obtém-se as fórmulas para o cálculo da média e variância da
distribuição Erlang.

1 1
E(X) = e Var(X) = . (2.23)
µ k µ2
Assim como a exponencial, a distribuição Erlang também pode ser parametrizada com
o seu parâmetro da taxa, que aqui neste trabalho, para evitar ambiguidades com o parâmetro
da taxa da distribuição exponencial, foi escolhida a letra hebraica τ para representá-la. Basta
lembrar que tanto τ quanto 1/λ representam o parâmetro de escala β na Equação 2.13.
Considera-se µ = τ/k, fazendo com que a fdp seja dada em função dos parâmetros k e τ;
como consta na Equação 2.24. 2

τ k xk−1 e−τ x
f (x|k, τ) = ,0≤x<∞ . (2.24)
(k − 1)!
Para essa parametrização, o valor esperado e a variância de X serão dados por:

E(X) = k/τ e Var(X) = k/τ 2 . (2.25)

Conforme Gross & Harris (2008), os diversos valores assumidos por k definem tais
distribuições como Erlang tipo-k ou distribuição Ek . Esse parâmetro k é também chamado
de parâmetro de forma, enquanto que o µ é tido como o parâmetro de escala. A Figura
2.2, onde t representa o tempo, ilustra alguns exemplos dessas distribuições para diferentes
valores assumidos por k.
2 Nota: Sempre que essa parametrização for utilizada, o leitor será notificado. Caso contrário, considere a

parametrização da Equação 2.22


2. F UNDAMENTAÇÃO T EÓRICA 17

Figura 2.2. Família de distribuições Ek com média 3.

Fonte: Gross & Harris (2008)

Nota-se que a medida que o valor de k cresce, mais a distribuição Erlang se torna
simétrica e fechada em torno da média. Se k → ∞, a distribuição se torna determinística com
média µ.

2.1.3.8 A distribuição qui-quadrado (X 2 )

Possivelmente a mais conhecida de todas as distribuições estatísticas, (Crawley, 2007,


p. 222), a distribuição qui-quadrado (X 2 ) é um caso especial da gama. Veja a definição dada
por DeGroot & Schervish (2012):

Definição 14 Para cada m positivo, a distribuição gama com parâmetros α = m/2 e β =


1/2 é chamada de distribuição qui-quadrado (X 2 ) com m graus de liberdade.

Posto isso, seja X uma variável aleatória qui-quadrado com m graus de liberdade, pela
Equação 2.13, segue que sua fdp é dada por:

 1
Γ(m/2) 2m/2
x(m/2)−1 e−x/2 , se x > 0 ;
f (x|m) = (2.26)
0, caso contrário.
2. F UNDAMENTAÇÃO T EÓRICA 18

2.2 Processos Estocásticos


Definição 15 “Um processo estocástico X = {X(t), t ∈ T } é uma coleção de variáveis ale-
atórias, isto é, para cada t em um conjunto de índices T , X(t) é uma variável aleatória.”
(Ross, 1996, p. 41, tradução nossa).

A um processo estocástico estão associados dois espaços: o espaço de estados e o


espaço de parâmetros. Sendo que o espaço de estados designa o conjunto de valores que a
variável aleatória X(t) pode assumir; o espaço de parâmetros, conjunto T , designa o conjunto
de valores assumidos pela variável t,
Caso T seja um conjunto enumerável (T = {0, ± 1, ± 2, ± 3, . . . } ou T =
{0, 1, 2, 3, . . . }), X é tido como um processo estocástico de parâmetro discreto e, por outro
lado, caso T for um intervalo ou uma combinação algébrica de intervalos (T = {−∞ < t < ∞}
ou T = {0 < t < ∞}), X é um processo de parâmetro contínuo, (Gross & Harris, 2008).
Uma definição complementar é dada a seguir:

“um processo estocástico {Xt , t ∈ T } é chamado de processo estocástico de es-


paço discreto se a variável aleatória Xt é discreta, e é chamado processo esto-
cástico de espaço contínuo se for contínua.” (Zukerman, 2013, p. 71, tradução
nossa)

Frequentemente, t é interpretado como tempo e denomina-se X(t) como o estado do


processo no instante de tempo t. Sendo assim, existem quatro tipos de processos estocásticos:

• Espaço Discreto e Tempo Contínuo.

• Espaço Discreto e Tempo Discreto.

• Espaço Contínuo e Tempo Contínuo.

• Espaço Contínuo e Tempo Discreto.

Taylor & Karlin (1998) apresentam alguns exemplos: nas situações mais comuns,
pode-se citar o resultado de sucessivos lançamentos de uma moeda (representado por Xt )
em sucessivos instantes de tempo t, ou, também, sucessivas obervações de determinadas ca-
racterísticas em uma população. Em outras situações, t pode representar, por exemplo, a
distância entre um ponto qualquer de um fio e uma origem arbitrária enquanto Xt representa
o número de defeitos nesse fio no intervalo (0,t].
2. F UNDAMENTAÇÃO T EÓRICA 19

2.2.1 Cadeias de Markov


Um processo estocástico é dito ser um processo de Markov se as distribuições de pro-
babilidade para os passos futuros do processo dependem somente do estado presente, des-
considerando como o processo chegou a tal estado. Sendo assim, os estados anteriores do
processo são irrelevantes para prever os estados seguintes, desde que o estado atual seja co-
nhecido. Esse tipo de processo estocástico é denominado “Memoryless Process (Processo
sem Memória)”.
(Ross, 2010, p. 192) mostra, através da Equação 2.27, como fica essa definição em
linguagem matemática:

P{Xt+1 = j|Xt = i, Xt−1 = it−1 . . . , X1 = i1 , X0 = i0 } = Pi j (2.27)

para todos os estados i0 , i1 , . . . , in−1 , i, j e para todo t ≥ 0.


Tais processos estocásticos como esses, que possuem espaço de estado discreto, geral-
mente, são denominados como cadeias de Markov. Assim como em Gross & Harris (2008),
neste texto, considere que um processo estocástico de espaço de estados discreto e parâmetro
(tempo) discreto será uma cadeia de Markov de tempo discreto e que um processo estocástico
de parâmetro (tempo) contínuo com espaço de estado discreto será uma cadeia de Markov
de tempo contínuo.
O valor Pi j , na Equação 2.27, representa a probabilidade de o processo, estando no
estado i, fazer uma transição para o estado j.
De modo informal, suponha, por exemplo, que uma cadeia de Markov entre no estado
i em algum instante de tempo t = 0, assuma que o processo não sairá desse estado durante
os próximos 10 minutos. Qual a probabilidade de que o processo fique no estado i até o
minuto 15? Bem, como o processo está no estado i em t = 10, pela propriedade Markoviana,
segue que a probabilidade de que ele permaneça nesse estado no intervalo [10, 15] é apenas
a probabilidade de não ocorrer nenhuma transição por pelo menos 5 minutos. Ou seja,

P{Ti > 15|Ti > 10} = P{Ti > 5},

onde Ti é a variável aleatória que denota a quantidade de tempo que o processo se mantém
no estado i antes de fazer uma transição para um estado diferente. Trata-se de uma variável
aleatória sem memória e, assim, deve ser exponencialmente distribuída. Veja Ross (2000,
p. 294).
As probabilidades P{Xt+1 = j|Xt = i} são condicionais e representam a chance da
2. F UNDAMENTAÇÃO T EÓRICA 20

variável aleatória X assumir o estado j após t + 1 passos de transições, dado que a mesma
assumiu o estado i após t passos de transições. Essas probabilidades recebem o nome de
“probabilidades de transição de estados” ou “probabilidades de transição de 1 passo” e
podem ser escritas como Pi j .

Definição 16 “Quando as probabilidades de transição de 1 passo são independentes da


variável de tempo t, nós dizemos que a cadeia de Markov possui probabilidades de transição
estacionárias.” (Taylor & Karlin, 1998, p. 96, tradução nossa).

Pela definição dada acima, se para cada i e j,

P{Xt+1 = j|Xt = i} = P{X1 = j|X0 = i}, ∀ t = 1, 2, . . . , (2.28)

então a probabilidade de transição de 1 passo é dita ser estacionária.


“Se acontecer de as probabilidades de transição serem independentes de n, então temos
o que é referido como uma cadeia de Markov homogênea.” (Kleinrock, 1975, p. 27, tradução
nossa).
Sendo assim, se Pi j for independente da constante de tempo t, tem-se uma cadeia de
Markov homogênea. Observe a Equação 2.29, que simplifica a notação:

Pi j = P{Xt+1 = j|Xt = i}. (2.29)

A partir de manipulações algébricas realizadas na Equação 2.28 encontra-se outro im-


portante resultado: a probabilidade de transição de n passos. Para cada i e j,

P{Xt+n = j|Xt = i} = P{Xn = j|X0 = i}, ∀ t = 1, 2, . . . , (2.30)

tal que n = 0, 1, 2, . . . , .
(n)
A Equação 2.31 simplifica a notação para Pi j :

(n)
Pi j = P{Xt+n = j|Xt = i}. (2.31)

É costume organizar Pi j em uma matriz quadrada P, assim como mostra a Equação


2.32:  
P00 P01 P02 . . .
 
 P10 P11 P12 . . . 
..
 
P= . . (2.32)
 
 

 Pi0 Pi1 Pi2 . . . 

.. .. ..
. . .
2. F UNDAMENTAÇÃO T EÓRICA 21

 
Essa matriz P = Pi j é denominada “matriz de probabilidade de transição” ou “ma-
triz de Markov” ou, simplesmente, matriz de transição. Com isso, claramente, satisfará às
condições de matrizes descritas a seguir:

Pi j ≥ 0 para i, j = 0, 1, 2, . . . , (2.33)


∑ Pi j = 1 para i = 0, 1, 2, . . . . (2.34)
j=0

2.2.1.1 Equações de Chapman-Kolmogorov

Uma vez definida a probabilidade de transição de 1 passo, Pi j , a “probabilidade de


transição de n passos”, Pi j n , é definida como na Equação 2.35:

Pinj = P{Xn+k = j|Xk = i}, n ≥ 0, i, j ≥ 0 . (2.35)

As equações de Chapman-Kolmogorov (CK), conforme Ross (1996), fornecem um


método para a computação de probabilidades de transição de n passos:

Pin+m
j = ∑ Pikn Pkmj ∀ n, m ≥ 0 . (2.36)
k=0

Essas equações de Kolmogorov podem ser trabalhadas em forma matricial, ficando da


seguinte forma, como mostra a Equação 2.37:

P(n+m) = P(n) P(m) . (2.37)

Consequentemente, tem-se que:

P(n) = P · P(n−1) . (2.38)

Continuando o procedimento recursivamente, obtém-se:

P(n) = P · P(n−1) = P · P · P(n−2)


(2.39)
P(n) = P · P . . . P = Pn ,

e, assim, para uma cadeia de Markov com espaço de estado finito, pode-se pensar em
P(n)como sendo a n-ésima potência de P. Isto é, obtém-se a matriz de transição de n passos
multiplicando a matriz P por ela mesma n vezes.
2. F UNDAMENTAÇÃO T EÓRICA 22

2.2.1.2 Classificação de Estados

Como se pôde notar, as probabilidades de transição apresentam enorme importância


para análises dos estados de uma cadeia de Markov. Sendo assim, para um melhor estudo
sobre as propriedades das cadeias de Markov, torna-se indispensável a apresentação de al-
guns conceitos e definições no que diz respeito à classificação desses estados.
Ross (1996) traz a seguinte definição sobre estados:

Definição 17 Um estado j é dito ser acessível a partir do estado i, para qualquer n ≥ 0


se Pinj > 0. Dois estados i e j que são mutuamente acessíveis são ditos estados que se
“comunicam” e escreve-se i ↔ j.

Essa relação de comunicação apresentada acima apresenta as seguintes propriedades:

(i) O estado i se comunica com o estado i, ∀ i ≥ 0, pois Pii0 = P{X0 = i|X0 = i} = 1.

(ii) Se o estado i se comunica com o estado j, então o estado j se comunica com o estado i.

(iii) Se o estado i se comunica com o estado j e o estado j se comunica com o estado k,


então o estado i se comunica com o estado k.

As propriedades (i) e (ii) decorrem da definição de estados comunicantes e são, respec-


tivamente, reflexiva e simétrica. Já a propriedade (iii) é a transitiva e são provadas utilizando
as equações de Chapman-Kolmogorov. Veja (Ross, 2010, p. 204) ou (Taylor & Karlin, 1998,
p. 236).
Como consequência dessas propriedades, tem-se as definições de classes e de irreduti-
bilidade que são apresentadas logo a seguir.

Definição 18 Dois estados que se comunicam são ditos estar na mesma classe. Uma cadeia
de Markov é dita irredutível se houver apenas uma classe, ou seja, se todos os estados se
comunicarem entre si.

Esse conceito é de fundamental importância no estudo de processos estocásticos e, no


tocante ao propósito deste trabalho, na teoria das filas.

2.2.1.3 Periodicidade

Outra propriedade de grande importância nas cadeias de Markov é a periodicidade.

Definição 19 Define-se como o período do estado i, d(i), o maior divisor comum (m.d.c) de
(n)
todos os inteiros n ≥ 1, para os quais Pii > 0.
2. F UNDAMENTAÇÃO T EÓRICA 23

Calcula-se d(i) como:

d(i) = mdc(n1 , n2 , n3 , . . . ). (2.40)

• Se d(i) = 1, o estado i é dito aperiódico.


(n)
• Se Pii = 0 ∀ n ≥ 1, então d(i) = 0.

Para elucidar a definição acima, seja uma cadeia de Markov de 4 estados (0, 1, 2 e 3),
representada pela matriz de probabilidade de transição P seguinte:

0 1 2 3
0 1 0 0 0
P= 1 0.8 0 0.2 0 .
2 0 0.8 0 0.2
3 0 0 0 1

(n) (2) (3)


Ao se calcular P11 , para todo n ≥ 1, verifica-se que P11 = 0, P11 = 0.16, P11 =
(4) (5) (n)
0, P11 = 0.256, P11 = 0. Ou seja, P11 = 0 para todo n ímpar. Sendo assim, o conjunto
(n)
de inteiros n ≥ 1 para os quais P11 > 0 é {2, 4, 6, . . .}. O período do estado 1 é, então,
d(1) = 2, pois d(1) = mdc(2, 4, 6, . . .) = 2.
Vale frisar que, conforme Taylor & Karlin (1998), a grande maioria dos processos de
Markov de estados finitos são aperiódicos.

2.2.1.4 Estados recorrentes e estados transientes

Para qualquer estado i e j, define-se como fiin a probabilidade de que, iniciando no


estado i, a primeira transição para o estado i ocorre após uma quantidade de tempo t = n,
ou seja, é a probabilidade de o processo reentrar no estado i após n transições de tempo.
Esse tempo n que o processo demora para sair do estado i e retornar pela primeira vez para
o mesmo é denominado como tempo de recorrência.
Formalmente, tem-se:

fi0j = 0,
(2.41)
finj = P{Xn = i, Xk 6= k, k = 1, . . . , n − 1|X0 = i} .

Seja

(n)
fi j = ∑ fi j (2.42)
n=1
2. F UNDAMENTAÇÃO T EÓRICA 24

onde fi j representa a probabilidade de sempre existir a transição para o estado j, dado que o
processo inicia no estado i.
Assume-se que o estado j é recorrente se f j j = 1, caso contrário, tem-se um estado
transiente. Ross (1996).
Claramente fii1 = Pii . O teorema 9 estabelece um critério para dizer se um estado i é
recorrente ou transiente.

Teorema 9 Assume-se que um estado i é recorrente se, e somente se:



(n)
∑ Pii =∞ . (2.43)
n=1

(n)
Caso ∑∞
n=1 Pii < ∞, o estado i é transiente.

Verifica-se a prova em (Taylor & Karlin, 1998, p. 241).


Pode-se provar, também, que se i for recorrente e i ↔ j então j também é recorrente.
Isso mostra que a recorrência, assim como a periodicidade, são propriedades de classe, ou
seja, todos os estados em uma classe ou são recorrentes ou são transientes e se o estado i em
uma classe tiver período t, todos os estados nessa classe também terão período t.

2.2.1.5 Probabilidades do estado estável

Ao se calcular as probabilidades de transição, P(n) para valores de n cada vez maiores


(n → ∞), percebe-se uma curiosa pecularidade. Parece existir uma probabilidade limite,
na qual o processo estará no estado j após um grande número de transições, sendo essa
probabilidade independente do estado inicial.
Como foi visto, caso o estado i seja recorrente, o processo estando no estado i, eventu-
almente retornará. Defina µii como a duração média entre esses retornos, dada por:

∞, se i for transiente,
µii = (2.44)
∑∞ n f (n) , se i for recorrente.
n=1 ii

De acordo com Ross (1996), o estado i, sendo recorrente, é considerado como recor-
rente positivo se µii < ∞ e como recorrente nulo caso µii = ∞.
Assim como no caso da recorrência, a recorrência positiva é uma propriedade de classe,
sendo que um estado aperiódico e recorrente positivo é chamado de estado ergódico. Embora
existam estados que não são recorrentes positivos, pode ser provado que em uma cadeia de
Markov de estado finito todos os estados recorrentes são recorrentes positivos.
2. F UNDAMENTAÇÃO T EÓRICA 25

Definição 20 “Se uma cadeia é irredutível, aperiódica e recorrente, ela é dita ser Ergódica.
Se é irredutível, aperiódica e recorrente positiva, ela é dita Fortemente Ergódica.” (Atuncar,
2011, p. 40).

Considere o seguinte Teorema dado por Ross (2010).:


(n)
Teorema 10 Para uma cadeia de Markov ergódica irredutível limn→∞ Pj j existe e é inde-
pendente de i. Além disso,

(n)
π j = limn→∞ Pj j , j ≥ 0,

onde π j é a única solução não negativa de


π j = ∑ π j Pi j , j ≥ 0,
i=0
∞ (2.45)
∑ π j = 1.
j=0

O estado j é recorrente positivo se π j > 0 e recorrente nulo se π j = 0.


Os π j são designados probabilidades estacionárias ou probabilidades de estado está-
vel. Isso significa que a probabilidade de o processo se encontrar no estado j após um número
grande de transições, tende a ser igual ao valor encontrado para π j , independentemente do
estado inicial da cadeia.
Em virtude dessas considerações, com relação a Atuncar (2011), se uma cadeia de
(n)
Markov é fortemente ergódica, então existe π = (π0 , π1 , π2 , . . .), tal que limn→∞ Pj j = π j >
0. O vetor π é chamado distribuição invariante da cadeia de Markov.
Logo,

π = π.P (2.46)

onde P é a matriz de probabilidade de transição dada pela Equação 2.32.


Pode-se, portanto encontrar a distribuição invariante resolvendo esse sistema linear de
equações. A condição de ergodicidade forte garante que a solução existe e é única.

2.2.2 Processos de nascimento e morte


A teoria dos processos de nascimento e morte compreende parte da teoria de processos
estocásticos, consistindo em um específico tipo de cadeia de Markov de tempo contínuo.
Seja um sistema que pode ser descrito, para cada t (0 ≤ t < ∞) fixado, por uma variável
aleatória N(t) com realizações 0, 1, 2, . . . .(Cooper, 1981, p. 14, tradução nossa).
2. F UNDAMENTAÇÃO T EÓRICA 26

Existem vários exemplos no cotidiano de processos de nascimento e morte. Alguns


exemplos são uma central telefônica, onde N(t) é o número de chamdas ocorrendo em um
intervalo de tempo de tamanho t; uma fila, onde N(t) é o número de clientes em espera ou
em serviço no tempo t; uma epidemia, onde o número de mortes que ocorreram em (0,t) é
N(t); uma cidade cuja população é N(t) no tempo t.
Note que em todos os exemplos dados, N(t) é uma diferente variável aleatória para
cada t fixado, formando, assim, uma família de variáveis aleatórias {N(t),t ≥ 0} que, como
visto no Capítulo 2.2, trata-se de um processo estocástico.
O processo de nascimento e morte pode ser esquematizado pelo diagrama de fluxo,
Figura 2.3, sendo que os nós representam os estados n (números de elementos no processo)
e os arcos, as transições entre os estados (taxas de nascimento e de morte, λn e µn , respecti-
vamente).

Figura 2.3. Diagrama de Fluxo

Fonte: Gross & Harris (2008)

Para n > 0, a probabilidade de transição do estado n a n + 1 é igual a uma variável


aleatória exponencial com taxa λn e entre n a n−1, igual a uma variável aleatória exponencial
com taxa µn . Quando n = 0, só pode haver chegadas e, sendo assim, chegadas correspondem
a nascimentos e o fim de serviço a uma morte. Trata-se, portanto, de cadeia de Markov de
tempo contínuo, (Gross & Harris, 2008).
Em teoria de filas, o estado representa o número de clientes no sistema e, desse modo,
o processo de nascimento e morte irá descrever probabilisticamente como esse estado varia
com o decurso do tempo, o qual, depende apenas do estado atual do sistema. Considere
N(t) como a variável aleatória que representa esse estado, a qual é composta pelo número de
clientes na fila, Nq (t), e no serviço, Ns (t).
Como o processo de nascimento e morte é uma cadeia de Markov irredutível, existe
um tempo, denotado por t∗, a partir do qual ele entra no regime estacionário, (Fogliatti &
Mattos, 2007).
2. F UNDAMENTAÇÃO T EÓRICA 27

Isso significa que após se contar o número de vezes em que o processo “entra” em
um estado e o número de vezes que o mesmo “sai” deste mesmo estado por um tempo t
muito grande, o sistema tenderá a entrar em equilíbrio. Logo, a partir do momento em que o
processo se encontrar no regime estacionário, a soma do que “entrar” no estado tenderá a ser
igual à soma do que “sair”. Basicamente, as duas taxas λn e µn , precisam ser iguais. Sendo
assim, na Figura 2.3, o fluxo do que entra em um nó deve ser igual ao fluxo do que sai desse
mesmo nó.
Um procedimento muito utilizado na literatura de filas é conhecido como balanço de
fluxo. Nesse método, o fluxo é definido como o produto da probabilidade estacionária pela
taxa de transição. Defina Pn (t) = P{N(t) = n} e Pn = P{N = n} como as probabilidades que
existam n clientes no sistema no tempo t e no estado estacionário, respectivamente. Isto é,
limt→∞ Pn (t) = Pn . Observe abaixo, o que Gross & Harris (2008) chamam de equações de
balanço.

Estado 0: Perceba, através do diagrama de fluxo, Figura 2.3, que existe uma entrada vindo
do estado 1 e uma saída para o mesmo. Veja Equação 2.47:

µ1 P1 = λ0 P0 . (2.47)

Estado 1: Perceba, também observando o diagrama de fluxo, que existe uma entrada
vindo do estado 0 e outra do estado 2. E uma saída para 2 e outra para 0. Equação 2.48:

λ0 P0 + µ2 P2 = λ1 P1 + µ1 P1 ↔ λ0 P0 + µ2 P2 = (λ1 + µ1 )P1 . (2.48)

Estado 2: De modo análogo a equação estacionária para o estado 2 fica como mostra em
(2.49):

λ1 P1 + µ3 P3 = (λ2 + µ2 )P2 . (2.49)

Estado n: Sendo assim, em (2.50) tem-se uma equação para qualquer estado:

λn−1 Pn−1 + µn+1 Pn+1 = (λn + µn )Pn . (2.50)

Essas equações são denominadas equações de equilíbrio e para se obter as equações


das probabilidades estacionárias, basta que se resolva em função de P0 . Observe:

λ0
P1 = P0 , (2.51)
µ1
2. F UNDAMENTAÇÃO T EÓRICA 28

(λ1 + µ1 )P1 − λ0 P0 λ1 µ1 P1 − λ0 P0 λ1 λ1 λ0
P2 = = P1 + = P1 → P2 = P0 . (2.52)
µ2 µ2 µ2 µ2 µ2 µ1

Repare que µ1 P1 − λ0 P0 = 0, pois, como já esclarecido, por se tratar de um sistema no


regime estacionário, a soma do fluxo que entra em um estado é igual à soma do fluxo que
sai.
De forma similar, obtém-se P3 :

λ2 λ2 λ1 λ0
P3 = P2 → P3 = P0 . (2.53)
µ3 µ3 µ2 µ1
O que parece estar emergindo para o seguinte padrão:

λn−1 λn−2 λ0
Pn = . . . P0 . (2.54)
µn µn−1 µ1
O leitor pode verificar a Equação 2.54 por indução matemática.
Então Pn é dado por:
n
λi−1
Pn = P0 ∏ n≥1 . (2.55)
i=1 µi

Usando o fato de que ∑n≥0 Pn = 1, obtém-se, também, P0 ; que é a probabilidade de o


sistema estar vazio no regime estacionário:

1
P0 = (2.56)
1 + ∑n≥1 ∏ni=1 λµi−1
i

desde que a soma do denominador de 2.56 seja convergente. Fogliatti & Mattos (2007).

2.3 Teoria das Filas


A teoria das Filas é um importante ramo da teoria da probabilidade que, como o pró-
prio nome sugere, estuda e analisa os diferentes fenômenos de filas presentes no cotidiano.
Tais análises são feitas por meio de conceitos básicos de processos estocásticos e de matemá-
tica aplicada, proporcionando modelos matemáticos que preveem o comportamento de um
determinado sistema cuja demanda cresce aleatoriamente. O estudo desses sistemas de filas
tem larga utilidade, como por exemplo análise de desempenho em sistemas de transportes e
tráfego, manutenção de máquinas, sistemas de saúde, etc.
Esses estudos e análises supracitados são realizados a fim de se obter as denominadas
medidas de desempenho. Alguns exemplos são o número médio de clientes na fila e no
2. F UNDAMENTAÇÃO T EÓRICA 29

sistema, o tempo médio de espera na fila e no sistema, a probabilidade de o sistema estar


vazio ou mesmo probabilidade de se ter exatamente n clientes no sistema.
Com os resultados de medidas como essas em mãos, adquire-se, também, uma infini-
dade de informações valiosas sobre o futuro comportamento do sistema tornando possível
realizar tomadas de decisões de forma mais eficaz, com maior clareza e coerência no tocante
à manutenção ou modificação na infraestrutura do sistema. Um gerente de supermercado tem
a opção de, por exemplo, sugerir a adição de um novo caixa para aumentar a produtividade
e diminuir as filas.
Conforme Gross e Harris (2008), um modelo ou sistema de filas pode ser descrito
como sendo clientes que chegam para receber determinado serviço, esperam pelo serviço
caso não haja atendimento imediato e deixam o sistema após serem servidos. O termo “cli-
ente” é usado num sentido geral, não implicando, necessariamente, ser um cliente humano.
Por exemplo, o termo cliente pode ser usado para se referir a um programa de computador
esperando para ser executado, a um carro aguardando por conserto em uma oficina, etc.
(Magalhães, 1996, p. 01), por sua vez, afirma que um “modelo ou sistema de filas pode
ser brevemente descrito da seguinte forma: clientes chegam para receber um certo serviço e,
devido à impossibilidade de atendimento imediato, formam uma fila de espera.”

2.3.1 Principais características de uma fila


Nesta Seção serão apresentadas e discutidas as principais características inerentes a
todos os tipos de fila, como os processos de chegada e atendimento, a capacidade do sistema,
dentre outros.

2.3.1.1 Notação de Kendall

Para facilitar o estudo, neste trabalho será usada a notação proposta por Kendall (1953),
atualmente padronizada pela literatura de filas. Consiste em uma série de símbolos e barras
do tipo A/B/c/k/z, que representam o processo de chegadas (A), processo de atendimento (B),
número de servidores em paralelo (c), capacidade do sistema (k) e disciplina de atendimento
(Z), sendo essas as principais características de uma fila.
Tanto o processo de chegada (A) quanto o processo de atendimento (B) são represen-
tados por distribuições estatísticas. Essas distribuições e seus respectivos símbolos estão
listados a seguir:

• D: distribuição determinística ou degenerada e para comportamento aleatório;

• M: distribuição exponencial (Memoryless ou Markoviana);


2. F UNDAMENTAÇÃO T EÓRICA 30

• Ek: distribuição de Erlang do tipo K(k = 1, 2, 3, . . . );

• G: distribuição geral (não especificada);

• U: distribuição uniforme.
(Magalhães, 1996, p. 05).

É válido ressaltar que em muitos casos, apenas os três primeiros símbolos são usados.
Adotou-se, por convenção, a omissão das letras k e z caso o sistema tenha capacidade infinita
e disciplina de fila do tipo FCFS (first come, first served). Por exemplo, uma fila M/M/1
significa chegada exponencial, serviço exponencial, um único servidor, capacidade infinita e
atendimento por ordem de chegada.
Veja a seguir uma visão geral sobre as principais disciplinas de atendimento e as res-
pectivas siglas que são utilizadas para representá-las.

2.3.1.2 Disciplina de atendimento

A disciplina de atendimento se refere ao modo que os usuários serão selecionados para


receber o serviço. Normalmente as filas se dão pela ordem de chegada, ou seja, o primeiro a
chegar é o primeiro a sair Magalhães (1996).

• FCFS (first come, first served): primeiro a chegar é o primeiro a ser atendido. Exem-
plos: Filas nos caixas de supermercados e a venda de ingressos no cinema.

• LCFS (last come, first served): último a chegar é o primeiro a ser atendido. Exemplos:
Utilização de estoques verticais ou horizontais, como o carregamento de contêineres
em navios.

• PRI (priority service) ou COM PRIORIDADE: os atendimentos são feitos com prio-
ridades estabelecidas. Exemplos: Internação hospitalar e tarefas a serem processadas
por um computador.

• SIRO (service in random order) ou ALEATÓRIO: os atendimentos são feitos sem qual-
quer preocupação com a ordem de chegada. Exemplo: Contemplação de consórcios e
a seleção de ganhadores em concursos públicos.

2.3.1.3 Processo de chegada e atendimento

Conforme dito na Subseção 2.3.1, na parte de notação de Kendall, tanto o processo


chegada quanto o de serviço (atendimento) podem ser determinísticos ou aleatórios. Caso
sejam determinísticos, os tempos entre chegadas e entre saídas serão sempre constantes. Já
2. F UNDAMENTAÇÃO T EÓRICA 31

para o caso de as chegadas e saídas acontecerem de forma aleatória no tempo, elas formarão
um processo estocástico e serão descritas por alguma distribuição estatística. Dentre as mais
usadas, destacam-se a exponencial, Erlang e hiperexponencial.
A hipótese mais comum para esses processos é que exista o que Magalhães (1996)
chama de “renovação”, ou seja, os intervalos entre chegadas e os tempos de serviço acon-
tecem de forma independente e identicamente distribuídos. Normalmente, o processo de
Poisson é um dos mais utilizados para modelar as chegadas em um sistema, uma vez que
proporciona facilidades no tratamento matemático proporcionadas pela “falta de memória”
da distribuição exponencial.

2.3.1.4 Capacidade do sistema

Para (Fogliatti & Mattos, 2007, p.09), “a capacidade do sistema é o número máximo de
usuários que o mesmo comporta (incluindo fila e atendimento) e pode ser finita ou infinita”.
Caso a capacidade total do sistema estiver ocupada, um novo usuário não poderá entrar
e será perdido ou desviado para outro centro de serviço. Como exemplo de um sistema com
capacidade finita tem-se um posto de vistoria de carros que admite um número máximo de
carros aguardando pelo serviço. Já para capacidade infinita, pode-se citar um porto onde
navios chegam para descarregamento aguardando, se necessário, no mar.

2.3.2 Medidas de desempenho


Gross & Harris (2008) afirmam que, geralmente, existem três tipos de respostas do
sistema de interesse: (1) alguma medida típica de espera que o cliente é forçado a suportar,
(2) uma indicação de como os clientes podem se acumular e (3) uma medida do tempo ocioso
no sistema. Uma vez que a maior parte dos sistemas de filas são estocásticos, essas medidas
de interesse são variáveis aleatórias e suas distribuições, assim como seus valores esperados,
são desejados.
Quanto ao tempo de espera, existem duas medidas de desempenho de interesse, que é
o tempo médio de espera na fila e o tempo médio de espera no sistema (fila mais servidor). Já
para sanar o interesse no modo em que os clientes podem se acumular, geralmente calcula-se
o número médio de clientes no sistema e na fila. Por fim, como medidas de tempo ocioso
no sistema incluem-se a porcentagem de tempo que um servidor em particular permanece
ocioso ou o tempo em que todo o sistema está desprovido de clientes.
Denotando a taxa média de chegadas no sistema por λ e a taxa média de serviço por
µ, uma medida de grande interesse ao se analisar um sistema de filas com uma quantidade c
2. F UNDAMENTAÇÃO T EÓRICA 32

de servidores em paralelo é a taxa de ocupação/utilização do sistema ou também conhecida


como intensidade do tráfego (ρ), definida por:

λ
ρ= . (2.57)

Caso ρ > 1(λ > c µ), a taxa de chegadas ao sistema excede a taxa de serviço e pode-se
esperar que à medida que o tempo passa, mais a fila crescerá tendendo ao infinito a menos
que em algum momento clientes sejam impedidos de entrar. No caso em que ρ = 1, ainda
assumindo que em nenhum momento clientes sejam impedidos de entrar, a aleatoriedade
impedirá que o sistema fique vazio e a fila cresçerá sem limite. Assim, para se atingir o
estado estacionário é necessário que ρ seja estritamente menor que 1, ou seja, o número
mínimo de servidores paralelos necessários para garantir uma solução de estado estacionário
pode ser calculado imediatamente encontrando-se o menor valor para c tal que λ /(c µ) < 1.
Retomando o raciocínio da Seção 2.2.2, na qual foram definidas as probabilidades
Pn (t) = P{N(t) = n} e Pn = P{N = n}. Considerando um sistema de filas no estado estacio-
nário com uma quantidade c de servidores, é possível obter duas medidas de grande interesse
no estudo de filas, que são o número médio de usuários no sistema (L) e na fila (Lq ). Essas
medidas são obtidas através do valor médio ou valor esperado, E[N], definido pela Equação
2.4 na Seção 2.1.2. Observe as Equações abaixo.

L = E[N] = ∑ n Pn , (2.58)
0


Lq = E[Nq ] = ∑ (n − c) Pn . (2.59)
n=c+1

2.3.3 Fórmulas de Little


As fórmulas de Little são expressões que estabelecem algumas relações entre as me-
didas de desempenho do sistema. Essas expressões relacionam o número médio de usuários
(L ou Lq ) com o tempo médio de espera (W ou Wq ).
As fórmulas de Little se baseiam na seguinte assertiva:

“O número médio de usuários num sistema é igual ao produto da taxa média de


ingresso pelo tempo médio de permanência de um usuário no mesmo.” (Fogliatti
& Mattos, 2007, p.57).

Para uma explicação mais intuitiva, imagine a situação em que um usuário chega em
um sistema de atendimento do tipo FCFS e espera em média W para ser atendido e deixar
o sistema. Ao sair, o mesmo olha para trás e observa quantos usuários ficaram no sistema.
2. F UNDAMENTAÇÃO T EÓRICA 33

Logo, ele deve “enxergar” em média L usuários presentes, aqueles que chegaram durante
seu tempo de serviço mais os que chegaram durante seu tempo de espera na fila. Cada um
desses L usuários levou em média λ1 para chegar e, assim, é possível escrever L( λ1 ) = W ou
L = λW , (Magalhães, 1996, p.29).
Assim sendo, valem as seguintes relações dadas nas equações a seguir; que são as
denominadas fórmulas de Little:
L = λW, (2.60)

Lq = λWq . (2.61)

2.3.4 Modelos determinísticos


Nos modelos determinísticos são considerados os casos em que os tempos de chegada
e de atendimento são determinísticos. Ao contrário do que acontece nos modelos de fila mar-
kovianos, a distribuição do número de clientes no sistema não alcança o estado estacionário,
uma vez que o tamanho da fila flutua deterministicamente seguindo um determinado padrão.
Existem diversos modos de se construir modelos de filas com características deter-
mininísticas, sendo que para cada um é necessário um estudo específico a fim de se ob-
ter as medidas de desempenho. Nesta Seção será apresentado o modelo D/D/1/k-1 como
forma de exemplificação. Para uma leitura sobre outros modelos como o D/D/k e o D/D/k/k
recomenda-se Zukerman (2013).

2.3.4.1 O modelo D/D/1/k-1

Considere o caso trivial de uma taxa constante de chegadas a uma estação única que
processa a uma taxa de serviço constante. Essas chegadas espaçadas regularmente serão
servidas na disciplina FCFS (First Come, First Served). Como λ é a taxa de chegada por
unidade de tempo e µ a taxa de saída, então o tempo entre chegadas será 1/λ e o tempo
entre saídas será 1/µ. Assuma que no tempo t = 0 não haja elementos no sistema e que a
taxa de chegada λ seja maior que a taxa de saída µ; ou seja, 1/λ < 1/µ.
Gross & Harris (2008) abordam que com o sistema nessas características supracitadas,
a fila cresceria e se estenderia para além de algum limite, cada sucessivo elemento esperaria
mais do que o elemento anterior, até que esperaria para sempre. Para evitar isso, torna-se
necessário haver uma recusa forçada assim que o sistema atinja um determinado número de
elementos; que é a capacidade do mesmo.
Para efeitos didáticos, considere a capacidade do sistema como K = K − 1, então a no-
tação ficará da seguinte forma: D/D/1/K − 1/FCFS. Isso significa que o k-ésimo elemento
2. F UNDAMENTAÇÃO T EÓRICA 34

será recusado.

Medidas de desempenho

Assumindo n(t) = número de elementos no sistema num instante t e que Wq (n) =


Tempo de espera do n-ésimo elemento a entrar no sistema. Essas duas medidas de desempe-
nho serão apresentadas a seguir.
Sob a hipótese de que assim que um serviço é completado, outro é iniciado, o número
de usuários no sistema (incluindo o usuário em serviço) no tempo t é dado pela Equação 2.62
h µi
n(t) = [λt] − µt − (2.62)
λ
em que [x], x ≥ 0, é o maior inteiro ≤ x e n(0) = 0.
Porém, por se tratar de um sistema com capacidade finita, a Equação 2.62 só é válida
até ocorrer a primeira recusa. Seja ti o tempo até essa recusa, encontrado por 2.63:
h µi
n(ti ) = k = [λti ] − µti − (2.63)
λ
em que ti é o menor número real satisfazendo (2.63). (Gross & Harris, 2008).
Observa-se que após ti , n(t) permanece em k −1 até que outro serviço seja completado.
Após isso, n(t) cairá para k − 2 a não ser que ocorra mais de uma chegada no mesmo instante
de tempo t; o que nunca ocorrerá quando o tempo de serviço for múltiplo do tempo entre
chegadas, pois a nova chegada acontecerá no mesmo instante em que o próximo serviço for
completado. Assim, para µ1 = m( λ1 ), com m inteiro, tem-se 2.64:

1


0, t< λ

n(t) = [λt] − µt − λµ , λ1 ≤ t < ti
 
n(t) = (2.64)


k − 1,

t ≥ ti
em que ti é encontrado em (2.63).
Para o caso em que o tempo de serviço não for múltiplo do tempo entre chegadas,
após o primeiro bloqueio, n(t) ocasionalmente cairá para k − 2 tornando um pouco mais
dificultoso o cálculo de n(t). Observe 2.65:



0, t < λ1

n(t) = n(t) = [λt] − µt − λµ , λ1 ≤ t < ti
 
(2.65)


k − 1 ou k − 2,

t ≥ ti
em que ti é encontrado em (2.63).
2. F UNDAMENTAÇÃO T EÓRICA 35

Como se pode notar, a complicação reside em detectar para quais valores de t ≥ ti ,


n(t) = k − 1 ou n(t) = k − 2.
Veja em Apêndice A uma rotina em linguagem R que automatiza os cálculos para
número de usuários no sitema (n(t)) em ambos os casos ( µ1 = m( λ1 ) e µ1 6= m( λ1 )), atenuando
essa complicação.
Gross & Harris (2008) também facilitam a medotologia de cálculo para o tempo de
(n) (n+1)
espera na fila até que o serviço comece. Basta observar que as esperas, Wq e Wq , de
dois sucessivos usuários em uma fila de servidor único são relacionadas pela simples relação
de recorrência em (2.66):

W (n) + S(n) − T (n) , (W (n) + S(n) − T (n) ) > 0
(n+1) q q
Wq = (n)
(2.66)
0, (Wq + S(n) − T (n) ) ≤ 0

em que S(n) é o tempo de serviço do n-ésimo usuário e T (n) é o tempo de interchegada


do n-ésimo usuário e do (n+1)ésimo usuário.
(n)
Percebe-se, intuitivamente, que o tempo de espera, Wq , para todo n ≥ n(ti ) será sem-
pre o mesmo: (k − 2) µ1 . Afinal, todo usuário que entrar no sistema após o tempo de recusa, ti ,
se deparará com k − 2 usuários à sua frente; cada um requerendo um tempo de serviço cons-
tante de S(n) = µ1 . Isso pode ser conferido pela Equação recursiva 2.66, pois após o primeiro
bloqueio, o tempo entre chegadas será igual ao tempo de serviço, T (n) = S(n) = µ1 , uma vez
que, nessas condições, somente entrarão novos usuários no sistema a cada completamento
(n+1) (n) (n)
de serviço. Logo Wq = Wq + µ1 − µ1 = Wq .
Já para n < n(ti ), T (n) = λ1 e S(n) = µ1 .
(n) (n+1)
É possível fixar uma fórmula para o cálculo de Wq a partir de (2.66): Wq =
(n) (n) (n) (n+1) (n) 1 1 (n+1) (n) 1 1
Wq + S − T =⇒ Wq = Wq + µ − λ =⇒ Wq −Wq = µ − λ . E com isso,
(n)
Wq = ( µ1 − λ1 )n+c; em que c é uma constante arbitrária. Para obtê-la, basta usar a condição
(1) (n)
de contorno Wq = 0 que fornece c = −( µ1 − λ1 ) =⇒ Wq = ( µ1 − λ1 )n − ( µ1 − λ1 ) =⇒
(n)
Wq = ( µ1 − λ1 )(n − 1).
Dessa forma, o tempo de espera do n-ésimo usuário a entrar no sistema é dado por
(2.67)

( 1 − 1 )(n − 1), para n < λti
(n) µ λ
Wq = . (2.67)
(k − 2) 1 , para n ≥ λti
µ
2. F UNDAMENTAÇÃO T EÓRICA 36

2.3.5 Modelos markovianos


Os modelos de filas markovianas são desenvolvidos pelos processos de nascimento e
morte vistos na subeção 2.2.2 e são descritos pelo diagrama de fluxos apresentado na Figura
2.3. Esses processos conduzem, de forma direta, na solução das probabilidades Pn no estado
estacionário, uma vez que consistem em cadeias de Markov de tempo contínuo.
Alguns exemplos de modelos de filas markovianas são M/M/1, M/M/1/k, M/M/c,
M/M/c/k dentre outros. Assim como feito para o modelo determinístico, apenas como cri-
tério de ilustração, serão apresentadas nas próximas Subseções, de forma suscinta, as prin-
cipais características do modelo M/M/1. Caso o leitor deseje estudar de forma mais apro-
fundada outros tipos de modelos, recomenda-se Gross & Harris (2008), Fogliatti & Mattos
(2007) ou Zukerman (2013).

2.3.5.1 Filas M/M/1

De acordo com Gross & Harris (2008), os tempos entre chegadas sucessivas e os tem-
pos de atendimento no modelo M/M/1 seguem distribuições exponenciais. As taxas de che-
gadas (ingresso) ao sistema e de atendimento são constantes e dadas respectivamente por
2.68:

λn = λ , ∀ n ≥ 0 e µn = µ, ∀ n ≥ 1 . (2.68)

Existe um único posto de atendimento (c = 1), não há espaço reservado para a fila de
espera e a disciplina de filas é do tipo FCFS.
Substituindo a equação 2.68 nas equações 2.57 e 2.55, obtém-se Pn para o modelo
M/M/1:
 n
λ
Pn = P0 . (2.69)
µ
De modo análogo, substituindo 2.68 nas equações 2.57 e 2.56, obtém-se:

1
P0 = n
. (2.70)
∑∞
n=0 ρ
Por se tratar de uma progressão geométrica infinita, sabe-se que

1
∑ ρn = 1 − ρ , (2.71)
n=0
2. F UNDAMENTAÇÃO T EÓRICA 37

então:

1 1
P0 = n
= 1
→ P0 = 1 − ρ . (2.72)
∑∞
n=0 ρ 1−ρ

Substituindo (2.72) em (2.69), tem-se a equação 2.73:

Pn = ρ n (1 − ρ) . (2.73)

Medidas de desempenho

Número médio de clientes: Conforme abordado anteriormente, uma forma de calcular


o número médio de clientes no sistema (L) e na fila (Lq ) é através do valor médio ou valor
esperado E[N], onde N é a variável aleatória que corresponde ao número de usuários no
sistema em regime estacionário. Logo, aplicando 2.73 em 2.58, tem-se que:
∞ ∞ ∞
L= ∑ nPn = ∑ nρ n(1 − ρ) → L = (1 − ρ) ∑ nρ n . (2.74)
n=0 n=0 n=0

Abrindo o somatório:


∑ nρ n = ρ + 2ρ 2 + 3ρ 3 + . . .
n=0
∞ (2.75)
2 n−1
= ρ(1 + 2ρ + 3ρ + . . . ) = ρ ∑ nρ .
n=1

Observa-se que ∑∞ n−1 nada mais é que a derivada de ∞ ρ n em relação a n, uma


n=1 nρ ∑n=0
vez que as operações de diferenciação e soma podem ser alternadas. Consequentemente,
h i
1
∞ d 1−ρ 1
∑ nρ n−1 = dρ
=
(1 − ρ)2
. (2.76)
n=1

Portanto, o número de clientes no sistema no estado estacionário, para o modelo M/M/1


é dado pela equação 2.77:

ρ(1 − ρ) ρ λ
L= 2
= →L= . (2.77)
(1 − ρ) 1−ρ µ −λ
De forma similar, lembrando que Nq é a variável aleatória que corresponde ao números
de clientes na fila no regime estacionário e c = 1, encontra-se uma elegante fórmula para Lq .
2. F UNDAMENTAÇÃO T EÓRICA 38

Observe o desenvolvimento em (2.78):

∞ ∞ ∞ ∞
Lq = E[Nq ] = ∑ (n − c) Pn = ∑ (n − 1)Pn = ∑ nPn − ∑ Pn
n=c+1 n=1 n=1 n=1
(2.78)
ρ ρ2
= L − (1 − P0 ) = −ρ = .
1−ρ 1−ρ

Assim, o número médio de clientes na fila é:

ρ2 λ2
Lq = = . (2.79)
1−ρ µ(µ − λ )

Tempo médio de espera: O tempo médio de espera no sistema (W ) é encontrado facil-


mente através das Fórmulas de Little (Subseção 2.3.3). Basta substituir (2.77) em (2.60):

L ρ 1
W= →W = = . (2.80)
λ λ (1 − ρ) µ − λ
De modo análogo, encontra-se o tempo médio de espera na fila (Wq ) substituindo 2.79
em 2.61

Lq ρ ρ
Wq = →W = = . (2.81)
λ µ(1 − ρ) µ − λ

2.3.6 Modelos de Erlang


Os modelos de Erlang são aplicáveis em sistemas de fila que possuem os tempos de
serviços ou os tempos entre chegadas caracterizados pela distribuição de Erlang tipo-k dis-
cutida na Subseção 2.1.3.
Com relação a Hillier & Lieberman (2001), a distribuição de Erlang possui grande im-
portância na análise de sistemas de filas por dois motivos. O primeiro vem de uma importante
relação com a distribuição exponencial. Mais precisamente, tem-se a seguinte propriedade
apresentada no teorema a seguir.

Teorema 11 Suponha que Ti , i = 1, 2, 3, . . . k sejam k variáveis aleatórias independentes e


identicamente distribuídas com distribuição exponencial cuja média é 1/(k µ). Então, sua
soma é:

T = T1 + T2 + . . . + Tk (2.82)

e possui distribuição Erlang com parâmetros k e µ.


2. F UNDAMENTAÇÃO T EÓRICA 39

O leitor pode verificar a prova desse teorema em Fogliatti & Mattos (2007). Essa soma
torna possível tirar proveito da propriedade markoviana da distribuição exponencial, uma
vez que a distribuição Erlang não é markoviana.
O segundo motivo é o fato de que a distribuição Erlang, visto que possui dois parâme-
tros, fornece mais flexibilidade em modelagem do que a distribuição exponencial, que possui
apenas um parâmetro. Assim, a família Erlang fornece uma maior flexibilidade no ajuste de
uma distribuição empírica a dados reais do que a família exponencial.
Existem dois casos opostos no ajuste de distribuições empíricas com a distribuição
Erlang, afinal, como foi discutido anteriormente, com o parâmetro k = 1 tem-se a distribuição
exponencial e quando k → ∞, a distribuição Erlang se torna determinística (Figura 2.2).
Ainda de acordo com Hillier & Lieberman (2001), o valor para k pode ser escolhido após
estimar os valores da média e variância da distribuição empírica a partir das fórmulas dadas
para média e variância em 2.23.
Voltando ao primeiro motivo, o Teorema 11 torna possível formular um processo
de nascimento e morte modificado em termos de fases com tempos exponenciais. Isto é,
consideram-se tarefas compostas por uma sequência de k fases, onde cada fase é exponen-
cialmente distribuída com média 1/(µ k), tendo, assim, um modelo Erlang tipo-k. Desse
modo, as propriedades benéficas da distribuição exponencial são preservadas. No entanto,
Gross & Harris (2008) salientam a desvantagem de que ao usar o conceito de fases aumenta-
se a quantidade de estados e, por conseguinte, a complexidade do sistema.
Gross & Harris (2008) apresentam algumas implicações desse tipo de modelo. São
elas:

• Todas as fases são independentes e idênticas.

• Apenas um cliente de cada vez é permitido no mecanismo de serviço, ou seja, o cliente


entra na fase 1 e deve completar a última fase antes que o próximo cliente entre na
primeira fase.

Para constatar a aplicabilidade da distribuição Erlang e estender o conhecimento sobre


esse tipo de modelo, será apresentado a seguir, como forma de exemplo, o modelo M/ Ek /1.
Para um estudo mais profundo sobre outros sistemas de filas que possuam o modelo de
Erlang, tal como o Ek /M/1, veja Gross & Harris (2008).

2.3.6.1 Filas M/Ek /1

No modelo M/Ek /1, os tempos entre chegadas sucessivas são exponencialmente dis-
tribuídos e os tempos de atendimento são realizados apenas por um servidor seguindo uma
2. F UNDAMENTAÇÃO T EÓRICA 40

distribuição Erlang tipo-k. Neste sistema, o tempo de serviço é composto por uma sequên-
cia de k fases, onde cada fase é exponencialmente distribuída com parâmetro kµ, logo cada
fase terá média 1/(k µ). Assim, pelo Teorema 11, a função de serviço geral (tempo para
completar o serviço) é uma Erlang com média 1/µ e parâmetros k e µ.
Na Subseção 2.1.3 foram apresentadas as fórmulas para o cálculo da variância de al-
gumas distribuições estatísticas; dentre elas a exponencial e a Erlang. Analisando a fórmula
para o cálculo da variância de uma distribuição Erlang com parâmetros k e µ e a compa-
rando com a fórmula para o cálculo da variância de uma distribuição exponencial, também
com parâmetro µ, percebe-se que os tempos de atendimento no modelo M/Ek /1 possuem
uma variação menor em relação ao modelo M/M/1.
Uma boa maneira para vislumbrar tal fato, assim como abordam Fogliatti & Mattos
(2007), é mediante o cálculo do coeficiente de variação (CV), definido como a razão entre o
desvio padrão e a média. Ele revela o prolongamento da variabilidade em relação à média
da distribuição.
Para o modelo M/M/1, tem-se:
p
M β2
CV = =1 . (2.83)
β
Enquanto que para o modelo M/Ek /1,
q
1
Ek k µ2 1
CV = 1
=√ . (2.84)
µ k
Já para o modelo determinístico, M/D/1:

o
CV D = 1
=0 . (2.85)
µ

E, assim, a seguinte relação entre os tempos de serviço para esses modelos é satisfeita:

CV D ≤ CV Ek ≤ CV M . (2.86)

Veja, na Figura 2.4, os gráficos de uma família Erlang com média 1/µ para diferentes
valores de k.
2. F UNDAMENTAÇÃO T EÓRICA 41

Figura 2.4. Uma família de distribuições Erlang com média 1/µ

Fonte: Hillier & Lieberman (2001)

Desse modo, entre os casos extremos dos modelos modelos determinísticos (CV = 0) e
markovianos (CV = 1), os modelos de Erlang soam como um caso intermediário no quesito
variabilidade de dados.

Medidas de desempenho As duas maneiras mais utilizadas pela literatura de filas para
desenvolver as fórmulas para o cálculo das principais medidas de desempenho vem de dois
outros modelos de fila: O modelo M/G/1 e o modelo M[K] /M/1. Isso se deve ao fato de o
modelo M/Ek /1 ser um caso especial desses dois modelos.
Uma vez que esses modelos não serão abordados, por fugirem ao escopo deste traba-
lho, serão apenas apresentadas as fórmulas para o cálculo das principais medidas de desem-
penho.
Para o leitor que desejar se aprofundar, recomenda-se Allen (1990) e Zukerman (2013)
para o modelo M/G/1, onde as fórmulas de Pollaczek-Khintchine são apresentadas de forma
didádica e minuciosa. E para o modelo M[X] /M/1 recomenda-se Gross & Harris (2008) e
Fogliatti & Mattos (2007).
2. F UNDAMENTAÇÃO T EÓRICA 42

Número médio de clientes na fila:

1+k λ2
Lq = × . (2.87)
2k µ (µ − λ )

Tempo médio de espera na fila:

1+k λ
W= × . (2.88)
2k µ (µ − λ )

Tempo médio de espera no sistema:

1
W = Wq + . (2.89)
µ

Número médio de clientes no sistema:

L=λW . (2.90)

2.4 Inferência Estatística


Enquanto a estatística descritiva se preocupa em analisar a amostra, a inferência es-
tatística concede fundamentos para examinar os dados sobre uma população. Casella &
Berger (2002), no prefácio de seu livro, declara que o núcleo central da inferência estatística
concentra-se na estimação (pontual e por intervalo) e nos testes de hipóteses. No que tange
ao intuito deste trabalho, tais tópicos são temas de fundamental importância, em especial, os
métodos dos momentos, os estimadores de máxima verossimilhança e os testes de hipóte-
ses não paramétricos Kolmogorov Smirnov e qui-quadrado. Em razão disso, uma lacônica
apresentação de cada um deles será dada a seguir.

2.4.1 Teste de hipóteses


Para Conover (1999), um teste de hipóteses é o processo de inferir a partir da amostra
se determinada declaração a respeito de uma dada população pode ser verdadeira. Essas
declarações são denominadas hipóteses. Alguns exemplos de hipóteses são:

• Homens são mais propensos a sofrerem acidentes de carro do que mulheres.

• O réu é culpado.

• A pasta de dentes A é mais eficiente na prevenção de cáries do que a pasta de dentes


B.
2. F UNDAMENTAÇÃO T EÓRICA 43

Considere a seguinte definição para o significado de hipótese:

Definição 21 “Uma hipótese é uma declaração sobre um parâmetro da popula-


ção.”(Casella & Berger, 2002, p. 373).

O ponto de vista significativo dessa definição é o de que uma hipótese faz uma afirma-
ção sobre a população. Tem-se, então, uma hipótese que se deseja testar, em contraste com
uma hipótese complementar. O objetivo do teste de hipóteses é decidir, com base em uma
amostra da população, qual dessas hipóteses traz a afirmação verdadeira.
Tem-se, portanto, a seguinte definição para hipótese nula e hipótese alternativa:

Definição 22 Denomina-se hipótese nula (H0 ) e hipótese alternativa (H1 ) as duas hipóteses
complementares em um teste de hipótese.

A ideia é utilizar um conjunto de ferramentas estatísticas que forneça um bom nível de


confiança para considerar que a hipótese H0 vai, de fato, acontecer, ou não.
Em razão do exposto, um teste de hipótese resulta em dois tipos de erros: Erro tipo 1
(também chamado de nível de significância) e Erro tipo 2:

• Erro tipo 1: Rejeita-se a hipótese H0 quando ela é verdadeira.

• Erro tipo 2: Aceita-se a hipótese H0 quando ela é falsa.

Como se trata de probabilidade, o valor desses erros é dado em forma de porcentagem


ou decimal.
O primeiro passo, em um teste de hipóteses, consiste em delimitar as hipóteses H0 vs
H1 , isto é:

1. Para quais valores amostrais H0 se torna verdadeira.

2. Para quais valores amostrais H0 é rejeitada e H1 é tida como verdadeira.

Denomina-se “região de rejeição” ou “região crítica” o subconjunto do espaço amostral


para o qual H0 será rejeitada e “região de aceitação” ou “região de confiança” o complemento
desse subconjunto.
Conover (1999) define uma região crítica como o conjunto de pontos no espaço amos-
tral que resulta em rejeitar a declaração feita na hipótese nula.
Estritamente, se θ denota um parâmetro populacional, as hipóteses são dadas do se-
guinte modo:
2. F UNDAMENTAÇÃO T EÓRICA 44

H0 : θ ∈ Ω e H1 : θ ∈ Ωc

onde Ω é algum subconjunto, no qual acredita-se o parâmetro populacional θ pertencer,


enquanto que Ωc é o seu complemento.
Após a definição das hipóteses é necessário especificar o tipo de teste que será reali-
zado. Basicamente, de acordo com Hinton (2004), existem três tipos de teste de hipótese: o
bilateral, o unilateral à esquerda e o unilateral à direita.
Veja na Figura 2.5 um exemplo de teste bilateral com a representação do nível de
significância:

Figura 2.5. Teste bilateral com representação do nível de significância = 5 %.

Fonte: Hinton (2004). Adaptada pelo autor.

A região onde a hipótese nula é aceita é a região de aceitação, enquanto que o comple-
mento (as caldas da distribuição) é a região crítica. O valor do Erro tipo 1 é dado pelo nível
da região de rejeição.
O segundo passo baseia-se em encontrar uma estatística de teste, que nada mais é
que uma função da amostra (variável aleatória) que calcula um valor que será usado para
decidir se a hipótese nula será rejeitada. Existem diversos métodos de escolhas de estatísticas
2. F UNDAMENTAÇÃO T EÓRICA 45

de testes e regiões de rejeição, que são consoantes às necessidades que se possa ter. Elas
são usadas para calcular o valor p; o chamado nível de significância observado (p-valor),
(DeGroot & Schervish, 2012, p. 539). O procedimento é simples: após calculada, essa
estatística de teste é comparada com os limites da região de rejeição. Caso o resultado esteja
dentro da região crítica, rejeita-se H0 . Similarmente, um experimentador que deseja um nível
de significância α para a sua pesquisa, rejeitará a hipótese nula se e somente se o p-valor for
menor ou igual a α.

2.4.2 O p-valor
O p-valor consiste no menor nível de significância para o qual a hipótese nula seria
rejeitada. Para Conover (1999), o resultado de um teste de hipóteses torna-se bem mais
significativo quando o p-valor é, também, declarado. Isso se deve ao fato de que, uma vez
que o p-valor tenha sido determinado, a conclusão de rejeitar ou não a hipótese nula (H0 ), em
qualquer nível de significância, α, especificado, implicará na comparação do p-valor com α.
Considerando tobs como o valor calculado para a estatística de teste T , em um teste
unilateral à direita, o p-valor será dado pela probabilidade P{T ≥ tobs }, enquanto que, para
um teste unilateral à esquerda, o p-valor será dado pela probabilidade P{T ≤ tobs }. Para os
testes bilaterais, Conover (1999) afirma que o p-valor é considerado como o dobro do p-valor
calculado para qualquer uma das duas regiões de rejeição, à direita ou à esquerda. Quando as
regiões de rejeição possuem probabilidades diferentes e a distribuição nula de T é discreta,
construir níveis de significância com, exatamente, a mesma probabilidade para ambas as
caudas torna-se impossível. Sendo assim, em casos como esses, para evitar ambiguidades,
considera-se o p-valor para testes bilaterais, como o dobro da probabilidade unilateral para a
cauda da distribuição nula, na qual o valor observado cai.

2.4.3 Testes de ajustamento


Os testes de hipóteses também são classificados em dois tipos: paramétricos e não
paramétricos. A diferença básica entre os dois é que os testes paramétricos necessitam que
os dados sejam normalmente distribuídos, enquanto que os não paramétricos assumem uma
distribuição arbitrária; como o próprio nome diz, nos testes paramétricos testam-se os pa-
râmetros. Alguns exemplos são média, variância, desvio padrão, proporção, etc. Já os não
paramétricos podem ser usados para testar se uma variável aleatória segue uma determinada
distribuição (testes de ajustamento), se existe homogeneidade entre variáveis aleatórias, etc.
A seguir, será falado sobre a aplicação de dois testes de ajustamento bastante úteis
neste trabalho: o teste qui-quadrado e o teste de Kolmogorov-Smirnov, onde as seguintes
2. F UNDAMENTAÇÃO T EÓRICA 46

hipóteses são testadas:

H0 : Os dados seguem a distribuição especificada.


H1 : Os dados não seguem a distribuição especificada

2.4.3.1 O teste de ajustamento qui-quadrado

Admita que seja retirada uma amostra aleatória de tamanho n de uma população sub-
dividida em k diferentes grupos e sejam pi=1 , pi=2 , . . . , pi=k as probabilidades de que um
elemento dessa amostra, selecionado ao acaso, pertença ao grupo i. Por se tratar de proba-
bilidade, pi satisfaz pi ≥ 0 ∀ i = 1, . . . , k e ∑ki=1 pi = 1. Seja, também, os seguintes números
específicos p0i=1 , p0i=2 , . . . , p0i=k , tal que pi 0 ≥ 0 ∀ i = 1, . . . , k e ∑ki=1 pi 0 = 1.
As seguintes hipóteses serão testadas para cada elemento da amostra:

H0 : pi = pi 0 para i = 1, . . . k
(2.91)
H1 : pi 6= pi 0 para pelo menos um valor de i.

Considere Ni como o número de observações contidas na amostra aleatória que per-


tencem ao grupo i; o que implica que Ni assumirá números inteiros não negativos, tais que
∑ki=1 Ni = n. Nesse sentido, quando H0 for verdade, o valor esperado do número de observa-
ções do tipo i é dado por ei = npi 0 e à medida que H0 for verdade, menor será a diferença
(Ni − ei )2 .
DeGroot & Schervish (2012) fornece a seguinte definição:

Definição 23 A seguinte estatística de teste:

k
(Ni − ei )2
Q= ∑ . (2.92)
i=1 ei
possui a propriedade de que sendo H0 verdade e o tamanho da amostra n → ∞, então
Q converge para a distribuição qui-quadrado (x2 ) com k − 1 graus de liberdade.

Logo, pelo exposto, percebe-se, de modo intuitivo, que à medida que Q for se tornando
maior que determinado valor c, a hipótese H0 vai sendo rejeitada. Esse valor é especificado
pelo nível de significância desejado pelo pesquisador. Se for desejado realizar um teste com
nível de significância α, então o valor especificado para c será o quantil 1 − α da distribuição
qui-quadrado (x2 ) com k − 1 graus de liberdade.
2. F UNDAMENTAÇÃO T EÓRICA 47

Tal teste é denominado teste de ajustamento qui-quadrado ou teste da bondade de


ajuste. Os valores de ei são calculados assumindo que H0 seja verdade, isto é, para cada
grupo i, ei = P(X = xi ), onde X é a variável aleatória da distribuição testada em H0 .
Sempre que o valor esperado de cada ei calculado não for tão pequeno, a distribuição
qui-quadrado (Subseção 2.1.3.8) possuirá boa aproximação com a distribuição real de Q.
O teste qui-quadrado possui a desvantagem de que o valor assumido pela estatística de
teste calculada, Q é dependente da forma como os dados são agrupados. Outra desvantagem
é que trata-se de um teste que requer amostras de tamanho suficientemente grande para que
seu resultado seja válido. Como visto na definição anterior, a aproximação com a distribuição
x2 se torna maior à medida que n tende ao infinito, (Sematech, 2012).

2.4.3.2 O teste de ajustamento Kolmogorov-Smirnov

Suponha uma amostra aleatória, de tamanho n, X1 , X2 , . . . , Xn e sejam X(1) , X(2) , . . . , X(n)


as suas estatísticas de ordem. Admita, além do mais, que a distribuição acumulada da va-
riável aleatória X seja F(x). D’Agostino (1986) define uma função de distribuição empírica
(fde) do seguinte modo:

Número de observações ≤ x
Fn (x) = ; −∞ < x < ∞ (2.93)
n
Mais precisamente,

Fn (x) = 0, x < X(1)


i
Fn (x) = , X(i) ≤ x ≤ X(i+1) ; i = 1, 2, . . . , (n − 1) (2.94)
n
Fn (x) = 1, X(n) ≤ x

Note que Fn (x) é uma função de passo; à medida que x aumenta, Fn (x) aumenta um
passo de tamanho 1n para cada observação da amostra. Desse modo, Fn (x) registra a propor-
ção de valores da amostra menores ou iguais a x, enquanto que F(x) indica a probabilidade
de uma observação Xi ser menor ou igual a x. Portanto, pela lei dos grandes números, segue
que quando n → ∞, Fn (x) converge para F(x) permitindo com que Fn (x) possa ser usada para
estimar F(x).
Tal estimativa é dada por uma estatística de teste que mede, verticalmente, a maior
distância entre essas duas funções. Essa estatística de teste calcula dois valores: D+ e D− ,
que indicam as maiores distâncias verticais entre Fn (x) e F(x) quando, respectivamente,
Fn (x) é maior que F(x) e quando Fn (x) é menor que F(x). Formalmente, tem-se que D+ =
2. F UNDAMENTAÇÃO T EÓRICA 48

supX {Fn (x)−F(x)} e D− = supX {F(x)−Fn (x)}. Tem-se, então, a bem conhecida estatística
de teste D; introduzida por Kolmogorov (1933):

D = supX |Fn (x) − F(x)| = max{D+ , D− } (2.95)

Nessa perspectiva, conforme DeGroot & Schervish (2012), sempre que a função de
distribuição acumulada F(x) for desconhecida, a função de distribuição acumulada da amos-
tra, Fn (x), pode ser considerada para estimar F(x).
Como pontos negativos para o teste Kolmogorov, verifica-se em Conover (1999) que
o mesmo só pode ser aplicado quando a distribuição indicada na hipótese nula estiver com-
pletamente especificada. Conforme D’Agostino (1986), isso acontece pelo fato de que es-
timar os parâmetros populacionais a partir dos dados da amostra traz a estatística do teste
Kolmogorov Smirnov, D, mais próxima da distribuição nula do que estaria caso os parâ-
metros populacionais fossem especificados. Por outro lado, esse teste, diferentemente do
qui-quadrado, possui a valiosa vantagem de ser aplicável a amostras pequenas.

2.4.4 Método dos momentos


Talvez o mais antigo método para se encontrar estimadores pontuais e possui a virtude
de ser bastante simples, porém, em muitos casos necessita ser aperfeiçoado. No entanto é
um bom ponto de partida para aplicação de outros métodos mais razoáveis.
Seja X1 , X2 , . . . , Xn uma amostra, independente e igualmente distribuída, de uma popu-
lação com fdp ou fp f (x|θ1 , θ2 , . . . , θk ). A ideia por trás do método dos momentos é igualar
os n primeiros momentos amostrais com os momentos de número n da população corres-
pondentes, estudados na Subseção 2.1.2. Logo depois resolve-se o sistema resultante de
equações simultâneas. Mais precisamente, tem-se:

1 k 1
m1 = ∑ Xi , µ10 = EX 1
k i=1
1 k 2
m2 = ∑ Xi , µ10 = EX 2
k i=1 (2.96)
..
.
1 k n
mn = ∑ Xi , µ10 = EX n
k i=1

Os momentos (θ̃1 . . . θ̃n ) são obtidos resolvendo o sistema de equações para


(θ1 , θ2 , . . . , θn ) em função de m1 , m2 , . . . , mn . Grosso modo, isola-se os parâmetros popu-
2. F UNDAMENTAÇÃO T EÓRICA 49

lacionais nas equações acima, (Casella & Berger, 2002).

2.4.5 Estimadores de máxima verossimilhança


Sendo um dos melhores estimadores pontuais, é, de longe, a técnica mais popular. Seja
X1 , X2 , . . . , Xn uma amostra, independente e igualmente distribuída, de uma população com
fdp ou fp f (x|θ1 , θ2 , . . . , θk ), a função de verossimilhança é dada por:
n
L(θ |x) = L(θ1 , . . . θn ) = ∏ f (xi |θ1 , . . . θk ). (2.97)
i=1

O estimador de máxima verossimilhança será o valor que maximiza essa função. Veja
a Definição dada por Casella & Berger (2002):

Definição 24 “Para cada ponto amostral x, seja θ̃ (x) um valor de parâmetro no qual L(θ |x)
atinge seu máximo como uma função de θ , com x mantido fixo. Um estimador de máxima
verossimilhança (EMV) do parâmetro θ com base em uma amostra X é θ̃ (X).”

Trata-se de um bom estimador. Existem, no entanto - ainda consoante Casella & Berger
(2002)-, apenas dois incovenientes. O primeiro reside no fato de encontrar o valor máximo,
que em diversos casos trata-se apenas de um simples problema de cálculo diferencial, mas
em certos momentos, mesmo em densidades comuns surgem dificuldades. O segundo in-
coveniente é devido a sua sensibilidade numérica. Existem circunstâncias em que pequenas
diferenças nos dados produzem EMV bem diferentes, tornando seu uso suspeito.

2.5 O software R
Uma das maiores metas deste trabalho foi demonstrar a eficácia do R em análise de
filas. Deseja-se mostrar que, de forma gratuita, simples e interativa, é possível obter análises
precisas de um sistema de fila, desde a especificação do modelo até a aquisição das medidas
de desempenho.
Por tais razões, na próxima Seção são abordadas as principais características do R,
respondendo questões como: O que é o R e como usá-lo?
Posteriormente, nas Seções 2.5.2, 2.5.3 e 2.5.4 são apresentados três pacotes muito im-
portantes em inferência estatística e teoria das filas: os pacotes fitdistrplus, KScorrect
e queueing. Sendo que, na mesma Seção do primeiro pacote citado, um procedimento no
ajuste de distribuições é apresentado.
2. F UNDAMENTAÇÃO T EÓRICA 50

2.5.1 O que é o R?
R é um software livre para computação estatística e gráficos. Ele compila e roda em
uma ampla variedade de plataformas, dentre as quais UNIX, Windows e MacOS, (R Core
Team, 2018). Crawley (2007) o define como uma linguagem de alto nível e um ambiente
para análise de dados e gráficos, sendo que possui grande influência da linguagem e ambiente
S que foi desenvolvida por Becker, Chambers e Wilks nos laboratórios Bell.
Mesmo sendo gratuito, o R fornece um enorme suporte tanto em análise estatística
(modelagem linear e não linear, testes estatísticos clássicos, análise de séries temporais, clas-
sificação, agrupamento, ...) como em análises gráficas. Muitos usuários começam a usar o R
por sua facilidade gráfica, sendo este um dos seus pontos mais fortes.
O R está disponível sob os termos da Free Software Foundation’s GNU General Public
License em forma de código fonte.
Para utilizar o R, o usuário também pode realizar o download do RStudio, um ambiente
de desenvolvimento integrado para R. O R e o RStudio podem ser instalados e executados
separadamente e trabalhar conjuntamente com ambos é uma opção de agregar facilidades ao
uso do R.
Ao executar o RStudio pela primeira vez, encontra-se um ambiente de desenvolvi-
mento constituído, basicamente, por quatro janelas. Observe a Figura 2.6:

Figura 2.6. RStudio

Fonte: Acervo do autor (2019).

A janela número 1 é a “R Script”, onde se implementam os códigos; na janela número


2, denominada “Console”, tem-se os valores das saídas dos comandos executados na janela
R Script; a janela 3 recebe o nome de “ambiente global”, onde são mostrados todos os
2. F UNDAMENTAÇÃO T EÓRICA 51

objetos que foram criados; a janela número 4 é subdividida em abas: na aba “files” é possível
navegar pelos arquivos do computador, a aba “packages” lista os pacotes instalados, sendo
possível carregá-los ou mesmo removê-los com apenas um clique, pela aba “help” o usuário
obtém ajuda sobre diversas funções e pacotes do R e na aba “plot” os gráficos gerados são
visualizados.
No R é usado o conceito de pacotes, que são constituídos por três partes básicas, (Ju-
nior, 2011):

1. R-base: são os pacotes que já vêm instalados quando se inicia o programa pela pri-
meira vez. O “coração” do R.

2. Pacotes recomendados (recommended packages): vêm instalados no R-base, porém


não carregados.

3. Pacotes contribuídos (contributed packages): não vêm instalados no R-base, sendo


necessário instalá-los e carregá-los para usá-los.

Os pacotes contribuídos são pacotes oficiais e podem ser acessados na página do R


(https://www.r-project.org/). Porém, existem pacotes não oficiais que podem ser en-
contrados na web.
Os pacotes oficiais estão registrados no CRAN - Comprehensive R Archive Network
(Rede abrangente de arquivos R). Os CRAN’s são uma série de sites com servidores espa-
lhados pelo mundo que transportam materiais do R, como extensões contribuídas, a última
versão do R para download, documentação de pacotes, etc.
Para instalar um pacote, basta digitar o comando:

> install.packages("nome do pacote")

Para carregá-lo, utilize o comando library:

> library(nome do pacote)

Para saber como citá-lo, digite:

>\citation(nome do pacote)

Para acessar o manual de algum pacote, uma opção é entrar com o comando help:

> help("nome do pacote")


2. F UNDAMENTAÇÃO T EÓRICA 52

Ao utilizar esse comando, uma documentação do R sobre o pacote em questão será


aberta no menu “Help” da janela 4.
É possível, também, desenvolver suas próprias funções ou pacotes e submetê-los ao
CRAN, tornando-se um contribuidor. Isso pode ser feito por meio da linguagem R; que é uma
linguagem de programação simples e fácil de usar. Porém, para tarefas computacionalmente
mais intensas ou complexas, o usuário mais avançado pode utilizar linguagens como C, C++
e Fortran “linkando-as” com a linguagem R.
Sendo assim, uma vez que é open source, é possível ter acesso ao código fonte das
funções e pacotes do R por meio dos sites do CRAN. Esses códigos são disponibilizados na
documentação dos respectivos pacotes.

2.5.2 O ajustamento de distribuições no R e o pacote


fitdistrplus
No ajuste de distribuições, segundo Ricci (2005), são identificados quatro passos:

1. Escolher as distribuições candidatas;

2. Estimar os parâmetros por meio de métodos como momentos e máxima verossimi-


lhança;

3. Avaliar a qualidade do ajuste;

4. Aplicar testes estatísticos de aderência.

Essa metodologia é sustentada por Delignette-Muller & Dutang (2015), que, na docu-
mentação do seu pacote, o fitdistrplus, também orienta plotar os gráficos da distribuição
empírica como o histograma, a função de distribuição acumulada (fda) e as funções de pro-
babilidades pontuais (fdp e fp) para escolha das distribuições candidatas.
O pacote fitdistrplus fornece funções para ajustes de distribuições univariadas para
diferentes tipos de dados, sejam eles contínuos censurados ou não censurados, sejam eles
discretos. Permite diversificados métodos de estimação, como o método dos momentos e de
máxima verosimilhança estudados na fundamentação teórica.
Para utilizar o pacote fitdistrplus é necessário instalá-lo e carregá-lo, sendo que a ins-
talação de alguns outros pacotes é exigida, como o MASS, survival e o npsurv. É altamente
recomendável ler a documentação do pacote digitando help(fitdistrplus) no console.
Os gráficos dos histogramas e das funções densidade e acumulada são obtidos por
meio da função plotdist() do pacote fitdistrplus. Porém, o usuário pode escolher trabalhar
de uma forma mais livre utilizando ferramentas fornecidas por pacotes do R-base, como o
2. F UNDAMENTAÇÃO T EÓRICA 53

pacote graphics para gráficos e o stats que contém funções para cálculos estatísticos e
geração de números aleatórios.
É de suma importância, também, o cálculo de medidas estatísticas descritivas, como
média, variância, desvio padrão, assimetria e curtose. Estas duas últimas para saber quão
simétrica e espalhada é a distribuição. Para tal finalidade, existem funções no R como
skewness() e kurtosis() do pacote fbasics (que precisa ser instalado) ou a função
descdist do fitdistrplus. A média e variância são calculadas com comandos simples como
mean() e var().
Em face dos conhecimentos adquiridos por meio do cálculo de medidas descritivas e
observação dos gráficos, o usuário possuirá um leque de informações para uma boa esco-
lha das distribuições candidadas. Damodaran (2007) resume esse processo de escolha no
fluxograma apresentado na Figura 2.7.
Uma vez selecionada uma ou mais distribuições candidatas, o próximo passo é estimar
os parâmetros. Como este trabalho considera amostras independentes e igualmente distribuí-
das, pode-se utilizar o método de máxima verossimilhança, apresentado na Subseção 2.4.5,
que é calculado por meio da função fitdist().
Para avaliar a qualidade do ajuste, o pacote fitdistrplus fornece diferentes tipos de
funções. As funções qqcomp() e ppcomp() plotam, respectivamente, os gráficos quantil-
quantil (Q-Q) e probabilidade-probabilidade (P-P), enquanto que as funções denscomp() e
cdfcomp() plotam, respectivamente, o gráfico das fda’s e fdp’s das distribuições candida-
tas. O detalhe é que as plotagens dessas funções são sobrepostas às distribuições empíricas
permitindo, assim, uma ótima capacidade visual analítica. Tal método de sobreposição é
abordado em (Wilks, 2006, p. 112).
Ainda consoante Wilks (2006), os gráficos Q-Q e P-P consistem em uma técnica grá-
fica que verifica se dois conjuntos de dados vêm de populações com a mesma distribuição.
Esses gráficos são constituídos de dois eixos: o eixo x (horizontal) e o eixo y (vertical), onde
os quantis (no caso do gráfico Q-Q ) ou as probabilidades acumuladas (no caso do gráfico
P-P) são as cooordenadas desses eixos. Uma linha de 45 graus é plotada e quanto mais
próximas dessa linha forem os pontos das coordenadas, maior é a evidência de aderência.
Apenas para exemplificar, supondo que uma amostra aleatória de tamanho 100, gerada
no R, de uma distribuição binomial de parâmetros n = 2000 e p = 0, 2 seja a distribuição
empírica. Deseja-se verificar a aderência com uma distribuição de Poisson de parâmetro
λ = 400. Lembre-se que foi mostrado na Subseção 2.1.3, que a distribuição de Poisson
pode ser usada como aproximação da distribuição Binomial quando os parâmetros binomiais
n é muito grande (n → ∞) e p muito pequeno (p → 0). Veja na Figura 2.8 como essa
aproximação é evidenciada.
2. F UNDAMENTAÇÃO T EÓRICA

Figura 2.7. Método de escolha das distribuições candidatas.

Fonte: Damodaran (2007). Adaptada pelo autor.


54
2. F UNDAMENTAÇÃO T EÓRICA 55

Figura 2.8. Gráficos P-P e Q-Q. Distribuição empírica: binomial de parâmetros n =


2000 e p = 0.2. Distribuição teórica: Poisson de parâmetro λ = 400.

Fonte: Próprio autor. Adaptado do RStudio.

Por fim, a aplicação dos testes de aderência se dá pela função gofstat(). Para o
caso contínuo, essa função executa, por padrão, os testes Kolmogorov-Smirnov, Cramer-von
Mises e Anderson-Darling. Enquanto que no caso discreto, ela aplica o teste qui-quadrado.
O pacote stats também oferece esses recursos por meio de funções como
chisq.test() para o teste do qui-quadrado e ks.test() para o teste Kolmogorov-
Smirnov.
Convém enfatizar o fato de que, não é razoável rejeitar ou aceitar uma hipótese de
aderência apenas se baseando nos resultados desses testes. Com relação a Casella & Berger
(2002) e Delignette-Muller & Dutang (2015), essa decisão deve ser tomada com base em
todo o conjunto, aqui neste trabalho demonstrado, da análise realizada nos dados.
Todas as funções e pacotes destacados nesta Seção possuem diversos detalhes que
valem a pena serem apreciados. Para isso, o uso do comando help(nome da função ou
do pacote ) no console (ou mesmo a busca pela documentção na Internet) serve para todos
os pacotes e funções acima citados.

2.5.3 O pacote KScorrect


Um problema de grande relevância, para este trabalho, é o de estimação pontual, no
qual se insere dados derivados de um experimento de amostragem para produzir um único
número específico, tal como a média, variância, desvio padrão, etc. Na Seção 2.4 foram
2. F UNDAMENTAÇÃO T EÓRICA 56

vistos os métodos dos momentos e os estimadores de máxima verossimilhança para lidar


com esse problema de estimação pontual, porém, consoante de Freitas (2003), nem sempre
é possível obter sucesso por meio desses métodos.
Com relação a Fishman (1995), o método de simulação Monte Carlo fornece soluções
aproximadas para uma variedade de problemas matemáticos por meio de realizações de ex-
perimentos de amostragem estatística em um computador. Sempre que soluções dadas por
métodos analíticos não são viáveis ou impossíveis para o problema em questão, o método
Monte Carlo é comumente utilizado. Como exemplos dos casos mais clássicos, pode-se
mencionar os problemas de computação numérica, nos quais deseja-se avaliar o volume de
uma região limitada em espaços euclidianos multidimensionais ou a integral de uma função
em dada região.
O problema a ser resolvido neste trabalho se deve ao fato de que, como citado na Sub-
seção 2.4.3.2, o teste de Kolmogorov Smirnov só pode ser aplicado quando a distribuição
indicada na hipótese nula está completamente especificada. Lilliefors (1967) afirma que se
um ou mais parâmetros precisarem ser estimados a partir da amostra, as tabelas de valores
críticos não são mais válidas. Em seu trabalho forneceu tabelas com valores críticos do teste
de Kolmogorov para testes de normalidade quando a média e a variância não são especifi-
cadas. Lilliefors (1969), também, forneceu tabelas similares para a distribuição exponencial
quando a média não é especificada. Tadikamalla (1990), por sua vez, forneceu os valores
críticos para os testes de ajustamento Cramer-von Mises, Anderson Darling e Kolmogorov
para a distribuição gama quando os parâmetros de forma e escala são desconhecidos, para
distribuição gama quando apenas o parâmetro de escala é desconhecido e para a distribuição
distribuição gaussiana inversa quando ambos os parâmetros não são conhecidos. Os valores
críticos de todas essas tabelas supracitadas foram obtidos por meio de um método Monte
Carlo.
Também é possível obter, facilmente, valores críticos para o teste de ajustamento
Kolmogorov-Smirnov por simulações Monte Carlo utilizando o R quando os parâmetros
populacionais não são especificados e necessitam ser estimados através da amostra. Para
isso, utiliza-se o pacote KScorrect; desenvolvido por Novack-Gottshall & Wang (2018).
Para instalá-lo, é necessário ter a versão 3.5 ou superior do R. Esse pacote implementa o
método realizado por Lilliefors (1967) e funciona como complemento à função ks.test; ci-
tada na Seção 2.5.2. Pode ser usado para uma variedade de distribuições contínuas, incluindo
normal, exponencial, gama, uniforme e outras.
O método consiste, basicamente, em gerar várias amostras aleatórias da distribuição
adotada na hipótese nula, com parâmetros estimados através da amostra que se deseja verifi-
car e, então, calcular (usando a função ks.test) a estatística de teste Kolmogorov para cada
amostra aleatória gerada; obtendo, assim, uma distribuição de estatísticas de testes simuladas
2. F UNDAMENTAÇÃO T EÓRICA 57

denominadas por “Dsim ”. Essa distribuição é comparada com o “Dobs ”, que é a estatística de
teste Kolmogorov obtida através da amostra de dados reais.
O p-valor é calculado dividindo o número de Dsim obtidos pelo número de replicações
realizadas. Acrescenta-se uma unidade ao numerador e ao denominador para evitar resulta-
dos sem sentido com muitas casas decimais. Veja Equação abaixo.

∑(Dsim > Dobs ) + 1


Pvalor = , (2.98)
nreps + 1
onde nreps é o número de replicações realizadas.
Para obter os valores críticos, ordena-se em ordem crescente todas as estatísticas si-
muladas. O valor crítico para o nível de significância 0.2 será a estatística simulada, Dsim ,
maior que 80% de todas as outras simuladas. O valor crítico para o nível de significância
0.15 será a estatística simulada, Dsim , maior que 85% de todos as outras; e assim por diante.
O procedimento é feito pela função LcKS:

LcKS(x, cdf, nreps = 4999)

onde em x é colocado vetor contendo a amostra e cdf recebe a string da função acumulada
da distribuição que se deseja testar. Mais detalhes na documentação do pacote.

2.5.4 O pacote queueing


O pacote queueing precisa ser instalado e carregado. Foi desenvolvido por Canadilla
(2017) e fornece recursos versáteis para análise de sistemas de filas markovianos baseados
no processo de nascimento e morte.
Ele automatiza o cálculo das medidas de desempenho dos seguitnes modelos:

• M/M/1, • M/M/c, • M/M/∞ • M/M/∞/K/K


• M/M/1/K, • M/M/c/K, • M/M/c/c
• M/M/1/K/K, • M/M/c/K/K, • M/M/c/K/m

O uso do pacote queueing é simples. Para criar a entrada de um modelo, basta utilizar
a função NewInput.model, digitando, por exemplo:

> X <- NewInput.MM1(lambda=0.25,mu=1,n=10)

para criar um modelo M/M/1 com taxas de 0.25 chegadas por unidade de tempo (λ = 0.25)
e de 1 atendimento por unidade de tempo (µ = 1). O valor de n é dado para o cálculo de
2. F UNDAMENTAÇÃO T EÓRICA 58

alguma probabilidade estacionária, por exemplo, a probabilidade de se obter n = 10 clientes


no sistema no regime estacionário.
Uma maneira de plotar os gráficos de probabilidade é com o seguinte comando:

> plot(n,pn(y),type="l",ylim=c(0,0.6),ylab="",col="green").

Feito isso, a função NewInput.model recebe os valores dados para λ , µ e n e fornece


os resultados das medidas de desempenho. A solução do modelo pode ser obtida de uma
forma mais direta pelo comando:

> y <- QueueingModel(x).

Sendo possível obter um resumo das principais medidas chamando o comando:

> summary(y).

Uma outra maneira de obter as medidas de desempenho é construindo sua própria


rotina. Um exemplo de tal procedimento é mostrado no artigo apresentado em 6.1, página
87.
Capítulo 3

Metodologia

Neste Capítulo é mostrado como os conhecimentos adquiridos são aplicados em aná-


lises de filas. São apresentadas algumas considerações sobre técnicas utilizadas para a espe-
cificação do modelo, assim como a obtenção das medidas de desempenho.
Para isso, optou-se por analisar um caso real de filas. O sistema escolhido foi apresen-
tado por Ferreira (2017) em sua dissertação de mestrado pelo Programa de Pós-Graduação
em Modelagem Computacional e Sistemas da Universidade Estadual de Montes Claros -
Unimontes. Seu trabalho demonstrou a viabilidade da implantação de corredores exclusivos
no centro da cidade Montes Claros, Estado de Minas Gerais, através de técnicas de simula-
ção.

3.1 Apresentação do Sistema


A problemática reside no fato de que por conta de sua extensão territorial e por abran-
ger serviços e atividades essenciais à região, Montes Claros possui um fluxo considerável de
pessoas em trânsito; porém, o tráfego congestionado e a falta de infraestrutura adequada têm
tornado ineficiente o serviço de transporte público na cidade.
Para lidar com essa situação, Ferreira (2017) propôs a utilização de um simulador que
demonstra a viabilidade de modificação de uma via de tráfego misto em corredor exclusivo
para transporte público. Tal simulação computacional foi realizada com o software Arena
e demonstrou que a implantação de corredores exclusivos de ônibus nos trechos em estudo
pode ser viável.
Duas ruas da cidade de Montes Claros foram tomadas como objeto de análise, a Rua
Doutor Santos e a Rua Camilo Prates, que foram “batizadas” de corredor Camilo Prates
e corredor Doutor Santos. São duas ruas paralelas localizadas no centro da cidade, onde
ocorre bastante movimentação de veículos de transporte público. A metodologia utilizada

59
3. M ETODOLOGIA 60

por Ferreira (2017) foi de caráter descritivo, dissertativo e comparativo, realizando análises
qualitativas e quantitativas dos cenários de tráfego de ônibus de transporte público local.
Mais precisamente, foram realizadas simulações referentes a dois tipos de cenários:
com corredores mistos (cenário atual) e corredores exclusivos. No primeiro caso, os ônibus
trafegam juntamente com outros tipos de veículos e pedestres. Já no segundo, nos corredores
exclusivos, os ônibus transitam de forma segregada do tráfego geral; sem nenhuma interfe-
rência. Nas simulações do cenário envolvendo os corredores mistos, foram utilizados os
dados coletados de todos os veículos. Enquanto que no cenário para corredores exclusivos,
foram utilizados somente os dados coletados de vans e ônibus.
Foram feitas quatro tipos de coletas:

1. Dados volumétricos de veículos;

2. Tempos de todos os semáforos dos corredores;

3. Dados para descobrir o fluxo de saturação e a capacidade dos sinais;

4. Tempos de embarque e desembarque.

Superficialmente, apenas por curiosidade, entende-se por fluxo de saturação o número


máximo de veículos que avança um cruzamento com o semáforo na indicação verde ativa
durante uma hora inteira.
O fluxo de veículos de todos os tipos nos locais de embarque e desembarque ocorrem
em grande escala, o que por muitas vezes, principalmente nos horários de pico, faz com que
os ônibus fiquem presos no trânsito. São quatro pontos de embarque e desembarque, os quais
estão situados nas praças Doutor Carlos Versiani e Coronel Ribeiro. Cada praça possui dois
pontos, um de cada lado; como se pode ver pelos traços vermelhos na Figura 3.1:
3. M ETODOLOGIA 61

Figura 3.1. Ilustração das ruas em estudo e pontos de embarque e desembarque.

Fonte: MCTRANS 2012, adaptada por Ferreira (2017)

Os pontos P1, P2, . . ., P6 situados nas ruas Doutor Santos e Camilo Prates correspon-
dem aos locais de coleta de dados que os pesquisadores se posicionaram. Ferreira (2017)
classificou todos os tipos de movimentos possíveis e a explicação de cada um deles consta
no quadro da Figura 3.2.
3. M ETODOLOGIA 62

Figura 3.2. Descrição dos tipos de movimentos

Fonte: Ferreira (2017)

No trabalho de Ferreira (2017), foram colhidas as chegadas sucessivas de veículos


em todos os tipos de movimentos para os dois corredores; Camilo Prates e Doutor Santos.
Quanto aos tempos de embarque e desembarque, foram colhidas amostras de tamanho 10
para cada um dos 4 pontos mostrados na Figura 3.1, em vermelho, dois em cada praça.
Os dados foram convertidos em UCP, (Unidades de carros de passeio), a qual converte
ônibus, caminhões, motocicletas e demais veículos em unidades de carros de passeio de
acordo com os efeitos exercidos pelo veículo na capacidade da via; por exemplo, o caminhão
recebe a nota 2,3 e a bicicleta 0,2.
Porém, para o presente trabalho, os únicos dados de importância foram os dados vo-
lumétricos dos ônibus e os tempos de embarque e desembarque. O objetivo foi supor um
cenário razoavelmente próximo ao cenário analisado por Ferreira (2017) e estudar o pro-
cesso de filas nas baias de ônibus/locais de embarque e desembarque.
Posto isso, o objeto de análise deste trabalho foi, apenas, o corredor Camilo Prates e
foram analisados os dados volumétricos do número de chegadas de ônibus (não convertidos
em UCP) nas praças Coronel Ribeiro (Ponto 1, movimento 0) e Doutor Carlos (Ponto 5,
movimento 3), assim como os tempos de embarque e desembarque nos pontos em vermelho
da praça Coronel e praça Doutor Carlos (apenas no corredor Camilo Prates).
Os dados dos tempos de embarque e desembarque, disponibilizados por Ferreira
(2017), que foram utilizados neste trabalho, constam na Tabela 3.1, enquanto que os da-
dos volumétricos do número de chegadas de ônibus nos pontos de embarque e desembarque
3. M ETODOLOGIA 63

constam na Tabela 3.2. Observe.

Tabela 3.1. Tempos de embarque e desembarque - Rua Camilo Prates.


Praça Coronel Ribeiro Praça Dr. Carlos Versiani
Horário 17:12 Horário 18:12
No Amostra Tempo (s) No Amostra Tempo (s)
1 57 1 97
2 54 2 143
3 21 3 323
4 78 4 166
5 24 5 101
6 95 6 64
7 17 7 152
8 38 8 124
9 25 9 101
10 44 10 73
Fonte: Ferreira (2017). Adaptada pelo autor.

Tabela 3.2. Número de chegadas de ônibus - Rua Camilo Prates.


Praça Coronel Ribeiro Praça Dr. Carlos Versiani
Horário 17:00 - Movimento 0 Horário 17:00 - Movimento 3
Horário Ônibus Horário Ônibus
17:00-17:15 8 17:00-17:15 8
17:15-17:30 16 17:15-17:30 13
17:30-17:45 14 17:30-17:45 13
17:45-18:00 14 17:45-18:00 14
18:00-18:15 15 18:00-18:15 15
18:15-18:30 11 18:15-18:30 11
18:30-18:45 16 18:30-18:45 16
18:30-18:45 11 18:30-18:45 11
Fonte: Ferreira (2017). Adaptada pelo autor.

3.2 Análise do Sistema


Conforme Fogliatti & Mattos (2007), um modelo de filas não determinístico fica to-
talmente estabelecido quando são conhecidas tanto as distribuições que regem os tempos de
chegadas e atendimento, como seus respectivos parâmetros: taxas de chegada e atendimento.
3. M ETODOLOGIA 64

É nesse ponto que a eficácia do R em análise de filas é revelada. Como mostrado na


Seção 2.5.2, a estimação dos parâmetros e a escolha das distribuições adequadas ao problema
sob análise se torna bem menos dispendiosa com o auxílio desse poderoso software. Afinal,
requer aplicação de testes estatísticos e construção de gráficos que, manualmente, poderia
ser bastante cansativo.
Referindo-se à especificação do modelo em análise de filas, na grande maioria das ve-
zes, são levadas em consideração as distribuições exponencial, Erlang e hiperexponencial
no critério de escolha das distribuições candidatas. Porém, neste trabalho, foram conside-
rados apenas os modelos exponencial e Erlang, pelo fato de, como discutido por (Hillier &
Lieberman, 2001, p. 873), serem aplicáveis na grande maioria dos sistemas de fila reais.
Sendo assim, para escolha das distribuições dos tempos entre chegadas e atendimento
do sistema apresentado na Seção anterior, foram consideradas as distribuições Poisson, para
caso discreto (número de chegadas por unidade de tempo), Exponencial e Erlang, para o
caso contínuo (tempos de embarque e desembarque dos ônibus). Como ponto de partida,
foram plotados gráficos das funções acumuladas e pontuais da distribuição empírica, isto é,
a amostra de dados coletados. Também foram efetuados os cálculos de medidas descritivas
como curtose, assimetria, média e mediana. Os resultados foram comparados seguindo o
método de escolha sugerido por Damodaran (2007) na Figura 2.7, página 54.
Fogliatti & Mattos (2007) recomenda, sempre que possível, escolher a distribuição
exponencial, mesmo que não seja o melhor ajuste, por seu emprego em muito facilitar a
aquisição das medidas de desempenho. Isso se deve pelo fato de que, infelizmente, para
os modelos de Erlang ainda não existem muitas fórmulas analíticas prontas para o cálculo
exato de suas medidas de desempenho em todos os tipos de sistemas (principalmente para
os sistemas com uma quantidade maior de servidores), tornando necessária a utilização de
tabelas ou o desenvolvimento das equações estacionárias. Devido a isso, e pelo exposto
na propriedade apresentada na Equação 2.86, página 40, onde verifica-se a possibilidade
de aproximação com o modelo exponencial por meio do cálculo do coeficiente de variação
(CV ), mesmo que alguma distribuição Erlang possua melhor aderência que a distribuição
Exponencial, é possível escolher trabalhar com o modelo markoviano desde que o coeficiente
de variação da amostra seja próximo de 1.
Quanto ao critério da estimação dos parâmetros pelos dados da amostra, assim como
abordado na Subseção 2.3.6, foram utilizadas as fórmulas de média e variância das distribui-
ções apresentadas na Subseção 2.1.3 para a obtenção dos mesmos. Tal método será denomi-
nado aqui neste trabalho como “Método analítico”. Por exemplo, para o caso da distribuição
3. M ETODOLOGIA 65

Erlang, a Equação 2.84 foi utilizada para estimação do parâmetro k. Observe:

1 1
CV Ek = √ → k = , (3.1)
k (CV Ek )2
onde CV é o coeficiente de variação da amostra coletada.
Também foram utilizados os critérios de máxima verossimilhança e momentos como
forma de comparação.
Para a avaliação da qualidade do ajuste, foi realizada análise gráfica conforme expli-
cado na Seção 2.5.2.
Depois de encontrar um nível aceitável de confiança que o modelo é markoviano ou
Erlang, aplicou-se os testes de ajustamento; Kolmogorov-Sminorv para os dados dos tempos
de atendimento e o teste qui-quadrado para os dados do número de chegadas ao sistema.
Diante do exposto, a metodologia aplicada para especificar o melhor modelo e, conse-
quentemente, fornecer análises precisas do mesmo, consistiu nos seguintes passos:

1. Verificar hipótese de aderência do número de chegadas de ônibus com a distribuição


de Poisson.

2. Verificar hipótese de aderência dos tempos de embarque e desembarque com o modelo


markoviano (distribuição exponencial) ou Erlang (distribuição gama).

3. Estimar os parâmetros pelos métodos analítico, momentos e máxima verossimilhança.

4. Propor modelo de fila que melhor se aplica.

5. Obter as medidas de desempenho.

Antes de tudo, 4 considerações precisam ser feitas. A primeira consiste em notar que
os dados coletados referentes aos tempos de embarque e desembarque estão em segundos,
enquanto que o número de chegadas de ônibus foram contados a cada 15 minutos. Existem,
portanto, dois impasses: os dados estão em unidades de medidas distintas (minutos e se-
gundos) e são poucos dados para aplicar o teste de aderência qui-quadrado pelo fato de que,
como visto na Subseção 2.4.3.1, não é eficiente para amostras pequenas.
Sendo assim, optou-se por realizar uma convenção gerando números aleatórios que
representem o número de chegadas a cada minuto, de modo que o total de chegadas a cada
15 minutos seja igual aos dados da Tabela 3.2. Ou seja, tinha-se em mãos o clássico problema
de programação: "gere N números aleatórios de modo que a soma entre eles dê Soma.
Não é um problema tão trivial quanto parece, uma vez que apenas “mandar” o R gerar
amostras de tamanho 15 e depois verificar se a soma dos dados é igual ao valor desejado
3. M ETODOLOGIA 66

pode durar um tempo infinito, por se tratar de um processo randômico. As linhas do código,
em linguagem R, que geraram esses números aleatórios constam a seguir:

A<-c(8, 13, 13, 14, 15, 11, 16, 11) #A recebe amostra de tamanho 8.
n<-15
B<-c()#B receberá a nova amostra de tamanho 120.
for (j in 1:length(A)) {
arrival<-vector("numeric", length = 15)
sum<-A[j]
for (i in 1:sum) {
home<-abs(floor((runif(1,1,(n+0.99999)))))
arrival[home]<-arrival[home]+1
}#a casa sorteada recebe a chegada em cada loop.
B<-c(B,arrival)
}
print(B) #Imprime vetor com nova amostra.

Repare que as chegadas foram uniformemente distribuídas nos intervalos de 15 minu-


tos. Como são 8 tempos de 15 minutos, após a aplicação do código acima foram adquiridas
duas novas amostras de número de chegadas de tamanho 120, tornando possível a aplicação
do teste qui-quadrado.
A segunda consideração é de grande relevância. Uma vez que o número de obser-
vações dos tempos de embarque e desembarque é pequeno, optou-se por utilizar o teste de
Kolmogorov-Smirnov para verificar a hipótese de aderência das distribuições exponencial
e Erlang. Para isso, foi consultada a tabela fornecida por Lilliefors (1969) para verificar a
aderência ao modelo exponencial e a tabela fornecida por Tadikamalla (1990), para verificar
a aderência ao modelo Erlang. As tabelas resumidas foram deixadas em Anexo. Os testes
foram aplicados ao nível de significância 5%. O pacote KScorrect foi usado para cálculo
do p-valor e, também, como ferramenta ilustrativa quando se achou necessário. Foram reali-
zadas 9999 replicações e os valores críticos obtidos por simulação através do referido pacote
não foram apresentados, uma vez que, sempre que calculados, se aproximaram bastante dos
valores divulgados nas tabelas dos trabalhos dos autores acima.
A terceira consideração é o fato de que as funções do pacote fitdistrplus utilizam a
parametrização da Equação 2.17 para a distribuição exponencial e a parametrização da Equa-
ção 2.24 para a distribuição Erlang. Tendo isso em vista, para simplificar, serão consideradas
apenas essas parametrizações a partir daqui.
Por último, mas não menos importante, foi considerado um sistema com 3 servidores
em paralelo, por ser a quantidade de ônibus suportada pelas quatro baias das duas praças.
3. M ETODOLOGIA 67

Foi considerada, também, uma situação de fila infinita, com disciplina FIFO, supondo que
os ônibus que chegam e encontram as três baias ocupadas se acumulam.
Capítulo 4

Resultados e Discussão

Após a importação dos dados para o R em forma de data.frame [Veja Peng (2016)],
foram aplicadas as técnicas apresentadas na Metodologia. Veja a seguir como foi realizada a
análise do problema apresentado na Seção anterior.

4.1 Praça Coronel


Iniciando as análises com a amostra do número de chegadas de ônibus na praça Co-
ronel Ribeiro, foi verificada a possibilidade de aderência a uma distribuição de Poisson de
parâmetro λ = 0.875 chegadas por minuto; que foi a taxa obtida pelo cálculo da média da
amostra.
Veja na Figura 4.1 os gráficos sobrepostos das fp’s e fda’s das distribuições empírica e
teórica, onde foi notada boa aderência.

68
4. R ESULTADOS E D ISCUSSÃO 69

Figura 4.1. FDA e FP teóricas e empíricas do número de chegada de ônibus praça


Coronel.

Fonte: Próprio autor. Adaptado do RStudio.

Aplicando o teste qui-quadrado, com a função gofstat, o valor observado Xobs 2 =


2
3.027, que é menor que o valor crítico X2,5% = 5.99, foi obtido. Sendo assim, ao nível de
5% de significância não há indicativos para rejeição da hipótese de que os dados da amostra
possuam boa aderência com a distribuição de Poisson de parâmetro λ = 0.875.
Os dados coletados referentes aos tempos de embarque e desembarque foram conver-
tidos para minutos, onde foi obtida a taxa de µ = 1.324 embarques e desembarques por
minuto.
A Figura 4.2 apresenta o gráfico das fda’s e fp’s para a amostra dos tempos de embar-
que e desembarque na praça Coronel Ribeiro; gerados pela função plotdist().
4. R ESULTADOS E D ISCUSSÃO 70

Figura 4.2. FDA e FDP tempos de embarque e desembarque praça Coronel

Fonte: Próprio autor. Adaptado do RStudio

Para o cálculo das medidas descritivas, os seguintes resultados, que se encontram na


Tabela 4.1, foram obtidos por meio da função descdist():

Tabela 4.1. Cálculo das Medidas Descritivas para os tempos de embarque e desembar-
que praça Coronel.
Estatísticas Resumidas Resultados
Média 0,755
Mediana 0,683
Desvio Padrão Estimado 0,432
Assimetria Estimada 0,83
Curtose Estimada 2,813
Máximo 1,583
Mínimo 0,283
Fonte: Próprio autor. Adaptada pelo RStudio.

Percebe-se uma assimetria levemente positiva, o que, pela Figura 2.7, apresentada na
página 54, obtém-se uma suspeita tanto para o modelo exponencial quanto para o modelo de
Erlang.
4. R ESULTADOS E D ISCUSSÃO 71

Os resultados da frequência relativa acumulada da amostra dos tempos de embarque e


desembarque foram plotados sobrepostos com a fda da distribuição exponencial de parâme-
tro µ = 1, 324. Observe, na Figura 4.3 o gráfico gerado pela função cdfcomp(), no qual foi
percebida razoável aderência.

Figura 4.3. Frequência relativa acumulada e modelo exponencial praça Coronel.

Fonte: Próprio autor. Adaptado do RStudio.

Isso foi confirmado pelo teste de Kolmogorov-Smirnov, que foi realizado utilizando
a função ks.test() do pacote stats, onde o valor para a estatística de teste D10 = 0, 3129,
menor que o valor crítico tabelado de Lilliefors (1969), D10;0,05 = 0, 325, para um nível
de significância α = 0, 05 , foi obtido. O p-valor obtido pela função LcKS() do pacote
KScorrect também foi maior que 5 por cento; p.value = 0, 07.
Já para o modelo gama, os parâmetros da forma, k, e da taxa, τ, estimados pelo método
dos momentos foram k = 3, 384 e τ = 4, 482, respectivamente. Enquanto que pelo método
da máxima verossimilhança, os resultados encontrados foram k = 3, 505 e τ = 4, 642. Esses
valores foram calculados pela função fitdist().
Para estimar os parâmetros pelos dados da amostra, o método analítico, a Equação 3.1
foi utilizada encontrando o valor k = 3, 045 para o parâmetro da forma e, para o parâmetro
da taxa, utilizando a Equação 2.25, o valor τ = 4, 034 foi encontrado.
4. R ESULTADOS E D ISCUSSÃO 72

Com a posse desses resultados, foram então plotados, na Figura 4.4, os gráficos so-
brepostos das fda’s das distribuições empírica e teórica para diferentes valores de k inteiro,
percebendo um melhor ajuste com k = 3. Observe:

Figura 4.4. Fda’s da distribuição empírica e Erlang tipos 2, 3 e 4.

Fonte: Próprio autor. Adaptado do RStudio.

A Figura 4.5 mostra um resultado comparativo dos três métodos de estimação; analí-
tico, momentos e máxima verossimilhança para k = 3 fixo.
4. R ESULTADOS E D ISCUSSÃO 73

Figura 4.5. Fda’s da distribuição empírica e erlang tipo 3 para métodos de estimação.

Fonte: Próprio autor. Adaptado do RStudio.

Como se pode ver, o parâmetro encontrado pelo método analítico foi o que evidenciou
maior nível de aderência.
A Figura 4.6 mostra uma ilustração dos gráficos das fda’s e fdp’s das distribuições
Erlang e exponencial estimadas sobrepostos aos dados da distribuição empírica.
4. R ESULTADOS E D ISCUSSÃO 74

Figura 4.6. Fda’s e Fdp’s dos modelos estimados sobrepostos à distribuição empírica.
Praça Coronel.

Fonte: Próprio autor. Adaptado do RStudio.

De fato, tudo indica que o modelo Erlang apresenta maior aderência que o exponen-
cial. Aplicando o teste de Kolmogorov-Smirnov para verificar aderência com uma Erlang
de parâmetros k = 3 e τ = 4, 034, foi obtido o valor D10 = 0, 162, menor que o valor crítico
tabelado de Tadikamalla (1990); D10;0,05 = 0, 269.
Sendo assim, dos resultados alcançados, verifica-se que o sistema sob análise pode ser
representado pelo modelo M/E3 /3, com λ = 0, 875 ônibus por minuto e µ = 1, 324 ônibus
por minuto.
Por não existirem fórmulas exatas para as medidas de desempenho desse tipo de mo-
delo, optou-se por realizar uma consulta em dados tabelados. Esses resultados podem ser
encontrados em Hillier & Lo (1972), que realizaram um projeto computacional para obter e
tabular resultados das medidas de desempenho de sistemas do tipo Em /Ek /c, onde m e k são
os parâmetros de forma da distribuição Erlang para os tempos entre chegadas e os tempos de
serviço, respectivamente, e c é o número de servidores (canais de serviços em paralelo).
Para tomar proveito dessa tabela, basta utilizar os valores de m = 1, k = 3, c = 3 e ρ.
4. R ESULTADOS E D ISCUSSÃO 75

Este último é dado pela Equação 2.57.

0, 875
ρ= ≈ 0, 22. (4.1)
3 ∗ 1, 324
Considerando ρ = 0, 2, as seguintes medidas de desempenho foram obtidas por meio
da tabela de Hillier & Lo (1972):

Probabilidade de a baia estar vazia:

P0 ≈ 0, 55.

Probabilidade de haver formação de fila (P(N > c)):

Pf ila ≈ 0, 02.

Número médio de ônibus no sistema:

L ≈ 0, 6.

Número médio de ônibus na fila:

Lq ≈ 0, 005.

Para obter os tempos médios de espera na fila e no sistema, utiliza-se as fórmulas de


Little dadas nas Equações 2.60 e 2.61.

Tempo médio de espera na fila:

Wq ≈ 0, 005 minuto.

Tempo médio de espera no sistema:

W ≈ 0, 691 minuto.

Com base nos valores obtidos, observa-se um sistema com baixa taxa de ocupação,
rara formação de filas e um tempo médio de permanência na baia de aproximadamente W −
Wq = 0, 686 minuto ≈ 41 segundos; o que conforme Ferreira (2017) está dentro dos padrões
recomendados.
4. R ESULTADOS E D ISCUSSÃO 76

Veja na Figura 4.7, os resultados, encontrados por Hillier & Lieberman (2001), das
probabilidades de estado para o sistema em questão.

Figura 4.7. Probabilidades de existir N usuários no sistema - Praça Coronel.

Fonte: Hillier & Lo (1972)

Note que a probabilidade de o sistema estar vazio é relativamente alta, P(N = 0) =


0, 548.

4.2 Praça Dr. Carlos


Para os números de chegadas de ônibus na praça Doutor Carlos Versiani, foi verificada
a possibilidade de aderência a uma distribuição de Poisson de parâmetro λ = 0, 842 chegadas
por minuto.
A Figura 4.8 mostra os gráficos sobrepostos das fda’s e fp’s das distribuições empírica
e teórica, onde foi notada boa aderência.
4. R ESULTADOS E D ISCUSSÃO 77

Figura 4.8. FDA e FP teóricas e empíricas do número de chegada de ônibus praça Dr.
Carlos.

Fonte: Próprio autor. Adaptado do RStudio.

No teste qui-quadrado, o valor observado Xobs 2 = 1, 85, menor que o valor crítico
2
X2,5% = 5, 99, foi obtido; não oferecendo indícios para rejeição da hipótese de que os dados
da amostra possuem boa aderência com a distribuição de Poisson de parâmetro λ = 0, 875.
Os dados coletados referentes aos tempos de embarque e desembarque, convertidos
para minutos, ofereceram taxa de µ = 0, 446 embarques e desembarques por minuto. A
Figura 4.9 apresenta o gráfico das fda’s e fp’s para a amostra dos tempos de embarque e
desembarque.
4. R ESULTADOS E D ISCUSSÃO 78

Figura 4.9. FDA e FDP tempos de embarque e desembarque praça Dr. Carlos.

Fonte: Próprio autor. Adaptado do RStudio.

O resultado das medidas descritivas encontram-se na Tabela 4.2:

Tabela 4.2. Cálculo das Medidas Descritivas para os tempos de embarque e desembar-
que praça Doutor Carlos.
Estatísticas Resumidas Resultados
Média 2,24
Mediana 1,875
Desvio Padrão Estimado 1,235
Assimetria Estimada 2,061
Curtose Estimada 8,141
Máximo 5,383
Mínimo 1,067
Fonte: Próprio autor. Adaptada pelo RStudio.

Novamente, percebe-se uma assimetria positiva, o que, conforme visto, obtém-se uma
suspeita tanto para o modelo exponencial quanto para o modelo de Erlang. Porém, dessa
vez, com certa presença de outliers devido ao alto valor de curtose observado; o que pode
prejudicar a qualidade de ajustamento, (Sematech, 2012).
4. R ESULTADOS E D ISCUSSÃO 79

Foi plotado na Figura 4.10 os resultados da frequência relativa acumulada da amostra


sobrepostos ao modelo exponencial de parâmetro µ = 0, 446. Observe:

Figura 4.10. Fda e Fdp do modelo exponencial sobreposto à distribuição empírica.


Praça Dr. Carlos.

Fonte: Próprio autor. Adaptado do RStudio.

Para o modelo Gama, assim como na praça Coronel, foi realizada a estimação dos
parâmetros por três métodos; o analítico, momentos e máxima verossimilhança. Os parâ-
metros da forma, k, e da taxa, τ, estimados pelo método dos momentos foram k = 3, 655 e
τ = 1, 632, respectivamente. Enquanto que pelo método da máxima verossimilhança, os re-
sultados encontrados foram k = 4, 889 e τ = 2, 183. Já pelo método analítico, foram obtidos
os valores k = 3, 29 e τ = 1, 469.
Utilizando a mesma metodologia da Subseção anterior, foi escolhido k = 3 e τ = 1, 469.
Novamente o modelo Erlang aparenta possuir um melhor ajuste. Veja na Figura 4.11 o
histograma da distribuição empírica sobreposto aos modelos estimados.
4. R ESULTADOS E D ISCUSSÃO 80

Figura 4.11. Fdp’s dos modelos estimados. Praça Dr. Carlos.

Fonte: Próprio autor. Adaptado do RStudio.

Aplicando os testes de Kolmogorov-Smirnov, foram obtidos D10 = 0, 379 para o mo-


delo exponencial, que é maior que o valor crítico tabelado de Lilliefors (1969) D10;0,05 =
0, 325. O p-valor obtido pela função LcKS foi menor que 5 por cento; p.value = 0, 011. Veja
na Figura 4.12 uma ilustração do resultado da simulação Monte Carlo utilizando o pacote
KScorrect, na qual a linha tracejada representa o Dobs obtido e a linha contínua indica o valor
crítico para o nível de significância 0,05.
4. R ESULTADOS E D ISCUSSÃO 81

Figura 4.12. Resultado da simulação Monte Carlo para modelo exponencial praça Dr.
Carlos.

Fonte: Próprio autor. Adaptado do RStudio.

Para o modelo Erlang, a estatística de teste obtida foi D10 = 0, 224, menor que o valor
crítico tabelado de Tadikamalla (1990); D10;0,05 = 0, 269 .
Assim, pelo conjunto de todas as análises gráficas, cálculo das medidas descritivas e
os testes de ajustamento, o modelo exponencial não parece ter uma boa qualidade de ajuste
em comparação com o modelo Erlang. O que confirma o fato de o coeficiente de variação
calculado para os tempos de atendimento não estar tão próximo de 1; CV ≈ 0, 55.
Em face dos resultados alcançados, optou-se pela escolha do modelo M/E3 /3, com
λ = 0, 446 ônibus por minuto e µ = 1, 324 ônibus por minuto.
Tem-se, portanto, o seguinte valor para ρ:

ρ ≈ 0, 63.

Considerando ρ = 0, 65, as seguintes medidas de desempenho foram obtidas por meio


da tabela de Hillier & Lo (1972):

Probabilidade de a baia estar vazia:

P0 ≈ 0, 12.
4. R ESULTADOS E D ISCUSSÃO 82

Probabilidade de haver formação de fila (P(N > c)):

Pf ila ≈ 0, 41.

Número médio de ônibus no sistema:

L ≈ 2, 5.

Número médio de ônibus na fila:

Lq ≈ 0, 54.

Tempo médio de espera na fila:

Wq ≈ 0, 65 minuto.

Tempo médio de espera no sistema:

W ≈ 2, 96 minuto.

Com base nos valores obtidos, observa-se um sistema tendo, em média, L − Lq = 1, 95


número de ônibus ocupando a baia; valor relativamente perigoso, uma vez que a formação
de filas é inadimissível para esse tipo de estabelecimento. Observa-se, também, um tempo
médio de permanência na baia de W − Wq = 2, 317 minutos que é aproximadamente 2 mi-
nutos e 19 segundos; valor muito acima do recomendável conforme a pesquisa de trânsito
realizada por Ferreira (2017).
Veja na Figura 4.13, os resultados, encontrados por Hillier & Lieberman (2001), das
probabilidades de estado para o sistema em questão.
4. R ESULTADOS E D ISCUSSÃO 83

Figura 4.13. Probabilidades de existir N usuários no sistema - Praça Dr. Carlos

Fonte: Hillier & Lo (1972)

Observe que as probabilidades que indicam estar presente um ou menos ônibus no


sistema (baia e fila) são pequenas: P(N = 0) = 0, 116 e P(N <= 1) = 0, 348.
Capítulo 5

Considerações Finais

Este trabalho e os artigos desenvolvidos pelo autor e seu orientador, apresentados no


Capítulo 6, forneceram substancial entendimento sobre sistemas de filas determinísticos,
exponenciais e Erlang.
Diversos conhecimentos sobre Estatística, Inferência Estatística e Processos Estocásti-
cos foram apresentados, sendo que, na fundamentação teórica, procurou-se abordar a Teoria
das Filas sobre um ponto de vista amplo, sempre buscando fornecer capacidades analíticas
ao leitor; um ponto de partida para empenhar-se no descobrimento das nuances do tema.
Acredita-se que, ao término do estudo, o leitor que ainda não tinha familiariedade com
o R já esteja bem envolvido e motivado com as potencialidades dos pacotes e suas funções.
Vale frisar que a frequência de publicações de novos pacotes do R no CRAN, assim como
suas respectivas atualizações, estão cada vez maiores e, devido a isso, é recomendável que o
leitor não se acomode, busque novas formas de resolver o mesmo problema e mantenha o R
sempre atualizado na versão mais recente.

5.1 Conclusão
A análise do sistema apresentado na Metodologia foi realizada com o propósito de
demonstrar como as técnicas de ajustamento de distribuições são aplicadas na especificação
do melhor modelo de filas.
A hipótese de aderência ao modelo Poisson foi bem aceita tanto para os dados volumé-
tricos de chegadas de ônibus na praça Coronel Ribeiro, quanto para a praça Doutor Carlos
Versiani.
Quanto aos tempos de embarque e desembarque na praça Coronel, tanto o modelo ex-
ponencial, quanto o modelo de Erlang mostraram razoável aderência, porém, ao avaliar a

84
5. C ONSIDERAÇÕES F INAIS 85

qualidade do ajuste, por meio de análises gráficas, e aplicar os testes de ajustamento estuda-
dos, o modelo Erlang estimado mostrou melhor aderência.
Já em relação aos tempos de embarque e desembarque na praça Doutor Carlos Versiani,
a hipótese de que os dados seguem o modelo Erlang foi bem aceita. É válido destacar que o
modelo exponencial não ofereceu boa aderência, uma vez que os resultados das análises grá-
ficas não indicaram um bom ajustamento, assim como o valor crítico do teste de ajustamento
Kolmogorov-Smirnov, para esse modelo, foi maior que o valor tabelado por Lilliefors (1969)
e o p-valor, obtido pela função LcKS, foi menor que 5 por cento. Isso evidenciou o fato de o
coeficiente de variação da amostra calculado não estar tão próximo de 1; CV ≈ 0, 55.
Ao observar in loco as baias de ônibus em momentos aleatórios de horários de pico,
o autor pôde constatar uma realidade compatível com os resultados obtidos no Capítulo 4.
Foram notados baixos tempos de permanência dos ônibus na baia da praça Coronel Ribeiro
e uma forte tendência em sempre haver cerca de 2 ônibus ocupando a baia da praça Doutor
Carlos.
Os resultados obtidos para os tempos médios de permanência nas baias se mostraram
condizentes com a média dos tempos de embarque e desembarque coletados por Ferreira
(2017). As médias das amostras apresentadas na Tabela 3.1 foram iguais a 45, 3 segundos
para a praça Coronel Ribeiro e 134, 3 para a praça Doutor Carlos Versiani, enquanto que os
tempos médios de permanência nas baias obtidos no Capítulo 4 foram iguais a 41 segundos
para a praça Coronel e 2, 317 minutos = 139 segundos para a praça Doutor Carlos.
Foi constatada, também, uma baixíssima probabilidade de haver formação de filas na
praça Coronel, Pf ila ≈ 0.02, e uma probabilidade relativamente alta para a praça Doutor
Carlos, Pf ila ≈ 0.41, tendo em vista que o tipo de sistema em questão (baias de ônibus) não
pode admitir filas.
Em virtude dos dados encontrados, fica evidenciada a existência do problema no pre-
cesso de filas nas baias de ônibus/locais de embarque e desembarque localizadas no corredor
Camilo Prates, tornando necessária a execução de alguma medida corretiva.
Acredita-se que apenas aumentar o número de linhas de ônibus para melhor suprir a
alta demanda de passageiros na praça Doutor Carlos pode não ser uma medida eficaz para
resolver o problema por completo, uma vez que, como abordado anteriormente, o tráfego
congestionado e a falta de infraestrutura adequada é que têm tornado ineficiente o serviço
de transporte público na cidade, não o contrário. O que foi notado nas observações in loco
é que, por muitas vezes, a fila de veículos que se acumulam no semáforo logo à frente à
praça Doutor Carlos é o que impede os ônibus conseguirem deixar a baia por completo,
mesmo após todo o processo de embarque e desembarque dos mesmos. Vale lembrar, que
a viabilidade de implantação de corredores exclusivos foi demonstrada por Ferreira (2017),
ficando esta como sugestão de medida corretiva pelo autor e orientador deste trabalho.
5. C ONSIDERAÇÕES F INAIS 86

5.2 Trabalhos Futuros


No desenvolvimento do presente trabalho, foi constatado, empiricamente, que a busca
por diferentes formas para resolver o mesmo problema desencadeia na aquisição de novas
ideias para trabalhos futuros. Como exemplo, durante a realização dos estudos foi despertado
o interesse em por em prática algumas abordagens diferentes. Veja algumas ideias logo a
seguir:

Engenharia de trânsito: Complementar o estudo realizado considerando os tempos de


espera dos semáforos. Como argumentado na Conclusão, o tráfego congestionado e a falta de
infraestutura adequada tem prejudicado o serviço de transporte público. Foi notado, in loco,
que o semáforo logo à frente à praça Doutor Carlos Versiani possui alta taxa de ocupação
nos horários de pico, o que desencadeia em filas de veículos que atrapalham as saídas dos
ônibus das baias, atrasando os tempos de embarque e desembarque dos ônibus que vêm logo
atrás. Posto isso, deseja-se complementar o estudo que foi realizado neste trabalho com a
análise do processo de formação de filas de veículos no semáforo supracitado.

Teoria da simulação no R: Analisar sistemas de filas, por meio de técnicas da simu-


lação, utilizando apenas o R (ou outro software/linguagem gratuito(a)). A ideia é aplicar a
Inferência Estatística, aplicando ideias parecidas com as que aqui foram utilizadas na espe-
cificação do melhor modelo de filas, para simular o comportamento de algum sistema em
diferentes cenários. Assim como feito no artigo da Subseção 6.4; porém com apenas ferra-
mentas gratuitas.

Modelos Erlang: Desenvolver equações estacionárias para diversos modelos Erlang e


propor ao CRAN pacotes que automatizem as medidas de desempenho.
Capítulo 6

Publicações e Apresentações em
Eventos

Neste Capítulo, são apresentados artigos desenvolvidos pelo autor e seu orientador no
decurso deste trabalho.

6.1 Algoritmo para análise de sistemas estocásticos


M/M/1
Este artigo foi apresentado no FEPEG 2017, Fórum de Ensino Pesquisa e Extensão
da Universidade Estadual de Montes Claros, onde foi desenvolvida uma rotina que simula o
funcionamento de um modelo M/M/1 (veja Apêndice B).
Consiste em gerar uma primeira amostra aleatória, com qualquer tamanho e média
desejada, que representa os números de chegadas a cada minuto; sendo que essa amostra
segue a distribuição de Poisson. Em seguida, o código calcula o tamanho dessa primeira
amostra e gera uma segunda amostra aleatória seguindo uma distribuição exponencial que
representa os tempos de atendimento para cada usuário da primeira amostra. Em vista disso,
o tamanho da amostra para os tempos de atendimento depende da quantidade de chegadas.
Por exemplo, suponha que se deseje uma amostra para 4 tempos de chegadas e o R gere o
vetor de Poisson ~v = (2; 0; 1; 0). Isso significa que no primeiro instante de tempo ocorreram
2 chegadas, no segunto instante 0, no terceiro 1 e no quarto 0 novamente, logo foram 3
chegadas ao todo e, por isso, a amostra para os tempos de atendimento deve ter tamanho 3.
Posteriormente, o algoritmo automatiza os cálculos das medidas de desempenho apre-
sentadas na discussão do modelo M/M/1 utilizando o pacote queueing. Para análise desse
modelo foi realizado o comparativo entre duas simulações com diferentes taxas para o nú-

87
6. P UBLICAÇÕES E A PRESENTAÇÕES EM E VENTOS 88

mero de chegadas. Na primeira, foi gerada uma amostra de tamanho 50 para o número de
chegadas por minuto seguindo uma distribuição de Poisson com média de aproximadamente
0, 3 chegadas por minuto e outra amostra aleatória para o tempo de atendimento seguindo
uma distribuição exponencial com média de 2 minutos. Na segunda simulação foi feito o
mesmo procedimento propondo uma taxa de chegada de aproximadamente 50% maior. Por
fim, foram comparadas as medidas de desempenho para os dois exemplos.

6.1.1 Resultados
A primeira amostra gerada para o número de chegadas no sistema, com taxa desejada
de 0, 28, foi a seguinte:

0 0 0 1 0 0 1 0 0 0 1 1 0 0 0 0 1 1 0 1 0 0 0 1 2 0 1 0 0 0 0 0 0 0
0 0 0 0 1 0 0 1 1 0 0 0 1 0 0 0

Isso significa que nos três primeiros minutos não houve chegada, no minuto 4 houve 1
chegada, no quinto e sexto também não, no sétimo 1 e assim por diante.
Pode-se verificar um total de 15 chegadas ocorridas e, assim, uma primeira amostra, de
tamanho 15, gerada para os tempos de atendimento, com média de 2 minutos, foi a seguinte:

0.15 1.29 2.55 1.91 2.07 1.62 2.16 3.26 0.37 0.29 2.97 1.2 3.44 1.03
5.68

Isso significa que o primeiro atendimento durou 0, 15 minutos, o segundo 1, 29 minu-


tos, o terceiro 2, 55 e assim por diante.
Para a segunda simulação, a amostra gerada para o número de chegadas com taxa de
0, 46 (aproximadamente 50% maior) foi a seguinte:

0 0 0 1 1 0 1 1 0 0 1 0 1 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 1 2 2 1 1 0 0
0 0 1 0 0 1 1 2 0 0 0 0 0 1 1

A amostra gerada para os tempos de atendimento de cada uma das chegadas acima,
com taxa de 2 minutos, foi:

0.8 1.45 5.61 1.44 0.07 1.25 0.11 0.21 0.41 6.84 3.2 0.47 2.94 0.18
3.5 1.08 3.88 1.93 5.22 1.03 0.64 2.92 0.82

As medidas de desempenho obtidas para a primeira e segunda simulação foram, res-


pectivamente:
6. P UBLICAÇÕES E A PRESENTAÇÕES EM E VENTOS 89

Taxa de utilização do sistema: 0, 6 e 0, 92; Número médio de clientes no sistema: 1, 5


e 11, 47; Número médio de clientes na Fila: 0, 9 e 10, 55; Probabilidade de o Sistema estar
vazio: 0, 4 e 0, 008; Tempo médio de espera de qualquer cliente na Fila: 3 e 22, 93 minutos;
Tempo médio de permanência de qualquer cliente no Sistema: 5 e 24, 93 minutos.
O algoritmo se mostrou aplicável, uma vez que as distribuições aleatórias geradas apre-
sentam médias suficientemente próximas às desejadas e calcula as medidas de desempenho
de forma correta. Foram feitos diversos outros testes com valores diferentes e os resultados
verificados se mostraram condizentes com os cálculos manuais.
Ao aumentar a taxa de chegada, a segunda simulação mostrou uma segunda situação
com maior taxa de utilização e, consecutivamente, maiores tempos médios de fila. Torna-
se possível citar o exemplo de uma pequena agência bancária, onde o primeiro caso simula
uma situação mais favorável para os clientes, enquanto que a segunda situação simula uma
melhor utilização do ponto de vista gerencial podendo vir a desagradar um cliente habitual
da agência.
No Apêndice B consta o pseudocódigo do algoritmo markoviano apresentado, o qual
pode servir de objeto para apresentações educativas como seminários, minicursos, etc.

6.2 Simulação em filas M/M/1 utilizando o pacote


queueing
Publicado no IV SAEP - Simpósio Acadêmico de Engenharia de Produção - este artigo
aborda sobre como analisar um sistema de filas do tipo M/M/1 demonstrando as potenciali-
dades do pacote queueing.
A metodologia consiste em inicialmente, assumir valores para a taxa de chegada, atra-
vés de simulação estocástica, mantida a taxa de serviço fixa. Cabe lembrar que λ < µ; caso
contrário a série não converge.
Foram considerados µ = 2, n = 10, com lambda recebendo a média de uma distribuição
exponencial com λ = 1/2, 5 = 0, 4. O experimento foi realizado 5000 vezes para garantir
uma boa estimativa.
Veja o script gerado no R logo a seguir:

#gerando 5000 amostras de tamanho 10 de uma exponencial (2.5)


dados1<-matrix(nrow=5000,ncol=10)
for(i in 1:5000){
dados1[i,1:10]<-rexp(10,2.5)
}
6. P UBLICAÇÕES E A PRESENTAÇÕES EM E VENTOS 90

#calculando as médias das 5000 amostras


media1<-matrix(nrow=5000,ncol=1)
for(i in 1:5000){
media1[i]<-mean(dados1[i,1:10])
}
#calculando a media das médias
mean(media1)
#agora usando na fila
x<-NewInput.MM1(lambda=mean(media1),mu=2,n=10)
y<-QueueingModel(x)

6.2.1 Resultados
Os resultados obtidos encontram-se na Tabela 6.1, em que os valores entre parênteses
são os teóricos para uma fila M/M/1 com taxa de chegadas λ = 0, 4 e taxa de serviço µ = 2:

Tabela 6.1. Valores obtidos por simulação para as medidas de desempenho de uma fila
M/M/1.
λ µ ρ P0 L W Lq Wq
0,401 2 0,2 0,8 0,25 0,625 0,05 0,125
(0,4) 2 (0,2) (0,8) (0,25) (0,625) (0,05) (0,125)

Fonte: Acervo do autor (2019).

A Figura 6.1 mostra o histograma dos dados gerados por simulação.


6. P UBLICAÇÕES E A PRESENTAÇÕES EM E VENTOS 91

Figura 6.1. Histograma de 5000 amostras de tamanho 10 de uma distribuição exponen-


cial de parâmetro 2,5)

Próprio autor. Adaptado pelo RStudio.

6.3 Um algoritmo para modelo determinístico


D/D/1/k-1
Publicado no SIMEP VII - Simpósio de Engenharia de Produção - este artigo discorre
sobre uma metodologia que automatiza o cálculo do número de clientes em um sistema
determinístico.
Gross & Harris (2008) afirmam que a medida de desempenho mais procurada em um
sistema de filas é o número de clientes no sistema em um instante de tempo qualquer, n(t).
Este algoritmo fornece uma técnica computacional que serve de grande ajuda para o cálculo
de n(t) em um modelo D/D/1/k − 1, bastando o usuário ter como entrada os parâmetros
tempo entre chegadas, tempo de serviço e a capacidade do sistema.
O algoritmo proposto foi desenvolvido em linguagem R, sendo que alguns outros resul-
tados triviais também foram automatizados, tais como o tempo de recusa, o primeiro cliente
a ser rejeitado pelo sistema, a primeira chegada no sistema após a primeira recusa e a duração
do ciclo para o caso do tempo de serviço ser não múltiplo do tempo entre chegadas. O ciclo
é o tempo que o número de clientes no sistema começa a se repetir novamente e é encontrado
simplesmente pelo cálculo do mmc entre o tempo de serviço e o tempo entre chegadas.
O pseudocódigo encontra-se disponível no Apêndice A e a metodologia utilizada foi a
6. P UBLICAÇÕES E A PRESENTAÇÕES EM E VENTOS 92

apresentada na Subseção 2.3.4.


Para a análise desses resultados determinísticos, foram feitos vários testes com dife-
rentes valores para as variáveis de entrada: tempo entre chegadas, tempo entre serviços e
capacidade do sistema.

6.3.1 Resultados
Os resultados encontrados para o algoritmo do sistema determinístico se mostraram
satisfatórios.
A Figura 6.2 mostra o resultado para dois tipos de exemplos: um com tempo de an-
tendimento múltiplo do tempo entre chegadas, µ1 = m λ1 , e outro com tempo de atendimento
não múltiplo do tempo entre chegadas; µ1 6= m λ1 , onde m > 0 é inteiro.

Figura 6.2. Resultado comparativo caso múltiplo vs não múltiplo

Fonte: Próprio autor. Adaptado pelo RStudio.

Perceba que para o primeiro caso, µ1 = m λ1 , o tempo de recusa ti é igual a 20. Observe
que após esse tempo, o número de clientes se mantém em 5 eternamente, condizendo com a
Equação 2.64.
6. P UBLICAÇÕES E A PRESENTAÇÕES EM E VENTOS 93

Já no segundo caso, µ1 6= m λ1 , o tempo de recusa é igual a 27. Note que após este
momento, n(t) fica oscilando entre 3 e 4 ((k − 1 e k − 2) para sempre; o que condiz com a
Equação 2.65.
As outras medidas calculadas para os dois exemplos encontram-se a seguir:

Tempo de serviço múltiplo do tempo entre chegadas:

Tempo de Recusa: 20
O usuario 10 foi o primeiro a ser rejeitado pelo sistema
Primeira saida no sistema apos a primeira recusa ocorreu no tempo 22
Primeira chegada no sistema apos a primeira recusa ocorreu no tempo 22
Duracao do ciclo: 4 unidades de tempo.

Tempo de serviço não múltiplo do tempo entre chegadas:

Tempo de Recusa: 27
O usuario 9 foi o primeiro a ser rejeitado pelo sistema
Primeira saida no sistema apos a primeira recusa ocorreu no tempo 28
Primeira chegada no sistema apos a primeira recusa ocorreu no tempo 30
Duracao do ciclo: 15 unidades de tempo.

O leitor conseguirá automatizar facilmente o tempo de recusa simplesmente com uma


boa analisada na Equação 2.63. Para a primeira chegada ao sistema após a primeira recusa,
basta perceber que, como ti sempre vai ocorrer no momento de uma chegada, pode-se afirmar
que essa chegada sempre vai ocorrer no tempo tc+ti (tempo entre chegadas mais o tempo de
recusa).

6.4 Simulação do sistema de serviço em um


restaurante universitário
Também publicado no SIMEP VII - Simpósio de Engenharia de Produção, este ar-
tigo utilizou técnicas de simulação de eventos discretos em um restaurante universitário do
campus da Universidade Estadual de Montes Claros, Minas Gerais.
Foram coletados dados e realizada análise estatística dos mesmos utilizando o soft-
ware Arena; um software de automação e simulação de eventos discretos desenvolvido pela
Rockwell Automation. A partir dos resultados obtidos, novos cenários foram criados, com
variações de parâmetros e processos com o intuito de quantificá-los para fins de comparações
com o cenário atual.
6. P UBLICAÇÕES E A PRESENTAÇÕES EM E VENTOS 94

O funcionamento normal do restaurante se dá da seguinte forma: o usuário entra na fila


de acesso aos caixas, no caixa é pedido o número de matrícula para liberação do sistema de
catraca eletrônica e após a realização do pagamento, o usuário se dirige à catraca eletrônica,
digita a sua matrícula e confirma sua identidade, utilizando a técnica de biometria disponível,
tendo acesso ao interior do restaurante.
No interior do restaurante os usuários possuem duas opções de buffet para se servirem;
o buffet A e o buffet B. O buffet B tem as mesmas opções do buffet A, exceto a carne
que é disponibilizada em uma estrutura um pouco à frente no layout por um funcionário do
restaurante para fins de controle.
O buffet A possui capacidade de 4 pessoas se servirem ao mesmo tempo, enquanto
que no buffet B, a capacidade de utilização é de 4 pessoas para cada lado (são utilizados os
dois lados do buffet), portando 8 pessoas ao mesmo tempo. Depois de se servir no buffet
B, o usuário entra em uma fila para ser servido a carne. Para fins de simulação, o tempo
para servir no buffet B foi acrescido ao tempo para servir a carne formando uma só etapa.
Observe a Figura 1.

Figura 6.3. Layout do restaurante universitário.

Fonte: Acervo do autor

O sistema analisado está restrito à análise do intervalo entre chegadas (IEC), tempo
para servir nos buffets (TSB) e tempo de permanência no salão (TP).
6. P UBLICAÇÕES E A PRESENTAÇÕES EM E VENTOS 95

6.4.1 Resultados
Com o auxílio da ferramenta Input Analyzer (analisador de dados de entrada) do soft-
ware Arena R , foi realizada a análise estatística dos dados, onde foram calculadas medidas
como média, mediana e desvio padrão das variáveis em estudo supracitadas, assim como a
melhor distribuição candidata.

Tabela 6.2. Análise estatística dos dados coletados.


Parâmetro IEC TSB1 TSB2 TP
Média Aritmética 9,723 2,13 1,81 21,13
Mediana 2,460 2,08 1,88 20,0
Moda 1,620 1,85 2,00 19,0
Desvio Padrão 12,422 0,45 0,38 7,77
Variância 154,311 12,12 8,76 3621,24
Coeficiente de Variação 127,76% 21,08% 21,05% 36,76%
Distribuição sugerida Gama Beta Beta Triangular

Onde:
IEC - Intervalo entre chegadas.
TSB1 - Tempo para servir buffet A em minutos.
TSB2 - Tempo para servir buffet B em minutos.
TP - Tempo permanência do salão em minutos.

A realização do pagamento teve como média o período de 36 segundos, o tempo de


deslocamento do caixa até o buffet 2, 9 segundos e o deslocamento dos usuários, após se
servirem, até a mesa teve como tempo médio 40 segundos. O tempo médio de espera na fila
do cliente para realizar o pagamento e ingressar no restaurante é de 613 segundos, pouco mais
de 10 minutos. Valor considerado alto para o sistema simulado, gerando fila e contrastando
com a baixa taxa de ocupação do Buffet que gira em torno de 68%.
Veja os resultados para 3 atendentes e 4 atendentes nas tabelas do Anexo A.
Analisando os resultados é possível concluir que o “gargalo” do sistema simulado está
no acesso ao restaurante, pode-se sugerir a alteração da quantidade de atendentes de 3 para
4, pois, segundo os resultados da simulação, a quantidade de pessoas e o tempo médio de
permanência do usuário na fila do caixa cairiam drasticamente. A média caiu de 10 minutos
para pouco menos de 2 minutos, a taxa de utilização do buffet B aumentou cerca de 15%
e das mesas em torno de 11%. Outra medida sugerida seria um sistema de crédito para o
usuário no qual ele poderia realizar o pagamento do almoço/jantar antecipadamente, o que
diminuiria o tempo gasto nos caixas.
Referências Bibliográficas

Allen, A. O. (1990). Probability, statistics, and queueing theory. Academic press.

Atuncar, G. S. (2011). Conceitos básicos de processos estocásticos. Departamento de Esta-


tística. Universidade Federal de Minas Gerais. Belo Horizonte.

Canadilla, P. (2017). queueing: Analysis of Queueing Networks and Models. R package


version 0.2.11.

Casella, G. & Berger, R. L. (2002). Statistical inference, volume 2. Duxbury Pacific Grove,
CA.

Conover, W. J. (1999). Practical nonparametric statistics. Wiley New York.

Cooper, R. B. (1981). Introduction to queueing theory. North Holland,.

Crawley, M. J. (2007). The R book. John Wiley & Sons.

D’Agostino, R. B. (1986). Goodness-of-fit-techniques, volume 68. CRC press.

Damodaran, A. (2007). Probabilistic approaches: Scenario analysis, decision trees, and


simulations. Research Paper.

de Freitas, J. F. G. (2003). Bayesian methods for neural networks. Tese de doutorado,


University of Cambridge.

DeGroot, M. H. & Schervish, M. J. (2012). Probability and statistics. Pearson Education.

Delignette-Muller, M. L. & Dutang, C. (2015). fitdistrplus: An R package for fitting distri-


butions. Journal of Statistical Software, 64(4):1--34.

Erlang, A. K. (1909). The theory of probabilities and telephone conversations. Nyt. Tidsskr.
Mat. Ser. B, 20:33--39.

96
R EFERÊNCIAS B IBLIOGRÁFICAS 97

Ferreira, M. M. (2017). Análise da implementação de risco de corredores de ônibus na


cidade de Montes Claros -MG. Dissertação de mestrado, Universidade Estadual de Montes
Claros, Montes Claros, MG.

Fishman, G. (1995). Monte Carlo: concepts, algorithms, and applications. Springer Science
& Business Media.

Fogliatti, M. C. & Mattos, N. M. C. (2007). Teoria de Filas. Interciência, Rio de Janeiro.

GNU (2019?). What is free software? Disponível em: http://www.gnu.org/home.en.


html. [Acesso em: 23-Maio-2019].

Gross, D. & Harris, C. M. (2008). Fundamentals of queueing theory. John Wiley & Sons, 4
edição.

Hillier, F. S. & Lieberman, G. J. (2001). Introduction to operations research. McGraw-Hill


Science, Engineering & Mathematics.

Hillier, F. S. & Lo, F. D. (1972). Tables for multiple-server queueing systems involving
erlang distributions. Relatório técnico, STANFORD UNIV CALIF.

Hinton, P. R. (2004). Statistics explained. Routledge.

Junior, P. J. R. (2011). Introdução ao ambiente estatístico r. Disponí-


vel em: http://www.leg.ufpr.br/~paulojus/embrapa/Rembrapa/Rembrapase36.
html#x38-22800036. [Acesso em: 23-Maio-2019].

Kendall, D. G. (1953). Stochastic processes occurring in the theory of queues and their analy-
sis by the method of the imbedded markov chain. The Annals of Mathematical Statistics,
pp. 338--354.

Kleinrock, L. (1975). Queueing systems, vol. 1.

Kolmogorov, A. (1933). Sulla determinazione empirica di una lgge di distribuzione. Inst.


Ital. Attuari, Giorn., 4:83--91.

Lilliefors, H. W. (1967). On the kolmogorov-smirnov test for normality with mean and
variance unknown. Journal of the American statistical Association, 62(318):399--402.

Lilliefors, H. W. (1969). On the kolmogorov-smirnov test for the exponential distribution


with mean unknown. Journal of the American Statistical Association, 64(325):387--389.

Magalhães, M. N. (1996). Introdução à rede de filas. ABE-Associação Brasileira de Esta-


tística.
R EFERÊNCIAS B IBLIOGRÁFICAS 98

Meyer, P. L. (1965). Introduction probability and statistical applications.

Moraes, F. G.; Silva, G. F. & Rezende, T. A. (2011). Introdução à teoria das filas. Universi-
dade Federal do Mato Grosso.

Novack-Gottshall, P. & Wang, S. C. (2018). KScorrect: Lilliefors-Corrected Kolmogorov-


Smirnov Goodness-of-Fit Tests. R package version 1.2.4.

Peng, R. D. (2016). R programming for data science. Leanpub.

R Core Team (2018). R: A language and environment for statistical computing. Disponível
em: https://www.r-project.org/about.html. [Acesso em: 23-Maio-2019].

Ricci, V. (2005). Fitting distributions with r. Contributed Documentation available on


CRAN, 96.

Ross, S. M. (1996). Stochastic processes. John Wiley & Sons, 2 edição.

Ross, S. M. (2010). Introduction to probability models. Academic press.

Sematech, N. (2012). e-handbook of statistical methods. Disponível em: https:


//www.itl.nist.gov/div898/handbook/eda/section3/eda35b.htm. [Acesso em:
20-Abril-2019].

Stone, A. (2012). Why waiting is torture? Disponível em: https://www.nytimes.com/


2012/08/19/opinion/sunday/why-waiting-in-line-is-torture.html. [Acesso
em: 23-Maio-2019].

Tadikamalla, P. R. (1990). Kolmogorov-smirnov type test-statistics for the gamma, erlang-2


and the inverse gaussian distributions when the parameters are unknown.

Taylor, H. M. & Karlin, S. (1998). An introduction to stochastic modeling. Academic press,


2 edição.

Wilks, D. S. (2006). Statistical methods in the atmospheric sciences. Academic press.

Zukerman, M. (2013). Introduction to queueing theory and stochastic teletraffic models.


arXiv preprint arXiv:1307.2968.
Apêndice A

Rotinas para Filas Determinísticas

Algorithm 1 ALGORITMO PARA MODELO DETERMINÍSTICO - Parte 1: Tempo de


serviço (ts ) múltiplo do Tempo entre chegadas (tc )
1: n ← Vetor nulo . n é o vetor que guardará os números de usuários nos tempos t.
2: k1 ← k − 1
3: if t < tc then
4: n[t] ← 0
5: else if tc ≤ t and t < ti then . ti é o tempo de recusa.
6: nct ← f loor(t/tc ) . Calcula, em inteiro, o número de chegadas para o t fornecido.
7: nst ← f loor((t − tc )/(ts )) . Calcula, em inteiro, o número de saídas para o t
fornecido.
8: nt ← nct − nst . Calcula o número de usuários no sistema.
9: n[t] ← nt
10: else
11: n[t] ← k1
12: end if

99
A. ROTINAS PARA F ILAS D ETERMINÍSTICAS 100

Algorithm 2 ALGORITMO PARA MODELO DETERMINÍSTICO - Parte 2: Tempo de


serviço (ts ) não múltiplo do Tempo entre chegadas (tc )
Require: t < ti . Para tempos menores que o tempo de recusa.
1: if t < tc then
2: nt ← 0
3: n[t] ← nt
4: else if t ≥ tc and t < ti then . O procedimento é análogo ao caso anterior.
5: nct ← f loor(t/tc ) . Calcula, em inteiro, o número de chegadas para o ti encontrado.
6: nst ← f loor((t − tc )/(ts )) . Calcula, em inteiro, o número de saídas para o ti
encontrado.
7: nt ← nct − nst . Calcula o número de usuários no sistema.
8: n[t] ← nt
9: end if

Algorithm 3 ALGORITMO PARA MODELO DETERMINÍSTICO - Parte 3: Tempo de


serviço (ts ) não múltiplo do Tempo entre chegadas (tc )
Require: t ≥ ti . Para tempos maiores ou iguais ao tempo de recusa.
1: nt ← k1 . Atribui a nt o valor de k1 que foi definido como k − 1.
2: while ti ≤ t do . ti aumenta uma unidade a cada loop. No momento em que o valor de
ti ultrapassar o valor de t o loop para.
3: cont_tc_ti ← 0
4: cont_ts_ti ← 0
5: if ti < primeiro_tc_ti then . Se o valor atual de ti for menor que o primeiro tempo
de chegada após a primeira recusa, manter o valor do contador como zero.
6: cont_tc_ti ← 0
7: else
8: primeiro_tc_ti ← primeiro_tc_ti + tc . Caso contrário, acrescenta-se um tempo
entre chegadas ao valor atual de primeiro_tc_ti.
9: cont_tc_ti ← cont_tc_ti + 1
10: end if
11: if ti < primeiro_ts_ti then
12: cont_ts_ti ← 0
13: else
14: primeiro_ts_ti ← primeiro_ts_ti + ts
15: cont_ts_ti ← cont_ts_ti + 1
16: di f erencacont_tc_ts ← cont_tc_ti − cont_ts_ti
17: nt ← nt + di f erencacont_tc_ts
18: end if
19: if nt > k1 then . Verifica condição de bloqueio
20: nt ← k1 . Caso positivo, nt volta a ter valor k − 1.
21: end if
22: ti ← ti + 1 . Incrementa uma unidade a ti
23: end while
24: n[t] = nt
Apêndice B

Rotinas para modelos markovianos

Algorithm 4 ALGORITMO PARA MODELO MM1 - Parte 1: Gera amostra dos número de
chegadas por instantes de tempo.
1: errocheg ← 1
2: while errocheg > 0.02 do . Loop gera amostra de número de chegadas
3: chegada ← vpois(ncheg, lambda) . Variável chegada recebe um vetor de poisson
de tamanho ncheg e média lambda declarados pelo usuário.
4: media ← media(chegada)
5: errocheg ← modulo(lambda − media) . Enquanto essa diferença for maior que
0.02, repete o loop.
6: end while

Algorithm 5 ALGORITMO PARA MODELO MM1 - Parte 2: Gera amostra dos tempos de
atendimentos.
1: natend ← 0
2: for i in chegada do . Este loop calcula a quantidade de chegadas e atribui à variável
natend.
3: natend ← natend + i
4: end for
5: erroatend ← 1
6: while errocheg > 0.001 do . Este loop gera amostra dos tempos de atendimentos.
7: atendimento ← vexp(natend, mi) . Variável atendimento recebe um vetor
exponencial de tamanho ncheg e média mi declarados pelo usuário.
8: media ← media(atendimento) . Calcula a média dessa amostra.
9: erroatend ← modulo(mi − media) . Enquanto essa diferença for maior que 0.001,
repete o loop.
10: end while

101
B. ROTINAS PARA MODELOS MARKOVIANOS 102

Algorithm 6 ALGORITMO PARA MODELO MM1 - Parte 3: Cálculo das medidas de


desempenho.
1: lambda ← media(chegada)
2: mi ← media(atendimento) . As medidas de desempenho são calculadas tendo como
parâmetros as médias das distribuições geradas. Sendo assim, lambda receberá a média
de chegada e mi o tempo médio de atendimento.
3: ro = lambda/mi . Taxa de utilização.
4: L = lambda/(mi − lambda) . Número médio de clientes no sistema.
5: Lq = lambda2 /(mi ∗ (mi − lambda)) . úmero médio de clientes na fila.
6: P0 = 1 − ro . Probabilidade de o sistema estar vazio.
7: W q = ro2 /(lambda ∗ (1 − ro)) . Tempo médio de espera na fila.
8: W = W q + (1/mi) . Tempo médio de espera no sistema.
Anexo A

Resultados das simulações no


restaurante universitário

Tabela A.1. Simulações do processo variando a quantidade de replicações.


Buffet A Buffet B Caixa
Replicações Tempo Clientes Tempo Clientes Tempo Clientes
Fila-Média Fila-Média Fila-Média Fila-Média Fila-Média Fila-Média
1 37,24 2 3,84 0,16 460 23
10 35,67 1,11 4,31 0,18 624 41,28
25 35,15 1,1 5,04 0,22 630 43,68
40 35,07 1,09 5,24 0,22 633 44,38

Tabela A.2. Taxa de utilização dos recursos do sistema.


Taxa Utilização
Replicações TMS Caixa Buffet A Buffet B Mesas
1 1433 99,16% 98,37% 67,73% 72,86%
10 1424 98,76% 98,06% 68,08% 72,72%
25 1431 99,03% 98,11% 68,61% 72,89%
40 1427 98,97% 98,01% 68,60% 72,83%

TMS - Tempo médio do usuário no sistema.


TMS - Tempo médio do usuário no sistema.

103
A. R ESULTADOS DAS SIMULAÇÕES NO RESTAURANTE UNIVERSITÁRIO 104

Tabela A.3. Simulação do tempo médio das filas com 4 atendentes.


Buffet A Buffet B Caixa
Replicações Tempo Clientes Tempo Clientes Tempo Clientes
Fila-Média Fila-Média Fila-Média Fila-Média Fila-Média Fila-Média
1 53,67 2,8 3,93 0,22 1,73 19,38
10 93,6 2,95 19,62 1,26 87,92 16,78
25 84,76 2,66 16,24 1,03 87,99 17,17
40 85,68 2,69 15,83 1 82,88 17,16

Tabela A.4. Simulação da taxa de utilização com 4 atendentes.


Taxa Utilização
Replicações TMS Caixa Buffet A Buffet B Mesas
1 1406 79,5% 97,5% 75,7% 81,0%
10 1426 84,8% 98,1% 83,7% 82,8%
25 1419 83,8% 97,8% 82,0% 82,0%
40 1420 84,5% 97,9% 83,2% 82,0%
Anexo B

Tabelas resumidas para valores


críticos do Teste Kolmogorov

Tabela B.1. Distribuição exponencial com média desconhecida


Tamanho da Amostra Níveis de significância para D
0.2 0.15 0.1 0.05 0.01
8 .291 .308 .329 .360 .419
9 .277 .291 .311 .341 .399
10 .263 .277 .295 .325 .380
11 .251 .264 .283 .311 .365
Fonte: Lilliefors (1967)

Tabela B.2. Distribuição Gama com parâmetros desconhecidos


Tamanho da Amostra Níveis de significância para D
0.2 0.15 0.1 0.05 0.01
10 0.224 0.233 0.247 0.269 0.309
11 0.212 0.223 0.236 0.257 0.296
12 0.205 0.215 0.228 0.246 0.286
13 0.199 0.208 0.220 0.239 0.278
Fonte: Tadikamalla (1990)

105

You might also like