You are on page 1of 6

A Lei de Benford: aprendendo a fazer ou a detectar fraudes?

Posted on September 10, 2012 by Antoine Nectoux

A autora original Christiane Rousseau. A traduo para o Portugus


de Humberto Jos Bortolossi.
muito arriscado ficar alterando nmeros demais em relatrios financeiros se voc no conhece matemtica. De fato, a maioria dos nmeros que aparecem em
declaraes financeiras seguem uma regra matemtica estranha, denominada de Lei de Benford ou Lei do Primeiro Dgito Significativo. Se algum se esquecer de seguir
essa regra, ento os nmeros alterados no iro passar em alguns testes estatsticos e provavelmente eles cairo em uma malha fina. A Lei de Benford afirma que se voc
coletar nmeros de forma aleatria e calcular as frequncias de seus primeiros dgitos significativos, ento os nmeros com primeiro digito significativo igual a
aparecero cerca de % das vezes, enquanto que os nmeros com primeiro dgito significativo igual a aparecero somente % das vezes. Esta regra observada
em muitos outros conjuntos de nmeros, como potncias de e os nmeros de Fibonacci.
Por qu?
Existem explicaes satisfatrias e iremos compartilh-las com voc.

A Lei de Benford trata da distribuio dos primeiros dgitos significativos de nmeros. O primeiro dgito significativo de um nmero positivo o dgito no nulo mais

esquerda em sua representao decimal. Por exemplo, o primeiro dgito significativo de , o de e o de . Uma outra maneira de

defini-lo (e que ser til para nossa discusso matemtica mais adiante) escrever cada nmero real positivo como um nmero vezes uma potncia
de :

Nesse contexto, o primeiro dgito significativo de a parte inteira de , que ser denotada por . O nmero denominado mantissa de . Afirmamos que

se voc coletar nmeros de forma aleatria e calcular a frequncia do primeiro dgito significativo , ento o valor de ser dado aproximadamente

por . Isto nos d a seguinte tabela de frequncias:

Tabela 1: Frequncias da Lei de Benford.


Figura 1: As frequncias B(i) da Lei de Benford.

Antes de continuarmos, vamos fazer um breve comentrio histrico. O fenmeno foi observado pela primeira vez pelo astrnomo Simon Newcombe (1835-1909), que
notou que as primeiras pginas das tabelas de logaritmos correspondentes aos primeiros dgitos significativos pareciam menos numerosas se comparadas com as pginas
seguintes. A descoberta de Newcombe foi esquecida e a lei foi redescoberta por Frank Benford (1883-1948) por volta de 1938. Frank Benford coletou dezenas de milhares
de nmeros de origens diversas, todos seguindo sua lei. O moderno banco de dados de Simon Plouffe que contm milhes de constantes matemticas tambm
seguem a Lei de Benford.

Muitos conjuntos de nmeros que no so aleatrios tambm seguem a Lei de Benford. Este o caso de populaes de pases, de suas reas, de comprimento dos rios,
etc. Talvez voc esteja ficando ctico e queira que eu pare Em quais unidades estes comprimentos e reas foram coletados? Os comprimentos esto em milhas ou
quilmetros? Isto no importa Se os comprimentos dos rios em quilmetros seguirem a Lei de Benford, ento os comprimentos em milhas tambm seguiro a Lei de
Benford! Uma mudana de unidade corresponde a uma mudana de escala. Como veremos, a Lei de Benford invariante por mudanas de escala. Mais ainda, ela
a nica lei de probabilidade que invariante por mudanas de escala.

Figura 2: Dados que seguem aproximadamente a Lei de Benford:: reas de pases em quilmetros quadrados, reas de pases em milhas quadradas e populaes de pases.

Na introduo desse texto eu havia mencionado que os nmeros de Fibonacci seguem a Lei de Benford. Mas, de um certo modo, a Lei de Benford subjetiva, uma vez

que ela depende da base na qual representamos nossos nmeros. Em alguma base com , os dgitos no nulos so os elemento do

conjunto , e a Lei de Benford na base diz que a frequncia do primeiro dgito significativo . Bem, os
nmeros de Fibonacci seguem a Lei de Benford em qualquer base A Lei de Benford invariante por mudanas de bases. E a nica lei de probabilidade no
trivial que invariante por mudanas de bases.
Bem, chegou a hora das explicaes. Voc ter que lembrar alguns conceitos do seu curso de probabilidade. Mas talvez voc prefira comprovar a Lei de Benford por si
mesmo antes de comear a ler alguma matemtica mais sria.

1. Invarincia por mudanas de escala


Vamos considerar uma mudana de escala simples obtida multiplicando-se todos os nmeros de um conjunto por . Se considerarmos os nmeros com primeiro dgito
significativo igual a , ento eles so mudados para nmeros com primeiro dgito significativo ou igual a ou igual a . fcil verificar

que . De fato,

Analogamente, vale que , etc. Mas como faramos, por exemplo, no caso uma converso de milhas para quilmetros, isto , no caso
de multiplicarmos os nmeros por ? Do modo que est enunciada, a Lei de Benford muito restritiva e precisamos generaliz-la. Qual a definio do primeiro

dgito significativo de um nmero ser igual a ? Resposta: a mantissa de deve pertencer ao intervalo . Assim, a Lei de Benford uma distribuio
de probabilidade parcial da mantissa. A Lei de Benford Generalizada (a qual, por abuso de linguagem, continuaremos chamando de Lei de Benford) descrita em termos

uma funo densidade no intervalo . Quando escolhemos aleatoriamente um nmero, podemos calcular sua mantissa. Isto nos d uma varivel aleatria

que valores em . Dizemos que ela segue a Lei de Benford se sua funo densidade dada por

Se representa a probabilidade que , ento isto significa dizer que

Isso realmente uma generalizao da Lei de Benford, pois

O que significa dizer que uma varivel aleatria em invariante por mudanas de escala? Reposta: significa dizer que se um nmero real positivo e se
consideramos a varivel aleatria , ento a mantissa da varivel aleatria tem a mesma funo densidade que . No difcil mostrar que este
o caso quando segue a Lei de Benford, mas existem vrios casos a considerar dependendo do valor de . Veremos um caso aqui e deixaremos os demais casos para

voc. Podemos escrever , com a mantissa de . Uma vez que a mantissa de a mesma de , suficiente considerar o

caso em que . Qual a ferramenta que mostrar isto? Voc deve lembrar do seu curso de probabilidade que a funo de distribuio (acumulada)
algumas vezes mais til do que a funo densidade para uma varivel aleatria contnua. A funo de distribuio (acumulada) de uma varivel aleatria definida
por

Se segue a Lei de Benford, ento sua funo de distribuio dada por

(1)
Agora devemos mostrar que se segue a Lei de Benford e a mantissa de para , ento a funo de distribuio de dada por (1).

Para esse propsito, precisamos calcular para . Note que a mantissa de a qual toma valores em .

Assim, quando e quando O primeiro caso ocorre quando . Para a mantissa de estar

em , a nica possibilidade que . Ento, a mantissa de igual a . Portanto,


como esperado. Os outros casos so justificados de maneira anloga.

A recproca mais excitante

2. A Lei de Benford a nica lei de probabilidade sobre a mantissa que invariante por mudanas de escala
Esse um enunciado impressionante! Ainda assim, voc ver que sua prova no muito mais complicada do que o argumento dado anteriormente. Seja um varivel

aleatria representando a mantissa e tomando valores em . Vamos considerar sua funo de distribuio , sob a hiptese que ser invariante por
mudanas de escala. Assim, precisamos calcular

A funo deve satisfazer as condies e . A dificuldade principal da prova est em interpretar o significado de dizer que
invariante por mudanas de escala. Uma vez que e so os mesmos eventos, temos que

(2)
Como antes, vamos considerar o caso em que de modo que ( depende de ). Assim, para , temos que
igual a sua mantissa. Uma vez que invariante por mudanas de escala, ento a mantissa de tem a mesma funo de distribuio que . Portanto,

Combinando esse resultado com (2), vemos que satisfaz

(3)
desde que no seja muito grande. Devemos agora encontrar que satisfaz aequao funcional (3). Vamos ver como fazer isso. Se
fizermos , ento

ou, ainda,

uma vez que . Vamos tomar o limite fazendo . Devemos reconhecer em cada lado um quociente cujo limite uma derivada. No lado

esquerdo, o quociente tem limite igual a e, no lado direito, o quociente tende a . Assim, deve
satisfazer a equao diferencial de variveis separveis:

cuja soluo . Uma vez que , devemos ter , e uma vez que ,

ento . Portanto, , como queramos!

3. Por que nmeros coletados de todas as origens seguem a Lei de Benford?


Uma resposta foi dada por Theodore Hill em 1995. Iremos agora discutir brevemente a sua ideia. Naturalmente, nem todo conjunto de nmeros segue a Lei de Benford.
Por exemplo, se voc considerar a altura de humanos em metros ento, com poucas excees, somente os primeiros dgitos significativos e iro ocorrer, e se voc
converter a altura em ps (um p aproximadamente igual a cm), voc mudar a lei de distribuio do primeiro dgito significativo. Assim, esse conjunto de
nmeros no invariante por mudanas de escala. Mas, suponha que consideremos um conjunto grande de nmeros vindo de todas as origens e que queiramos mudar a
escala. Existem diferentes subconjuntos com sua prpria escala particular. Uma vez que o conjunto grande e os nmeros vm de todas as origens, quase todas as escalas
diferentes estaro presentes. Se multiplicarmos todos os nmeros do conjunto por uma constante positiva, isso induzir uma permutao das escalas presentes no novo
conjunto. Assim, como um todo, podemos esperar que o conjunto de nmeros se comporte como se ele no tivesse uma escala especial. Portanto, ele seguir a Lei de
Benford.

Essa explicao boa para conjuntos coletados de todas as origens. Mas ela no explica o porqu de reas de pases, populaes de pases ou comprimentos de rios
seguirem a Lei de Benford. Vamos discutir explicaes muito recentes (2008!) para esse caso dadas por Gauvrit, Delahaye e Fewster. Essas explicaes tambm so
vlidas para conjuntos grandes de nmeros coletados de todas as origens.

4. Conjuntos de nmeros abrangendo vrias ordens de magnitude so suscetveis de seguirem a Lei de Benford!
Estamos trabalhando na base e j vimos que nmeros positivos podem ser escritos na forma , com e . Aqui
a ordem de magnitude. Diremos que existem vrias ordens de magnitude se existem vrios valores de para nosso conjunto de nmeros. (Note que tal propriedade

invariante por mudanas de escala!) Para simplificar a explicao, suponha que os nmeros estejam no intervalo . Ento, os nmeros com primeiro dgito
significativo so aqueles que pertencem ao conjunto

com conjuntos anlogos para os outros dgitos . conveniente usarmos o logaritmo na base destes nmeros: .

Assim, . Vamos mostrar que se uma varivel aleatria em segue a Lei de Benford, ento a varivel

aleatria simplesmente uniforme em . Para isso, suficiente mostrarmos que a funo de distribuio de aquela da varivel

aleatria uniforme em , a saber,

De fato, quando ,

Se pertence ao conjunto , ento pertence ao conjunto :

com conjuntos anlogos para os outros dgitos . Suponha que escolher um nmero aleatrio em nosso conjunto seja uma varivel aleatria que toma valores

em . Ento toma valores em . Lembre-se que a probabilidade de alguma varivel aleatria pertencer a algum conjunto igual

a rea sob o grfico da funo densidade restrita a esse conjunto. Se a funo densidade de em fosse uniforme como na Figura 3 (a), nada haveria para ser
feito. Contudo, nem sempre esse ser o caso, como mostra a Figura 3 (b). Mas aqui est a importncia do conjunto original de nmero abranger vrias
escalas de magnitude. As sees diferentes correspondentes a um dado primeiro dgito significativo espalham-se horizontalmente sobre vrios segmentos cuja soma

dos comprimentos da ordem de do comprimento total. Assim, mesmo que a altura de no seja a mesma de um segmento para outro,
podemos esperar que a altura mdia seja da mesma ordem de magnitude para os dgitos diferentes. Quando isso ocorre, ento os dados seguem a Lei de Benford.

(a) funo densidade f uniforme


(b) funo densidade f no uniforme
Figura 3: As reas correspondentes s frequncias dos primeiros dgitos significativos 1, 2, 3 e 4
para duas funes de densidade diferentes de Y. Os valores das reas correspondentes esto indicados na Figura 4.
(a) funo de densidade de f
(b) reas sobre a curva para dgitos significativos de f e para a funo uniforme
Figure 4: As reas correspondentes s frequncias dos primeiros dgitos significativos 1, 2, 3 e 4 para a funo densidade da Figure 3(b).
No lado direito vemos que estes valores esto muito prximos daqueles obtidos pela Lei de Benford no caso de uma funo de densidade uniforme para Y.

5. Como testar se um conjunto de nmeros segue a Lei de Benford?

Se voc fez um curso de estatstica, ento voc provavelmente estudou o teste . Este teste permite verificar se algum conjunto de dados segue alguma distribuio de
probabilidade. Suponha que voc queira fazer o teste com um conjunto de nmeros. Voc precisa apenas construir uma tabela, na qual representa o nmero de
nmeros em seu conjunto que possuem primeiro dgito significativo igual a . Naturalmente, . Na Tabela 2, representa o nmero de

nmeros que teriam primeiro dgito significativo igual a se seu conjunto seguisse a Lei de Benford, a saber, .

Tabela 2: A tabela para o teste .

Feito isto, basta ento calcular

e verificar na tabela pela linha correspondente a graus de liberdade. Caso voc queira fazer um teste com % de erro, ento voc aceitar que o seu conjunto de

dados satisfaz a Lei de Benford se e rejeitar esse fato caso contrrio. Esta uma receita rpida, mas caso voc faa tais testes junto com seus
estudantes, ento gaste algum tempo para que eles se familiarizem com os detalhes do teste e o seu significado.

6. Invarincia da Lei de Benford por mudanas de base


Isto pode ser modelado de maneira anloga ao que foi feito para a invarincia por mudanas de escala. Contudo, a situao mais delicada, uma vez que no podemos
nos limitar a trabalhar apenas com a mantissa. De fato, se , ento a parte tambm precisa ser convertida para a nova base. E, certamente, a
dificuldade principal expressar em termos matemticos o que significa uma varivel aleatria ser independente por mudanas de base. No faremos isso aqui.

7. Concluso
A Lei de Benford fascinante: ela desafia nossa intuio e algo que voc pode testar por si mesmo como adapt-la em uma atividade em sala de aula. Pode parecer uma
mera curiosidade, mas ela agora usada como uma ferramenta para e detectar fraudes. Naturalmente, mais e mais sonegadores de impostos aprendem sobre ela. Mas,
preste ateno: o primeiro dgito significativo no a nica coisa com a qual se preciso preocupar. A Lei de Benford Generalizada permite obter uma lei para o segundo
dgito significativo, para o terceiro dgito significativo, etc. Voc pode tentar descobri-la sozinho: pense em quais unies de intervalos a mantissa de um nmero deveria
estar para que o seu segundo dgito significativo seja .

H um equvoco no que diz respeito origem da observao do fenmeno objeto deste texto. Este afirma que O fenmeno foi observado pela primeira vez pelo
astrnomo Simon Newcombe (1835-1909), que notou que as primeiras pginas das tabelas de logaritmos correspondentes aos primeiros dgitos significativos pareciam
menos numerosas se comparadas com as pginas seguintes.

Na realidade, o que ocorreu foi coisa diversa. Simon Newcombe percebeu que as tabelas de logaritmos apresentavam pginas mais desgastadas e sujas justamente nos
primeiros nmeros, por serem mais manuseadas nesta poro. Isto mostrou que o nmero 1 era o mais consultado, ao passo que o nmero 9 era o menos consultado
pelas pessoas. Ora, sendo assim, era de se supor que os nmeros menores estatisticamente apareciam mais vezes que os maiores por ocasio de fenmenos observados
por quem utilizava a tabela, o que acabou sendo matematicamente confirmado incontveis vezes.