You are on page 1of 9

Benford's Law

Benford's Law predicts the occurrence of digits in large sets of data. Simply put, this law maintains that we can
expect some digits to occur more often than others. For example, the numeral 1 should occur as the first digit
in any multiple-digit number about 30.1% of the time, while the numeral 9 should occur as the first digit only
4.6% of the time. We also can apply the law to determine the expected occurrence of the second digit of a
number, the first two digits of a number and other combinations.

How can such predictions help you red-flag potential irregularities? When someone creates false transactions
or commits a data-entry error, the resulting numbers often deviate from the law's expectations. This is true
when someone creates random numbers or intentionally keeps certain transactions below required
authorization levels.

For example, in 2008, Bernie Madoff famously created fictitious data to hide an estimated $65
billion in losses resulting from Madoff's investment Ponzi scheme. - Had the CPAs looked at
this data using Benford's Law, they might have found that the digits smelled of fraud, perhaps
triggering a deeper investigation.

Applying Benford's Law Using Excel


According to Benford's Law, the various digits should occur as the first digit position according to the following
percentages.

Benford's Law
Occurrence
Number

30.10%

17.60%

12.50%

9.70%

7.90%

6.70%

5.80%

5.10%

4.60%

As First Digit

1
2

To analyze data, simply use the LEFT function to extract the leading digits, and then add them up as follows. As
a simple example, I found a random workbook containing 136 rows of revenue amounts. I entered a formula
in cell C4 to extract the first digit and copied this formula down. Next I used the
COUNTIF function to count the number of occurrences of each of the nine digits, and calculated their rate of
occurrence, then charted the results.

You can clearly see that this data pattern does not conform to Benford's law, and yes, I fabricated this
particular set of data years ago.

When Excel helps you spot a deviation like this, it raises a red flag. Considerable statistical research supports
the effectiveness of Benford's Law, making it a valuable tool for CPAs. The technique isn't guaranteed to detect
fraud in all situations but is useful in analyzing the credibility of accounting records.
A Note of Caution

Benford's Law is not effective for all financial data. If the data set is small, the law becomes less accurate
because there are not enough items in the sample and so the rules of randomness don't apply—or at least
apply with less predictability.

Also, if the data include built-in minimums and maximums, they also might not conform well to the law's
predictions. For example, consider a petty-cash fund where all disbursements are between a $10 minimum and
a $20 maximum. All first digits would be either 1 or 2, and the expected distribution of first digits would not
apply. Likewise, when a company's major product sells for, say, $9.95, most sales totals will be a multiple of
995, again offsetting the value of the process. Finally, when a data set consists of assigned numbers, such as a
series of internally generated invoice numbers, the data will not follow a Benford distribution.

History of Beford's Law

Newcomb, 1881 - The discovery of Benford's law dates back to 1881, when the American astronomer Simon
Newcomb noticed that in logarithm tables (used at that time to perform calculations) the earlier pages (which
contained numbers that started with 1) were much more worn than the other pages. Newcomb's published
result is the first known instance of this observation and includes a distribution on the second digit, as well.
Newcomb proposed a law that the probability of a single number N being the first digit of a number was equal
to log(N + 1) - log(N).

Benford, 1938 - The phenomenon was again noted in 1938 by the physicist Frank Benford, who tested it on
data from 20 different domains and was credited for it. His data set included the surface areas of 335 rivers,
the sizes of 3259 US populations, 104 physical constants, 1800 molecular weights, 5000 entries from a
mathematical handbook, 308 numbers contained in an issue of Readers' Digest, the street addresses of the
first 342 persons listed in American Men of Science and 418 death rates. The total number of observations
used in the paper was 20,229. This discovery was later named after Benford.

Varian, 1972 - In 1972, Hal Varian suggested that the law could be used to detect possible fraud in lists of
socio-economic data submitted in support of public planning decisions. Based on the plausible assumption
that people who make up figures tend to distribute their digits fairly uniformly, a simple comparison of first-
digit frequency distribution from the data with the expected distribution according to Benford's law ought to
show up any anomalous results.

Nigrini, 1999 - Following this idea, Mark Nigrini showed that Benford's law could be used in forensic
accounting and auditing as an indicator of accounting and expenses fraud. In practice, applications of Benford's
law for fraud detection routinely use more than the first digit.

Analyzing All Digits

Building on the simple example described above, we can expand our Excel formulas to analyze all of the digits
included in a set of data as follows: In the example shown below, I have used the MID function to extract each
digit from the column of values in column A, and the resulting individual numerals are displayed in columns C
through H. Next, I totaled the occurrence for each number 1 through 9 in the summary box and charted the
results.

In this example, the data does appear to ever so slightly adhere to Benford's Law as the first 4 bars in the chart
and a few others seem to come close to matching Benford's declining curve.

According to Benford's Law one would expect lower numerals to appear more frequently than higher values,
but why? Lower digits (1, 2,& 3) tend to appear more frequently than higher digits (7, 8, & 9) because it is
easier to own 1 acre than 9 acres; and more people have $100 than $900. Lower numbers are typically more
achievable than higher numbers in many situations. For this reason, we would expect to see an analysis of
numbers form a slightly curved declining chart like this one:
However, the presence of the leading digit may significantly skew the data, therefore, we could ignore the
leading digit and analyze the occurrence of the remaining 8 numerals in an effort to determine whether or not
the data appears to roughly follow Benford's Law. Ignoring the leading digit reveals the following analysis.

As expected, the numeral 1 occurs less often than when the leading digits were included. Still, with the leading
digit ignored, the data appears not to follow Benford's Law.
Conclusion
This case study was intentionally brief and is only intended to convey the general ideas related to Benford's
law. The forensic CPA may choose to run these numbers to help confirm suspicions or beliefs related to the
authenticity of a large data set of numbers in question. There are probably many instances where this
approach would offer little value, however in a high ticket audit with high potential for fraud, running Benford's
Law analysis is a rather quick exercise which may offer insights to help the forensic CPA determine how to best
proceed.
Legea lui Benford Legea Benford anticipează apariția de cifre în seturi mari de date. Pur și simplu pune, această lege
susține că ne putem aștepta la unele cifre să apară mai des decât altele. De exemplu, cifra 1 trebuie să apară ca
prima cifră în orice număr multiplu cifre aproximativ 30,1% din timp, în timp ce numărul 9 ar trebui să apară ca prima
cifră doar 4,6% din timp. De asemenea, se poate aplica legea pentru a determina apariția așteptat a doua cifră a unui
număr, primele două cifre ale unui număr și alte combinații. Cum pot astfel de predicții vă ajuta să roșu-pavilion
potențiale nereguli? Când cineva creează tranzacții false sau comite o eroare de introducere a datelor, numerele
rezultate se abat de multe ori de la așteptările legii. Acest lucru este valabil atunci când cineva creează numere
aleatoare sau menține anumite tranzacții sub nivelurile de autorizare necesare în mod intenționat. De exemplu, în
2008, Bernie Madoff a creat faimoasa date fictive pentru a ascunde o valoare estimată de 65 de miliarde $ în pierderi
rezultate din schema Ponzi de investiții al lui Madoff. - Dacă APC uitat la aceste date folosind Legea Benford, ei ar fi
găsit că cifrele mirosit de fraudă, probabil, declanșând o investigație mai profundă. Aplicarea Legii Benford Utilizarea
Excel Conform Legii lui Benford, diferitele cifre ar trebui să apară ca prima poziție cifră în conformitate cu următoarele
procente. Benford Legea lui Apariție Numărul Ca prima cifră 1 2 3 4 E 6 7 8 9 Pentru a analiza datele, pur și simplu
utilizați funcția STANGA pentru a extrage cifre de conducere, și apoi adăugați-le după cum urmează. Ca un exemplu
simplu, am găsit un registru de lucru aleatoriu care conține 136 rânduri de sume de venituri. Am intrat într-o formulă în
celula C4 pentru a extrage prima cifră și copiat această formulă în jos. În continuare am folosit funcția COUNTIF
pentru a contoriza numărul de apariții ale fiecăreia dintre cele nouă cifre, și se calculează rata lor de apariție, schițată
rezultatele. Puteți vedea în mod clar că acest model de date nu sunt conforme cu legea lui Benford, si da, am fabricat
acest set de date de ani în urmă. Când Excel vă ajută să identificați o abatere ca aceasta, se ridică un steag
roșu. cercetării statistice considerabile sprijină eficiența Legii Benford, făcându-l un instrument valoros pentru
CPAS. Tehnica nu este garantat pentru a detecta frauda în toate situațiile, dar este utilă în analiza credibilității
înregistrărilor contabile. O notă din Legea Atenție Benford nu este eficient pentru toate datele financiare. Dacă setul de
date este mic, legea devine mai puțin precise, deoarece nu există suficiente elemente în eșantion și astfel regulile de
dezordine nu se aplică-sau cel puțin se aplică cu mai puțină predictibilitate. De asemenea, în cazul în care datele
includ și minime maxime încorporate, ele, de asemenea, s-ar putea să nu se conformeze bine la predicții ale legii. De
exemplu, ia în considerare un fond mic-numerar în cazul în care toate plățile sunt între un minim de $ 10 si un maxim
de 20 $. Toate primele cifre ar fi 1 sau 2, precum și distribuția așteptată a primelor cifre nu s-ar aplica. De asemenea,
atunci când mai important produs al unei companii se vinde pentru, să zicem, $ Pret: 9.95, cele mai multe totaluri de
vânzări va fi un multiplu de 995, compensând din nou valoarea procesului. În cele din urmă, atunci când un set de
date este format din numere atribuite, cum ar fi o serie de numere de factură generate pe plan intern, datele nu vor
urma o distribuție Benford. Istoria Legii Newcomb Beford lui, 1881 - Descoperirea legii Benford datează din 1881, când
astronomul american Simon Newcomb a observat că, în tabele de logaritmi (utilizat la acel moment pentru a efectua
calcule) paginile anterioare (care conțineau numere care au început cu 1) au fost mult mai uzată decât celelalte
pagini. Rezultatul este publicata Newcomb prima cunoscută instanță a acestei observații și include o distribuție pe a
doua cifră, de asemenea. Newcomb a propus o lege care probabilitatea unui singur număr N fiind prima cifră a unui
număr a fost egal cu log (N + 1) - log (N). Benford 1938 - Fenomenul a fost observat din nou în 1938 de fizicianul
Frank Benford, care a testat pe datele din 20 de domenii diferite și a fost creditat pentru ea. setul său de date incluse
zonele de suprafață de 335 râuri, dimensiunile 3259 populațiilor din SUA, 104 constante fizice, 1800 greutăți
moleculare, 5000 intrări de la un manual matematic, 308 numere de conținut într-o chestiune de Digest cititorilor,
adresele de primul 342 de persoane enumerate la barbati americani de Stiinta si 418 ratele de deces. Numărul total de
observații utilizate în lucrare a fost 20229. Această descoperire a fost numit mai târziu, după Benford. Varian, 1972 - În
1972, Hal Varian a sugerat că legea ar putea fi folosite pentru a detecta posibile fraude în listele de date socio-
economice prezentate în susținerea deciziilor de planificare publice. Bazat pe presupunerea plauzibilă că oamenii care
alcătuiesc cifrele au tendința de a distribui cifrele lor destul de uniform, o simplă comparație a distribuției frecvenței
primei cifre din datele cu distribuția de așteptat conform legii lui Benford ar trebui să apară rezultate aberante. Nigrini,
1999 - Ca urmare a acestei idei, Mark Nigrini a arătat că legea Benford ar putea fi utilizate în contabilitate medico-
legale și de audit ca un indicator al fraudei contabile și a cheltuielilor. În practică, cererile de drept Benford pentru
detectarea fraudelor folosesc în mod obișnuit mai mult decât prima cifră. Analizând toate zecimalele Bazându-se pe
exemplul simplu descris mai sus, putem extinde formulele noastre Excel pentru a analiza toate cifrele incluse într-un
set de date, după cum urmează: În exemplul prezentat mai jos, am folosit funcția MID pentru a extrage fiecare cifre
înscris coloană de valori în coloana a, iar cifrele individuale rezultate sunt afișate în coloanele C prin H. Apoi, am
totalizat apariția pentru fiecare număr de 1 până la 9 în caseta rezumat și cartografiat rezultatelor. În acest exemplu,
datele nu par să adere vreodată atât de ușor la Legea Benford ca primele 4 baruri din diagramă și câteva altele par să
se apropie de curba lui Benford declin. Conform Legii lui Benford ar fi de așteptat cifre mai mici să apară mai frecvent
decât valori mai mari, dar de ce? digiti inferioare (1, 2, & 3) tind să apară mai frecvent decât cifre mai mari (7, 8, și 9),
deoarece este mai ușor să dețină 1 acru de 9 acri; și mai multe persoane au 100 $ decât $ 900 de. Numerele mai mici
sunt de obicei mai realizabile decât un număr mai mare în multe situații. Din acest motiv, ne-am aștepta la o analiză a
numerelor formează o diagramă în declin ușor curbat ca aceasta: Cu toate acestea, prezența cifrei fruntașe poate
distorsiona în mod semnificativ datele, prin urmare, am putea ignora cifra de conducere și analizează apariția cele 8
numere rămase într-un efort de a determina dacă este sau nu datele pare să urmeze aproximativ Legea lui
Benford. Ignorând cifrei fruntașe relevă următoarea analiză. Așa cum era de așteptat, cifra 1 apare mai rar decât
atunci când au fost incluse cifrele de conducere. Cu toate acestea, cu cifra de conducere a ignorat, datele nu pare să
urmeze Legea lui Benford. Concluzii Acest studiu de caz a fost în mod intenționat scurt și este destinat numai pentru a
transmite ideile generale legate de legea lui Benford. Medico-legală CPA poate alege pentru a rula aceste numere
pentru a ajuta la a confirma suspiciunile sau convingerile legate de autenticitatea unui mare set de date de numere în
cauză. Sunt, probabil, multe cazuri în care această abordare ar oferi o valoare redusă, cu toate acestea într-un audit
de mare bilet cu potențial ridicat de fraudă, care rulează analiza Legea Benford este un exercițiu destul de rapid, care
poate oferi informații pentru a ajuta medico-legal CPA determina cum să procedeze cel mai bine.

You might also like