You are on page 1of 30

Основни теоретични понятия, използвани в

практиката на НСИ

В раздела „Обща теория на статистиката” се включват основни понятия и термини от теорията


и практиката на статистиката. Това са понятия, които се използват при подготовката на
инструментариума на статистическите изследвания, осъществявани от НСИ. Потребителите и
експертите, използващи статистическите данни, ще получат основни познания за статистическата
терминология, която се използва при подготовката на статистическите документи и формуляри, а
също така и при анализа на получената информация. Представените понятия и термини се включват
в инструментариумите и анализите пряко (вербално описани) или имплицитно при тяхното
разработване. Този речник не претендира за изчерпателност и пълнота по темата. Неговата основна
цел е да приближи методолози, експерти, научни работници и потребители до една материя, която е в
сърцевината на теорията и практиката на статистическите изследвания. Някои от понятията и
термините се повтарят с представените в речника „Теория на извадковите изследвания”. Това се
дължи на обстоятелството, че статистическите методи са разработени при изследване на събития и
явления, основаващи се на данни от извадки. Въпреки това следва да се има предвид, че основната и
значима разлика между двата речника се изразява в обстоятелството, че в този речник се представят
понятия и термини, които са характеристики на статистически разпределения. В речника,
представящ понятията и термините на „Теория на извадковите изследвания”, се акцентира на
оценките на характеристики, сводиращи резултатите от изследваните явления и процеси.

№ Термин Определение
Характеризира в абсолютни величини размера на изменение (развитие).
Абсолютен прираст Получава се като разлика между абсолютни размери на два периода
1. (момента). При динамичен ред могат да се изчислят абсолютни прирасти за
Аbsolute growth всеки период в сравнение с предходния (верижно).

Абсолютни
Абсолютните статистически величини изразяват размера на масовите
статистически
явления и процеси - общо и на техните съставни части. С тях се изразява
2. величини
общият обем на дадена статистическа съвкупност, на нейна част или
Absolute statistical
различията, които съществуват между броя на обхванатите единици.
values
Абсолютно Показва изменението в абсолютния прираст, т.е. дали се засилва, или
3. ускорение забавя скоростта на изменението (развитието), измерена в абсолютна
Аbsolute acceleration величина.
При това направление на статистическия анализ се получават обобщаващи
Анализ на
числови измерения за поредица статистически характеристики - средна,
разпределенията
4. медиана, мода, квантили, степента на вариация, разсейването и други. Въз
Analysis of the
основа на анализа се изучава динамиката и структурата на явленията и
distributions
процесите, обект на статистически наблюдения.
5. Анализ на Статистически анализ, който може да се разработи в няколко основни
развитието направления: да измери темповете и скоростта на развитие на дадено явление
(динамиката) или процес; да разкрие основните тенденции; да прогнозира най-вероятния
сценарий на развитие; да измери и опише връзките със събития и явления,
Analysis of the
които влияят косвено или пряко върху изследвания процес.
development
Аналитичен метод Метод, който се използва при изчисляването, синтезирането, графичното
6. представяне и логическото описание на статистически данни и показатели,
Analytical method характеризиращи дадено общественозначимо явление или процес.
Изчислява се по формулите:
S k1 
x  Mo
и S k2 
 
3 x  Me
, където:
 
x - средна аритметична;
M o - мода;
M e - медиана;
 - стандартно отклонение.
Асиметрия Разпределението е асиметрично с дясно изтеглена крива, когато
7.
Asymmetry
стойностите на S k и S k са положителни, и обратно, за ляво изтеглена крива.
1 2

Асиметрията може да се изчисли и по формулата:


m
 1  33 , където:

m3 - трети централен момент (вж. моменти);
 3 - стандартното отклонение на трета степен (вж. стандартно
отклонение).
Бивариационни
данни
8. При изследване на две променливи (признаци) на една опитна единица.
Bivariate data
Бинарна
променлива
9. Променлива, която е с две възможни стойности (значения на признака).
Binary variable
Вариационни признаци са тези, чиито определения могат да се дефинират
Вариационни
с мерна единица (числа) и затова се наричат още количествени или
признаци
10. метрирани. Такива признаци са например: брой на членовете на
домакинството, възраст, заплати, цени на стоки, литри мляко, безалкохолни и
Variation signs
алкохолни напитки, килограми плодове и зеленчуци и т.н.
Единиците на наблюдение, наредени възходящо или низходящо по
Вариационен ред
11. числовите значения на техните признаци. Например: лица от населението по
Set of order statistics възраст.

Вероятност за
събитие А
12. Честота на благоприятните случаи за сбъдване на събитие А.
Ptobability of an
event A
Вероятностно
разпределение Честотите на благоприятните случаи за сбъдване на дадено събитие при
13. поредица от опити. Например: разпределение на случаите за поразяване на
Probability мишена при 100 изстрела.
distribution
Висок квартил (UQ)
(трети квартил) Висок квартил е стойността на значението на признака, който разделя
14.
трети от четвърти квартил.
Upper quartile (UQ)
Временен ред Стойности от последователни наблюдения, подредени по определени
15. отрязъци от време. Например: доходи средно на домакинство по години и
Time series месеци.

Втори квартил
16. Вторият квартил е равен на медианата в статистическото разпределение.
Second quartile
Вторични
статистически Статистически изучавания, при които се използват сведенията за
изучавания единиците на статистическата съвкупност, събрани за нестатистически цели.
17.
Например: гражданската регистрация на населението, при която се събира
Secondary statistical информация за рождената дата, семейното положение и т.н.
studies
Общност от обекти (лица, предприятия, предмети и т.н.), които са обекти
на наблюдение и източник на определени данни за тях. В статистиката
генералната съвкупност се разглежда като изчерпателно множество от
Генерална единици, за които е събрана информация по определени признаци.
съвкупност, Информация за генералната съвкупност се получава при преброяванията на
18. популация населението и жилищния фонд. Генералната съвкупност е основата за
провеждане на извадкови изследвания по различни общественозначими теми.
Population При формирането на извадки от особена важност са дефинирането на
генералната съвкупност и дизайнът за осъществяването на извадката. При
тези обстоятелства извадката притежава статут за представителност при
оценяване на характеристиките на генералната съвкупност.
Гнездовата извадка е метод за формиране на случайна извадка. Това е
първата степен за излъчване на извадката. Гнездата съдържат единиците за
наблюдение, които се излъчват при следващата степен (процедура) по
определен начин, като се спазват условията за рандомизация (случаен подбор
Гнездова извадка
на единиците). Гнездовата извадка се използва при реализацията на дадено
19.
статистическо изследване с оптимален разход на средства, без това да се
Cluster sample
отрази върху точността на получаваните оценки. Същият ефект при равни
други условия може да се постигне и чрез формиране на проста случайна
извадка от единиците за наблюдение, но при забележимо по-висок разход на
средства.
Графичен метод
20. Метод за визуализация на данните от едно статистическо изследване.
Graphical method
Грешка на оценката се получава при представителните извадкови
Грешка на оценката
изследвания и включва: стохастична грешка, дължаща се на обстоятелството,
21.
че се наблюдава представителна част на генералната съвкупност;
Error of estimation
нестохастична грешка, дължаща се на получена недостоверна информация.
22. Дизайн ефект Загубата на ефективност чрез използването на гнездова извадка вместо
проста случайна извадка се нарича дизайн ефект. Изчислява се по формулата:
Design effect DEFF  1    n  1 , където:
 - вътрешногнездова корелация по определени изследвани признаци на
единиците от извадката;
n - среден размер на гнездото.
Колкото DEFF е по-близо до 1, толкова по-добър е избраният дизайн на
извадката.

23. Дисперсионен  Същност: Основната задача на дисперсионния анализ е да направи


анализ оценка на общото въздействие на даден фактор или група фактори,
които при изменението си влияят върху резултативната променлива
Analysis of Variance (следствие).
Multivariate Analysis  Условия за приложение на дисперсионния анализ:
of Variance - Резултативната променлива да бъде на интервалната скала;
- Информацията за неговото осъществяване да бъде получена
чрез независими стохастични извадки;
- Случаите на отделните значения на факторната
(факторните) променлива да бъдат нормално разпределени
съобразно стойностите, които притежават като резултативна
променлива;
- Дисперсиите на тези разпределения да бъдат равни
помежду си;
- Да се елиминира смущаващото влияние на страничните
фактори.
 Етапи за приложение на дисперсионния анализ:
- Дефиниране на Н0 и Н1:
Н0: y1 = y 2 = y 3 =…= y k ;

Н1: y1  y 2  y 3  ...  y k .

- Фиксиране на равнище на значимост: примерно   0.05 .

 M2
- Определяне на метода за проверка: FEM  , където:
 B2

 M2 - междугрупова дисперсия;

 B2 - вътрешногрупова дисперсия.

- Набавяне на необходимата информация, както следва:


а) изчисляване на средната по отделните значения ( y i ) на
факторната променлива:

yi 
y ij
;
ni

б) изчисляване на средната по всички значения ( y ij ) на


факторната променлива:

y
 y ij
;
n i

в) изчисляване на девиациите по групите:


- обща: SS O   y ij  y ;  2

- междугрупова: SS M    y i  y  ;
2

- вътрешногрупова: SS B   y ij  y i ;   2
- спазване на условието: SS O  SS M  SS B .

г) изчисляване на двете независими оценки на общата


дисперсия:

y  2
 y ni
 2
M 
i
- междугрупова;
k 1

  y  2
y n е брой
 2
B 
ij
- вътрешногрупова, където
nk
случаи, k е броят на групите.

- Изчисляване на емпиричната характеристика FEM .

- Определяне на критичната област: едностранна - ляво


или дясно; двустранна.
- Определяне на теоретичната характеристика от таблицата
в съответствие с параметрите:

  .0 05 
FT  f1  k 1  .
 f2  n  k
- Вземане на решения, като се сравняват емпиричната
FEM и теоретичната FT характеристика:

когато FEM > FT : Н0 се отхвърля и се приема Н1;

когато FEM < FT : Н0 се приема и се отхвърля Н1.

- Изчисляване на корелационно отношение:

SS B
  1 , където 0    1 .
SS O

Забележка: При анализ на специфични явления и събития се използва


двуфакторен или многофакторен дисперсионен анализ. Условията за
приложение на тези анализи са доста специфични и капризни и
изискванията за тяхното спазване са задължителни, за да се гарантира
надеждността на резултатите и значимостта на аналитичните изводи.
Измерва върховата изтегленост на кривата на емпиричното разпределение
в сравнение с нормалното разпределение и се изчислява по формулата:
m
Ексцес  2  44  3 , където:
24. 
Excess m 4 - четвърти централен момент (вж. моменти);
 4 - стандартно отклонение на четвърта степен (вж. стандартно
отклонение).
Емпирично
статистическо
Под емпирично (честотно) разпределение се разбира разпределение на
разпределение
25. честотите по значение на даден признак, резултат от проведено статистическо
изследване.
Empirical statistical
distribution
26. Закон за големите „Свойствата на много закономерности от обективния свят да се формират
числа отчетливо само в масовите процеси, само при достатъчно голям брой
елементи на съвкупности се нарича закон за големите числа” (Пасхавер, И.,
Law of large numbers 1974, „Закон больших чисел и статистические закономерности”, с. 18,
Статистика, Москва).
На практика това означава, че всеки отделен елемент съдържа в себе си
част от обективните закономерности, които се проявяват само при
изучаването на съвкупност от елементи. Обратно - „Закономерности,
проявяващи се в единичното, във всеки отделен елемент, се наричат
динамични закономерности” (Пасхавер, 1974, с. 4).
Първият математически израз на закона за големите числа е теоремата на
Бернули (1654 - 1705). Теоремата на Бернули е публикувана през 1713 г. в
труд, озаглавен „Изкуството да се правят догадки”, и се дефинира, както
следва: „Ако вероятността за настъпване на някакво събитие „А” в
последователни и независими опити е неизменна, постоянна и равна на „р”, а
относителният дял (релативната честота) за неговата поява е m/n, то
вероятността „Р” на абсолютната разлика |m/n - p| да бъде по-малка от
произволно избрано положително число  , ще клони към 1 при увеличаване
броя на изпитанията” (Пасхавер, 1974, с. 34; Сугарев, Христова, Бонев, 1970,
с. 560; Гатев, 1991, с. 182).
От практическа гледна точка това означава, че разликата |m/n - p| показва
доколко честотата (делът на случаите за настъпване на събитието в една
извадкова съвкупност) се отличава от вероятността (относителният дял на
случаите за настъпване на събитието в генералната съвкупност) или в каква
степен възможността се отличава (различава) от действителността.
По същество идеята на Бернули се отнася до значително прост модел,
когато събитието се появява или не и когато вероятността за всяко събитие е
постоянна.
Развитието на идеите на Бернули са продължени от Поасон (1781 -
1840), който въвежда понятието закон за големите числа. Той доказва, че
теоремата на Бернули е вярна и в случаите, когато вероятността „р” се мени в
хода на изпитанията независимо от резултатите на предходните изпитания.
Доказателството се основава върху поредица от опити, при които се
използват няколко урни с различен състав на бели и черни топки. По този
начин се доказва, че ако вероятностите за настъпване на събитието „А”
(появяването на топка с определен цвят) са p1, p 2, p 3, .... p n , а относителната
честота на събитието „А” е m/n в направените изпитания, то вероятността
„Р” на абсолютната разлика:

m p1  p2  p3  ...  pn
|  |
n k

да бъде по-малка от произволно избрано положително число , ще клони


към 1 при увеличаване на броя на опитите:
imP|m/n p| 1
n 
, където

p1  p 2  p3  ....  p n
p = .
k

Поасон публикува своите идеи през 1837 г. в труда си „Изследвания за


вероятностните съждения”, като означава:

p1  p 2  p3  ....  p n
p = , където „к” е броят на урните.
k

Теоремите на Бернули и Поасон са свързани с алтернативната


изменчивост на разглежданите събития, но в действителност признаците, по
които се изучава дадено събитие, имат повече от две значения. Това
обстоятелство е изразено математически с теоремата на Чебишев (1821 -
1894), от която произтича, че ако средната на генералната съвкупност от
изучавани случаи по определен признак е  , а средната на извадковата
съвкупност - x , то вероятността на абсолютната разлика | x -  | да бъде по-
малка от произволно избрано число  , ще клони към 1 при увеличаване на
обема на извадката n (Пасхавер, 1974, с. 40 - 42; Сугарев, Христова, Бонев,
1970, с. 565; Гатев, 1991, с. 182).

imP| x | 1


n
С продължаване на математическия анализ на закона за големите
числа се доказва, че не само средната величина, но и нейното разпределение,
както и разпределението на отклоненията от средната, се формират в
масовите процеси под влияние на причини в самото явление (Пасхавер,
1974).
Закономерността за приближаването на разпределението на
извадковите средни към нормалното разпределение с увеличаване на обема
на извадките е обобщена в теоремата на Ляпунов (1857 - 1918) и се нарича
централна пределна теорема. При нейното дефиниране математическият
израз определя общите и необходими условия, в съответствие с които
разпределението на извадковите средни се приближава към нормалното при
достатъчно голям обем на извадките (даден предел), независимо от това как
се разпределят вероятностите на индивидуалните величини (единиците по
значенията на признака), от които са формирани извадковите средни.
Като се отчита обстоятелството, че извадковата средна величина се
явява случайна променлива величина, теоремата на Ляпунов може да се
формулира така: случайна променлива величина, състояща се от голям брой
взаимно независими слагаеми, сред които няма нито едно рязко отличаващо
се със своите колебания, има нормално разпределение (Пасхавер, 1974).
Практически Ляпунов доказва, че при достатъчно голям обем на
извадката и ограничен размер на дисперсията от генералната съвкупност
вероятността разликата между извадковата средна и средната на генералната
съвкупност да бъде в пределите на максималната грешка е равна на
плътността на вероятностите при нормалното разпределение:


z ) =
z z2
1 
P(| X - | e 2
dz .
2
n z

По този начин от теоремите на Бернули, Поасон и Чебишев,


разглеждащи и характеризиращи закона за големите числа по отношение на
честотите и средните, като естествено продължение, теоремата на Ляпунов
представя същия закон по отношение на закономерностите на разпределение
на случайната променлива.
Следват разработките на Марков (1856 - 1922) и Бернщайн (1880 -
1968), които доказват, че законът за големите числа се проявява при
определени условия и при взаимнозависими единични събития. В частност
Марков разпространява закона за нормално разпределение за зависими
величини и при условие, че връзката между тях намалява в размера на
тяхното отделяне една от друга и че вариацията на тези величини е
ограничена в определени предели.

Зависима/
резултатна
Променлива, изменението на която се обяснява чрез изменението на една
променлива
27. или няколко независими променливи. Статистическите модели я представят
като функция на независимите променливи.
Dependent/Response
variable
Извадка
Представителна част от случаите на генералната съвкупност, която се
28.
използва за оценка на характеристиките на генералната съвкупност.
Sample
Извадково
разпределение Разпределение на оценките от представителни случайни извадки,
29.
включващи определен брой единици.
Sampling distribution
Изместване,
отклонение на Разлика между оценката (резултат от представително извадково
30. оценката изследване) и параметъра на генералната съвкупност, при което същата е
извън интервала на доверителност.
Bias of estimator
31. Индекси  Същност: специфично конструирани измерители на относителни
различия по време, място, между фактически резултати и нормативи, на
Indices влиянието на отделни фактори върху тези различия.
 Видове:
- Динамични индекси на равнища: конструирани са във
връзка с необходимостта от измерване на общото изменение
на цените през определен период от време.
Агрегатен индекс на Етиен Ласпер (1871 г.): I p  q  
pq 1 0
.
0
p q 0 0

Агрегатен индекс на Херман Пааше (1874 г.): I p  q  


pq 1 1
.
1
p q 0 1

Индекси на Ласпер, представени като средна аритметична и


средна хармонична претеглени:
p1
p pq 0 0
;
 
0
I p  q0
p q 0 0

I p  q0  
pq 1 0

1
 p pq 1
1 0 .
p0

Забележка: Индексът на Пааше може да бъде представен по


същия начин. Известни са и още индекси, които по-малко се
използват в практиката:
Индекс на Еджуърт (1985 г.):

I p  q0  q1  
 p q 1 0  q1 
.
 p q 0 0  q1 

Индекс на Ирвинг Фишер:

Ip 
pq pq
1 1 1 0
.
p q p q
0 1 0 0

- Динамични индекси на обеми:


I p  p0  
q 1 p0
;
q 0 p0

I q  p1  
q 1 p1
.
q 0 p1

- Динамични индекси на маса:


I pq 
 p1q1 .
 p0 q0
- Връзка между индексите:
 p1q1   p1q0  q1 p0   1 1 :  1 0 ;
pq pq
 p 0 q 0  p 0 q0  q 0 p 0 p q p q 0 1 0 0

pq 1 1

 p q q p   p q : q p  ;
1 0 1 0 1 1 1 0

p q0 0  p q q p q p q p
0 0 0 0 0 1 0 0

pq 1 1

 p q q p   p q : q p  .
1 1 1 1 1 0 1 1

p q0 0  p q q p q p q p
0 1 0 1 0 0 1 0
Индексен факторен
Приложение на индексния метод за конкретно измерване на отделните
32. анализ
фактори върху интересуващото ни явление резултат.
Index factor analysis
Интегрален Изчислява се по формулата:
коефициент на   i   j  2
неравномерността KR  , където
33.  i2   2j
Integral coefficient of  i и  j са относителните дялове на сравняваните структури.
variability Коефициентът е нормиран в границите от 0 до 1.
Изчерпателно
статистическо
изучаване Обхваща всички единици (случаи) на генералната съвкупност, които
34.
притежават признаците на изучаване.
Comprehensive
statistical studying
Това е общото наименование на поредица характеристики, като:
децили - съвкупността се разделя на 10 равни части;
центили - съвкупността се разделя на 100 равни части;
квартили - съвкупността се разделя на 4 равни части.
Квантил
Най-често за аналитични цели се използват квартилите и тогава една от
35.
трите точки разделя наредените единици на четири равни части: първият
Quantile
квартил отрязва 25% от извадката и съвпада с 25-и процентил; вторият
квартил отрязва 50% от извадката и съвпада с медианата; третият квартил
отрязва 75% от извадката и съвпада със 75-и процентил.
Отбелязват се с Q1, Q2 и Q3 или с P25, P50, P75, т.е. като процентили.
Коефициент на Изчислява се по формулата:
вариацията 
V  100 , където:
36. x
Coefficient of  - средно квадратично отклонение;
variation x - средна аритметична величина.

Най-често се определя като група от лица, които се изследват през


Кохорта определен период от време. Това са родените в предварително дефиниран
37. отрязък от време, така че интересуващите ни характеристики на тази част от
Cohort населението могат да се наблюдават във всеки следващ временен (възрастов
период).
Коефициент на Равен на коефициента на корелация на втора степен ( r 2 ). Показва каква
детерминация част от вариацията на Y се дължи на различията в стойностите на Х, т.е. на
влиянието на изучавания фактор. Разликата до 1 се дължи на влиянието на
38.
Coefficient of други фактори, които не са включени в избрания модел за измерване на
determination корелационната зависимост.

Коефициент на Силата на корелационната зависимост се установява чрез коефициент на


корелация линейна корелация, който се изменя в границите от -1 до +1. Колкото
39. величината на коефициента е по-близо до нулата, толкова зависимостта е по-
Correlation слаба. Когато корелацията е нелинейна, силата на зависимостта се изразява
coefficient без положителен или отрицателен знак.
Широко разпространен метод за измерване на неравномерността е
методът, основаващ се на кривата на Лоренц и средната разлика на Корадо
Джини. Коефициентът на Джини е мярка за неравномерността на дадено
статистическо разпределение. Например: Нека се допусне, че съвкупност от
лица получават еднакви заплати. Тогава кривата за техния кумулативен
(натрупван) доход би изглеждала като правата линия на фигурата, означена
като „Линия на равномерното разпределение”. Това е теоретична постановка,
която не съществува в обществото, но обяснява смисъла на коефициента на
Джини и кривата на Лоренц.
Реалната постановка е, когато на абсцисата се намират равни относителни
дялове на лицата, получаващи определени (различни) относителни дялове от
съвкупната сума на заплатите. Съответно на ординатата се отчитат
относителните дялове от заплатите на всяка група лица. При това
обстоятелство се очертава крива, която визуално представя неравенството
между отделните групи лица по размера на техните заплати.
Цялата площ под правата линия (ограничена от нея, абсцисата и
ординатата) се приема за единица (или 100%). Коефициентът на Джини е
частта от тази площ и е нормиран в границите от 0 до 1 (или от 0 до 100%).
Коефициент на
неравномерността
на Лоренц - Джини
40.
Coefficient of
variability of Lorenz -
Gini

Когато е налице разпределение на единиците по децилни групи и


изследвания (метриран признак), коефициентът на Джини може да се изчисли
по формулата:
2 C J  1
GR  1  , където:
k
C j - кумулативни относителни дялове на признака по групите;
k - брой групи.

41. Коефициент на Коефициент на рангова корелация на Спирман    - използването на този


корелация на коефициент е коректно, когато:
ранговете на - двете променливи са рангово скалирани признаци;
Спирман - едната променлива е рангова, а другата - количествена. В такъв случай
предварително е необходимо количествената променлива да бъде
Correlation трансформирана в рангова скала. Изчислява се по формулата:
coefficient of of the 6 d 2
  1
ranks of Speerman 
N N 2 1  , където:
d - разлика между ранговете на двата статистически реда;
N - брой на двойките рангове.
Коефициентът на рангова корелация на Спирмън има голямо приложение
в спортните игри, тъй като там спортният резултат е рангово скалиран.
За характеристика на съгласуваността на мненията и оценките на
експертите най-често се използва коефициент на конкордация (съгласие).
Коефициентът на конкордация се изменя от 0 (пълна несъгласуваност) до 1
(пълна съгласуваност). Изчислява се по формулата:
Коефициент на 12 d 2
конкордация W 
42. (съгласуваност) 
m2 n3  n  , където:
d - разликите между сумите на ранговете за всеки фактор и средната сума
Consistency на ранговете на един фактор;
m - брой експертни мнения;
n - брой фактори.
Коефициентът е нормиран в границите от 0 до 1. Съгласуваността на
групата се смята за висока при W ≥ 0.8.

Той се прилага при рангово скалирани признаци. Изчислява се по


Коефициент на формулата:
корелация на PQ
ранговете на Кендал  
N  N  1 , където:
43.
Kendall's Rank 2
Correlation P - брой на съответствията;
Q - брой на инверсиите.
Coefficient

Изчислява се по формулата:
Коефициент на ad  bc
асоциацията на Юл Q , където
ad  bc
44. a , b , c , d са честотите (броят на единиците) на комбинираните
Coefficient of
значения на двата признака, намиращи се в четирите клетки на таблицата.
association Yul
Нормиран е в границите от 0 до 1.
Медианата е значението на признака на единицата в статистическия ред,
която се намира в средата, ако единиците са подредени възходящо или
низходящо. Изчислява се от групирани данни по формулата:
  f 1  h
M e  LM e    C M e 1 
Медианa  2  f , където:
45.   Me
Median LM e - долна граница на медианната група;
C M e 1 - кумулативна честота на предмедианната група;
h - ширина на интервала в медианната група;
f M e - брой на единиците в медианната група.
Модата е най-често срещаното значение на признака в съвкупността.
Изчислява се от групирани данни по формулата:
f Mo  f M o 1 h
M o  LM o 
46.
Мода
f Mo  
 f M o 1  f M o  f M o 1  , където:
Mode f M o - брой на случаите в модалната група;
f M o 1 - брой на случаите в предмодалната група;
f M o 1 - брой на случаите в следмодалната група.
Изчисляват се по формулата:
  x  A
k
f
MA  , където
Моменти f
47. M A - момент от к-ти ред (к=1, 2, 3 и т.н.);
Moments f- честоти (брой случаи).
Когато: А=0, се получават начални моменти; А= x , се получават
централни моменти; вторият централен момент е равен на дисперсията -  2 .
Нисък квартил (1-
ви кварил) QL Нисък квартил е стойността на х, която надвишава една четвърт от
48.
измерванията и е по-малка от останалите три четвърти.
Lower quartile
Открито и описано от Карл Фридрих Гаус (1777 - 1855) и Пиер Симон
Лаплас (1749 - 1827). Кривата, описваща нормалното разпределение, е
идеално симетрична с релеф на камбана. Практическият смисъл на това
разпределение е свързан с централната пределна теорема и други теореми. От
тях следва, че каквото и да е разпределението в дадена генерална съвкупност,
при достатъчно голям брой извадки средните от изучавания признак на
единиците ще имат разпределение, което задоволително ще се апроксимира с
нормалното разпределение. Средната на извадките ще има нормално
разпределение с обща средна аритметична, равна на средната аритметична на
Нормално  02
разпределение генералната съвкупност, и дисперсия , т.е. n пъти по-малка от
49. n
дисперсията на генералната съвкупност (стандартното отклонение съответно
Normal distribution
0
е ). Тази ситуация създава големи възможности за анализ, и особено за
n
оценяване на параметрите на генералните съвкупности по характеристиките
на извадките.

За пръв път закономерността за приближението на разпределението на


извадковите средни към нормалното разпределение с увеличаване на обема на
извадките е обобщено в теоремата на Ляпунов (1857 - 1918) и се нарича
централна пределна теорема.
Номинална скала
50. Вж. „Статистическо скалиране”.
Nominal scale
Обща теория на
статистиката
Наука за познавателната същност и общите методологически и
51.
организационни основи на статистическото изучаване.
General Theory of
Statistics
Описателна
статистика
52. Занимава се с обобщаването на систематизирани данни.
Descriptive statistics
Опитна единица
53. Обект, от който се вземат измерванията.
Experimental unit
Прилага се за неметрирани статистически признаци, когато възможните
Ординална скала им определения изразяват различие в степента на дадено качество или
54. свойство на единиците на статистическата съвкупност. Например:
Ordinal scale разпределение на работниците по степента на тяхната квалификация - ниска,
средна и висока.
Оценител
Оценителят е алгоритъм, дефиниращ начина за изчисляване на оценка въз
55.
основа на информацията от извадково изследване.
Estimator

Величина, която представлява определена характеристика на генералната


съвкупност/популация. Тя обикновено е неизвестна и следователно
Параметър
подлежаща на оценяване. Параметърът на генералната съвкупност има
56.
фиксирана стойност. Чрез определена извадка и подходящ метод може да се
Parameter
оцени този параметър. Тъй като извадката е случайна, оценката е придружена
с определена стохастична грешка.

Поасоново Поасоновото разпределение се прилага при изследване на редица процеси


разпределение в областта на статистическия контрол на качеството, на масовото обслужване
57. и др., при които се наблюдава многократно повтаряне на определено събитие
The Poisson през определен интервал от време. Характерно за Поасоновото разпределение
distribution е това, че математическото очакване и дисперсията са равни помежду си.
Прекъснати
(дискретни или Това са вариационните признаци, чиито определения могат да бъдат само
дисконтинуитетни) цели числа. Такива признаци са например брой на членовете на
58.
признаци домакинството, брой на работниците, брой на живородените деца от една
жена и други.
Interrupted signs
Характеристика на обекта на изследване, която варира във времето.
Променливите могат да бъдат количествени и категорийни (качествени). От
своя страна, количествените променливи могат да
Променлива
бъдат дискретни или непрекъснати. Дискретните променливи са цели числа,
59.
отразяващи някаква бройка, например брой деца, а непрекъснати са
Variable
променливите, чиито стойности могат да бъдат всички възможни реални
числа в допустимия диапазон на променливата и обикновено се получават
при измерване на характеристики с апарати или при изчислителни процедури.
Прост случай
60. Събитие, което не може да бъде разложено, се нарича прост случай.
Simple event
Равномерно
разпределение Равномерно разпределение е това, при което честотите са еднакви за
61.
всички значения на признака.
Uniform distribution
62. Регресионен и  Същност - регресионният и корелационният анализ са методи за
корелационен изследване и измерване на връзки и зависимости от корелационен тип,
анализ когато всички променливи са представени на интервалната скала.
Зависимостите от корелационен тип в статистическите изследвания се
Regression Analysis разглеждат като „смутени” функционални зависимости, тъй като при
тях отсъства строго дефинираната функционална зависимост, която в
математиката има точно определен аналитичен и графичен вид.
 Основни задачи на регресионния анализ:
- Установяване на формата на зависимост;
- Определя се функцията на регресия;
- Оценяват се неизвестните значения на зависимата
променлива.

 Основни задачи на корелационния анализ:


- Избор на фактора (факторите), оказващ съществено
влияние върху резултативната променлива;
- Откриване на неизвестни причинни връзки;
- Измерване на силата (степента) на връзка между
променливите (Фëрстер и Рëнц, „Методы коррелационого и
регрессионного анализа”, 1983).
 Линеен вероятностен модел, който може да бъде записан в следния
вид:

y  a  bx
n 2 n
 

  y i  y i     y i   a  bx  
2

i 1   i 1

Неизвестните параметри а и в се намират чрез следната система


от уравнения:

 y  Na  b x ;
 yx  a  x  b x 2
, откъдето следва:

b
 xy  N x y
;
x  Nx 2 2

a  y  bx .

Така изчислените неизвестни параметри се заместват в


изходното уравнение, за да се изчислят последователно стойностите за

y.

За да се изчисли коефициентът на корелация r , е необходимо


да се оценят стандартната грешка Sy 2 и общата дисперсия  y :
2
  y  y  ;

S y2 
N

  y  y
2

 2
y  .
N

Коефициентът на корелация (на Пирсън) се изчислява по


формулата:

S y2
r  1 ,
 y2

където коефициентът на корелация е нормиран в границите:


 1  r  1 ; тези граници са валидни единствено и само когато
се използва линеен вероятностен модел.
Коефициентът на определение (детерминация) показва каква
част от вариацията на резултативната променлива се дължи на
вариацията на факторната променлива. Изчислява се, като
коефициентът на корелация се повдигне на квадрат - r 2 .

Връзката между коефициента на корелация и регресионните


коефициенти може да се изрази чрез релацията:
r b y / x * bx / y .

Като частен случай понякога се използва и коефициентът на


Браве за изчисляване на коефициента на корелация при линеен
вероятностен модел:

r
  x  x  y  y 
.
  x  x   y  y 
Забележка: Етимологията на линейния вероятностен модел
продължава с разработването на многофакторния регресионен
анализ и множествената корелация, които се използват често при
изследването на различни явления и процеси от по-сложен характер и
вид.

Реална съвкупност Реалната съвкупност е действително съществуваща съвкупност от


63. единици (случаи), които могат да се обхванат непосредствено в определени
Real aggregation териториални и времеви граници.

Регресионният анализ показва причинно-следствени връзки между една и


повече променливи. Можем да приемем повече променливи като независими
и да търсим тяхното влияние върху една зависима. Изследователят определя
Регресионен
кои променливи ще бъдат зависими и кои независими.
коефициент
64. При интерпретация, когато b >0, повишаването на значението на едната
променлива води до повишаване на значението на другата. Когато b <0,
Regression coefficient
повишаването на стойността на независимата води до понижаване на
стойността на зависимата.
Риск Термин, който означава вероятност за настъпване на някакво събитие с
65. отрицателен характер за човек или за определена група хора/явления и/или
Risk определен период от време.

Случайна
променлива Променливата x е случайна променлива, ако стойността, която приема,
66.
съответства на резултата от опита (шанс или случайно събитие).
Random variable
Средната аритметична величина е една от най-приложимите
статистически величини в ежедневната отчетна дейност. Чрез нея могат да се
осредняват равнища, обеми и маси и да се проследи изменението им във
времето. Средната аритметична величина се използва за осредняване на
вариационни статистически редове. Непретеглената средна аритметична
величина се изчислява по следната формула:

Средна
аритметична където:
67. величина е средната аритметична величина;

The arithmetic mean са значенията на признака, по които се прави осредняването при


i = 1, 2, 3,..., N;
N е обемът на изучаваната съвкупност, включващ единиците, попадащи в
нея.
Средна аритметична претеглена се изчислява по формулата:
n

x i fi
x i 1
n , където f i са честотите на изучавания признак.
f
i 1
i

Средната геометрична величина се използва главно за характеризиране на


средни темпове на развитие, като се използва формулата:
Средна геометрична Y
величина T  N 1 N ,
68. Y1
The geometric mean където:
YN - последният член в динамичния ред;
Y1 - първият член в динамичния ред.
69. Средна квадратична Средната квадратична величина е квадратен корен от средната
величина аритметична на квадратите на осредняваните величини. Тя няма
самостоятелно значение като обобщаваща характеристика на значенията на
Mean square value статистическите признаци. Използва се като форма за осредняване при
характеризиране на вариацията.
Непретеглената средна квадратична величина се изчислява по формулата:

Претеглената средна квадратична величина се изчислява по формулата:


Средната хармонична величина служи за осредняване на такива величини,
които се намират в обратнопропорционална връзка с определено свойство.
Нейното приложение при статистическия анализ трябва да бъде логически
обосновано при всеки конкретен случай.
Непретеглена:
Средна хармонична
величина
70.
Harmonic mean Претеглена:

Средна
хронологична Средната хронологична величина по своята същност е средна
величина аритметична, приложена спрямо динамични (хронологични) редове. Тя
71.
изразява общото, типичното и закономерното в размера на явленията,
Mean chronological представени чрез динамични редове, за определени периоди от време.
value
Средното аритметичното отклонение е средна аритметична величина,
изчислена от абсолютните отклонения на осредняваните величини от тяхната
средна аритметична.
Непретеглено: Претеглено:
Средно N N

72.
аритметично
отклонение
 xi  x
. x i x
 i 1
 i 1
,
N N

Average deviation f i 1

където f =
N.
Средното квадратично (стандартно) отклонение е средна квадратична
величина, изчислена от отклоненията на осредняваните величини от средната
им аритметична.
Средно квадратично
Непретеглено: Претеглено:
(стандартно)
отклонение
x 
N

  x  x
73. N
2
x f
2

i i
Mean square . 2  i 1
2  i 1
N ,
(standard) deviation N
f
i 1
където  = f N.
74. Статистическа
закономерност
Статистическите закономерности визират масовите явления и процеси. Те
Statistical regularity се проявяват при повторяемост на наблюденията, без да се спазват условията
за идентичност на резултатите.
За разлика от статистическите закономерности динамичните
закономерности визират единичните явления и процеси, дефинирани в
границите на определен опит или експеримент, в който се проявяват
класически, фундаментални научни резултати. Резултатите могат да бъдат
идентични единствено и само когато се спазват условията при провеждане на
опита или експеримента.
Статистически Под статистически метод се разбира специфичен подход към разкриване
метод и опознаване на конкретно проявление на статистическите закономерности в
75.
масовите явления.
Statistical method
Единиците (случаите), чрез които се проявяват закономерностите на
Статистически
изучаваното масово явление и чиято общност образува статистическата
единици
76. съвкупност, се наричат статистически единици. Статистическите единици,
или както още се наричат, единици на статистическата съвкупност, са
Statistical units
отделни, елементарни, конкретни и неделими.
Статистическата съвкупност е основно понятие в теорията на
статистиката. Статистическата съвкупност е общност от единици (случаи),
чрез които се проявява дадено масово явление, изучавано по статистически
Статистическа път. Всяка статистическа съвкупност е еднородна по същество и се определя
съвкупност от естеството на самото масово явление или от аспекта на неговото
77.
статистическо изучаване. Статистическата закономерност и обобщаващите
Statistical aggregation характеристики на масовите явления имат определен териториален и
временен обсег и затова статистическите съвкупности, които те
характеризират, винаги трябва да бъдат териториално и времево
разграничени. Статистическите съвкупности са моментни и периодни.
Статистически Статистическите величини са числови характеристики на масовите
величини явления. Едни са непосредствен продукт на статистическото наблюдение,
78.
други - на статистическата групировка, а трети се получават чрез прилагане
Statistical value на различни по сложност методи за анализ.
Статистическите единици притежават определени белези, свойства,
Статистически качества и особености, от които при статистическото наблюдение и обработка
признаци на информацията се получават синтезирани характеристики на
79.
статистическите разпределения. Делят се основно на две групи: вариационни
Statistical indicators - значенията им се дефинират с мерна единица; и категорийни - значенията
им се дефинират словесно.
Прилагането на статистическите методи предполага използването на скали
за значението на признаците, по които се разпределят статистическите
Статистическо
единици. Най-често използваните скали са: номинална, включваща
скалиране
80. категорийни значения на признаците, без ранжиране; рангова, включваща
пореден номер като значение на признака; ординална, включваща
Statistical scaling
категорийни значения на признака с ранжиране (степенуване); интервална,
включваща метрирани значения на признака.
81.
Въведение

Статистически  Същност: статистическото изследване на закономерностите на развитие се


анализ на развитие осъществява чрез анализа на динамични редове от данни, които
представляват хронологично подредени числа, резултат от определени
статистически изследвания.
Statistical analysis of  Изискванията за построяване на динамични редове са:
development - Съпоставимост по време;
- Съпоставимост по място;
- Съпоставимост по обхват;
- Съпоставимост по методология;
- Съпоставимост по мярка.

 Видове динамични редове:


- Периодни;
- Моментни: с равно широки интервали; с различно широки
интервали.

 Компоненти на развитие:
- Тренд: формира се под влияние на трайно действащи
причини, непроменящи силата и посоката на въздействие;
- Сезонни колебания: формират се под влияние на трайно
действащи причини, променящи силата и посоката на
въздействие със смяната на годишните времена;
- Циклични колебания: формират се под влияние на трайно
действащи причини, променящи силата и посоката на
въздействие със смяната на определен цикъл през определен
период от време;
- Несистематични колебания: формират се под влияние на
временно действащи причини, които понякога имат случаен
характер.

Описание на общото развитие

- Среден абсолютен обем при периодни редове:


y
 yi - непретеглен;
N
n

yt i i
y i 1
n - претеглен.
t
i 1
i

- Среден абсолютен обем при моментни редове:


n 1
y  yn
 yi  1
2 - с равно широки интервали от време;
y  i 2
N 1

yt y t
i i i i 1

y n 1
- с различно широки интервали от време.
2 t i
i 1

- Темпове на растеж: при постоянна база (получават се чрез


умножение на верижни индекси); при верижна база (получават
се чрез деление на индекси с постоянна база).
- Темпове на прираст:
y n  y1
 или
y1

yn
 100  100 .
y1

- Средногеометричен темп на развитие:


y
T  n 1 n .
y1

Статистическо изследване на тенденцията - методи

- Изглаждане посредством средния прираст:


а) определяне на прирастите за отделните периоди:
 1  y 2  y1
 2  y3  y 2
.....................
 N 1  y N  y N 1

б) определяне на средния прираст:

1   2   3  ...   N 1 y N  y1
 
N 1 N 1

в) получаване на изгладените стойности:



y 1  y1
 
y 2  y1  
 
y3  y 2  
.......................
  
y N  y N 1    y 1   N  1 

- Изглаждане посредством средния темп:


а) изчисляване на T ;
б) получаване на изгладените стойности:

y1  y1

y 2  y1 T

y 3  y2 T
.................
 
y N  y N 1 T

- Изглаждане по метода на верижните средни (осредняване на 3


или 5 стойности от динамичния ред)
- Аналитичен метод за изглаждане - модел на права линия:

y  a  bt

b
 yt  N yt
 t  Nt
2 2

a  y  bt

Статистическо изучаване на сезонни колебания

 Същност: При статистическото изследване на сезонните колебания


основната цел е да се открои релефно сезонната компонента в
динамичния ред. За целта се използват следните методи за отстраняване
на тренда и случайните колебания:
- Метод на обикновените (прости) средни аритметични:
методът е приложим, когато в динамичния ред, съдържащ
данни по месеци, се наблюдават относително устойчиви
колебания, но по години не се очертава тенденция на
увеличение или понижение. Когато няма сезонни колебания,
размерът на изследваното явление се колебае около
постоянен размер, измерен чрез средната аритметична. Ако
има сезонни колебания, след елиминиране на случайните
отклонения размерът на изследваното явление ще се колебае
постоянно по месеци от средния размер. Случайните
колебания се елиминират, когато се използва информация по
месеци за 3 и повече години. При използване на този метод
се извършват следните изчислителни процедури:
а) изчисляване на средни по месеци:

yi 
y i
;
k

б) изчисляване на общата средна:

y 1  y 2  y 3  ...  y 12
y ;
12

в) изчисляване на показателите, характеризиращи


сезонните колебания:

Si  y i  y - абсолютни сезонни колебания;

yi  y
S i%  100 - относителни сезонни колебания;
y

yi
is  - индекси на сезонни колебания.
y

- Метод на отношенията на фактическите към изгладените


стойности. Чрез него се елиминира влиянието на трайната
тенденция, ако тя се проявява през годините, както следва:
а) изчисляват се изгладените стойности по месеци по
метода на плъзгащите се средни:
 1 / 2 y1  y 2  y 3  y 4  1 / 2 y13
y7  и т.н.
12
б) изчисляване на разликите между фактически и
изгладени стойности:

S i  y i  y i - абсолютни разлики;


yi  y i
Si%   - относителни разлики;
yi

yi
is%  
100 - индекси.
yi

в) Изчисляване на средна аритметична по месеци, за да


се получат 12 характеристики, представящи сезонните
колебания, както следва:

  y 

 yi 
i
Si  
k 1

 

 yi  y i 
   
yi 
S i%   100
k 1

yi
 
yi , където
i i%  100
k 1
k - брой години.

Съотношение между Емпиричната формула за съотношението между средните величини е:


средни величини 2x  M o
Me  .
82. 3
Ratio between Формулата може да се преобразува спрямо x и M O като уравнение с
averages едно неизвестно.
Общата теория на статистиката е наука за познавателната същност и
общите методологически и организационни основи на статистическото
изучаване. Общата теория на статистиката: изяснява същността,
възможностите и условията за приложение на статистическия метод като
Теория на специфичен подход за изследване на конкретното проявление на
статистиката закономерностите на масовите явления; разработва и усъвършенства общите
83.
принципи и правила за планиране, организиране и осъществяване на
Theory of Statistics статистическите изучавания; разработва общи статистически понятия като
специфицирани статистически отражения на действителността; разработва и
усъвършенства методите за получаване на конкретни обобщаващи числови
статистически характеристики с оглед на разкриването и интерпретирането
на статистическите закономерности.
Точен тест на
Тест за 2х2 крос таблици. Аналог на Хи квадрат тест, който се използва
Фишер
84. при малък брой наблюдения, когато в някои от клетките има по-малко от 5
случая.
Fisher's exact test
Фази на
статистическото
изучаване Три са фазите на статистическото изучаване: наблюдение; групировка и
85.
сводка; анализ.
Phases of the
statistical studying
86. Основните постановки, свързани със статистическата проверка на
хипотези, са:

Статистическа  Определение: „Хипотезата е някакво предположение (допускане)


проверка на относно формата или параметрите на една или повече случайни
хипотези: нулева и променливи величини, което може да се провери по статистически път
алтернативна т.е. по данни от извадка”.
хипотеза  Въведение:
- Видове хипотези: прости - дефинират се по отношение на
отделен параметър на статистическо разпределение; сложни -
представя се комбинация от няколко сложни и се дефинират по
Hypothesis, Null отношение на интервал, в който се намират оценките на множество
hypothesis, параметри; нулева (Но) - дефинира се като отсъствие на
Alternative закономерност; алтернативна (Н1) - дефинира се като наличие на
закономерност.
- Грешки при вземане на решение:

Решение да се приеме Вярна е:


Но Н1

Но Вярно Грешка от втори


род - 

Н1 Грешка от първи род - 


Вярно

- Статистически тест на хипотезата - сравняват се две


характеристики: емпирична - резултат от обработка на данни от
извадково статистическо изследване, включва влиянието както на
случайната, така и на закономерната компонента (Qem); теоретична -
таблична стойност, определяща границата на случайните влияния (Qт).
- Изводи: преминаването на границата на случайните влияния
предполага отхвърляне на Но и приемане на Н1 (Qem > Qт - наличие
на закономерност); обратното - не се преминава границата на
случайните влияния, което предполага, че не може да се отхвърли Но,
т.е. не се приема Н1 (Qem < Qт - отсъствие на закономерност).
- Критична област: съвкупност от всички стойности на
емпиричната характеристика, за които Но се счита за
неправдоподобна.
- Зона на приемливите решения: съвкупност от всички
стойности на емпиричната характеристика, за които Но не може да
бъде отхвърлена и се счита за правдоподобна. В тази зона са включени
всички характеристики на Qт, които са резултат на случайни влияния.
- Мощност на критерия: определя се вероятността да бъде
потвърдена алтернативната хипотеза, когато точно тя е вярна.
- Избор на равнище на значимост  - зависи от степента на
последствията и загубите, свързани със стойността на грешките от
първи и втори род: когато отхвърлянето на вярна Но е по-скъпо
отколкото приемането на „грешна”, целесъобразно е да се избере по-
малка стойност за  , т.е. критичната област ще бъде с по-малка площ
и приемането на Но - по-сигурно; когато приемането на „грешна” Но е
по-скъпо отколкото отхвърлянето, целесъобразно е да се приеме по-
висока стойност за  , т.е. критичната област ще бъде с по-голяма
площ и приемането на Но ще бъде по-малко вероятно. Тези
разсъждения са валидни при условие, че е налице логика в
направените изводи и е премахната всякаква опасност от умишлено и
субективно манипулиране на резултатите от изследването.
Например: Изследва се разликата между параметрите на две
лекарства за язва. Едното се продава в аптеките, а другото е ново (с по-
ниска цена) и се тества по отношение на странични ефекти върху
човешкия организъм. Очевидно е, че трябва да се долови и най-
малката разлика между негативните параметри на двете лекарства, за
да бъде отхвърлена нулевата хипотеза (разширява се критичната
област). Тогава новото лекарство се отхвърля като опасно за здравето
на хората, или по-точно като по-опасно от старото, което се използва
за лекуване на язва, и, естествено, не трябва да се предлага за
продажба.
- Критична стойност на статистическия тест (определя се от
равнището на значимост  и е стойност от таблица, визираща
конкретно теоретично разпределение) - разделя критичната област от
областта на приемливите решения (вж. предходната графика).
- Едностранен и двустранен статистически тест: едностранният
се дефинира като площ отляво или отдясно на зоната за приемливи
решения; двустранният се дефинира като площ от двете страни на
зоната за приемливи решения. Така се определя и критичната област
на хипотезата. Това е пряко свързано и се предопределя от начина, по
който се дефинира Н1.

 Основни типове задачи са представени чрез статистическите тестове


за изчисляване на емпиричните характеристики, както следва:
- Проверка на хипотези за разлика между средна от извадка и
средна на генерална съвкупност, когато извадковата
съвкупност е по голяма (n>30).
x  0
z em 
s/ n

- Проверка на хипотези за разликата между две средни,


когато извадковите съвкупности са големи.
x1  x 2
z em 
 12  22

n1 n 2

- Проверка на хипотези за разлика между относителния дял


на генералната съвкупност и относителния дял от извадка,
когато съвкупността е голяма.
p  p0
z em 
p0 q0
n

- Проверка на хипотези за разликата между два относителни


дяла, когато извадковите съвкупности са големи.
p1  p 2
z em 
p1 q1 p 2 q 2

n1 n2

- Проверка на хипотези за разлика между две средни, когато


съвкупностите са малки.
x1  x 2 n1  n 2  2
t em 
1 
 2
1 
* n1   22 * n 2  
1

 n1 n 2 

Теоретичната характеристика се определя по таблица при следните


параметри:

  0.01или0.05
tT  
 f  n1  n2  2 
- Проверка на хипотези за разлика между две дисперсии от
две статистически разпределения:
 12
Fem 
 22

Теоретичната характеристика се определя по таблица при следните


параметри:

  .0 05 / .0 01 
FT  
 f1  n 1; f2  n2 1
87. Хи квадрат анализ  Същност на  2 - анализа - решава задачи при: проверка на формата на
разпределение (чрез тест, при който се сравняват емпирично и
теоретично разпределение); установяване на връзки и зависимости
между явленията. Прилага се, когато променливите са на номиналната
Chi-square analysis скала (значенията на признаците са дефинирани словесно).
 Етапи за приложение на  2 - анализа - решава задачи за установяване
на връзки и зависимости между явленията, представени в
статистическа таблица, в която случаите са разпределени по
номинални значения на признаците:
- Дефиниране на Н0 и Н1:
Н0: няма връзка между изследваните явления;
Н1: съществува закономерна връзка и зависимост.
- Фиксиране на равнище на значимост: примерно   0.05 .

- Определяне на метода за проверка:  2


 
f ij  f ijT* 
2

,
EM
f ijT
където:
f ij - фактически брой (честоти) случаи в клетките на таблицата;

*
- теоретичен брой (честоти) случаи в клетките на
f ijT
таблицата, при положение, че между изследваните явления не
съществува връзка и зависимост.
- Набавяне на необходимата информация, както следва:
а) изчисляване на теоретичната честота за всяка клетка от
таблицата:

f ijT* 
 f  f . j , където:
i.

 f ij

 f ij - общ брой случаи в таблицата;

f i. - общ брой случаи в даден ред на таблицата;

f .j - общ брой случаи в съответната колона на


таблицата.
б) изчисляване на емпиричната честота за всяка клетка от
таблицата чрез съотношението:

f ijem 
f ij  f ijT*  2

, където:
f ij* T

f ij - фактически брой случаи в клетките на таблицата;


*
f ijT - теоретичен брой случаи в клетките на таблицата;

- Изчисляване на емпиричната характеристика -  EM


2
.

- Определяне на критичната област: едностранна - ляво или


дясно; двустранна.
- Определяне на теоретичната характеристика от таблицата в
съответствие с параметрите:

  .0 05 
 2

 f  a 1b 1
, където:
T

aи b са съответно брой редове и колони от таблицата.

- Вземане на решения, като се сравняват емпиричната


 2
EM и теоретичната  T2 характеристика:

когато  EM
2
>  T2 : Н0 се отхвърля и се приема Н1;

когато  EM
2
<  T2 : Н0 се приема и се отхвърля Н1.

- Изчисляване на силата на връзката:

 EM
2
2  , където 0   2  1 .
 f ij

 EM
2

Коефициент на Чупров: T 
2
, където
 f ij  a  1 b  1
0  T  1. 2

 EM
2

Коефициент на Крамер: V 
2
, където
 f ij . min a  1 / b  1
0 V 2 1.

Забележка: При анализ на специфични явления и събития се


използват сумарни методи, при които многофакторните връзки и
зависимости са представени чрез измерители на номиналната или
ординалната скала. За целта се използват модифицирани форми на  2 -
метода.

Хипотетична
съвкупност
88. Съвкупност от безкраен брой единици.
Hypothetical
aggregation

Теория на извадковите изследвания


В раздела „Теория на извадковите изследвания” се включват основни понятия и термини от
теорията и практиката на извадковите изследвания, осъществявани от НСИ. Потребителите и
експертите, използващи статистическите данни (оценки), ще се запознаят с понятийния и
терминологичен апарат, който се използва при подготовката на инструментариума за провеждане на
извадковите изследвания, а също така и при анализа на получената информация. Представените
понятия и термини се включват в инструментариумите и анализите пряко (вербално описани) или
имплицитно при тяхното разработване. Този речник не претендира за изчерпателност и пълнота по
темата. Неговата основна цел е да приближи методолози, експерти, научни работници и потребители
до една материя, която е в сърцевината на теорията и практиката на извадковите изследвания.
1. Автокорелационни Наличие на времева компонента на зависимост, т.е. всеки
съвкупности елемент от статистическия ред да е корелиран с предходен.
Ако елементите са последователни, стъпката, наречена,
Autocorrelated populations „лаг”, е 1. Ако са през един, лагът е 2 и т.н.
2. Агрегиране (съвкупност) Статистически единици, групирани по определен признак
(признаци).
Aggregation
3. Административен Законово и нормативно определен източник на
източник информация, който се използва за целите на
статистическите изследвания.
Administered source
4. Актуализиране на данни Окончателни оценки от статистически изследвания към
определен момент. Актуализацията предполага предходен
вариант на данните. Първите данни не могат да бъдат
класифицирани като „актуализирани”. Например:
подобряване и допълване на съществуващите оценки за
Data update дадено явление към определен момент.
5. Анализ на данни Описание на дадено явление или процес по оценки от
проведено статистическо изследване. Завършва с конкретни
Data analysis изводи, заключения и хипотези.
6. Аналитична единица Обекти на статистически наблюдения.
Analytical unit
7. Аналитична рамка Предварително дефинирани ограничителни условия за
разработване на анализ на данни от статистически
Analytical framework наблюдения.
8. Аналитични изследвания Статистически изследвания на общественозначими явления
и процеси. Аналитичното изследване предполага модел на
връзки и зависимости. Осъществява се чрез приложение на
Analytical surveys статистически инструментариум.
9. База за записване Технически създадена специална система за отразяване на
информацията от проведени статистически изследвания.
Recording basis
10. Базисен период Период, определен за начален, с който се сравнява
последващото развитие на изучаваното явление.
Base period
11. Безвъзвратен подбор Подбор, при който веднъж избраните единици не участват в
следващи извадки.

Irretrievable selection

12. Без отговор Единица/и на статистическо изследване, от която (които) не


Non-response са получени желаните данни по една или друга причина.
13. Бенчмаркинг Белязана единица на статистическо наблюдение по
определено значение на даден признак. В много случаи се
Benchmarking използва като определен „стандарт”.
14. Биноминално Разпределение, при което единиците от статистическия ред
вероятностно са независими една от друга и могат да имат само две
разпределение стойности с еднаква вероятност.

Binominal probability
distribution
15. Биноминално Статистическо разпределение, при което единиците на
разпределение наблюдение се разпределят по определен признак с две
значения в зависимост от честотата на изпитанията.
Binominal distribution
16. Вариационен коефициент Характеристика на статистически ред, равна на частното от
средното квадратично отклонение, разделена на средната,

You might also like