Professional Documents
Culture Documents
Glossary NSI Osnovni-Poniatia
Glossary NSI Osnovni-Poniatia
практиката на НСИ
№ Термин Определение
Характеризира в абсолютни величини размера на изменение (развитие).
Абсолютен прираст Получава се като разлика между абсолютни размери на два периода
1. (момента). При динамичен ред могат да се изчислят абсолютни прирасти за
Аbsolute growth всеки период в сравнение с предходния (верижно).
Абсолютни
Абсолютните статистически величини изразяват размера на масовите
статистически
явления и процеси - общо и на техните съставни части. С тях се изразява
2. величини
общият обем на дадена статистическа съвкупност, на нейна част или
Absolute statistical
различията, които съществуват между броя на обхванатите единици.
values
Абсолютно Показва изменението в абсолютния прираст, т.е. дали се засилва, или
3. ускорение забавя скоростта на изменението (развитието), измерена в абсолютна
Аbsolute acceleration величина.
При това направление на статистическия анализ се получават обобщаващи
Анализ на
числови измерения за поредица статистически характеристики - средна,
разпределенията
4. медиана, мода, квантили, степента на вариация, разсейването и други. Въз
Analysis of the
основа на анализа се изучава динамиката и структурата на явленията и
distributions
процесите, обект на статистически наблюдения.
5. Анализ на Статистически анализ, който може да се разработи в няколко основни
развитието направления: да измери темповете и скоростта на развитие на дадено явление
(динамиката) или процес; да разкрие основните тенденции; да прогнозира най-вероятния
сценарий на развитие; да измери и опише връзките със събития и явления,
Analysis of the
които влияят косвено или пряко върху изследвания процес.
development
Аналитичен метод Метод, който се използва при изчисляването, синтезирането, графичното
6. представяне и логическото описание на статистически данни и показатели,
Analytical method характеризиращи дадено общественозначимо явление или процес.
Изчислява се по формулите:
S k1
x Mo
и S k2
3 x Me
, където:
x - средна аритметична;
M o - мода;
M e - медиана;
- стандартно отклонение.
Асиметрия Разпределението е асиметрично с дясно изтеглена крива, когато
7.
Asymmetry
стойностите на S k и S k са положителни, и обратно, за ляво изтеглена крива.
1 2
Вероятност за
събитие А
12. Честота на благоприятните случаи за сбъдване на събитие А.
Ptobability of an
event A
Вероятностно
разпределение Честотите на благоприятните случаи за сбъдване на дадено събитие при
13. поредица от опити. Например: разпределение на случаите за поразяване на
Probability мишена при 100 изстрела.
distribution
Висок квартил (UQ)
(трети квартил) Висок квартил е стойността на значението на признака, който разделя
14.
трети от четвърти квартил.
Upper quartile (UQ)
Временен ред Стойности от последователни наблюдения, подредени по определени
15. отрязъци от време. Например: доходи средно на домакинство по години и
Time series месеци.
Втори квартил
16. Вторият квартил е равен на медианата в статистическото разпределение.
Second quartile
Вторични
статистически Статистически изучавания, при които се използват сведенията за
изучавания единиците на статистическата съвкупност, събрани за нестатистически цели.
17.
Например: гражданската регистрация на населението, при която се събира
Secondary statistical информация за рождената дата, семейното положение и т.н.
studies
Общност от обекти (лица, предприятия, предмети и т.н.), които са обекти
на наблюдение и източник на определени данни за тях. В статистиката
генералната съвкупност се разглежда като изчерпателно множество от
Генерална единици, за които е събрана информация по определени признаци.
съвкупност, Информация за генералната съвкупност се получава при преброяванията на
18. популация населението и жилищния фонд. Генералната съвкупност е основата за
провеждане на извадкови изследвания по различни общественозначими теми.
Population При формирането на извадки от особена важност са дефинирането на
генералната съвкупност и дизайнът за осъществяването на извадката. При
тези обстоятелства извадката притежава статут за представителност при
оценяване на характеристиките на генералната съвкупност.
Гнездовата извадка е метод за формиране на случайна извадка. Това е
първата степен за излъчване на извадката. Гнездата съдържат единиците за
наблюдение, които се излъчват при следващата степен (процедура) по
определен начин, като се спазват условията за рандомизация (случаен подбор
Гнездова извадка
на единиците). Гнездовата извадка се използва при реализацията на дадено
19.
статистическо изследване с оптимален разход на средства, без това да се
Cluster sample
отрази върху точността на получаваните оценки. Същият ефект при равни
други условия може да се постигне и чрез формиране на проста случайна
извадка от единиците за наблюдение, но при забележимо по-висок разход на
средства.
Графичен метод
20. Метод за визуализация на данните от едно статистическо изследване.
Graphical method
Грешка на оценката се получава при представителните извадкови
Грешка на оценката
изследвания и включва: стохастична грешка, дължаща се на обстоятелството,
21.
че се наблюдава представителна част на генералната съвкупност;
Error of estimation
нестохастична грешка, дължаща се на получена недостоверна информация.
22. Дизайн ефект Загубата на ефективност чрез използването на гнездова извадка вместо
проста случайна извадка се нарича дизайн ефект. Изчислява се по формулата:
Design effect DEFF 1 n 1 , където:
- вътрешногнездова корелация по определени изследвани признаци на
единиците от извадката;
n - среден размер на гнездото.
Колкото DEFF е по-близо до 1, толкова по-добър е избраният дизайн на
извадката.
Н1: y1 y 2 y 3 ... y k .
M2
- Определяне на метода за проверка: FEM , където:
B2
M2 - междугрупова дисперсия;
B2 - вътрешногрупова дисперсия.
yi
y ij
;
ni
y
y ij
;
n i
- обща: SS O y ij y ; 2
- междугрупова: SS M y i y ;
2
- вътрешногрупова: SS B y ij y i ; 2
- спазване на условието: SS O SS M SS B .
y 2
y ni
2
M
i
- междугрупова;
k 1
y 2
y n е брой
2
B
ij
- вътрешногрупова, където
nk
случаи, k е броят на групите.
.0 05
FT f1 k 1 .
f2 n k
- Вземане на решения, като се сравняват емпиричната
FEM и теоретичната FT характеристика:
SS B
1 , където 0 1 .
SS O
m p1 p2 p3 ... pn
| |
n k
p1 p 2 p3 .... p n
p = .
k
p1 p 2 p3 .... p n
p = , където „к” е броят на урните.
k
z ) =
z z2
1
P(| X - | e 2
dz .
2
n z
Зависима/
резултатна
Променлива, изменението на която се обяснява чрез изменението на една
променлива
27. или няколко независими променливи. Статистическите модели я представят
като функция на независимите променливи.
Dependent/Response
variable
Извадка
Представителна част от случаите на генералната съвкупност, която се
28.
използва за оценка на характеристиките на генералната съвкупност.
Sample
Извадково
разпределение Разпределение на оценките от представителни случайни извадки,
29.
включващи определен брой единици.
Sampling distribution
Изместване,
отклонение на Разлика между оценката (резултат от представително извадково
30. оценката изследване) и параметъра на генералната съвкупност, при което същата е
извън интервала на доверителност.
Bias of estimator
31. Индекси Същност: специфично конструирани измерители на относителни
различия по време, място, между фактически резултати и нормативи, на
Indices влиянието на отделни фактори върху тези различия.
Видове:
- Динамични индекси на равнища: конструирани са във
връзка с необходимостта от измерване на общото изменение
на цените през определен период от време.
Агрегатен индекс на Етиен Ласпер (1871 г.): I p q
pq 1 0
.
0
p q 0 0
I p q0
pq 1 0
1
p pq 1
1 0 .
p0
I p q0 q1
p q 1 0 q1
.
p q 0 0 q1
Ip
pq pq
1 1 1 0
.
p q p q
0 1 0 0
I q p1
q 1 p1
.
q 0 p1
pq 1 1
p q q p p q : q p ;
1 0 1 0 1 1 1 0
p q0 0 p q q p q p q p
0 0 0 0 0 1 0 0
pq 1 1
p q q p p q : q p .
1 1 1 1 1 0 1 1
p q0 0 p q q p q p q p
0 1 0 1 0 0 1 0
Индексен факторен
Приложение на индексния метод за конкретно измерване на отделните
32. анализ
фактори върху интересуващото ни явление резултат.
Index factor analysis
Интегрален Изчислява се по формулата:
коефициент на i j 2
неравномерността KR , където
33. i2 2j
Integral coefficient of i и j са относителните дялове на сравняваните структури.
variability Коефициентът е нормиран в границите от 0 до 1.
Изчерпателно
статистическо
изучаване Обхваща всички единици (случаи) на генералната съвкупност, които
34.
притежават признаците на изучаване.
Comprehensive
statistical studying
Това е общото наименование на поредица характеристики, като:
децили - съвкупността се разделя на 10 равни части;
центили - съвкупността се разделя на 100 равни части;
квартили - съвкупността се разделя на 4 равни части.
Квантил
Най-често за аналитични цели се използват квартилите и тогава една от
35.
трите точки разделя наредените единици на четири равни части: първият
Quantile
квартил отрязва 25% от извадката и съвпада с 25-и процентил; вторият
квартил отрязва 50% от извадката и съвпада с медианата; третият квартил
отрязва 75% от извадката и съвпада със 75-и процентил.
Отбелязват се с Q1, Q2 и Q3 или с P25, P50, P75, т.е. като процентили.
Коефициент на Изчислява се по формулата:
вариацията
V 100 , където:
36. x
Coefficient of - средно квадратично отклонение;
variation x - средна аритметична величина.
Изчислява се по формулата:
Коефициент на ad bc
асоциацията на Юл Q , където
ad bc
44. a , b , c , d са честотите (броят на единиците) на комбинираните
Coefficient of
значения на двата признака, намиращи се в четирите клетки на таблицата.
association Yul
Нормиран е в границите от 0 до 1.
Медианата е значението на признака на единицата в статистическия ред,
която се намира в средата, ако единиците са подредени възходящо или
низходящо. Изчислява се от групирани данни по формулата:
f 1 h
M e LM e C M e 1
Медианa 2 f , където:
45. Me
Median LM e - долна граница на медианната група;
C M e 1 - кумулативна честота на предмедианната група;
h - ширина на интервала в медианната група;
f M e - брой на единиците в медианната група.
Модата е най-често срещаното значение на признака в съвкупността.
Изчислява се от групирани данни по формулата:
f Mo f M o 1 h
M o LM o
46.
Мода
f Mo
f M o 1 f M o f M o 1 , където:
Mode f M o - брой на случаите в модалната група;
f M o 1 - брой на случаите в предмодалната група;
f M o 1 - брой на случаите в следмодалната група.
Изчисляват се по формулата:
x A
k
f
MA , където
Моменти f
47. M A - момент от к-ти ред (к=1, 2, 3 и т.н.);
Moments f- честоти (брой случаи).
Когато: А=0, се получават начални моменти; А= x , се получават
централни моменти; вторият централен момент е равен на дисперсията - 2 .
Нисък квартил (1-
ви кварил) QL Нисък квартил е стойността на х, която надвишава една четвърт от
48.
измерванията и е по-малка от останалите три четвърти.
Lower quartile
Открито и описано от Карл Фридрих Гаус (1777 - 1855) и Пиер Симон
Лаплас (1749 - 1827). Кривата, описваща нормалното разпределение, е
идеално симетрична с релеф на камбана. Практическият смисъл на това
разпределение е свързан с централната пределна теорема и други теореми. От
тях следва, че каквото и да е разпределението в дадена генерална съвкупност,
при достатъчно голям брой извадки средните от изучавания признак на
единиците ще имат разпределение, което задоволително ще се апроксимира с
нормалното разпределение. Средната на извадките ще има нормално
разпределение с обща средна аритметична, равна на средната аритметична на
Нормално 02
разпределение генералната съвкупност, и дисперсия , т.е. n пъти по-малка от
49. n
дисперсията на генералната съвкупност (стандартното отклонение съответно
Normal distribution
0
е ). Тази ситуация създава големи възможности за анализ, и особено за
n
оценяване на параметрите на генералните съвкупности по характеристиките
на извадките.
i 1 i 1
y Na b x ;
yx a x b x 2
, откъдето следва:
b
xy N x y
;
x Nx 2 2
a y bx .
S y2
N
y y
2
2
y .
N
S y2
r 1 ,
y2
r
x x y y
.
x x y y
Забележка: Етимологията на линейния вероятностен модел
продължава с разработването на многофакторния регресионен
анализ и множествената корелация, които се използват често при
изследването на различни явления и процеси от по-сложен характер и
вид.
Случайна
променлива Променливата x е случайна променлива, ако стойността, която приема,
66.
съответства на резултата от опита (шанс или случайно събитие).
Random variable
Средната аритметична величина е една от най-приложимите
статистически величини в ежедневната отчетна дейност. Чрез нея могат да се
осредняват равнища, обеми и маси и да се проследи изменението им във
времето. Средната аритметична величина се използва за осредняване на
вариационни статистически редове. Непретеглената средна аритметична
величина се изчислява по следната формула:
Средна
аритметична където:
67. величина е средната аритметична величина;
x i fi
x i 1
n , където f i са честотите на изучавания признак.
f
i 1
i
Средна
хронологична Средната хронологична величина по своята същност е средна
величина аритметична, приложена спрямо динамични (хронологични) редове. Тя
71.
изразява общото, типичното и закономерното в размера на явленията,
Mean chronological представени чрез динамични редове, за определени периоди от време.
value
Средното аритметичното отклонение е средна аритметична величина,
изчислена от абсолютните отклонения на осредняваните величини от тяхната
средна аритметична.
Непретеглено: Претеглено:
Средно N N
72.
аритметично
отклонение
xi x
. x i x
i 1
i 1
,
N N
Average deviation f i 1
където f =
N.
Средното квадратично (стандартно) отклонение е средна квадратична
величина, изчислена от отклоненията на осредняваните величини от средната
им аритметична.
Средно квадратично
Непретеглено: Претеглено:
(стандартно)
отклонение
x
N
x x
73. N
2
x f
2
i i
Mean square . 2 i 1
2 i 1
N ,
(standard) deviation N
f
i 1
където = f N.
74. Статистическа
закономерност
Статистическите закономерности визират масовите явления и процеси. Те
Statistical regularity се проявяват при повторяемост на наблюденията, без да се спазват условията
за идентичност на резултатите.
За разлика от статистическите закономерности динамичните
закономерности визират единичните явления и процеси, дефинирани в
границите на определен опит или експеримент, в който се проявяват
класически, фундаментални научни резултати. Резултатите могат да бъдат
идентични единствено и само когато се спазват условията при провеждане на
опита или експеримента.
Статистически Под статистически метод се разбира специфичен подход към разкриване
метод и опознаване на конкретно проявление на статистическите закономерности в
75.
масовите явления.
Statistical method
Единиците (случаите), чрез които се проявяват закономерностите на
Статистически
изучаваното масово явление и чиято общност образува статистическата
единици
76. съвкупност, се наричат статистически единици. Статистическите единици,
или както още се наричат, единици на статистическата съвкупност, са
Statistical units
отделни, елементарни, конкретни и неделими.
Статистическата съвкупност е основно понятие в теорията на
статистиката. Статистическата съвкупност е общност от единици (случаи),
чрез които се проявява дадено масово явление, изучавано по статистически
Статистическа път. Всяка статистическа съвкупност е еднородна по същество и се определя
съвкупност от естеството на самото масово явление или от аспекта на неговото
77.
статистическо изучаване. Статистическата закономерност и обобщаващите
Statistical aggregation характеристики на масовите явления имат определен териториален и
временен обсег и затова статистическите съвкупности, които те
характеризират, винаги трябва да бъдат териториално и времево
разграничени. Статистическите съвкупности са моментни и периодни.
Статистически Статистическите величини са числови характеристики на масовите
величини явления. Едни са непосредствен продукт на статистическото наблюдение,
78.
други - на статистическата групировка, а трети се получават чрез прилагане
Statistical value на различни по сложност методи за анализ.
Статистическите единици притежават определени белези, свойства,
Статистически качества и особености, от които при статистическото наблюдение и обработка
признаци на информацията се получават синтезирани характеристики на
79.
статистическите разпределения. Делят се основно на две групи: вариационни
Statistical indicators - значенията им се дефинират с мерна единица; и категорийни - значенията
им се дефинират словесно.
Прилагането на статистическите методи предполага използването на скали
за значението на признаците, по които се разпределят статистическите
Статистическо
единици. Най-често използваните скали са: номинална, включваща
скалиране
80. категорийни значения на признаците, без ранжиране; рангова, включваща
пореден номер като значение на признака; ординална, включваща
Statistical scaling
категорийни значения на признака с ранжиране (степенуване); интервална,
включваща метрирани значения на признака.
81.
Въведение
Компоненти на развитие:
- Тренд: формира се под влияние на трайно действащи
причини, непроменящи силата и посоката на въздействие;
- Сезонни колебания: формират се под влияние на трайно
действащи причини, променящи силата и посоката на
въздействие със смяната на годишните времена;
- Циклични колебания: формират се под влияние на трайно
действащи причини, променящи силата и посоката на
въздействие със смяната на определен цикъл през определен
период от време;
- Несистематични колебания: формират се под влияние на
временно действащи причини, които понякога имат случаен
характер.
yt i i
y i 1
n - претеглен.
t
i 1
i
yt y t
i i i i 1
y n 1
- с различно широки интервали от време.
2 t i
i 1
yn
100 100 .
y1
1 2 3 ... N 1 y N y1
N 1 N 1
b
yt N yt
t Nt
2 2
a y bt
yi
y i
;
k
y 1 y 2 y 3 ... y 12
y ;
12
yi y
S i% 100 - относителни сезонни колебания;
y
yi
is - индекси на сезонни колебания.
y
yi y i
Si% - относителни разлики;
yi
yi
is%
100 - индекси.
yi
y
yi
i
Si
k 1
yi y i
yi
S i% 100
k 1
yi
yi , където
i i% 100
k 1
k - брой години.
0.01или0.05
tT
f n1 n2 2
- Проверка на хипотези за разлика между две дисперсии от
две статистически разпределения:
12
Fem
22
.0 05 / .0 01
FT
f1 n 1; f2 n2 1
87. Хи квадрат анализ Същност на 2 - анализа - решава задачи при: проверка на формата на
разпределение (чрез тест, при който се сравняват емпирично и
теоретично разпределение); установяване на връзки и зависимости
между явленията. Прилага се, когато променливите са на номиналната
Chi-square analysis скала (значенията на признаците са дефинирани словесно).
Етапи за приложение на 2 - анализа - решава задачи за установяване
на връзки и зависимости между явленията, представени в
статистическа таблица, в която случаите са разпределени по
номинални значения на признаците:
- Дефиниране на Н0 и Н1:
Н0: няма връзка между изследваните явления;
Н1: съществува закономерна връзка и зависимост.
- Фиксиране на равнище на значимост: примерно 0.05 .
,
EM
f ijT
където:
f ij - фактически брой (честоти) случаи в клетките на таблицата;
*
- теоретичен брой (честоти) случаи в клетките на
f ijT
таблицата, при положение, че между изследваните явления не
съществува връзка и зависимост.
- Набавяне на необходимата информация, както следва:
а) изчисляване на теоретичната честота за всяка клетка от
таблицата:
f ijT*
f f . j , където:
i.
f ij
f ijem
f ij f ijT* 2
, където:
f ij* T
.0 05
2
f a 1b 1
, където:
T
когато EM
2
> T2 : Н0 се отхвърля и се приема Н1;
когато EM
2
< T2 : Н0 се приема и се отхвърля Н1.
EM
2
2 , където 0 2 1 .
f ij
EM
2
Коефициент на Чупров: T
2
, където
f ij a 1 b 1
0 T 1. 2
EM
2
Коефициент на Крамер: V
2
, където
f ij . min a 1 / b 1
0 V 2 1.
Хипотетична
съвкупност
88. Съвкупност от безкраен брой единици.
Hypothetical
aggregation
Irretrievable selection
Binominal probability
distribution
15. Биноминално Статистическо разпределение, при което единиците на
разпределение наблюдение се разпределят по определен признак с две
значения в зависимост от честотата на изпитанията.
Binominal distribution
16. Вариационен коефициент Характеристика на статистически ред, равна на частното от
средното квадратично отклонение, разделена на средната,