Professional Documents
Culture Documents
1
22
20
18
16
Брой студенти
14
12
10
8
6
4
2
0
2 3 4 5 6
Оценка
x .f
j 1
j j
2.4 3.8 4.18 5.20 6.10 264
x 4,4
k
4 8 18 20 10
f
60
j
j 1
Таблица 2
Работна таблица за междинни изчисления
Брой
Оценка
𝑥𝑗
студенти 𝑥𝑗 . 𝑓𝑗 C xj x xj x
2
xj x .f j
2
𝑓𝑗
2 4 8 4 -2,40 5,76 23,04
3 8 24 12 -1,40 1,96 15,68
4 18 72 30 -0,40 0,16 2,88
5 20 100 50 0,60 0,36 7,20
6 10 60 60 1,60 2,56 25,60
Общо 60 264 74,40
За да намерим медианата е необходимо да определим кой от студентите
заема централна позиция в изследвания статистически ред, тъй като носител на
медианната стойност е средният член на реда. Намирането на средния член при
дискретен вариационен ред се установява по следния начин:
k
f
j 1
j 1
60 1
Median position = 30,5
2 2
При четен брой на реда, както е в случая (60 студента), два члена заемат
k
f
j 1
j
60
централно място. Това са студенти с номера съответно 30 и
2 2
k
f
j 1
j
60
1 1 31 . Медианата се изчислява като полусума от значенията на тези
2 2
две централни единици на реда. Чрез кумулативните честоти (колона “C” в
таблица 2.) се установява, че двете централни единици на реда - студентите с
номера 30 и 11 са поставили оценка на преподаването по статистика съответно 4
45
и 5. Следователно Me 4,5 .
2
Модата е средна, чиято величина е равна на най-често срещаната стойност
на признака в статистическия ред. При дискретен вариационен ред, какъвто е
3
редът за студентите, разпределени по оценките, които са поставили за
преподаването по статистика, модата е равна на онази стойност на признака,
която има най-голяма честота. Студентите най-често са поставяли оценка 5 на
преподаването по статистика (20 студента са поставили оценка 5). Следователно
модата има стойност 5.
3. Установяване на вариацията чрез изчисляване на средно
квадратично (стандартно) отклонение
Средният размер на квадрата на отклоненията на значенията на признака
от средната величина се установява чрез средно квадратичното (стандартно)
отклонение. Използва се формулата:
x
k
2
j x .fj
j 1
s k
f
j 1
j 1
x
k
2
j x .fj
j 1 74,4
s 1,12
k
60 1
f
j 1
j 1
4
Относителният размер на вариацията по отношение на средната оценка
25,45%.
4. Установяване на асиметрията чрез изчисляване на коефициент на
асиметрия на Пирсън
Степента на отклонение на емпиричното от нормалното разпределение се
установява чрез показателите за асиметрия. Асиметрията (отклонението на
емпиричното разпределение от симетричното разпределение) се измерва чрез
коефициент на асиметрия на Пирсън. Той се изчислява по формулата:
x Mo
Kp
s
4,4 5
Kp 0,54
1,12
1. Построяване на хистограма
Емпиричното разпределение на студентите по признака “Разходи за
покупка на учебна литература през текущия семестър” може да се представи
графично чрез хистограма. Графичното изображение се построява, като на
абцисата се нанасят значенията на признака разходи, а на ординатата – честотите
(брой студенти). Хистограмата е плоскостна стълбовидна диаграма.
От построената хистограма на разпределението (фиг. 2) се вижда, че
емпиричното разпределение на студентите по разходи за покупка на учебна
литература през текущия семестър има отрицателна асиметрия.
9
8
7
Брой студенти
6
5
4
3
2
1
0
до 10 над 10 до 20 над 20 до 30 над 30 до 40 над 40
Разходи за покупка на учебна литература (лева)
6
2. Установяване на средните величини чрез изчисляване на средна
аритметична, медиана и мода
За изчисляването на средния размер на разходите за покупка на учебна
литература през текущия семестър на студентите се използва средна
аритметична претеглена величина, тъй като данните са групирани.
k
x
j 1
j fj
x k
f j 1
j
x
j 1
j fj
575
x k
=25 лева
f
23
j
j 1
Таблица 4
Работна таблица за междинни изчисления
Разходи
(лева)
Брой
студенти
𝑥𝑗 𝑥𝑗 . 𝑓𝑗 С xj x x j x
2
x j x . f j
2
𝑓𝑗
до 10 4 5 20 4 -20 400 1600
над 10 до 20 4 15 60 8 -10 100 400
над 20 до 30 5 25 125 13 0 0 0
над 30 до 40 8 35 280 21 10 100 800
над 40 2 45 90 23 20 400 800
Общо: 23 575 3600
7
Чрез медианата се установяват разходите за покупка на учебна литература
през текущия семестър на онзи студент, който се намира точно в центъра на
изследвания статистически ред. В конкретния случай статистическият ред за
студентите, разпределени по разходи е вариационен индискретен и се използва
следната формула:
k
f j 1
j 1 W
Me A C Me1 .
2 f
m
където:
Ме - медиана;
А - долна граница на интервала на медианата;
Сme-1 - кумулативно-прогресивни честоти до интервала на медианата;
W - ширина на интервала;
m – абсолютна честота на медианния интервал.
Интервалът на медианата се установява по следния начин:
k
f j 1
23 1
Median position = j 1
12
2 2
При нечетен брой на реда, както е в случая (23 студента), един член на
статистическия ред заема централно място. Това е студент номер 12. Чрез
кумулативните честоти (колона С от таблица 4) установяваме, че той се намира
в интервала над 20 до 30 лева. Заместваме във формулата за медианата:
23 1 10
Me 20 8 . = 28 лева
2 5
8
броят на студентите с разходи над 30 до 40 лева (8 студенти). След това
заместваме в следната формула:
f f 1 .W
Mo A
0
f 0 f 1 f 0 f 2
където:
Мо - мода;
А - долна граница на модалния интервал;
W - ширина на модалния интервал;
0 - честота на модалния интервал;
1 - честота на предмодалния интервал;
2 - честота на следмодалния интервал.
След заместване във формулата се получава:
M o 30
8 5.10 = 33,33 лева.
8 5 8 2
Средният размер на разходите за покупка на учебна литература през
текущия семестър на студентите, измерен чрез мода, е 33,33 лева.
От получените резултати за средния размер на разходите, измерен чрез
средната аритметична претеглена величина, медианата и модата, можем да
направим следния извод: x M e M o (25<28<33,33) следователно, емпиричното
разпределение на студентите по разходи за покупка на учебна литература през
текущия семестър има отрицателна асиметрия.
9
x
k
2
j x .fj
j 1
s k
f
j 1
j 1
11
k
x .f
j 1
j j
1.8 2.8 3.18 4.22 5.16 6.10 7.8 8.4 9.4 10.2 450
x 4,5 5посещения
k
8 8 18 22 16 10 8 4 4 2
f
100
j
j 1
където:
f j – честоти по групи;
k – брой групи;
x
k
2
j x .fj
j 1
s k
f
j 1
j 1
Таблица 6
12
Работна таблица за междинни изчисления
Брой Брой 𝑥𝑗 . 𝑓𝑗 xj x xj x
2
xj x .f j
2
посещения студенти
𝑥𝑗 𝑓𝑗
1 8 8 -3,5 12,25 98,0
2 8 16 -2,5 6,25 50,0
3 18 54 -1,5 2,25 40,5
4 22 88 -0,5 0,25 5,5
5 16 80 0,5 0,25 4,0
6 10 60 1,5 2,25 22,5
7 8 56 2,5 6,25 50,0
8 4 32 3,5 12,25 49,0
9 4 36 4,5 20,25 81,0
10 2 20 5,5 30,25 60,5
Общо 100 450 461,0
В условието на задачата е даден обемът на генералната съвкупност
N=10000 студенти и обемът на извадката n=100 студента. За намиране на среднта
стохастична (стандартна) грешка използваме формулата за безвъзвратен подбор:
s n 2,16 100
sx . 1 . 1 =0,21
n N 100 10000
4,09 4,91
Задача 4
По безвъзвратен метод е излъчена репрезентативна извадка на студентите
от втори курс. Извършена е групировка по признака “Време отделено за
самоподготовка по Статистика”.
Общият брой на обучаваните студенти е 2500.
Таблица 7
Време (часове) Брой студенти
до 20 2
над 20 до 30 8
над 30 до 40 20
над 40 до 50 30
над 50 до 60 38
над 60 2
Общо 100
Да се оценят:
1. Средна аритметична величина;
2. Средна стохастична (стандартна) грешка;
3. Максимална стохастична грешка при равнище на значимост α = 0,05;
4. Доверителен интервал на средната аритметична величина.
РЕШЕНИЕ:
1. Средна аритметична величина
За изчисляването на средното време, отделено за самоподготовка по
Статистика, на студентите се използва средна аритметична претеглена величина,
тъй като данните са групирани.
14
Формулата е предназначена за вариационни дискретни редове.
Следователно преди да я използваме е необходимо да преобразуваме
емпиричния ред от индискретен в дискретен чрез центриране. В първата и
последната група не е определена долната и съответно горната граница.
Необходимо е те да се определят така, че ширината на интервала да бъде същата,
както при останалите групи. В случая ширината на интервала е 10, следователно
за долна граница на първата група определяме 0, а за горна граница на
последната група 70. Необходимите изчисления за установяване на средното
време са поместени в таблица 8.
Таблица 8
Време
Брой 𝑥𝑗 𝑥𝑗 . 𝑓𝑗 xj x x j x
2
x j x . f j
2
студенти
(часове)
𝑓𝑗
до 20 2 15 30 -30 900 1800
над 20 до 30 8 25 200 -20 400 3200
над 30 до 40 20 35 700 -10 100 2000
над 40 до 50 30 45 1350 0 0 0
над 50 до 60 38 55 2090 10 100 3800
над 60 2 65 130 20 400 800
Общо: 100 4500 11600
k
x .f
j 1
j j
4500
x k
= 45 часа
f
100
j
j 1
където:
x - средна аритметична величина на извадката;
𝑥𝑗 - значения на признака по групи;
𝑓𝑗 – честоти по групи;
k – брой групи;
j – индекс за поредност на групите.
2. Средна стохастична (стандартна) грешка
15
Средното квадратично (стандартно отклонение), което ни е необходимо за
изчисляването на средната стохастична (стандартна) грешка, се установява чрез
формулата:
x
k
2
j x .fj
j 1
s k
f
j 1
j 1
16
x z.s x 1,96.1,06 = 2,08 часа
42,92 47,08
Задача 5
По безвъзвратен метод е излъчена репрезентативна извадка на студентите
от факултет “Информатика”. Извършена е групировка по алтернативния признак
“Удовлетвореност от оценката по Статистика”.
Общият брой на студентите, обучавани във факултет “Информатика” е
600.
Таблица 9
Удовлетвореност Брой студенти
от оценката
Да 38
Не 12
Общо 50
Да се оценят:
1. Относителния дял на студентите, удовлетворени от оценката по
статистика;
2. Средна стохастична (стандартна) грешка;
3. Максимална стохастична грешка при равнище на значимост α = 0,05;
17
4. Доверителния интервал на относителния дял на студентите,
удовлетворени от оценката по статистика.
РЕШЕНИЕ
1. Относителния дял на студентите, удовлетворени от оценката по
статистика
Относителният дял на студентите, които са удовлетворени от оценката по
статистика се намира по формулата:
k 38
p =0,76=76%
n 50
Относителният дял на студентите, които не са удовлетворени от оценката
по статистика (алтернативният относителен дял) е:
12
q =0,24=24%.
50
2. Средна стохастична (стандартна) грешка
Разполагаме с данни за общия брой на студентите, т.е. обема на
генералната съвкупност N= 600 студенти, следователно използваме формулата
за средна стохастична (стандартна грешка) при безвъзвратен подбор:
p.1 p n 0,76.1 0,76 50
sp . 1 . 1 =0,06
n N 50 600
64% P 88%
ТЕМА III. Корелационен анализ
Задача 6
Събрани са годишни данни за 10 предприятия от един отрасъл по
признаците “Разходи за реклама” и “Приходи от продажби”.
Таблица 10
№ на Разходи за Приходи от
предприятието реклама в млн. продажби
лв. в млн. лв.
1 1 8
2 3 10
3 2 11
4 2 11
5 2 6
6 1 5
7 4 15
8 4 12
9 1 7
10 5 15
Общо 25 100
Иска се:
Да се изследва зависимостта между разходите за реклама и приходите от
продажби чрез оценка и интерпретация на корелационния коефициент на Браве.
РЕШЕНИЕ
19
Зависимата променлива (следствието) yi са приходите от продажби, а
независимата променлива xi (факторът) са разходите за реклама. Формулата, по
която се намира корелационния коефициент на Браве е:
x x . y
n
i i y
r i 1
x x . y y
n n
2 2
i i
i 1 i 1
x i
25
x i 1
= 2,5 млн.лв.
n 10
n
y i
100
y i 1
=10 млн.лв.
n 10
Междинните изчисления, необходими за коефициента на корелация на
Браве са поместени в таблица 11.
Като се замести във формулата за коефициента на корелация на Браве, се
получава:
x
n
i x . yi y
39
r i 1
0,865
x
n n
18,50.110
x . y i y
2 2
i
i 1 i 1
Таблица 11
Работна таблица за междинни изчисления
Разходи за Приходи от
реклама продажби
(млн.лв.) ( x i x ) ( x i x ) ( yi y ) ( yi y ) ( xi x ).( yi y )
№ 2 2
(млн. лв.)
xi yi
1 1 8 -1,5 2,25 -2 4 3,0
2 3 10 0,5 0,25 0 0 0,0
3 2 11 -0,5 0,25 1 1 -0,5
20
4 2 11 -0,5 0,25 1 1 -0,5
5 2 6 -0,5 0,25 -4 16 2,0
6 1 5 -1,5 2,25 -5 25 7,5
7 4 15 1,5 2,25 5 25 7,5
8 4 12 1,5 2,25 2 4 3,0
9 1 7 -1,5 2,25 -3 9 4,5
10 5 15 2,5 6,25 5 25 12,5
Общо 25 100 0 18,50 0 110 39,0
21
№ на Разходи за Приходи от
предприятието реклама в млн. продажби
лв. в млн. лв.
1 1 8
2 3 10
3 2 11
4 2 11
5 2 6
6 1 5
7 4 15
8 4 12
9 1 7
10 5 15
Общо 25 100
Иска се:
Да се изследва зависимостта между разходите за реклама и приходите от
продажби чрез:
1. Построяване на корелограма;
2. Оценка на регресионните коефициенти b0 и b1 при условие, че се
използва модела yi 0 1.xi i ;
3. Оценка на коефициента на еластичност be1.
РЕШЕНИЕ
1. Построяване на корелограма
Графичното изображение на корелационната зависимост между приходите
от продажби и разходите за реклама е точкова диаграма и се нарича корелограма.
Определяме като зависима променлива (Yi) – приходите от продажби на
предприятията, а като независима променлива (фактор) - Xi – разходите за
реклама на предприятията.
22
16
12
10
0
0 1 2 3 4 5 6
Разходи за реклама (млн. лв.) - Xi
yi n.b0 b1 . xi
i 1 i 1
n n n
xi yi b0 . xi b1 . xi2
i 1 i 1 i 1
x .y i i n.x. y
289 10.2,5.10
b1 i 1
= 2,11
n
81 10.2,5 2
x i 1
2
i n.x 2
b0 y b1 .x =10-2,11.2,5 = 4,72
23
n
x i
100
x i 1
=10 млн.лв.
n 10
n
y i
25
y i 1
=2,5 млн.лв.
n 10
Таблица 13
1 1 8 8 1
2 3 10 30 9
3 2 11 22 4
4 2 11 22 4
5 2 6 12 4
6 1 5 5 1
7 4 15 60 16
8 4 12 48 16
9 1 7 7 1
10 5 15 75 25
Общо 25 100 289 81
24
ТЕМА V. Статистически анализ на динамични редове
Задача 8
Събрани са месечни данни за приходите от продажби на търговско
предприятие през текущата година:
Таблица 14
Приходи от
Месеци продажби
(млн. лв.)
I 10
II 8
III 10
IV 11
V 12
VI 11
VII 12
VIII 13
IX 12
X 16
Общо 115
Иска се:
Да се изследва динамиката на приходите от продажби чрез:
1. Изчисляване на темповете на растеж и темповете на прираст;
2. Изчисляване на средните темпове на растеж и средните темпове на
прираст.
РЕШЕНИЕ:
1. Изчисляване на темповете на растеж и темповете на прираст
Темповете на растеж показват колко пъти даден член на реда е по-голям
(по-малък) от друг член на реда.
Верижните темпове на растеж се получават като отношения между
последователни съседни двойки членове на инамичния ред:
yi y 8
Ta .100 2 .100 .100 =80%
yi 1 y1 10
yi y 10
Ta .100 3 .100 .100 =125%
yi 1 y2 8
25
yi y 11
Ta .100 4 .100 .100 =110%
yi 1 y3 10
yi y 12
Ta .100 5 .100 .100 =109,09%
yi 1 y4 11
yi y 11
Ta .100 6 .100 .100 =91,67%
yi 1 y5 12
y3 10
Tb .100 .100 =100%
y1 10
y4 11
Tb .100 .100 =110%
y1 10
y5 12
Tb .100 .100 =120%
y1 10
26
y6 11
Tb .100 .100 =110%
y1 10
y3 10
TPa .100 100 .100 100 =25%
y2 8
y4 11
TPa .100 100 .100 100 =10%
y3 10
y5 12
TPa .100 100 .100 100 =9,09%
y4 11
y6 11
TPa .100 100 .100 100 = -8,33%
y5 12
y3 10
TPb .100 100 .100 100 =0%
y1 10
y4 11
TPb .100 100 .100 100 =10%
y1 10
y5 12
TPb .100 100 .100 100 =20%
y1 10
y6 11
TPb .100 100 .100 100 =10%
y1 10
27
намаление. През останалите месеци се наблюдава увеличение на приходите от
продажби, като най-значително приходите са се увеличили през месец октомври
спрямо месец септември, когато те са нараснали с 33,33%. В сравнение с месец
януари на текущата година приходите от продажби намаляват през месец
февруари с 20%, а през месец март не се променят. През останалите месеци от
април до октомври приходите се увеличават спрямо месец януари. Най-
значително е увеличението им през месец октомври спрямо месец януари – с
60%.
2. Изчисляване на средните темпове на растеж и средните темпове на
прираст
С помощта на средния темп на растеж се измерва средномесечното
относително изменение на приходите от продажбиза целия изследван период.
yn 16
T n 1 .100 101 .100 =105,4%
y1 10
28
Задача 9
Събрани са месечни данни за приходите от продажби на търговско
предприятие през текущата година:
Таблица 16
Приходи от
Месеци продажби
(млн. лв.)
I 10
II 8
III 10
IV 11
V 12
VI 11
VII 12
VIII 13
IX 12
X 16
Общо 115
Иска се:
Да се изследва динамиката на приходите от продажби чрез:
1. Построяване на плоскостна и линейна диаграма на приходите от
продажби;
2. Построяване на аналитичен модел от вида yˆ i a0 a1 .t i ;
3. Прогноза за очакваните приходи от продажби през следващия месец,
основаваща се на аналитичния модел.
РЕШЕНИЕ
1. Построяване на плоскостна и линейна диаграма на приходите от
продажби
29
18
18
Приходи от продажби (млн. лв.)
16
y = 0,6x + 8,2
14
12
10
8
6
4
2
0
I II III IV V VI VII VIII IX X
Месец
30
динамичния ред е: yˆ i a0 a1 .t i . Параметрите на модела a0 и a1 се намират по
МНМК с помощта на система от две уравнения:
n n
y
i 1
i n.a0 a1. ti
i 1
n n n
y .t i i n. y.t
682 10.11,5.5,5
a1 i 1
=0,6
n
385 10.5,5 2
t i 1
i
2
n.t 2
a0 y a1 .t =11,5-0,6.5,5=8,2
n
y i
115
y i 1
=11,5 млн.лв.
n 10
n
t i
55
t i 1
=5,5
n 10
Междинните изчисления, необходими за оценяване на параметрите a0 и a1
на линейния модел са поместени в таблица 17.
Параметърът a1=0,6 има положителна стойност, следователно тенденцията
на приходите от продажби е нарастваща. Те се увеличават средно с 0,6 млн. лв.
за един месец. Параметрите a0 и a1 на линейния модел служат за получаване на
теоретичните (изгладените) стойности на динамичния ред на приходите от
продажби. Стойностите са поместени в таблица 17.
31
Таблица 17
Работна таблица за междинни изчисления
Приходи от
продажби
Месеци (млн. лв.) ti yi .t i t i2 yˆ i a0 a1 .t i
yi
I 10 1 10 1 8,8
II 8 2 16 4 9,4
III 10 3 30 9 10,0
IV 11 4 44 16 10,6
V 12 5 60 25 11,2
VI 11 6 66 36 11,8
VII 12 7 84 49 12,4
VIII 13 8 104 64 13,0
IX 12 9 108 81 13,6
X 16 10 160 100 14,2
Общо 115 55 682 385 115
32
ТЕМА VI. Индекси
Задача 10
Събрани са статистически данни за цените и количествата на продадените
в търговска верига три вида стоки през 2014 и 2015 година.
Таблица 18
Цена на един килограм Продадени количества
Стоки (лв.) (кг)
2014 2015 2014 2015
А 5,4 5,6 360 350
Б 2,5 2,5 510 530
В 7,6 8,0 220 220
Да се намери:
1. Средното относително изменение на цените на стоките чрез агрегатните
индекси на Ласпер и на Пааше.
2. Средното относително изменение на физическия обем на продадените
стоки.
3. Средното относително изменение на приходите от продажби на
стоките.
РЕШЕНИЕ
1. Средно относително изменение на цените на стоките чрез
агрегатните индекси на Ласпер и на Пааше
Цената на стоките А, Б и В е равнището. Продадените количества са обема,
а масата е приходи от продажби и се получава като произведение от цената и
продадените количества. Наблюдават се два периода – 2014 и 2015 година, от
които първият е базисен, а вторият е отчетен. Равнището (цената) през базисния
период се отбелязва с 𝑝0 , а през отчетния период – с 𝑝1 . Съответно обемът през
базисния и отчетния период се означава с 𝑞0 и 𝑞1 .
При изчисляването на множествените индекси на равнище, цните на
стоките (равнището) се претеглят с продадените количества (обемите). В
зависимост от това от кой период се използват обемите (базисен или периоден),
33
могат да се изчислят два множествени индекса на равнище – на Ласпер и Пааше.
Индексът на Ласпер използва за тегла обемите от базисния период, а индексът на
Пааше използва за тегла обемите от отчетния период. Междинните изчисления,
необходими за получаването на множествените индекси са поместени в таблица
Таблица 19
Работна таблица за междинни изчисления
Прода
𝑝1 𝑞0
5,6 360
2,5 510
8,0 220
1090
I p q0
p .q
1 0
5051
=1,033.100=103,3%
p .q
0 0 4891
34
- Множествен индекс на Пааше:
I p q1
p .q 1 1
5045
=1,032.100=103,2%
p .q 0 1 4887
I q p0
q .p
1 0
4887
=0,9992.100=99,92%
q .p
0 0 4891
I q p1
q .p
1 1
5045
=0,9988.100=99,88%
q .p
0 1 5051
I qp
q .p
1 1
5045
=1,031.100=103,1%
q .p
0 0 4891
36