You are on page 1of 36

РЕШЕНИ ЗАДАЧИ

ТЕМА I. Анализ на емпирични разпределения


Задача 1
Излъчена е извадка от студенти. Извършена е групировка по признака
“Оценка на преподаването по статистика на шестобална скала”.
Таблица 1
Оценка Брой студенти
2 4
3 8
4 18
5 20
6 10
Общо 60
Иска се:
Да се изследва емпиричното разпределение чрез:
1. Построяване на полигон на разпределение;
2. Установяване на средните величини чрез изчисляване на средна
аритметична, медиана и мода;
3. Установяване на вариацията чрез изчисляване на средно квадратично
(стандартно) отклонение;
4. Установяване на асиметрията чрез изчисляване на коефициент на
асиметрия на Пирсън.
РЕШЕНИЕ
1. Построяване на полигон на разпределение
Общият вид на емпиричното разпределение на студентите по признака
оценка се представя чрез полигон на разпределение. Полигонът се построява,
като на абсцисата се представят значенията по признака оценка, на ординатата -
честотите (брой студенти). Като графичен образ се използва линия. Полигонът
на разпределение е линейна диаграма.

1
22
20
18
16
Брой студенти
14
12
10
8
6
4
2
0
2 3 4 5 6
Оценка

Фиг. 1 Разпределение на студентите по признака


“Оценка на преподаването по статистика”
Полигонът на разпределение на студентите по признака “Оценка на
преподаването по статистика” дава възможност да се прецени, че то има
отрицателна асиметрия.
2. Установяване на средните величини чрез изчисляване на средна
аритметична, медиана и мода
Емпиричното разпределение на студентите по признака “оценка на
преподаването по статистика” е представено чрез дискретен (прекъснат)
вариационен ред, тъй като определенията на признака са цели дискретни числа
(2, 3, 4, 5 и 6).
За да се установи средната оценка на преподаването по статистика, която
са поставили студентите, се използва средна аритметична претеглена величина,
тъй като данните са групирани.
k

x .f
j 1
j j
2.4  3.8  4.18  5.20  6.10 264
x    4,4
k
4  8  18  20  10
f
60
j
j 1

x j - значения на признака по групи;


f j – честоти (тегла) по групи;
2
k – брой групи;
j – индекс за поредност на групите.

Таблица 2
Работна таблица за междинни изчисления
Брой
Оценка
𝑥𝑗
студенти 𝑥𝑗 . 𝑓𝑗 C xj  x xj  x
2

xj  x .f j
2
  
𝑓𝑗
2 4 8 4 -2,40 5,76 23,04
3 8 24 12 -1,40 1,96 15,68
4 18 72 30 -0,40 0,16 2,88
5 20 100 50 0,60 0,36 7,20
6 10 60 60 1,60 2,56 25,60
Общо 60 264 74,40
За да намерим медианата е необходимо да определим кой от студентите
заема централна позиция в изследвания статистически ред, тъй като носител на
медианната стойност е средният член на реда. Намирането на средния член при
дискретен вариационен ред се установява по следния начин:
k

f
j 1
j 1
60  1
Median position =   30,5
2 2
При четен брой на реда, както е в случая (60 студента), два члена заемат
k

f
j 1
j
60
централно място. Това са студенти с номера съответно   30 и
2 2
k

f
j 1
j
60
1   1  31 . Медианата се изчислява като полусума от значенията на тези
2 2
две централни единици на реда. Чрез кумулативните честоти (колона “C” в
таблица 2.) се установява, че двете централни единици на реда - студентите с
номера 30 и 11 са поставили оценка на преподаването по статистика съответно 4
45
и 5. Следователно Me   4,5 .
2
Модата е средна, чиято величина е равна на най-често срещаната стойност
на признака в статистическия ред. При дискретен вариационен ред, какъвто е
3
редът за студентите, разпределени по оценките, които са поставили за
преподаването по статистика, модата е равна на онази стойност на признака,
която има най-голяма честота. Студентите най-често са поставяли оценка 5 на
преподаването по статистика (20 студента са поставили оценка 5). Следователно
модата има стойност 5.
3. Установяване на вариацията чрез изчисляване на средно
квадратично (стандартно) отклонение
Средният размер на квадрата на отклоненията на значенията на признака
от средната величина се установява чрез средно квадратичното (стандартно)
отклонение. Използва се формулата:

 x 
k
2
j  x .fj
j 1
s k

f
j 1
j 1

Необходимите изчисления за намиране на стандартното отклонение са


поместени таблица 2.

 x 
k
2
j  x .fj
j 1 74,4
s   1,12
k
60  1
f
j 1
j 1

Абсолютният размер на вариацията по отношение на средната оценка,


която са поставили студентите е 1,12.
Относителният размер на вариацията в процент се установява по
формулата:
s
Vs  .100
x
където:
Vs - относителна величина на средното квадратично (стандартно)
отклонение в процент.
1,12
Vs  .100  25,45%
4,4

4
Относителният размер на вариацията по отношение на средната оценка
25,45%.
4. Установяване на асиметрията чрез изчисляване на коефициент на
асиметрия на Пирсън
Степента на отклонение на емпиричното от нормалното разпределение се
установява чрез показателите за асиметрия. Асиметрията (отклонението на
емпиричното разпределение от симетричното разпределение) се измерва чрез
коефициент на асиметрия на Пирсън. Той се изчислява по формулата:
x  Mo
Kp 
s

4,4  5
Kp   0,54
1,12

Коефициентът на асиметрия на Пирсън е с отрицателен знак и е по-малък


по абсолютна стойност от 1. Можем да обобщим, че разпределението на
студентите по признака “Оценка на преподаването по статистика” има
отрицателна умерена асиметрия.
Задача 2
Излъчена е извадка от студенти. Извършена е групировка по признака
“Разходи за покупка на учебна литература през текущия семестър”.
Таблица 3
Разходи (лева) Брой студенти
до 10 4
над 10 до 20 4
над 20 до 30 5
над 30 до 40 8
над 40 2
Общо 23
Иска се:
Да се изследва емпиричното разпределение чрез:
1. Построяване на хистограма;
2. Установяване на средните величини чрез изчисляване на средна
аритметична, медиана и мода;
5
3. Установяване на вариацията чрез изчисляване на средно квадратично
(стандартно) отклонение;
4. Установяване на асиметрията чрез изчисляване на коефициент на
асиметрия на Юл.
РЕШЕНИЕ

1. Построяване на хистограма
Емпиричното разпределение на студентите по признака “Разходи за
покупка на учебна литература през текущия семестър” може да се представи
графично чрез хистограма. Графичното изображение се построява, като на
абцисата се нанасят значенията на признака разходи, а на ординатата – честотите
(брой студенти). Хистограмата е плоскостна стълбовидна диаграма.
От построената хистограма на разпределението (фиг. 2) се вижда, че
емпиричното разпределение на студентите по разходи за покупка на учебна
литература през текущия семестър има отрицателна асиметрия.
9
8
7
Брой студенти

6
5
4
3
2
1
0
до 10 над 10 до 20 над 20 до 30 над 30 до 40 над 40
Разходи за покупка на учебна литература (лева)

Фиг. 2 Хистограма на разпределението на студентите по разходи за


покупка на учебна литература през текущия семестър

6
2. Установяване на средните величини чрез изчисляване на средна
аритметична, медиана и мода
За изчисляването на средния размер на разходите за покупка на учебна
литература през текущия семестър на студентите се използва средна
аритметична претеглена величина, тъй като данните са групирани.
k

x
j 1
j fj
x k

f j 1
j

Формулата е предназначена за вариационни дискретни редове.


Следователно преди да я използваме е необходимо да преобразуваме
емпиричния ред от индискретен в дискретен чрез центриране. В първата и
последната група не е определена долната и съответно горната граница.
Необходимо е те да се определят така, че ширината на интервала да бъде същата,
както при останалите групи. В случая ширината на интервала е 10, следователно
за долна граница на първата група определяме 0, а за горна граница на
последната група 50. Необходимите изчисления за установяване на средния
размер на разходите за покупка на учебна литература през текущия семестър на
студентите са поместени в таблица 4.
k

x
j 1
j fj
575
x k
 =25 лева
f
23
j
j 1

Таблица 4
Работна таблица за междинни изчисления
Разходи
(лева)
Брой
студенти
𝑥𝑗 𝑥𝑗 . 𝑓𝑗 С xj  x x j  x
2
x j  x . f j
2

𝑓𝑗
до 10 4 5 20 4 -20 400 1600
над 10 до 20 4 15 60 8 -10 100 400
над 20 до 30 5 25 125 13 0 0 0
над 30 до 40 8 35 280 21 10 100 800
над 40 2 45 90 23 20 400 800
Общо: 23 575 3600

7
Чрез медианата се установяват разходите за покупка на учебна литература
през текущия семестър на онзи студент, който се намира точно в центъра на
изследвания статистически ред. В конкретния случай статистическият ред за
студентите, разпределени по разходи е вариационен индискретен и се използва
следната формула:
 k 
  f j 1 
 j 1 W
Me  A    C Me1 .
2 f
  m
 

където:
Ме - медиана;
А - долна граница на интервала на медианата;
Сme-1 - кумулативно-прогресивни честоти до интервала на медианата;
W - ширина на интервала;
m – абсолютна честота на медианния интервал.
Интервалът на медианата се установява по следния начин:
k

f j 1
23  1
 Median position = j 1
  12
2 2
При нечетен брой на реда, както е в случая (23 студента), един член на
статистическия ред заема централно място. Това е студент номер 12. Чрез
кумулативните честоти (колона С от таблица 4) установяваме, че той се намира
в интервала над 20 до 30 лева. Заместваме във формулата за медианата:
 23  1  10
Me  20    8 . = 28 лева
 2  5

Средният размер на разходите за покупка на учебна литература през


текущия семестър на студентите, измерен чрез медиана, е 28 лева.
Модата е средна, чиято величина е равна на най-често срещаната стойност
на признака в статистическия ред. При вариационен индискретен ред, първо се
определя модалният интервал (интервалът с най-голяма честота). Най-голям е

8
броят на студентите с разходи над 30 до 40 лева (8 студенти). След това
заместваме в следната формула:
f  f 1  .W
Mo  A 
0

f 0  f 1  f 0  f 2 

където:
Мо - мода;
А - долна граница на модалния интервал;
W - ширина на модалния интервал;
0 - честота на модалния интервал;
1 - честота на предмодалния интервал;
2 - честота на следмодалния интервал.
След заместване във формулата се получава:

M o  30 
8  5.10 = 33,33 лева.
8  5  8  2
Средният размер на разходите за покупка на учебна литература през
текущия семестър на студентите, измерен чрез мода, е 33,33 лева.
От получените резултати за средния размер на разходите, измерен чрез
средната аритметична претеглена величина, медианата и модата, можем да
направим следния извод: x  M e  M o (25<28<33,33) следователно, емпиричното
разпределение на студентите по разходи за покупка на учебна литература през
текущия семестър има отрицателна асиметрия.

3. Установяване на вариацията чрез изчисляване на средно


квадратично (стандартно) отклонение
Средно квадратичното (стандартно) отклонение се използва най-често като
измерител на вариацията. Чрез него се установява средният размер на квадрата
на отклоненията на значенията на признака от средната величина. Използва се
формулата:

9
 x 
k
2
j  x .fj
j 1
s k

f
j 1
j 1

Необходимите изчисления за намиране на стандартното отклонение са


поместени таблица 4.
3600
s = 12,79 лева
23  1

Абсолютният размер на вариацията по отношение на средния размер на


разходите за покупка на учебна литература през текущия семестър на студентите
е 12,79 лева.
Относителният размер на вариацията в процент се установява по
формулата:
s
Vs  .100 ,
x
12,79
V  .100 = 51,16%
25
Относителният размер на вариацията по отношение на средния размер на
разходите на студентите е 51,16%.
4. Установяване на асиметрията чрез изчисляване на коефициент на
асиметрия на Юл.
Степента на отклонение на емпиричното от нормалното разпределение се
установява чрез показателите за асиметрия. Асиметрията (отклонението на
емпиричното разпределение от симетричното разпределение) се измерва чрез
коефициент на Юл. Той се изчислява по следната формула:
Коефициент на асиметрия на Юл:
3.x  M e  3.25  28
KJ   = - 0,70
s 12,79

Коефициентът на асиметрия на Юл е с отрицателен знак и е по-малък по


абсолютна стойност от 1. Можем да обобщим, че емпиричното разпределение на
студентите по разходи за покупка на учебна литература през текущия семестър
има умерена отрицателна асиметрия.
10
ТЕМА II. Статистическо оценяване
Задача 3
По безвъзвратен метод е излъчена репрезентативна извадка от студенти.
Извършена е групировка по признака “Брой посещения на университетската
библиотека през текущия семестър”.
Общият брой на обучаваните студенти е 10000.
Таблица 5
Брой посещения Брой студенти
1 8
2 8
3 18
4 22
5 16
6 10
7 8
8 4
9 4
10 2
Общо 100
Да се оценят:
1. Средна аритметична величина;
2. Средна стохастична (стандартна) грешка;
3. Максимална стохастична грешка при равнище на значимост α = 0,05;
4. Доверителен интервал на средната аритметична величина.
РЕШЕНИЕ
1. Средна аритметична величина
Емпиричното разпределение на студентите по признака “Брой посещения
на университетската библиотека през текущия семестър” е представено чрез
дискретен (прекъснат) вариационен ред, тъй като определенията на признака са
цели дискретни числа (1 посещение, 2 посещения, 3 посещения и т.н.). За
изчисляването на средния брой посещения на университетската библиотека се
използва средна аритметична претеглена величина, тъй като данните са
групирани:

11
k

x .f
j 1
j j
1.8  2.8  3.18  4.22  5.16  6.10  7.8  8.4  9.4  10.2 450
x    4,5  5посещения
k
8  8  18  22  16  10  8  4  4  2
f
100
j
j 1

където:

x - средна аритметична величина на извадката;

x j - значения на признака по групи;

f j – честоти по групи;

k – брой групи;

j – индекс за поредност на групите.

2. Средна стохастична (стандартна) грешка


Средното квадратично (стандартно отклонение), което ни е необходимо за
изчисляването на средната стохастична (стандартна) грешка, се установява чрез
формулата:

 x 
k
2
j  x .fj
j 1
s k

f
j 1
j 1

Необходимите изчисления за намиране на стандартното отклонение са


поместени таблица 6.
461
s = 2,16
100  1

Абсолютният размер на вариацията по отношение на средния брой


посещения на университетската библиотека през текущия семестър е 2,16.

Таблица 6
12
Работна таблица за междинни изчисления
Брой Брой 𝑥𝑗 . 𝑓𝑗 xj  x xj  x
2

xj  x .f j
2
  
посещения студенти
𝑥𝑗 𝑓𝑗
1 8 8 -3,5 12,25 98,0
2 8 16 -2,5 6,25 50,0
3 18 54 -1,5 2,25 40,5
4 22 88 -0,5 0,25 5,5
5 16 80 0,5 0,25 4,0
6 10 60 1,5 2,25 22,5
7 8 56 2,5 6,25 50,0
8 4 32 3,5 12,25 49,0
9 4 36 4,5 20,25 81,0
10 2 20 5,5 30,25 60,5
Общо 100 450 461,0
В условието на задачата е даден обемът на генералната съвкупност
N=10000 студенти и обемът на извадката n=100 студента. За намиране на среднта
стохастична (стандартна) грешка използваме формулата за безвъзвратен подбор:
s n 2,16 100
sx  . 1  . 1 =0,21
n N 100 10000

3. Максимална стохастична грешка при равнище на значимост


α = 0,05
Максималната стохастична грешка (  x ) се установява с определена
вероятност, използвайки апроксимация на нормалното теоретично
разпределение. За да установим максималната стохастична грешка е необходимо
предварително да определим гаранционния множител (z). Той се определя от
предварително избраното равнище на значимост (α), което означава
вероятността да се допусне грешка в заключението. С помощта на таблицата на
функцията на стандартизираното нормално разпределение при α=0,05 се
установява, че гаранционният множител z = 1,96. В такъв случай грешката, която
евентуално ще се допусне като се анализират данните от извадката е:
 x  z.s x  1,96.0,21 = 0,41

4. Доверителен интервал на средната аритметична величина


13
Границите на вариране на средния брой посещения на университетската
библиотека през текущия семестър на студентите е:
x       x   
x x

4,5  0,41    4,5  0,41

4,09    4,91

Средният брой посещения на университетската библиотека през текущия


семестър на студентите е от 4 до 5, гарантирано с вероятност 95%.

Задача 4
По безвъзвратен метод е излъчена репрезентативна извадка на студентите
от втори курс. Извършена е групировка по признака “Време отделено за
самоподготовка по Статистика”.
Общият брой на обучаваните студенти е 2500.
Таблица 7
Време (часове) Брой студенти
до 20 2
над 20 до 30 8
над 30 до 40 20
над 40 до 50 30
над 50 до 60 38
над 60 2
Общо 100
Да се оценят:
1. Средна аритметична величина;
2. Средна стохастична (стандартна) грешка;
3. Максимална стохастична грешка при равнище на значимост α = 0,05;
4. Доверителен интервал на средната аритметична величина.
РЕШЕНИЕ:
1. Средна аритметична величина
За изчисляването на средното време, отделено за самоподготовка по
Статистика, на студентите се използва средна аритметична претеглена величина,
тъй като данните са групирани.
14
Формулата е предназначена за вариационни дискретни редове.
Следователно преди да я използваме е необходимо да преобразуваме
емпиричния ред от индискретен в дискретен чрез центриране. В първата и
последната група не е определена долната и съответно горната граница.
Необходимо е те да се определят така, че ширината на интервала да бъде същата,
както при останалите групи. В случая ширината на интервала е 10, следователно
за долна граница на първата група определяме 0, а за горна граница на
последната група 70. Необходимите изчисления за установяване на средното
време са поместени в таблица 8.
Таблица 8

Работна таблица за междинни изчисления

Време
Брой 𝑥𝑗 𝑥𝑗 . 𝑓𝑗 xj  x x j  x
2
x j  x . f j
2

студенти
(часове)
𝑓𝑗
до 20 2 15 30 -30 900 1800
над 20 до 30 8 25 200 -20 400 3200
над 30 до 40 20 35 700 -10 100 2000
над 40 до 50 30 45 1350 0 0 0
над 50 до 60 38 55 2090 10 100 3800
над 60 2 65 130 20 400 800
Общо: 100 4500 11600
k

x .f
j 1
j j
4500
x k
 = 45 часа
f
100
j
j 1

където:
x - средна аритметична величина на извадката;
𝑥𝑗 - значения на признака по групи;

𝑓𝑗 – честоти по групи;

k – брой групи;
j – индекс за поредност на групите.
2. Средна стохастична (стандартна) грешка

15
Средното квадратично (стандартно отклонение), което ни е необходимо за
изчисляването на средната стохастична (стандартна) грешка, се установява чрез
формулата:

 x 
k
2
j  x .fj
j 1
s k

f
j 1
j 1

Необходимите изчисления за намиране на стандартното отклонение са


поместени таблица 8.
11600
s =10,82 часа
100  1

Абсолютният размер на вариацията по отношение на средното време,


отделено за самоподготовка по Статистика е 10,82 часа.
В условието на задачата е даден обемът на генералната съвкупност N=2500
студенти и обемът на извадката n=100 студента. За намиране на среднта
стохастична (стандартна) грешка използваме формулата за безвъзвратен подбор:
s n 10,82 100
sx  . 1  . 1 = 1,06 часа
n N 100 2500

3. Максимална стохастична грешка при равнище на значимост


α = 0,05
Максималната стохастична грешка (  x ) се установява с определена
вероятност, използвайки апроксимация на нормалното теоретично
разпределение. За да установим максималната стохастична грешка е необходимо
предварително да определим гаранционния множител (z). Той се определя от
предварително избраното равнище на значимост (α), което означава
вероятността да се допусне грешка в заключението. С помощта на таблицата на
функцията на стандартизираното нормално разпределение при α=0,05 се
установява, че гаранционният множител z = 1,96. В такъв случай грешката, която
евентуално ще се допусне като се анализират данните от извадката е:

16
 x  z.s x  1,96.1,06 = 2,08 часа

4. Доверителен интервал на средната аритметична величина


Интервалът, в който се намира средното време, отделено за
самоподготовка по Статистика, на студентите в генералната съвкупност от 2500
студенти е:
x       x   
x x

45  2,08    45  2,08

42,92    47,08

Средното време, отделено за самоподготовка по Статистика е между 42,92


и 47,08 часа, гарантирано с вероятност 95%.

Задача 5
По безвъзвратен метод е излъчена репрезентативна извадка на студентите
от факултет “Информатика”. Извършена е групировка по алтернативния признак
“Удовлетвореност от оценката по Статистика”.
Общият брой на студентите, обучавани във факултет “Информатика” е
600.
Таблица 9
Удовлетвореност Брой студенти
от оценката
Да 38
Не 12
Общо 50

Да се оценят:
1. Относителния дял на студентите, удовлетворени от оценката по
статистика;
2. Средна стохастична (стандартна) грешка;
3. Максимална стохастична грешка при равнище на значимост α = 0,05;
17
4. Доверителния интервал на относителния дял на студентите,
удовлетворени от оценката по статистика.
РЕШЕНИЕ
1. Относителния дял на студентите, удовлетворени от оценката по
статистика
Относителният дял на студентите, които са удовлетворени от оценката по
статистика се намира по формулата:
k 38
p  =0,76=76%
n 50
Относителният дял на студентите, които не са удовлетворени от оценката
по статистика (алтернативният относителен дял) е:
12
q =0,24=24%.
50
2. Средна стохастична (стандартна) грешка
Разполагаме с данни за общия брой на студентите, т.е. обема на
генералната съвкупност N= 600 студенти, следователно използваме формулата
за средна стохастична (стандартна грешка) при безвъзвратен подбор:
p.1  p  n 0,76.1  0,76 50
sp  . 1  . 1 =0,06
n N 50 600

3. Максимална стохастична грешка при равнище на значимост


α = 0,05
За намиране на максималната стохастична грешка се използва
гаранционният множител z от нормалното разпределение, тъй като биномното
разпределение при n≥30 се апроксимира с нормалното разпределение.
Гаранционния множител (z) се определя от предварително избраното равнище
на значимост (α), което означава вероятността да се допусне грешка в
заключението. С помощта на таблицата на функцията на стандартизираното
нормално разпределение при α=0,05 се установява, че гаранционният множител
z = 1,96. В такъв случай грешката, която евентуално ще се допусне като се
анализират данните от извадката е:
 p  z.s p =1,96.0,06=0,12
18
4. Доверителен интервал на относителния дял на студентите,
удовлетворени от оценката по статистика
Границите, в които варира относителният дял на студентите, които са
удовлетворени от оценката по статистика в генералната съвкупност от 600
студенти е:
p     P  p   
p p

0,76  0,12  P  0,76  0,12


0,64  P  0,88

64%  P  88%
ТЕМА III. Корелационен анализ
Задача 6
Събрани са годишни данни за 10 предприятия от един отрасъл по
признаците “Разходи за реклама” и “Приходи от продажби”.
Таблица 10
№ на Разходи за Приходи от
предприятието реклама в млн. продажби
лв. в млн. лв.
1 1 8
2 3 10
3 2 11
4 2 11
5 2 6
6 1 5
7 4 15
8 4 12
9 1 7
10 5 15
Общо 25 100
Иска се:
Да се изследва зависимостта между разходите за реклама и приходите от
продажби чрез оценка и интерпретация на корелационния коефициент на Браве.
РЕШЕНИЕ

19
Зависимата променлива (следствието) yi са приходите от продажби, а
независимата променлива xi (факторът) са разходите за реклама. Формулата, по
която се намира корелационния коефициент на Браве е:

 x  x . y 
n

i i y
r i 1

 x  x  . y  y 
n n
2 2
i i
i 1 i 1

За изчисляването на коефициента на Браве е необходимо предварително да


се изчислят средните величини за зависимата и независимата променлива. Те се
изчисляват със средни аритметични по данни от извадки по следните формули:
n

x i
25
x i 1
 = 2,5 млн.лв.
n 10
n

y i
100
y i 1
 =10 млн.лв.
n 10
Междинните изчисления, необходими за коефициента на корелация на
Браве са поместени в таблица 11.
Като се замести във формулата за коефициента на корелация на Браве, се
получава:

 x  
n

i  x . yi  y
39
r i 1
  0,865
 x   
n n
18,50.110
 x . y i  y
2 2
i
i 1 i 1

Коефициентът на корелация на Браве r = 0,865 показва силна права


корелационна зависимост между приходите от продажби и разходите за реклама.

Таблица 11
Работна таблица за междинни изчисления
Разходи за Приходи от
реклама продажби
(млн.лв.) ( x i  x ) ( x i  x ) ( yi  y ) ( yi  y ) ( xi  x ).( yi  y )
№ 2 2
(млн. лв.)
xi yi
1 1 8 -1,5 2,25 -2 4 3,0
2 3 10 0,5 0,25 0 0 0,0
3 2 11 -0,5 0,25 1 1 -0,5
20
4 2 11 -0,5 0,25 1 1 -0,5
5 2 6 -0,5 0,25 -4 16 2,0
6 1 5 -1,5 2,25 -5 25 7,5
7 4 15 1,5 2,25 5 25 7,5
8 4 12 1,5 2,25 2 4 3,0
9 1 7 -1,5 2,25 -3 9 4,5
10 5 15 2,5 6,25 5 25 12,5
Общо 25 100 0 18,50 0 110 39,0

Коефициентът на детерминация е: rdet %  r 2 .100 =0,8652.100=74,82%


Коефициентът на индетерминация е:
run det %  100  r 2 .100 =100-0,8652.100=25,18%.

Следователно 74,82% от нарастването на приходите от продажби се дължи


на разходите за реклама, а 25,18% от нарастването на приходите се дължи на
други фактори, които не са включени в изследването.

ТЕМА IV. Регресионен анализ


Задача 7
Събрани са годишни данни за 10 предприятия от един отрасъл по
признаците “Разходи за реклама” и “Приходи от продажби”.
Таблица 12

21
№ на Разходи за Приходи от
предприятието реклама в млн. продажби
лв. в млн. лв.
1 1 8
2 3 10
3 2 11
4 2 11
5 2 6
6 1 5
7 4 15
8 4 12
9 1 7
10 5 15
Общо 25 100

Иска се:
Да се изследва зависимостта между разходите за реклама и приходите от
продажби чрез:
1. Построяване на корелограма;
2. Оценка на регресионните коефициенти b0 и b1 при условие, че се
използва модела yi  0  1.xi   i ;
3. Оценка на коефициента на еластичност be1.
РЕШЕНИЕ
1. Построяване на корелограма
Графичното изображение на корелационната зависимост между приходите
от продажби и разходите за реклама е точкова диаграма и се нарича корелограма.
Определяме като зависима променлива (Yi) – приходите от продажби на
предприятията, а като независима променлива (фактор) - Xi – разходите за
реклама на предприятията.

22
16

Приходи от продажби (млн. лв.) - Yi


14

12

10

0
0 1 2 3 4 5 6
Разходи за реклама (млн. лв.) - Xi

Фиг. 3 Корелационна зависимост между приходите от продажби и разходите за


реклама

От корелограмата можем да направим заключението, че между приходите


от продажби и разходите за реклама съществува линейна права зависимост.

2. Оценка на регресионните коефициенти b0 и b1 при условие, че се


използва модела yi  0  1.xi   i
За моделиране на корелационната зависимост между приходите от
продажби и разходите за реклама използваме линейна функция: yˆ i  b0  b1 .xi .
Оценките на параметрите на модела b0 и b1 се получават от приложението на
МНМК.
n n

 yi  n.b0  b1 . xi
i 1 i 1
n n n

 xi yi  b0 . xi  b1 . xi2
i 1 i 1 i 1

 x .y i i  n.x. y
289  10.2,5.10
b1  i 1
 = 2,11
n
81  10.2,5 2
x i 1
2
i  n.x 2

b0  y  b1 .x =10-2,11.2,5 = 4,72
23
n

x i
100
x i 1
 =10 млн.лв.
n 10
n

y i
25
y i 1
 =2,5 млн.лв.
n 10
Таблица 13

Работна таблица за междинни изчисления


№ на
xi yi y i xi xi2
предприятието

1 1 8 8 1
2 3 10 30 9
3 2 11 22 4
4 2 11 22 4
5 2 6 12 4
6 1 5 5 1
7 4 15 60 16
8 4 12 48 16
9 1 7 7 1
10 5 15 75 25
Общо 25 100 289 81

Регресионният коефициент b1=2,11 от линейния регресионен модел


показва, че при увеличение на разходите за реклама с 1 млн.лв., приходите от
продажби се увеличават с 2,11 млн.лв.
3. Оценка на коефициента на еластичност be1
Коефициентът на еластичност be1 измерва относителни изменения на
зависимата променлива при изменение на независимата променлива с 1%.
Намира се по формулата:
x 2,5
be1  b1 .  2,11. =0,53.
y 10

24
ТЕМА V. Статистически анализ на динамични редове
Задача 8
Събрани са месечни данни за приходите от продажби на търговско
предприятие през текущата година:
Таблица 14
Приходи от
Месеци продажби
(млн. лв.)
I 10
II 8
III 10
IV 11
V 12
VI 11
VII 12
VIII 13
IX 12
X 16
Общо 115

Иска се:
Да се изследва динамиката на приходите от продажби чрез:
1. Изчисляване на темповете на растеж и темповете на прираст;
2. Изчисляване на средните темпове на растеж и средните темпове на
прираст.

РЕШЕНИЕ:
1. Изчисляване на темповете на растеж и темповете на прираст
Темповете на растеж показват колко пъти даден член на реда е по-голям
(по-малък) от друг член на реда.
Верижните темпове на растеж се получават като отношения между
последователни съседни двойки членове на инамичния ред:
yi y 8
Ta  .100  2 .100  .100 =80%
yi 1 y1 10

yi y 10
Ta  .100  3 .100  .100 =125%
yi 1 y2 8

25
yi y 11
Ta  .100  4 .100  .100 =110%
yi 1 y3 10

yi y 12
Ta  .100  5 .100  .100 =109,09%
yi 1 y4 11

yi y 11
Ta  .100  6 .100  .100 =91,67%
yi 1 y5 12

Останалите изчисления са представени в таблица 15.


Таблица 15
Верижни и базисни темпове на растеж и на прираст на приходите от
продажби за периода месец януари – октомври на текущата година
Верижен темп Базисен темп Верижен темп на Базисен темп на
Приходи от на растеж на растеж прираст прираст
Месеци продажби y y
Ta  i .100 Tb  i .100
(млн. лв.) yi 1 y0 TPa 
yi
.100  100 TPb 
yi
.100  100
yi 1 y0
I 10 - - - -
II 8 80,00 80 -20,00 -20
III 10 125,00 100 25,00 0
IV 11 110,00 110 10,00 10
V 12 109,09 120 9,09 20
VI 11 91,67 110 -8,33 10
VII 12 109,09 120 9,09 20
VIII 13 108,33 130 8,33 30
IX 12 92,31 120 -7,69 20
X 16 133,33 160 33,33 60

Базисните темпове на растеж представляват отношения между членовете


на динамичния ред и един от тях, който е приет за база на сравнението.
Обикновено за база за сравнение се избира първият член на динамичния ред.
y2 8
Tb  .100  .100 =80%
y1 10

y3 10
Tb  .100  .100 =100%
y1 10

y4 11
Tb  .100  .100 =110%
y1 10

y5 12
Tb  .100  .100 =120%
y1 10

26
y6 11
Tb  .100  .100 =110%
y1 10

Останалите изчисления са представени в таблица 15.


Темпът на прираст измерва относителния прираст на изследвания процес
през даден период в сравнение с друг, предходен период.
Верижен темп на прираст:
y2 8
TPa  .100  100  .100  100 = -20%
y1 10

y3 10
TPa  .100  100  .100  100 =25%
y2 8

y4 11
TPa  .100  100  .100  100 =10%
y3 10

y5 12
TPa  .100  100  .100  100 =9,09%
y4 11

y6 11
TPa  .100  100  .100  100 = -8,33%
y5 12

Останалите изчисления са представени в таблица 15.


Базисен темп на прираст:
y2 8
TPb  .100  100  .100  100 = -20%
y1 10

y3 10
TPb  .100  100  .100  100 =0%
y1 10

y4 11
TPb  .100  100  .100  100 =10%
y1 10

y5 12
TPb  .100  100  .100  100 =20%
y1 10

y6 11
TPb  .100  100  .100  100 =10%
y1 10

Останалите изчисления са представени в таблица 15.


Верижните темпове на прираст показват, че през месец февруари спрямо
януари приходите от продажби са намалели с 20%. През месец юни в сравнение
с месец май и през месец септември спрямо месец август отново се наблюдава

27
намаление. През останалите месеци се наблюдава увеличение на приходите от
продажби, като най-значително приходите са се увеличили през месец октомври
спрямо месец септември, когато те са нараснали с 33,33%. В сравнение с месец
януари на текущата година приходите от продажби намаляват през месец
февруари с 20%, а през месец март не се променят. През останалите месеци от
април до октомври приходите се увеличават спрямо месец януари. Най-
значително е увеличението им през месец октомври спрямо месец януари – с
60%.
2. Изчисляване на средните темпове на растеж и средните темпове на
прираст
С помощта на средния темп на растеж се измерва средномесечното
относително изменение на приходите от продажбиза целия изследван период.
yn 16
T  n 1 .100  101 .100 =105,4%
y1 10

Средният темп на прираст се получава като разлика между средния темп


на растеж и 100:
yn 16
T   T  100  n1 .100  100  101 .100  100 =5,4%
y1 10

Средномесечният прираст на приходите от продажби за периода месец


януари – месец октомври на текущата година е 5,4 %.

28
Задача 9
Събрани са месечни данни за приходите от продажби на търговско
предприятие през текущата година:
Таблица 16
Приходи от
Месеци продажби
(млн. лв.)
I 10
II 8
III 10
IV 11
V 12
VI 11
VII 12
VIII 13
IX 12
X 16
Общо 115

Иска се:
Да се изследва динамиката на приходите от продажби чрез:
1. Построяване на плоскостна и линейна диаграма на приходите от
продажби;
2. Построяване на аналитичен модел от вида yˆ i  a0  a1 .t i ;
3. Прогноза за очакваните приходи от продажби през следващия месец,
основаваща се на аналитичния модел.
РЕШЕНИЕ
1. Построяване на плоскостна и линейна диаграма на приходите от
продажби

29
18

Приходи от продажби (млн. лв.)


16
14
12
10
8
6
4
2
0
I II III IV V VI VII VIII IX X
Месец

Фиг. 4 Динамика на приходите от продажби за периода месец януари – месец


октомври

18
Приходи от продажби (млн. лв.)

16
y = 0,6x + 8,2
14
12
10
8
6
4
2
0
I II III IV V VI VII VIII IX X
Месец

Фиг. 5 Динамика на приходите от продажби за периода месец януари – месец


октомври

2. Построяване на аналитичен модел от вида yˆ i  a0  a1 .t i


От линейната диаграма (фиг. 5) можем да направим заключението, че
трендът на приходите от продажби е линеен. Моделираме го с линейна функция
(уравнение на права линия). Теоретичният образ на линейната тенденция в

30
динамичния ред е: yˆ i  a0  a1 .t i . Параметрите на модела a0 и a1 се намират по
МНМК с помощта на система от две уравнения:
n n

y
i 1
i  n.a0  a1. ti
i 1
n n n

 yiti  a0 . ti  a1. ti2


i 1 i 1 i 1

Времето ti при несъкратения способ за оценяване на параметрите a0 и a1


приема последователни стойност от 1 до n. Параметрите a0 и a1 се получават по
формулите:
n

 y .t i i  n. y.t
682  10.11,5.5,5
a1  i 1
 =0,6
n
385  10.5,5 2
t i 1
i
2
 n.t 2

a0  y  a1 .t =11,5-0,6.5,5=8,2
n

y i
115
y i 1
 =11,5 млн.лв.
n 10
n

t i
55
t  i 1
 =5,5
n 10
Междинните изчисления, необходими за оценяване на параметрите a0 и a1
на линейния модел са поместени в таблица 17.
Параметърът a1=0,6 има положителна стойност, следователно тенденцията
на приходите от продажби е нарастваща. Те се увеличават средно с 0,6 млн. лв.
за един месец. Параметрите a0 и a1 на линейния модел служат за получаване на
теоретичните (изгладените) стойности на динамичния ред на приходите от
продажби. Стойностите са поместени в таблица 17.

31
Таблица 17
Работна таблица за междинни изчисления
Приходи от
продажби
Месеци (млн. лв.) ti yi .t i t i2 yˆ i  a0  a1 .t i
yi
I 10 1 10 1 8,8
II 8 2 16 4 9,4
III 10 3 30 9 10,0
IV 11 4 44 16 10,6
V 12 5 60 25 11,2
VI 11 6 66 36 11,8
VII 12 7 84 49 12,4
VIII 13 8 104 64 13,0
IX 12 9 108 81 13,6
X 16 10 160 100 14,2
Общо 115 55 682 385 115

3. Прогноза за очакваните приходи от продажби през следващия


месец, основаваща се на аналитичния модел
Прогнозната стойност на приходите от продажби за месец ноември на
текущата година се получава с помощта на израза:
yˆ i  a0  a1 .t i

yˆ11  8,2  0,6.11=14,8 млн. лв.

Очакваните приходи от продажби през месец ноември на текущата година


са 14,8 млн. лв. Получената стойност е т.нар. “осреднен вариант на прогнозата”.
За да се получат оптимистичният и песимистичният вариант на прогнозата на
приходите от продажби, и необходимо да се изчисли стандартната грешка на
прогнозата.

32
ТЕМА VI. Индекси
Задача 10
Събрани са статистически данни за цените и количествата на продадените
в търговска верига три вида стоки през 2014 и 2015 година.
Таблица 18
Цена на един килограм Продадени количества
Стоки (лв.) (кг)
2014 2015 2014 2015
А 5,4 5,6 360 350
Б 2,5 2,5 510 530
В 7,6 8,0 220 220

Да се намери:
1. Средното относително изменение на цените на стоките чрез агрегатните
индекси на Ласпер и на Пааше.
2. Средното относително изменение на физическия обем на продадените
стоки.
3. Средното относително изменение на приходите от продажби на
стоките.

РЕШЕНИЕ
1. Средно относително изменение на цените на стоките чрез
агрегатните индекси на Ласпер и на Пааше
Цената на стоките А, Б и В е равнището. Продадените количества са обема,
а масата е приходи от продажби и се получава като произведение от цената и
продадените количества. Наблюдават се два периода – 2014 и 2015 година, от
които първият е базисен, а вторият е отчетен. Равнището (цената) през базисния
период се отбелязва с 𝑝0 , а през отчетния период – с 𝑝1 . Съответно обемът през
базисния и отчетния период се означава с 𝑞0 и 𝑞1 .
При изчисляването на множествените индекси на равнище, цните на
стоките (равнището) се претеглят с продадените количества (обемите). В
зависимост от това от кой период се използват обемите (базисен или периоден),

33
могат да се изчислят два множествени индекса на равнище – на Ласпер и Пааше.
Индексът на Ласпер използва за тегла обемите от базисния период, а индексът на
Пааше използва за тегла обемите от отчетния период. Междинните изчисления,
необходими за получаването на множествените индекси са поместени в таблица

Таблица 19
Работна таблица за междинни изчисления

Прода

𝑝1 𝑞0

5,6 360

2,5 510

8,0 220

1090

Чрез агрегатните (множествените) индекси на равнище на Ласпер и на


Пааше индивидуалните индекси на цените за трите вида стоки А, Б и В се
обобщават в един измерител. Той показва какво е средното изменение на цената
общо за трите наблюдавани стоки.
- Множествен индекс на равнище на Ласпер:

I p  q0  
 p .q
1 0

5051
=1,033.100=103,3%
 p .q
0 0 4891

34
- Множествен индекс на Пааше:

I p q1  
 p .q 1 1

5045
=1,032.100=103,2%
 p .q 0 1 4887

Множествените индекси на равнище на Ласпер и на Пааше се различават


незначително по стойност. Разликата произтича от използваните тегла. Цената
на трите вида стоки се е увеличила средно с 3,3% (3,2%) през 2015 г. в сравнение
с 2014 г.
2. Средно относително изменение на физическия обем на продадените
стоки
За измерване на средното относително изменение на обема (продадените
количества) за трите вида стоки А, Б и В се използват множествените индекси на
обем. При тях обобщаването на измененията за отделните стоки се постига чрез
използване на съизмерител (тегла) – равнището (цената). В зависимост от това
от кой период (базисен или отчетен) е използваният съизмерител, се прилагат два
индекса.
- Множествен индекс на обем със съизмерител равнището от
базисния период:

I q  p0  
 q .p
1 0

4887
=0,9992.100=99,92%
 q .p
0 0 4891

- Множествен индекс на обем със съизмерител равнището от


отчетния период

I q  p1  
 q .p
1 1

5045
=0,9988.100=99,88%
 q .p
0 1 5051

Продадените количества от трите вида стоки А, Б и В са намалели средно


с 0,08% (0,12%) през 2015 г. в сравнение с 2014 г.
3. Средно относително изменение на приходите от продажби на
стоките
За измерване на средното относително изменение на приходите от
продажби (масата) се използва множественият индекс на маса. Той измерва
35
едновременно средното относително изменение на равнищата и на обемите на
изучаваните съвкупности.

I qp 
 q .p
1 1

5045
=1,031.100=103,1%
 q .p
0 0 4891

Приходите от продажби на трите вида стоки са се увеличили с 3,1% през


2015 г. в сравнение с 2014 г.

36

You might also like