Professional Documents
Culture Documents
дополнение статистика
дополнение статистика
2, 15
За наведеними даними, проаналізуйте наявність та характер зв’язку між ознаками за
допомогою комбінаційного та аналітичного групування. Результати покажіть в табличному та
графічному вигляді і зробіть висновки.
Охарактеризуйте отриманий ряд розподілу за допомогою середніх величин, оцініть однорідність
розподілу. Знайдіть з імовірністю 0,997 межі для середнього значення факторної ознаки у
генеральній сукупності, якщо представлені дані отримані шляхом 12% відбору. Розрахуйте з
імовірністю 0,954 межі для долі підприємств, які входять до останньої групи в інтервальному ряду
розподілу. Прокоментуйте проведення розрахунків та отримані результати.
.
3, 12, 16, 22
Евристичне завдання. За наведеними даними, проаналізуйте наявність та характер зв’язку
між ознаками за допомогою комбінаційного та аналітичного групування. Результати покажіть в
табличному та графічному вигляді і зробіть висновки.
Охарактеризуйте отриманий ряд розподілу за допомогою середніх величин, оцініть
однорідність розподілу. Знайдіть з імовірністю 0,997 межі для середнього значення факторної
ознаки у генеральній сукупності, якщо представлені дані отримані шляхом 18% відбору. Розрахуйте з
імовірністю 0,954 межі для долі підприємств, які входять до останньої групи в інтервальному ряду
розподілу. Прокоментуйте проведення розрахунків та отримані результати.
результ.признак
факторный 27-36.5 36.5-46 46-55.5 55.5-65 65-74.5 74.5-84
признак
61-66 *****
66-71 ******* ***
71-76 * *
76-81 * **
81-86 * *
86-91 * **
Вывод: по результатам комбинационной группировки видно, что чем больше площадь квартиры, тем
дороже ее стоимость.
Площадь Кол-во Sкум x`
61-66 5 5 63,5
66-71 10 15 68,5
71-76 2 17 73,5
76-81 3 20 78,5
81-86 2 22 83,5
86-91 3 25 88,5
2
(x x)
i
2
*f
f
σ2= ((63,5-72,7)2*5+(68,5-72,7)2*10+(73,5-72,7)2*2+(78,5-72,7)2*3+(83,5-
72,7)2*2+(88,5-72,7)2*3)/25 =
(423,2+176,4+1,28+100,92+233,28+748,92)/25=1684/25=67,36
По результатам рассчитанной дисперсии найдем среднее квадратическое
отклонение: σ=√σ2
σ = √67,36=8,21м2
В среднем общая площадь квартир отклоняется на 8,21 м2 от среднего значения.
Для оценки однородности совокупности рассчитаем среднеквадратичное
коэффициент вариации: Vσ =σ/xcp*100%
Vσ =8,21/72,7*100=11,29%. Т.о., можно сделать вывод, что совокупность однородная, т.к.
коэффициент вариации менее 33%.
Следующим шагом найдем пределы для среднего значения факторного
признака в генеральной совокупности, если представленные данные получены путем 18% отбора
с вероятностью 0,997.
При вероятности 0,997 t = 3. Найдем N:
Если хср по результативному признаку постоянно увеличивается, то существует прямая связь между
факторным и результативным признаком, в противном случае – наоборот.
Интерва Кіл. ВП ОФ
л xi fi Всего хср Всего хср
2,1-3,52 5 3,5+3,3+3,5+2,1+3,5=15,9 3,18 3,4+3,1+3,5+2+3=15 3
3,52-4,94 6 4,5+4,3+4,8+4,6+4,2+4,9=27,3 4,55 4,1+3,8+5,6+4,2+4+4,3=26 4,3
4,94-6,36 5 5,9+5,8+5,8+5,3+6=28,8 5,76 4,1+4,5+5,1+4,9+5,8=24,4 4,88
6,36-7,78 5 7,5+6,9+7,3+6,9+7,2=35,8 7,16 5,8+5,2+6,5+6,6+6,7=30,8 6,16
7,78-9,2 2 8,4+7,8=16,2 8,1 6,1+6,4=12,5 6,25
9,2-10,6 2 10,6+10,4=21 10,5 8+7,2=15,2 7,6
Если хср по результативному признаку постоянно увеличивается, то существует прямая связь между
факторным и результативным признаком, в противном случае – наоборот.
Комбінаційне групування
m=6
h=4,25
1
12-16,67 16,67-45,34 45,34-62,01 62,01-78,68 78,68-95,35 95,35-112
2
12,1-13,35 1 11
13,35-14,6 1 11
14,6-15,85 11 111
15,85-17,1 11 11111111 1
17,1-18,35 1111 1
18,35-19,6 1 11
Результат побудови комбінаційного групування вказує на існування прямого зв’язку між
досліджуваними показниками. Це свідчить про те, що з 1, збільшується 2. В результаті проведеного
групування був одержаний ряд розподілу Варіаційний інтервальний ряд розподілу
Інтервал (кількість) fi S – кумулятивні частоти Середина інтервалу
12,1-13,35 3 3 12,725
13,35-14,6 3 6 13,975
14,6-15,85 5 11 15,225
15,85-17,1 11 22 16,475
17,1-18,35 5 27 17,725
18,35-19,6 3 25 18,975
f
частота, mo 1 – наступна частота.
Модальний інтервал – це інтервал, що характеризується найбільшою кількістю влучень випадкової
величини. В нашому випадку модальним інтервалом є 15,85-17,1 тому що має найбільше значення fi.
Визначимо модальний інтервал:
Тобто, найчастіше зустрічається M o =16,6грн. Медіана ( M e ) – значення ознаки у статистичної
одиниці, що стоїть в середині рангового ряду і ділить сукупність на дві рівні за чисельністю частини.
N me S me 1
M e хme h
f me
N me 2 - медіаний номер
f
∑ ( x - x)
2
*f
i
Q2
∑f i
;
хср = 16,1грн.
(12.72−16.1)2 ∗3+(13.95−16.1)2 ∗3+(15,225−16.1)2 ∗5+
+(16,475−16.1)2 ∗11+
+(17.725−16.1)2 ∗5+(18.975−16.1)2 ∗3
𝑄2 = =3,036458333
30
Q Q 2 1,743
За результатами розрахованої дисперсії знайдемо середньоквадратичне відхилення:
грн.
Для оцінки однорідності сукупності розрахуємо середньоквадратичний коефіцієнт варіації.
Q
VQ *100% = 1.743/16.1*100%=10,83%
x
Таким чином, можна зробити висновок, що сукупність однорідна, так як розрахований коефіцієнт
варіації менше 10.83%.
Наступним кроком знайдемо межі для середнього значення факторної ознаки у генеральній
сукупності, якщо представлені дані отримані шляхом 10% відбору з імовірністю 0,997.
При ймовірності 0,997 t=3. Знайдемо N з пропорції :
N-100%
30 - 10 % Звідси N= (30*100)/10=300
~
x - x x ~
x x x t *
2 n
Якщо є N, або ми його можемо знайти використовуємо формулу для розрахунку = (1 - )
n N
3,03646 30
(1 - ) =0,0911
30 300
x 3 * 0,0911 0,2733
16.1-0.2733 ≤ x ≤ 16.1+0.2733
15,8267 ≤ x ≤ 16,3733
Таким чином, з ймовірністю 0,997 можна стверджувати, що середня прибуток для генеральної
сукупності знаходиться в межах від 15,8267 до16,3733 грн.
При ймовірності 0,954 t=2.
w - p p w p
знайдемо долю регіонів, які входять до останнього інтервалу.
m
w
n 1/30=0,033
p = t *
w (1 - w ) n
= (1 - )
n N
0,033(1 - 0,033) 30
(1 - ) =0,0010285979
30 300
p 2*0,0010285979=0,0020571958
0,033-0,001≤p≤0,033+0,001
0,032≤p≤0,034
Таким чином, з ймовірністю 0,954 можна стверджувати, що доля підприємств, які входять до
останнього інтервалу знаходиться в межах від 0,032 до 0,034
7, 21
1) Для того щоб побудувати аналітичний та комбінацій розподіл підприємств України (табл. 1),
необхідно визначити кількість груп та ширину інтервалу. Визначаємо кількість груп по формулі
Стерджеса: n 1 3.322 lg N log 2 N 1 , (1.1)
На основі даної формули отримуємо наступну шкалу:
N 15-24 25-44 45-89 90-179 180-359 360-719
n 5 6 7 8 9 10
х max - x min
h=
Ширину інтервалу визначаємо за формулою: n
n – знаходимо за шкалою Стерджесса.
Аналітичними групуваннями в статистиці називаються такі дані, за допомогою яких виявляють і
вивчають взаємозв'язок між окремими ознаками досліджуваного соціально-економічного явища В
рамках нашого дослідження факторною ознакою є Середньорічна вартість основних фондів,, а
результативною – Випуск продукції, тобто визначаємо вплив розміру середньорічної вартості ОСФ
на випуск продукції на підприємствах України
Для проведення групування знаходимо шаг, кількість груп дорівнює 6 з шкали Стерджеса, так як в
основу дослідження покладено 30 підприємств , тобто 30 входить до інтервалу 25-44, таким чином
(101 41) 60
отримуємо 6 груп. h 10
6 6 .
Результати аналітичного групування по регіонах України представлено в табл. 2:Аналітичне
групування регіонів України
Інтервал f Середньорічна вартість основних фондів, Випуск продукції
Усього х Усього х
36-46 3 42 +46+36 =124 41,33 45+41+54 =140 46,67
46-56 5 54,6+49,6+51+50+55 =260,2 52,05 57+52+48+65+62 =284 56,8
56-66 7 62+62,4+58,4+64,2+65+65,6 +60,8 =438,4 62,63 69+59+66+67+64+72+74 =471 67,28
66-76 10 73,6 68,4 71,2 70,4 75,2 67,2 68 71+73+80+68+76+83+81+75+78+
71,8 69,2 69 =704 70,4 70 =755 75,5
76-86 3 78,8 83,2 76,2 =238,2 79,4 88+92+85 =265 88,33
86-96 2 87,2 96 =183,2
91,6 96+101 =197 98,5
Комбінаційне групування виконується за кількома ознаками послідовно. Послідовність
встановлюється виходячи з логіки взаємозв'язку показників. Результати комбінаційного групування
підприємств України представлено в табл. 3.
х
( х f )
і i
f ,
(1.3)
i
2 - медіаний номер
f (1.6)
N me ,
∑
2
( x - x) *f
2 i
Q
∑f i
Розрахуємо дисперсію для варіаційного ряду розподілу за формулою:
(41 64,67) 2 3 (51 64,67) 2 5 (61 64,67) 2 7
(71 64,67) 2 10 (81 64,67) 2 3 (91 64,67) 2 2
Q
2
30
1680,81 934,34 94,28 400,69 800 1386,54 5296,66
176,55
30 30
За результатами розрахованої дисперсії знайдемо середньоквадратичне відхилення:
Q Q 2 13,29
грн.
Для оцінки однорідності сукупності розрахуємо середньоквадратичний коефіцієнт варіації.
Q
VQ *100% 13,29 / 64,67 20,55%
x
Таким чином, можна зробити висновок, що сукупність однорідна, так як розрахований коефіцієнт
варіації менше 33 %.
Наступним кроком знайдемо межі для середнього значення факторної ознаки у генеральній
сукупності, якщо представлені дані отримані шляхом 10% відбору з імовірністю 0,997.
При ймовірності 0,997 t=3. Знайдемо N з пропорції :
2 n 176,55 30
= (1 - ) (1 - )
n N 30 300 = 2,30
x 3 * 2,30 6,90
64,67 - 6,90 ≤ x ≤ 64,67 6,90
57,77 ≤ x ≤ 71,57
Таким чином, з ймовірністю 0,997 можна стверджувати, що вартість ОсФ для генеральної сукупності
знаходиться в межах від 57,77 грн. до 71,57грн.
w
m
2
0.067 p = t * =
w (1 - w )
(1 -
n
)
n 30 n N
0,067(1 - 0,067)
(1 -
30
=0,043 p 2 * 0,043 0,086
30 300
0,067 - 0,086 p 0,067 0,086
- 0,019 p 0,153
Таким чином, з ймовірністю 0,954 можна стверджувати, що доля регіонів, які входять до останнього
інтервалу знаходиться в межах від 0,019 до 0,153.
8, 18, 24
h= (19,6-12,1)/6= 1,25
m=6 Аналітичне групування
Кіл Втрати робочого часу, тис. людино-днів Прибуток, млн.. грн
Інтервал
(f) Усього Усього
12,633333
12,1-13,35 3 91+100+112 101 37,9
3
13,35-14,6 3 78+79,8+85,2 81 42,6 14,2
14,6-15,85 5 57,4+72,8+56,4+70,4+66 64,6 76,8 15,36
52,945 16,336363
15,85-17,1 11 57+72+55,7+36+54,6+37+56+53,6+55,4+52+53,1 179,7
4545 6
17,1-18,35 5 44+42+38+23,1+46 38,62 88,9 17,78
22,433 19,066666
18,35-19,6 3 34,9+20,4+12 57,2
3333 7
Комбінаційне групування
1
12-16,67 16,67-45,34 45,34-62,01 62,01-78,68 78,68-95,35 95,35-112
2
12,1-13,35 1 11
13,35-14,6 1 11
14,6-15,85 11 111
15,85-17,1 11 11111111 1
17,1-18,35 1111 1
18,35-19,6 1 11
Результат побудови комбінаційного групування вказує на існування прямого зв’язку між
досліджуваними показниками. Це свідчить про те, що з 1, збільшується 2. В результаті проведеного
групування був одержаний ряд розподілу Варіаційний інтервальний ряд розподілу
Інтервал (кількість) fi S – кумулятивні частоти Середина інтервалу
12,1-13,35 3 3 12,725
13,35-14,6 3 6 13,975
14,6-15,85 5 11 15,225
15,85-17,1 11 22 16,475
17,1-18,35 5 27 17,725
18,35-19,6 3 25 18,975
f
частота, mo 1 – наступна частота.
Модальний інтервал – це інтервал, що характеризується найбільшою кількістю влучень випадкової
величини. В нашому випадку модальним інтервалом є 15,85-17,1 тому що має найбільше значення fi.
Визначимо модальний інтервал:
Тобто, найчастіше зустрічається M o =16,6грн. Медіана ( M e ) – значення ознаки у статистичної
одиниці, що стоїть в середині рангового ряду і ділить сукупність на дві рівні за чисельністю частини.
N me S me 1
M e хme h
f me
11 5
M o 15,85 1,25 16,6
(10 5) (10 5)
N me 2 - медіаний номер
f
∑( xi - x) * f
2
Q2 хср = 16,1грн.
∑f i
(12.72−16.1)2 ∗3+(13.95−16.1)2 ∗3+(15,225−16.1)2 ∗5+
+(16,475−16.1)2 ∗11+
+(17.725−16.1)2 ∗5+(18.975−16.1)2 ∗3
𝑄2 = =3,036458333
30
Q Q 2 1,743
За результатами розрахованої дисперсії знайдемо середньоквадратичне відхилення:
грн.
Для оцінки однорідності сукупності розрахуємо середньоквадратичний коефіцієнт варіації.
Q
VQ *100% = 1.743/16.1*100%=10,83%
x
Таким чином, можна зробити висновок, що сукупність однорідна, так як розрахований коефіцієнт
варіації менше 10.83%.
Наступним кроком знайдемо межі для середнього значення факторної ознаки у генеральній
сукупності, якщо представлені дані отримані шляхом 10% відбору з імовірністю 0,997.
При ймовірності 0,997 t=3. Знайдемо N з пропорції :
N-100%
30 - 10 % Звідси N= (30*100)/10=300
~x - x x ~x x x t *
Якщо є N, або ми його можемо знайти використовуємо формулу для розрахунку
n2
= ) (1 -
n N
3,03646 30
(1 - ) =0,0911
30 300
x 3 * 0,0911 0,2733
16.1-0.2733 ≤ x ≤ 16.1+0.2733
15,8267 ≤ x ≤ 16,3733
Таким чином, з ймовірністю 0,997 можна стверджувати, що середня прибуток для генеральної
сукупності знаходиться в межах від 15,8267 до16,3733 грн.
При ймовірності 0,954 t=2.
w - p p w p
знайдемо долю регіонів, які входять до останнього інтервалу.
m
w p = t *
n 1/30=0,033
w (1 - w ) n
= (1 - )
n N
0,033(1 - 0,033) 30
(1 - ) =0,0010285979
30 300
p 2*0,0010285979=0,0020571958
9, 19
Номер підприємства Випуск продукції, млн.. грн Втрати робочого часу, тис.
людино-днів
1 65,0 66,0
2 78,0 44,0
3 41,0 91,0
4 54,0 78,0
5 66,0 57,4
6 80,0 42,0
7 45,0 100,0
8 57,0 79,8
9 67,0 57,0
10 81,0 38,0
11 92,0 23,1
12 48,0 112,0
13 59,0 72,0
14 68,0 55,7
15 83,0 36,0
16 52,0 85,2
17 62,0 72,8
18 69,0 54,6
19 85,0 37,0
20 70,0 56,4
21 71,0 56,0
22 64,0 70,4
23 72,0 53,6
24 88, 34,9
25 73,0 55,4
26 74,0 52,0
27 96,0 20,4
28 75,0 53,1
29 101,0 12,0
30 76,0 46,0
2) Для того щоб побудувати аналітичний та комбінацій розподіл підприємств України (табл. 1),
необхідно визначити кількість груп та ширину інтервалу. Визначаємо кількість груп по формулі
f ,
(1.3) х – це середина кожного інтервалу
i
41 3 51 5 61 7 71 10 81 3 91* 2
x
30
123 255 427 710 243 182 1940
64,67 грн
30 30
Мода ( M ) - найчастіше значення ознаки, що зустрічається в сукупності. Мода, широко
o
використовується в статистичній практиці при вивченні купівельного попиту, реєстрації цін і інше.
f mo f mo1
Mo X mo h (1.4)
( f mo f mo1 ) ( f mo f mo1 ) ,
X mo –нижня границя інтервалу для M o , f mo – частота для інтервалу M o ,
f mo1 – попередня частота, f mo1 – наступна частота.
Модальний інтервал – це інтервал, що характеризується найбільшою кількістю влучень випадкової
величини. В нашому випадку модальним інтервалом є 66-76 тому що має найбільше значення fi.
Визначимо модальний інтервал:
10 7
M o 66 10 * 69 грн.,
(10 7) (10 3)
Тобто, найчастіше зустрічається вартість ОФ по підприємствах України в розмірі 69 грн.
Медіана ( M e ) – значення ознаки у статистичної одиниці, що стоїть в середині рангового ряду і
ділить сукупність на дві рівні за чисельністю частини.
N me S me 1
M e хme h (1.5)
f me ,
2 - медіаний номер
f (1.6)
N me ,
Q Q 2 13,29
грн.
Для оцінки однорідності сукупності розрахуємо середньоквадратичний коефіцієнт варіації.
Q
VQ *100% 13,29 / 64,67 20,55%
x
Таким чином, можна зробити висновок, що сукупність однорідна, так як розрахований коефіцієнт
варіації менше 33 %.
Наступним кроком знайдемо межі для середнього значення факторної ознаки у генеральній
сукупності, якщо представлені дані отримані шляхом 10% відбору з імовірністю 0,997.
При ймовірності 0,997 t=3. Знайдемо N з пропорції :
2 176,55 30
=
n
(1 - ) (1
- ) = 2,30
n N 30 300
x 3 * 2,30 6,90 64,67 - 6,90 ≤ x ≤ 64,67 6,90
57,77 ≤ x ≤ 71,57
Таким чином, з ймовірністю 0,997 можна стверджувати, що вартість ОсФ для генеральної сукупності
знаходиться в межах від 57,77 грн. до 71,57грн.
p = t *
m 2 w (1 - w ) n
w 0.067 = (1 - )
n 30 n N
0,067(1 - 0,067) 30
(1 - =0,043 p 2 * 0,043 0,086
30 300
0,067 - 0,086 p 0,067 0,086
- 0,019 p 0,153
Таким чином, з ймовірністю 0,954 можна стверджувати, що доля регіонів, які входять до останнього
інтервалу знаходиться в межах від 0,019 до 0,153.
23.