You are on page 1of 94

Статистическо оценяване – от

извадка към популация. Защо е


необходимо? Същност.

Стандартна и максимална грешка.

Интервал на доверителност –
стъпки за построяване.

Практически стъпки при


статистическо оценяване.
Въпрос 1
• С каква цел се прави оценка на
данни от репрезентативни извадки?:
1) За да се установи съществено ли е
различието между тях;
2) За да се обобщят данните от извадката
за популацията;
3) За да се уеднакви структурата на
средата от която са изчислени данните;
Въпрос 1
• С каква цел се прави оценка на
данни от репрезентативни извадки?:
1) За да се установи съществено ли е
различието между тях;
2) За да се обобщят данните от извадката
за популацията;
3) За да се уеднакви структурата на
средата от която са изчислени данните;
Въпрос 2
• Грешката на средната аритметична
величина в извадката:
1) Се дължи на неподходящи техники на
подбор;
2) Намалява с увеличаване на размера на
извадката;
3) Не зависи от стандартното отклонение;
4) Винаги е равна на единица;
Въпрос 2
• Грешката на средната аритметична
величина в извадката:
1) Се дължи на неподходящи техники на
подбор;
2) Намалява с увеличаване на размера на
извадката;
3) Не зависи от стандартното отклонение;
4) Винаги е равна на единица;
Въпрос 3
• Как се променя репрезентативната
грешка при четирикратно
увеличаване на броя на
наблюдаваните случаи?:
1) Репрезентативната грешка намалява
два пъти;
2) Репрезентативната грешка нараства;
3) Репрезентативната грешка намалява
четири пъти;
Въпрос 3
• Как се променя репрезентативната
грешка при четирикратно
увеличаване на броя на
наблюдаваните случаи?:
1) Репрезентативната грешка намалява
два пъти;
2) Репрезентативната грешка нараства;
3) Репрезентативната грешка намалява
четири пъти;
Въпрос 4
• Какво трябва да направим, ако
желаем да намалим три пъти
репрезентативната грешка?:
1) Да намалим девет пъти броя на
наблюдаваните случаи;
2) Да увеличим броя на наблюдаваните
случаи девет пъти;
3) Да увеличим три пъти броя на
наблюдаваните случаи;
Въпрос 4
• Какво трябва да направим, ако
желаем да намалим три пъти
репрезентативната грешка?:
1) Да намалим девет пъти броя на
наблюдаваните случаи;
2) Да увеличим броя на наблюдаваните
случаи девет пъти;
3) Да увеличим три пъти броя на
наблюдаваните случаи;
Въпрос 5
• Извадка от 3600 случая е подбрана
случайно от безкрайно голяма
популация. Стандартното отклонение
е равно на 10. Грешката на средната
аритметична е:
1) 2/15;
2) 1/6;
3) 4/5;
4) 10;
5) Никое от посочените;
Въпрос 5
• Извадка от 3600 случая е подбрана
случайно от безкрайно голяма
популация. Стандартното отклонение
е равно на 10. Грешката на средната
аритметична е:
1) 2/15; s
sx 
2) 1/6; n
3) 4/5;
4) 10;
5) Никое от посочените;
Въпрос 6
• Коефициентът на доверителност представлява
вероятността, че даден неизвестен параметър
има определена стойност:
1) Вярно;
2) Невярно;

• Коефициентът на доверителност представлява


вероятността, че даден неизвестен параметър
ще се намира в рамките на даден интервал:
1) Вярно;
2) Невярно;
Въпрос 6
• Коефициентът на доверителност представлява
вероятността, че даден неизвестен параметър
има определена стойност:
1) Вярно;
2) Невярно;

• Коефициентът на доверителност представлява


вероятността, че даден неизвестен параметър
ще се намира в рамките на даден интервал:
1) Вярно;
2) Невярно;
Въпрос 7
• Как се определя доверителния
интервал на средната величина в
популацията?:
1) Към средната от извадката се прибавя и
изважда 0,5 пъти стандартното
отклонение;
2) Към средната от извадката се прибавя и
изважда 2 пъти репрезентативната
грешка;
3) Към средната се прибавя и изважда t
пъти репрезентативната грешка;
Въпрос 7
• Как се определя доверителния
интервал на средната величина в
популацията?:
1) Към средната от извадката се прибавя и
изважда 0,5 пъти стандартното
отклонение;
2) Към средната от извадката се прибавя и
изважда 2 пъти репрезентативната
грешка;
3) Към средната се прибавя и изважда t
пъти репрезентативната грешка;
Въпрос 8
• Извадка от 16 случая е извлечена от популация
с нормално разпределение. За да
определите 99% интервал на доверителност
при и s = 20, каква трябва да бъде
стойността на t-критерия от таблицата за
критичните му стойности?:
1) 2,602;
2) 2,326;
3) 2,576;
4) 2,947
5) 2,921
Въпрос 8
• Извадка от 16 случая е извлечена от популация
с нормално разпределение. За да
определите 99% интервал на доверителност
при и s = 20, каква трябва да бъде
стойността на t-критерия от таблицата за
критичните му стойности?:
1) 2,602;
2) 2,326; CI = 99%;
3) 2,576; df = n – 1 = 16 – 1 = 15;
4) 2,947 t = 2,947
5) 2,921
Въпрос 9
• При интервална оценка на средна
величина за дадена популация,
ширината на интервала може да бъде
стеснена чрез?:
1) Увеличаване на размера на извадката;
2) Намаляване на коефициента на
доверителност;
3) Намаляване на стандартното
отклонение;
4) Всичко посочено е вярно;
Въпрос 9
• При интервална оценка на средна
величина за дадена популация,
ширината на интервала може да бъде
стеснена чрез?:
1) Увеличаване на размера на извадката;
2) Намаляване на коефициента на
доверителност;
3) Намаляване на стандартното
отклонение;
4) Всичко посочено е вярно;
Въпрос 10
• Кое от посоченото може да доведе до
най-тесен интервал на доверителност?:
1) Голяма извадка и интервал на
доверителност 0,95;
2) Голяма извадка и интервал на
доверителност 0,99;
3) Малка извадка и интервал на
доверителност 0,95;
Въпрос 10
• Кое от посоченото може да доведе до
най-тесен интервал на доверителност?:
1) Голяма извадка и интервал на
доверителност 0,95;
2) Голяма извадка и интервал на
доверителност 0,99;
3) Малка извадка и интервал на
доверителност 0,95;
Статистически
хипотези.

Параметрични методи
за проверка на
хипотези.
Въпроси 1
• Грешка от I род се допуска винаги, когато:
– Нулевата хипотеза се отхвърля, когато тя е вярна;
– Нулевата хипотеза не се отхвърля, когато тя е
невяра;
– Алтернативната хипотеза се отхвърля, когато тя е
вярна;

• Нивото на значимост на алтернативната


хипотеза представлява:
– Вероятността, че наблюдаваното различие се
дължи на случайност;
– Вероятността, че наблюдаваното различие се
дължи на закономерни причини;
– И двете са верни;
Въпроси 1
• Грешка от I род се допуска винаги, когато:
– Нулевата хипотеза се отхвърля, когато тя е вярна;
– Нулевата хипотеза не се отхвърля, когато тя е
невяра;
– Алтернативната хипотеза се отхвърля, когато тя е
вярна;

• Нивото на значимост на алтернативната


хипотеза представлява:
– Вероятността, че наблюдаваното различие се
дължи на случайност;
– Вероятността, че наблюдаваното различие се
дължи на закономерни причини;
– И двете са верни;
Въпроси 2
• Ако стойността на р (Н0) за даден
статистически критерий е р>0,25, тогава:
– Нулевата хипотеза трябва да се приеме;
– Нулевата хипотеза се отхвърля;
– Нито едно от двете;

• Нивото на значимост на нулевата хипотеза


представлява:
– Вероятността, че наблюдаваното различие се
дължи на случайност;
– Вероятността, че наблюдаваното различие се
дължи на закономерни причини;
– Нито едно от двете;
Въпроси 2
• Ако стойността на р (Н0) за даден
статистически критерий е р>0,25, тогава:
– Нулевата хипотеза трябва да се приеме;
– Нулевата хипотеза се отхвърля;
– Нито едно от двете;

• Нивото на значимост на нулевата хипотеза


представлява:
– Вероятността, че наблюдаваното различие се
дължи на случайност;
– Вероятността, че наблюдаваното различие се
дължи на закономерни причини;
– Нито едно от двете;
Въпроси 3
• Статистическа значимост означава, че ако
даден експеримент се повтори многократно:
– Със сигурност биха се наблюдавали отново
същите резултати;
– Вероятно биха се наблюдавали същите резултати;
– Вероятно не биха се наблюдавали същите
резултати;

• Въпреки че говорим за два типа грешки (I и II


род), при проверка на дадена хипотеза можем
да направим едновременно само една
грешка:
– Вярно;
– Невярно;
Въпроси 3
• Статистическа значимост означава, че ако
даден експеримент се повтори многократно:
– Със сигурност биха се наблюдавали отново
същите резултати;
– Вероятно биха се наблюдавали същите резултати;
– Вероятно не биха се наблюдавали същите
резултати;

• Въпреки че говорим за два типа грешки (I и II


род), при проверка на дадена хипотеза можем
да направим едновременно само една
грешка:
– Вярно;
– Невярно;
Въпроси 4
• Решението за използване на едностранен
или двустранен тест при проверка на
хипотези обикновено се взема след
анализиране на данните:
– Вярно;
– Невярно;

• Вероятност на Н0 р=0,001 означава, че тя със


сигурност е невярна:
– Вярно;
– Невярно;
Въпроси 4
• Решението за използване на едностранен
или двустранен тест при проверка на
хипотези обикновено се взема след
анализиране на данните:
– Вярно;
– Невярно;

• Вероятност на Н0 р=0,001 означава, че тя със


сигурност е невярна:
– Вярно;
– Невярно;
Въпроси 5
• Грешка от I род представлява:
– Приемане на нулевата хипотеза, когато тя не е
вярна;
– Приемане на нулевата хипотеза, когато тя е вярна;
– Отхвърляне на нулевата хипотеза, когато тя е вярна;

• Грешка от II род се отнася до:


– Отхвърляне на нулевата хипотеза, когато
алтернативната е вярна;
– Избиране на грешно решение;
– Приемане на нулевата хипотеза, когато
алтернативната е вярна;
Въпроси 5
• Грешка от I род представлява:
– Приемане на нулевата хипотеза, когато тя не е
вярна;
– Приемане на нулевата хипотеза, когато тя е вярна;
– Отхвърляне на нулевата хипотеза, когато тя е вярна;

• Грешка от II род се отнася до:


– Отхвърляне на нулевата хипотеза, когато
алтернативната е вярна;
– Избиране на грешно решение;
– Приемане на нулевата хипотеза, когато
алтернативната е вярна;
Въпроси 6
• Коя хипотеза се използва най-често, като
работна при научните проучвания?:
– Нулевата хипотеза;
– Алтернативната хипотеза;
– И двете се използват еднакво често;

• Сумата от вероятностите на нулевата и


алтернативната хипотеза:
– Е в интервала от 0,0 до 1,0;
– Може да надхвърли 1,0;
– Винаги е равна на 1,0;
Въпроси 6
• Коя хипотеза се използва най-често, като
работна при научните проучвания?:
– Нулевата хипотеза;
– Алтернативната хипотеза;
– И двете се използват еднакво често;

• Сумата от вероятностите на нулевата и


алтернативната хипотеза:
– Е в интервала от 0,0 до 1,0;
– Може да надхвърли 1,0;
– Винаги е равна на 1,0;
Непараметрични методи за
проверка на хипотези.

Критерий хи-квадрат (χ2).

Корелационен анализ –
принцип, подходящо
графично представяне.
Въпроси 1
• Кой е най-често използваният критерий
при непараметричен анализ?
– t-критерий на Студент;
– Критерий на Фишер;
– Критерий хи-квадрат;

• Хи-квадрат се изчислява само на


основата на:
– Абсолютни числа;
– Предварително изчислени средни
стойности;
– Предварително изчислени проценти;
Въпроси 1
• Кой е най-често използваният критерий
при непараметричен анализ?
– t-критерий на Студент;
– Критерий на Фишер;
– Критерий хи-квадрат;

• Хи-квадрат се изчислява само на


основата на:
– Абсолютни числа;
– Предварително изчислени средни
стойности;
– Предварително изчислени проценти;
Въпроси 2
• Степента на свобода при хи-квадрат се
определя:
– df = n-1;
– df = r.c – 1 (r-редове, c-колони на таблицата);
– df = (s – 1) (r - 1);

• Определете ниво на значимост на Н0 при


χ2 = 6.2 и степен на свобода df = 2:
– р (Н0 ) < 0.05;
– р (Н0 ) > 0.05;
– р (Н0 ) < 0.01;
Въпроси 2
• Степента на свобода при хи-квадрат се
определя:
– df = n-1;
– df = r.c – 1 (r-редове, c-колони на таблицата);
– df = (s – 1) (r - 1);

• Определете ниво на значимост на Н0 при


χ2 = 6.2 и степен на свобода df = 2:
– р (Н0 ) < 0.05;
– р (Н0 ) > 0.05;
– р (Н0 ) < 0.01;
Въпроси 3

• При χ2 = 12.7 и степен на свобода df = 3,


различието между сравняваните групи е:
– случайно;
– значимо, дължащо се на закономерни причини;
– недостоверно;
Въпроси 3

• При χ2 = 12.7 и степен на свобода df = 3,


различието между сравняваните групи е:
– случайно;
– значимо, дължащо се на закономерни причини;
– недостоверно;
Въпроси 4

• Направете извод за влияние на


тютюнопушенето върху заболеваемостта
от рак на белите дробове, ако нивото на
значимост на нулевата хипотеза е р (χ2 )
< 0.05:
– няма съществено влияние;
– има съществено влияние;
– не може да се направи извод от тези данни;
Въпроси 4

• Направете извод за влияние на


тютюнопушенето върху заболеваемостта
от рак на белите дробове, ако нивото на
значимост на нулевата хипотеза е р (χ2 )
< 0.05:
– няма съществено влияние;
– има съществено влияние;
– не може да се направи извод от тези данни;
Въпроси 5

• Колкото е по-голямо различието между


фактическите и очакваните честоти
при изчисляване на хи-квадрат:
– толкова по-вероятно е резултатите да
бъдат незначими;
– толкова по-вероятно е да бъде отхвърлена
нулевата хипотеза;
– нито едно от двете;
Въпроси 5

• Колкото е по-голямо различието между


фактическите и очакваните честоти
при изчисляване на хи-квадрат:
– толкова по-вероятно е резултатите да
бъдат незначими;
– толкова по-вероятно е да бъде отхвърлена
нулевата хипотеза;
– нито едно от двете;
ВЪПРОСИ ЗА САМОПОДГОТОВКА

1. За определяне коефициента на корелация между х и у е необходимо да разполагаме с:


A. група лица, някои от които притежават променливата х, а останалите – променливата y
Б. измервания на променливата х при една група лица и променливата y при друга група
B. измервания на променливите х и у при всяко лице в една и съща група

2. Диаграмата на разсейването представлява графично средство за откриване и анализиране


на връзка между две променливи
А. вярно Б. невярно

3. Даден изследовател установява, че корелацията между личностовите черти “алчност” и


“надменност” е -0.40. Какъв процент от варирането в алчността може да бъде обяснено чрез
връзката с надменността?
А. 60% Б.0% В. 16% Г. 20% Д. 40%

4. Каква част от варирането на зависимата променлива е свързана с независимата


променлива х, ако коефициент на корелация между двете променливи е r = 0.5?
A. най-голямата част
Б. половината
B. много малка част
Г. една четвърт (25%)

5. Коя стойност на r показва най-силна зависимост на една променлива от друга?


А. r = 1.18 Б. r = -0.77 В. r = 0.68 Г. r = 0.45

6. Ако корелацията между възрастта на колите и средствата за ремонт е +0.90, то:


A. 81% от изразходваните средства за ремонт се обясняват с възрастта на колите
Б. 81% от изразходваните средства за ремонт не зависят от възрастта на колите
B. 90% от изразходваните средства за ремонт може да се обяснят с възрастта на колите

7. Ако коефициентът на корелация е 0.61, това показва, че пропорцията от варирането в


зависимата променлива, която се обяснява с варирането в независимата променлива е:

А. 37% Б. 61% В. 98% Г. не може да се определи

8. Да предположим, че между средния успех на учащите се в един колеж и резултатите от


представянето им на тест за интелигентност е установен коефициент на корелация r = 0.40. Какъв
общ процент вариране имат тези две променливи?
А. 20 Б. 16 В. 40 Г.80

9. Ако в даден експеримент r = 0.70, то тогава 49% от варирането на зависимата променлива


У може да се обясни с различията в променливата X.
А. вярно Б. невярно

10. Коефициентът на корелация може да има стойности между -1 и + 1.


А. вярно Б. невярно

11. Коефициентът на детерминация може да има стойности между -1 и + 1.


А. вярно Б. невярно

12. Коефициентът на корелация между х и у е - 0.95. Кое от следните заключения е вярно?


A. линейната връзка между х и у е слаба и у намалява, когато x нараства.
Б. линейната връзка между х и у е силна и у намалява, когато x нараства.
B. линейната връзка между х и у е силна и у нараства, когато х нараства.

13. Ако коефициентът на корелация между х и у в извадка е - 1, то:


A. няма връзка между x и у в извадката
Б. няма връзка между x и у в популацията
B. има пълна (функционална) отрицателна връзка между х и у в популацията
Г. има пълна (функционална) отрицателна връзка между х и у в извадката

14. При проучване на връзката между IQ (коефициент на интелигентност) и средния успех от


следването в един колеж, кой от следните статистически анализи е най-подходящ?
A. коефициент на корелация
Б. дисперсионен анализ
B. t-критерий

15. При проучване на връзката между самооценката за подготовката и постиженията при лица
в дадена извадка е изчислен коефициент на корелация r = 0.75. Това показва, че връзката между
тези две променливи е:
A. слаба и положителна
Б. силна и положителна
B. слаба и отрицателна
Г. силна и отрицателна

16. Корелацията между изпълнението на сложни задачи (x) и състоянието на тревожност (у) е r
- 0.73. Какво заключение може да се направи?
A. с нарастване на тревожността се подобрява изпълнението на сложни задачи
Б. подобряването на изпълнението на сложни задачи намалява тревожността
B. високо ниво на тревожност причинява лошо изпълнение на сложни задачи

17. Ако коефициентът на корелация на Пирсон r = - 0.75, то това означава, че:


A. индивидите с високи резултати за едната променлива проявяват тенденция към ниски
резултати за другата променлива
Б. индивидите с високи резултати за едната променлива проявяват тенденция към високи
резултати и за другата променлива
B. няма връзка между двете променливи
Г. връзката е в противоположна посока от първоначалното предвиждане Д. допусната е
грешка

18. Изчислен е коефициент на корелация r = -1.08 между резултатите от кандидат-


студентските изпити и успеваемостта на студентите през следващите години. Какъв е изводът?
A. резултатите от кандидат-студентските изпити са добър прогностичен признак за успех
Б. университетът трябва да си наеме друг статистик
B. резултатите от кандидат-студентските изпити са лош прогностичен признак за успех
Г. кандидатите, които се представят най-добре ще станат най-лоши студенти

19. Под диаграмата на разсейване е отбелязано, че r = 0.10. Какво означава това?


A. плюс и минус 10% от средните стойности включват около 68% от случаите
Б. една десета от дисперсията на дадена променлива се споделя с другата променлива
B. една десета от едната променлива е причинена от другата променлива
Г. степента на линейна връзка между двете променливи е +0.10 по скала от-1 до +1.

20. Коя от посочените стойности на коефициента на корелация показва ситуация, където


повече от половината от промените в едната величина са свързани с промени в другата?
А. r = -0.7 Б. r = 0.3 В. r = -0.9 Г. r = - 0.6 Д. r = 1.0

21. Ако коефициентът на корелация между x и у е равен на нула, то:


A. x и у имат стандартни разпределения
Б. дисперсиите над x и у са еднакви
B. има връзка между х и у
Г. няма линейна връзка между х и у

22. Установена е връзка между две променливи с r = - 0.90. Това показва, че:
A. изчислението е грешно, тъй като r не може да бъде отрицателно число
Б. има много слаба връзка между двете променливи
B. коефициентът на детерминация е равен на корен квадратен от 0.90
Г. променливата У има тенденция да намалява при нарастване на променливата X.

23. Коефициент на корелация r = - 0.80:


A. е по-малък от r = + 0.80
Б. показва същата сила на връзка както r = + 0.80
B. е по-висок от r = + 0.80
Г. не може да се прави сравнение между r = - 0.80 и r = + 0.80

24. Коя от следните стойности най-добре би характеризирала връзката между две променливи:
“брой отработени часове” и “количество извършена работа”?
A. приблизително 0.9
Б. приблизително 0.4
B. приблизително 0.0

25. Знакът (плюс или минус) на коефициента на корелация показва:


A. посоката на корелационната зависимост
Б. практическата значимост на зависимостта
B. вероятността, че степента на връзката е по-голяма от нула

26. Корелацията между резултати от тест за неврастения и тест за тревожност е силна и


положителна, Следователно:
A. тревожността не причинява неврастения
Б. лицата с ниски резултати при единия тест показват високи резултати при другия тест
B. лицата с ниски резултати от единия тест показват ниски резултати и при другия

27. При корелационния анализ, когато точките се разпръскват широко около линията на
регресия, това означава че корелацията е:
A. отрицателна
Б. слаба
B. силна
28. Ако r е близо до +1 или -1, ще кажем, че има силна корелация, подразбирайки безусловно,
че говорим само за линейна зависимост.
А. вярно Б. невярно

29. Ако знаем, че коефициентът на корелация при обикновена линейна зависимост е


положителен за две променливи (x и у ), тогава регресията на у по отношение на x ще се представи
чрез линия на регресия, която е наклонена отгоре надолу, започвайки отляво надясно.
А. вярно Б. невярно

30. Ако знаем, че коефициентът на корелация при обикновена линейна зависимост е


положителен за две променливи (х и у), тогава регресията на у по отношение на x ще се представи
чрез линия на регресия, която е наклонена отдолу нагоре, започвайки отляво надясно.
А. вярно Б. невярно

31. Когато r е изчислен от извадка, стойността, която получаваме за r е само една оценъчна
стойност за истинския параметър на корелация за цялата популация.
А. вярно Б. невярно

32. При сравняване на хи-квадрат и коефициента на корелация (r) вярно е:


A. коефициентът на корелация е с по-голяма мощност от хи-квадрат
Б. коефициентът на корелация е с по-малка мощност от хи-квадрат
B. няма разлика в мощността на двата критерия

33. Кое от посочените твърдения не е вярно?


A. коефициентът на корелация е с по-голяма мощност от хи-квадрат
Б. коефициентът на корелация е с по-малка мощност от хи-квадрат
B. има разлика в мощността на двата критерия

34. Корелационният анализ се прилага:


A. само при качествени променливи
Б. само при количествени променливи
B. и при двата вида променливи

35. При избор на коефициент за корелация за дадени конкретни данни, трябва да отчетем:
A. дали зависимостта е линейна или нелинейна
Б. вида на скалата за измерване на всяка променлива
B. и двете условия

36. Най-подходящ за изучаване на взаимовръзка между променливи величини е:


A. средна аритметична величина
Б. коефициент за честота
B. корелационен коефициент

37. Определете степента и посоката на корелацията при r = + 0.65, като използвате 5- степенна
скала за оценка:
A. умерена права връзка
Б. умерена обратна връзка
B. значителна права връзка

38. Определете степента и посоката на корелационна връзка при коефициент на корелация r =


- 0.23, ако използвате 5-степенна скала за оценка:
A. умерена права връзка
Б. значителна обратна връзка
B. слаба обратна връзка

39. Казват Ви, че съществува силна обратна връзка между променливите “количество
физически упражнения” и “честота на сърдечни заболявания”. Кой от следващите корелационни
коефициенти съответства на това твърдение?
А. r =+0.8 Б. r = - 0.3 В. r = - 0.8 Г. r = + 0.9

40. При отрицателна корелационна зависимост:


A. с нарастване на x, нараства у
Б. с намаляване на х, намалява у
B. с нарастване на х, намалява y

41. Кой от следващите корелационни коефициенти отразява най-слаба зависимост?


А. r = - 0.60 Б. r = - 0.33 В. r = + 0.29 Г. r = + 0.5

42. Ако корелацията между х и у е положителна, зависимата променлива y намалява:


A. при нарастване на х
Б. запазване на x на едно и също ниво
B. при намаляване на x
43. Изберете най-подходящия статистически тест за определяне на връзката между нивото на
систоличното налягане и серумния холестерол като имате предвид, че и двете променливи
величини са изразени количествено:
A, коефициент на рангова корелация на Спирман
Б. коефициент на корелация на Пирсон
B. хи-квадрат

44. Кое от следните твърдения за корелацията е невярно?


A. Коефициентът за рангова корелация на Спирман се използва при количествени
променливи
Б. Корелационен коефициент r = - 0.8 показва по-висока степен на връзка между две
променливи, отколкото r=+0.6.
B. Построяването на диаграма на разсейването е полезно за оценяване дали определена
връзка между две променливи е праволинейна или криволинейна.

45. При изчисляване на коефициента за рангова корелация на Спирман изходните данни


трябва да бъдат представени в:
A. номинална скала
Б. ординална скала
B. интервална скала

46. Регресионният анализ служи за:


A. установяване на достоверност на различията
Б. измерване на централна тенденция
B. моделиране на линейни зависимости

47. За количествено измерване на промените в зависимата променлива (у) при единица


промяна на независимата променлива (х) се използва:
A. стандартно отклонение
Б. коефициент на корелация
B. коефициент на регресия

48. Корелацията се дефинира като относителна разлика между две променливи.


А. вярно Б. невярно

49. Връзката между две променливи може да се представи чрез диаграма на разсейването.
А. вярно Б. невярно
50. Когато говорим за положителна зависимост, това означава, че високи стойности на едната
променлива са свързани с високи стойности на другата променлива.
А. вярно Б. невярно

51. При отрицателна зависимост ниски стойности на едната променлива са свързани с ниски
стойности на другата променлива.
А. вярно Б. невярно

52. Има няколко вида коефициенти на корелация, изборът на които се определя от вида на
скалата, чрез която се измерват двете променливи величини.
А. вярно Б. невярно

53. Когато и двете променливи се измерват върху интервална или пропорционална скала, най-
подходящ е коефициентът на корелация на Пирсон.
А. вярно Б. невярно

54. Когато двете променливи се измерват върху ординална скала, трябва да се използва
коефициент на корелация 𝜑(фи).
А. вярно Б. невярно

55. За две променливи величини, измерени върху номинална скала, се използва 𝜌 (ро) за
изразяване на корелация.
А. вярно Б. невярно

56. При коефициент на корелация на Пирсон се приема, че двете променливи са непрекъснати


и с нормално разпределение.
А. вярно Б. невярно

57. Стойностите на коефициента на корелация се намират в интервала между 0 и -1.


А. вярно Б. невярно

58. Коефициент на корелация -1.0 представя много ниска линейна корелация.


А. вярно Б. невярно

59. Коефициентът на детерминация е равен на квадрата на коефициента на корелация.


А. вярно Б. невярно
60. Ако r = 0.3, то коефициентът на детерминация ще бъде 9.0%.
А. вярно Б. невярно

61. Ако r = 0.36, то това означава, че 36% от вариабилността на у се дължи на независимата


променлива х.
А. вярно Б. невярно

62. Дори висока корелация не е непременно доказателство за причинна връзка между две
променливи величини.
А. вярно Б. невярно

63. С нарастване на стойността на r, делът на промените y, които може да се обяснят с x,


намалява.
А. вярно Б. невярно

64. Диаграмата на разсейването се използва, за да помогне да се реши дали връзката между


две променливи е праволинейна или криволинейна.
А. вярно Б. невярно

65. Коефициентът на корелация на Спирман 𝜌 (ро) се изчислява, когато едната или двете
променливи се измерват с интервална скала.
А. вярно Б. невярно
Примерни въпроси
В1. Работна книга (book) в EXCEL
съдържа:
1. работни листи таблици.
2. работни листи графики.
3. формули и функции.
4. работни листи таблици и
работни листи графики.
В2. Произволни клетки в таблица
се избират с:
1. Натиснат ляв бутон на
мишката.
2. Натиснат десен бутон на
мишката.
3. Клавиш Ctrl и ляв бутон на
мишката.
4. Клавиш Alt и ляв бутон на
мишката.
В3. Сравняване на стойностите
на различни категории се
представя чрез:
1. Лентова и стълбова
диаграма.
2. Кръгово-секторна диаграма.
3. Линейна диаграма.
4. Диаграма на разсейване.
В4. Тенденция във времето или в
категории се представя чрез:
1. Лентова и стълбова
диаграма.
2. Кръгово-секторна диаграма.
3. Линейна диаграма.
4. Диаграма на разсейване.
В5. Част от цялото (частта на
всяка от категориите в цялото)
се представя чрез:
1. Лентова и стълбова
диаграма.
2. Кръгово-секторна диаграма.
3. Линейна диаграма.
4. Диаграма на разсейване.
В6. Популацията представлява:
1. голяма група индивиди.
2. число или измерване,
получено в резултат на
наблюдение.
3. пълен набор от индивиди,
предмети или измервания,
имащи общи
характеристики.
4. нито едно от посочните.
В7. Интервалната скала има
абсолютна нула.
1. Вярно.
2. Невярно.

В8. Екстензивните показатели са


показатели за честота
(разпространение), а
интензивните показатели са
показатели за структура
(разпределение)
1. Вярно.
2. Невярно.
В9. Изследовател разделя
извадка от пациенти на HIV-
положителни и HIV-
отрицателни. Какъв тип данни
се обособява при това
разделяне?
1. Пропорционални.
2. Номинални.
3. Ординални.
4. Интервални.
В10. Какъв тип данни ще се
генерира относно броя на
бирите, които група студенти
изпиват за месец?
1. Номинални.
2. Ординални.
3. Интервални.
4. Пропорционални.
В11. Данни, представени на
интервална или
пропорционална скала, се
изобразяват като:
1. хистограма.
2. честотен полигон.
3. стълбова диаграма.
В12. С каква цел се
стандартизират общи
интензивни показатели?
1. да се определи оптималния
брой случаи за наблюдение.
2. да се направи оценка на
нулевата хипотеза.
3. да се отстранят различията в
структурата на средата.
4. да се определят пропорции за
различните възрастови групи.
В13. Кое от следните твърдения НЕ Е ВЯРНО?
1. Ако разпределението е симетрично, средната
аритметична е равна на медианата.
2. Средната аритметична на извадка е по-
чувствителна към екстеремни стойности от
медианата.
3. Стандартното отклонение на извадка е мярка
на централната тенденция около средната.
4. Размахът на извадка е по-чувствителен към
екстремни стойности от стандартното
отклонение.
5. Стандартното отклонение на извадка е мярка
на варирането около средната.
В14. Модата е:
1. стойността, която дели
вариационния ред на две
равни части.
2. стойността, която се среща
най-често във вариационния
ред.
3. стойността, която рязко се
отличава от останалите във
вариационния ред.
В15. Стандартното отклонение и
дисперсията са:
1. Мерки на централната
тенденция.
2. Мерки на разсейването.
3. Показатели за честота.
4. Показатели за структура.
В16. В честотно разпределение
от 250 елемента, средната е
44, а медианата е 65. Какъв е
вида на разпределението?
1. Положително (дясно)
изтеглено.
2. Отрицателно (ляво) изтеглено.
3. Нормално разпределение.
4. Бимодално.
В17. Искате да знаете по колко филма за
месец гледат студентите във Варна.
Имате извадка от 144 студента за която
се знае, че средния брой филми
гледани за месец е 12.00, а
стандартното отклонение е 3.00. Каква е
най-добрата оценка за средния брой
филми, гледани от варненските
студенти?
1. 3.00.
2. 12.00.
3. Не е възможно да се прецени.
В18. Искате да знаете по колко филма
за месец гледат студентите във Варна.
Имате извадка от 144 студента за която
се знае, че средният брой филми
гледани за месец е 12.00, а
стандартното отклонение е 3.00. Каква е
най-добрата оценка за стандартната
грешка (SEM)?
1. 0.2.
2. 0.25.
3. 12.
В19. Искате да знаете по колко филма за
месец гледат студентите във Варна. Имате
извадка от 144 студента за която се знае, че
средният брой филми гледани за месец е
12.00, а стандартното отклонение е 3.00.
Каква е най-добрата оценка за средния
брой филми, гледани от Варненските
студенти? Ако трябва да сте 99% сигурни във
вашия отговор, какъв е интервала на
грешката, която можете да приемете?
1. ± 2.58*SEM.
2. ± 1.96*SEM.
99% CI (11,355 ÷ 18,45)
3. ± 1.65*SEM.
В20. Каква е връзката между
размера на извадката и
стандартната грешка?
1. При по-малки извадки има по-малка
стандартна грешка.
2. Връзката е обратно пропорционална:
ако се увеличи размера на извадката
с фактор C, стандартната грешка се
намалява с фактор единица върху
квадртатен корен от C.
3. Нито едно от посочените.
В21. Какво е Грешка от I род?
1. Извършвате грешка от I род, ако
приемете невярна нулева
хипотеза.
2. Извършвате грешка от I род, ако
отхвърлите невярна нулева
хипотеза.
3. Извършвате грешка от I род, ако
отхвърлите вярна нулева хипотеза.
4. Извършвате грешка от I род, ако
приемете вярна нулева хипотеза.
В22. Какво е Грешка от II род?
1. Извършвате грешка от II род, ако
приемете невярна нулева
хипотеза.
2. Извършвате грешка от II род, ако
отхвърлите невярна нулева
хипотеза.
3. Извършвате грешка от II род, ако
отхвърлите вярна нулева хипотеза.
4. Извършвате грешка от II род, ако
приемете вярна нулева хипотеза.
В23. При нормално
разпределение около 95% от
случаите попадат между
средната и ±2.58 стандартни
отклонения от средната.
1. Вярно.
2. Невярно.
В24. Какво трябва да направим, ако
желаем да намалим два пъти
стандартната грешка?
1. да намалим четири пъти броя на
наблюдаваните случаи.
2. да намалим два пъти броя на
наблюдаваните случаи.
3. да увеличим броя на
наблюдаваните случаи четири пъти.
4. да увеличим два пъти броя на
наблюдаваните случаи.
В25. Има ли закономерно
различие между средния ръст
при градски и селски
новородени момчета, ако t =
2.345, р< 0.058
1. има закономерно различие.
2. различието е съществено.
3. различието е случайно.
4. различието е закономерно и
статистически значимо.
В26. Имате оценките на две извадки от 12
студенти, включени в два курса, покриващи
един и същи материал по биостатистика.
Да предположим, че искате да проверите дали
средната оценка на студентите от Курс А е по-
висока от тази на студентите от Курс В.
Кой тест е подходящ за случая, какви са
нулевата и алтернативната хипотези, тестът 1-
ностранен ли е или 2-вустранен?

1. t-test , H0: µA = µB; Halt: µA ≠ µB, 2-странен.


2. t-test , H0: µA ≤ µB; Halt: µA > µB, 1-странен.
3. t-test, H0: µA≥ µB; Halt: µA < µB, 1-странен.
4. z-test, H0: µA = µB; Halt: µA > µB, 1-странен.
5. z-test, H0: µA = µB; Halt: µA ≠ µB, 2-странен.
В27. 99% доверителен интервал за
средна (отбележете ГРЕШНИЯ
отговор):
1. Е добър начин за описване на
акуратността на проучването.
2. Ще включва средната на извадка с
вероятност 1.
3. Е по-тесен от 95% доверителен
интервал.
4. При повтарящи се извадки ще
включва средната на популацията в
99% от случаите.
В28. 99% доверителен интервал в
проучване е 72 ÷ 79. Това означава, че:
1. Вероятността средната на популацията
да бъде извън интервала 72 ÷ 79 е 0.0001.
2. Вероятността, интервалът 72 ÷ 79 да
включва средната на популацията е 0.95.
3. Вероятността средната на популацията
да бъде извън интервала 72 ÷ 79 е 0.05.
4. Вероятността, интервалът 72 ÷ 79 да
включва средната на популацията е 0.99.
5. Това не е валиден доверителен
интервал.
В29. Проучване отхвърля нулевата
хипотеза, че инкубационния период на
вируса Ебола е 3 седмици, t = 2.345, df
= 9, p < 0.01. Това означава, че:
1. При 1% от случите инкубационния
период е 3 седмици.
2. Средната продължителност на
инкубационния период е 9 дни.
3. Шансът, нулевата хипотеза да е
отхвърлена погрешно е 5%.
4. Шансът, нулевата хипотеза да е
отхвърлена погрешно е 1%.
В30. В извадка от 200 пациенти с хипертония,
които вземат определен медикамент е
установено, че стойностите на артериалното
кръвно налягане (АКН) и дозировката на
медикамента корелират r = -0.3, p<0.05. Може
да се направи следното заключение ОСВЕН:
1. Връзката между дозировката на
медикамента и стойностите на АКН най-
вероятно не е случайна.
2. Връзката между дозировката на
медикамента и стойностите на АКН е слаба
и отрицателна.
3. Независимо от други фактори, дозировката
на медикамента причинява намаляване на
АКН.
4. Дозировката на медикамента допринася за
9% от варирането на АКН.
В31. Какво е нивото на
значимост, при което Нулевата
хипотеза се приема с 99%
доверителност?
1. р < 0.05.
2. р ≥ 0.05.
3. р > 0.01.
4. p < 0.01.
В32. Изследовател иска да сравни ефекта от
три различни комбинации от антивирусни
медикаменти върху преживяемостта на
две групи пациенти със СПИН: едната
група са наркомани, другата са деца на
наркомани, заразени in utero.
Всяка от тези групи е разделена на четири
подгрупи, получаващи различна
комбинация от медикаменти.
Каква статистическа техника е най-
подходяща за анализа на резултатитет от
проучването?
1. t-test.
2. Корелация и t-test.
3. ANOVA.
4. Хи-квадрат тест.
В33. Изследовател открива, че 169 от 212
HIV-положителнинаркомани са
починали след 5 години, докато само 64
от 439 НIV-отрицателни наркомани са
починали за същия период.
Каква статистическа техника ще се
използва за тестване на нулевата
хипотеза, че няма разлика между тези
пропорции?
1. t-test.
2. Корелация и t-test.
3. Хи-квадрат тест.
4. ANOVА.
В34. p-стойността:
1. Е най-ниското ниво на
значимост, при което нулевата
хипотеза може да се отхвърли.
2. Е единица минус Грешка от I
род.
3. Е голяма за малки проучвания.
4. Може да приема ограничени
стойности като 0.1, 0.05, 0.01.
В35. Мощността на теста е:
1. Е най-ниското ниво на значимост, при
което нулевата хипотеза може да се
отхвърли.
2. Е единица минус Грешка от II род.
3. Е единица минус Грешка от I род.
4. Може да приема ограничени
стойности като 0.1, 0.05, 0.01.
В36. Непараметричните тестове:
1. Са трудни за изчисление.
2. Са „независими от
разпределението“.
3. Се използват за оценка на поне
един популационен параметър
от извадкова статистика.
4. Са подходящи за големи извадки
и сериозно изкривени данни.
В37. Корелационният коефициент на
Пирсън (r):
1. Може да се използва за предвиждане на
стойностите на една променлива от тези
на друга.
2. Е мярка за измерване силата и
посоката на линейната зависимост на
две непрекъснати променливи.
3. Винаги е в диапазона 0 – 1.
4. Може да се използва за обобщаване на
връзката между стойностите на
хемоглобина и кръвната група на
извадка от хоспитализирани пациенти.
В38. Лектор докладва за намерен
коефициент на корелация r = + 1.33 между
физическата активност и сърдечно-
съдовите заболявания.
Какво заключение може да бъде направено:
1. между физическата активност и
сърдечно-съдовите заболявания
съществува много силна корелационна
зависимост.
2. връзката между физическата активност и
сърдечно-съдовите заболявания е
статистически значима.
3. лекторът не докладва коректно резултата.
4. връзката между физическата активност и
сърдечно-съдовите заболявания не е
статистически значима.
В39. Коефициентът на детерминация r2:
1. Е полезен начин за описване
прецизността на проучването.
2. Винаги е в диапазона -1 to +1.
3. Изразява частта от варирането на
зависимата променлива, което може
да се обясни чрез независимата
променлива.
4. Може да се използва за предвиждане
на стойностите на една променлива
от тези на друга.
В40. Искате да разработите методика за
предвиждане преживяемостта от
карцином на простатата. Каква
статистическа техника ще използвате?
1. Хи-квадрат тест.
2. t-test за независими извадки.
3. множествен регресионен анализ.
4. корелационен анализ.

You might also like