You are on page 1of 7

str.

Zaliczenie wykładu z przedmiotu


Biostatystyka z elementami informatyki

Poprawne odpowiedzi oznaczone są kolorem czerwonym.

Przykładowe pytania testowe


 Poniższych przykładowych pytań testowych nie należy traktować jako jedynych, które mogą pojawić się
na zaliczeniu wykładu.
 W każdym z poniższych pytań może być więcej, niż jedna prawidłowa odpowiedź.

1. Wartości pewnej cechy kształtowały się następująco: 4, 5, 3, 8, 9, 2, 2. Wynika stąd, że


a) mediana analizowanej cechy jest równa 8
b) rozstęp cechy wynosi 7
c) mediana analizowanej cechy jest równa 4
d) żadna z odpowiedzi a), b, c) nie jest prawdziwa

2. Miarami tendencji centralnej są


a) średnia arytmetyczna, odchylenie standardowe, moda
b) średnia arytmetyczna, moda, mediana
c) średnia arytmetyczna, mediana, wariancja

6. Standaryzowany rozkład normalny ma wartość oczekiwaną


a) dowolną
b) dodatnią
c) wynoszącą zero

7. Rozkład t-Studenta jest rozkładem


a) z asymetrią prawostronną
b) z asymetrią lewostronną
c) symetrycznym

8. Z poniższych wypowiedzi wybierz zdania prawdziwe:


a) Mediana służy do charakteryzowania rozproszenia wartości cechy.
b) Można wyznaczyć 3 kwartyle.
c) Rozkład platokurtyczny to rozkład o spłaszczeniu takim, jak dla rozkładu normalnego.
d) Odchylenie standardowe to miara służąca do opisu położenia cechy.

9. Współczynnik zmienności
a) jest ilorazem średniej arytmetycznej i odchylenia standardowego
b) jest ilorazem odchylenia standardowego i średniej arytmetycznej
c) służy do oceny koncentracji rozkładu cechy
d) jest używany do konstrukcji wykresu pudełkowego

10. Wśród poniższych wypowiedzi dotyczących odchylenia standardowego


W1. Odchylenie standardowe nie może być ujemne
W2. Odchylenie standardowe jest zawsze mniejsze od średniej arytmetycznej
W3. Odchylenie standardowe jest miarą asymetrii
a) prawdziwe są wszystkie te wypowiedzi
b) żadna z tych wypowiedzi nie jest prawdziwa
c) fałszywa jest tylko wypowiedź W3
d) prawdziwa jest tylko wypowiedź W1

11. Kwartyl dolny cechy C jest równy 30, mediana wynosi 55, kwartyl górny jest równy 70, zaś 40-ty percentyl
jest równy 38. W tej sytuacji
a) odchylenie ćwiartkowe wynosi 20
b) 90-ty percentyl nie może być równy 60
c) co najmniej 60% wartości cechy C jest większe, niż 35
str. 2

d) żadna z wypowiedzi a), b), c) nie jest prawdziwa

12. Wśród poniższych wskaż zdania fałszywe:


a) Średnia z próby może być znacznie większa, niż średnia w populacji.
b) W rozkładzie normalnym średnia jest większa od mediany.
c) Jeśli dane podlegają rozkładowi normalnemu, to współczynnik zmienności może być większy niż 1 (jeśli
go wyrazimy w %, to większy od 100%).
d) Rozstęp międzykwartylowy jest przykładem klasycznej miary asymetrii.

13. Połowa studentów zaliczyła test w pierwszym podejściu, 30% w drugim podejściu, zaś pozostali w trzecim
podejściu. Tego typu dane można zilustrować wykorzystując
a) histogram prosty
b) wykres słupkowy
c) takich danych nie przedstawia się w formie graficznej
d) żadna z powyższych odpowiedzi nie jest prawdziwa

14. Na podstawie poniższego wykresu


Histogram: wiek
O czekiwana normalna
90

80

70

60
Liczba obs.

50

40

30

20

10

0
45 50 55 60 65 70 75

X < = G ranica klasy

można stwierdzić, że
a) największa wartość wśród danych była równa 75
b) pierwszy kwartyl jest mniejszy, niż 50
c) rozkład ma charakter typowy
d) żadna z powyższych wypowiedzi nie jest prawdziwa

15. Pięćdziesiąty centyl to jednocześnie


a) moda
b) mediana
c) średnia arytmetyczna, ale tylko w rozkładzie symetrycznym
d) żadna z powyższych odpowiedzi nie jest prawdziwa

16. Która z poniższych miar nie mierzy rozproszenia?


a) moda
b) odchylenie standardowe
c) odchylenie ćwiartkowe
d) rozstęp międzykwartylowy

17. Prawdą jest, że


a) Jeśli zdarzenia losowe 𝐴 i 𝐵 wykluczają się, to 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
b) Zdarzenia losowe 𝐴 i 𝐵 są niezależne, jeśli 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ⋅ 𝑃(𝐵)
c) Prawdopodobieństwo warunkowe zdarzenia 𝐴 nie może być równe 𝑃(𝐴)
d) wypowiedzi z punktów a), b) i c) są fałszywe
str. 3

18. Rozkład prawdopodobieństwa, który opisuje liczbę „sukcesów” w 𝑛 próbach, w których


prawdopodobieństwo „sukcesu” jest takie samo to:
a) rozkład geometryczny
b) rozkład dwumianowy
c) rozkład Poissona
d) rozkład jednostajny

19. Prawdą jest, że


a) zmienna losowa o rozkładzie geometrycznym przyjmuje wartości 0, 1, 2, …
b) prawdopodobieństwo, że zmienna losowa o rozkładzie Poissona przyjmie wartość dodatnią jest takie
samo, jak prawdopodobieństwo, że przyjmie wartość ujemną
c) normalna zmienna losowa o wartości oczekiwanej równej 3 z większym prawdopodobieństwem
przyjmie wartość większą niż 4, niż mniejszą od 3
d) wypowiedzi z punktów a), b) i c) są fałszywe

20. Jeśli zmienna losowa 𝑋 ma rozkład normalny z wartością oczekiwaną równą 0 oraz odchyleniem
standardowym równym 𝜎, to
a) jest standaryzowaną normalną zmienną losową
b) 𝑃(𝑋 > 0) = 𝑃(𝑋 < 0) = 0,5
c) 𝑃(𝑋 > 2) > 𝑃(𝑋 < 2)
d) 𝑃(𝑋 > 2) = 𝑃(𝑋 < −2)

21. Wartości pewnego wskaźnika laboratoryjnego L w populacji osób wieku 25-44 lata opisuje zmienna losowa
X o rozkładzie normalnym z wartością oczekiwaną 50 oraz wariancją równą 16. Z populacji osób, w której
wartości wskaźnika L opisuje ta zmienna losowa, losujemy próbę 16 osób. Wówczas
a) średnia z próby ma rozkład normalny z wartością oczekiwaną równą 50
b) kwantyl rzędu 0,6 zmiennej losowej 𝑋 jest mniejszy, niż 16
c) odchylenie standardowe średniej z próby jest równe 1
d) żadna z wypowiedzi a), b), c) nie jest prawdziwa

22. Jeśli liczba k jest kwantylem rzędu 0,85 zmiennej losowej typu ciągłego, to
a) pole pod wykresem funkcji gęstości tej zmiennej losowej, nad osią OX i na lewo od prostej o równaniu
x = 0,85 wynosi 0,85
b) pole pod wykresem funkcji gęstości tej zmiennej losowej, nad osią OX i na prawo od prostej
o równaniu x = 0,85 wynosi 0,85
c) pole pod wykresem funkcji gęstości tej zmiennej losowej, nad osią OX i na lewo od prostej o równaniu
x = k wynosi 0,15.
d) żadna z wypowiedzi a), b), c) nie jest prawdziwa

23. Mediana pewnej cechy w populacji wyniosła 175 cm. Dodatkowo wiadomo, że rozkład cechy jest
jednomodalny, z asymetrią prawostronną. Wynika stąd, że
a) na wykresie pudełkowym mediana jest położona bliżej pierwszego, niż trzeciego kwartyla
b) na wykresie pudełkowym mediana jest położona bliżej trzeciego, niż pierwszego kwartyla
c) średnia arytmetyczna wartości tej cechy jest mniejsza, niż 175 cm
d) żadna z odpowiedzi a), b, c) nie jest prawdziwa

24. Gdyby wartości badanej cechy ilościowej były jednakowe dla wszystkich jednostek statystycznych,
wówczas oznaczałoby to
a) dużą średnią arytmetyczną badanej cechy
b) małą średnią arytmetyczną badanej cechy
c) zerowe odchylenie standardowe
d) wysoki współczynnik zmienności

25. Kwartyl trzeci


a) jest miarą zmienności
str. 4

b) jest miarą pozycyjną


c) dzieli zbiorowość tak, że 25% jednostek ma wartości nie mniejsze, niż Q3 i jednocześnie 75% jednostek
ma wartości nie większe od Q3
d) może być nie większy od mediany

26. Na podstawie diagramu kumulacyjnego można graficznie wyznaczyć


a) średnią arytmetyczną
b) kwartyle
c) wariancję
d) żadna z powyższych odpowiedzi nie jest prawdziwa

27. Jeśli dane w próbie mają charakter jakościowy, to


a) prezentujemy je graficznie za pomocą histogramu
b) nie można dla nich wyznaczyć rozkładu empirycznego
c) najlepszą miarą tendencji centralnej jest w tym przypadku średnia arytmetyczna
d) żadna z powyższych wypowiedzi a), b), c) nie jest prawdziwa.

28. Prawdą jest, że


a) im większe zróżnicowanie wartości cechy, tym większa wariancja
b) zerowa wariancja oznacza, że średnia arytmetyczna też jest równa zero
c) wariancja jest wyrażona w tych samych jednostkach, co analizowana cecha
d) żadna z powyższych wypowiedzi a), b), c) nie jest prawdziwa.

29. Dla pewnych danych wyznaczono Q1, Me, P30, P10, Q3 oraz P25 (gdzie Pxx oznacza centyl rzędu xx)
W tej sytuacji można powiedzieć, że
a) Q1 jest nie mniejsze, niż P10
b) P25=Q3
c) P30 jest równe co najmniej tyle, co Q1
d) nie da się porównać między sobą wartości Q1, Me, P30, P10, Q3 oraz P25.

30. Rozkład pewnej cechy ciągłej charakteryzuje się tym, że mediana jest równa 10, moda 20, zaś średnia
arytmetyczna 5. W tej sytuacji:
a) rozkład jest symetryczny
b) pierwszy kwartyl jest większy, niż 5
c) rozkład jest asymetryczny
d) żadna z wypowiedzi a), b), c) nie jest prawdziwa

31. Hipoteza statystyczna


a) jest weryfikowana w oparciu o całą populację
b) dotyczy próby, która została pobrana z populacji
c) dotyczy populacji, z której została pobrana próba
d) żadna z powyższych wypowiedzi nie jest prawdziwa

32. Statystyka testowa


a) jest obliczana na podstawie danych z próby
b) może przyjąć wartości ujemne
c) nie może przyjąć wartości ujemnych
d) jest zmienną losową, której rozkład jest ustalany przy założeniu, że prawdziwa jest hipoteza
alternatywna

33. Jeśli wartość statystyki testowej należy do obszaru krytycznego testu, to


a) przyjmujemy hipotezę zerową
b) przyjmujemy hipotezę alternatywną
c) stwierdzamy, że nie ma podstaw do odrzucenia hipotezy zerowej
d) przyjmujemy inny, niż aktualnie wybrany poziom istotności testu

34. Błąd I rodzaju we wnioskowaniu statystycznym polega na


str. 5

a) odrzuceniu fałszywej hipotezy alternatywnej


b) odrzuceniu prawdziwej hipotezy zerowej
c) przyjęciu fałszywej hipotezy zerowej
d) przyjęciu zbyt małego poziomu istotności

35. W każdym przedziale ufności


a) znajduje się prawdziwa wartość szacowanego parametru populacji
b) dolna granica przedziału ufności zależy od danych w próbie
c) górna granica przedziału ufności zależy od danych w próbie
d) żadna z powyższych wypowiedzi nie jest prawdziwa

36. Jeśli wykonujemy obliczenia na danych z tej samej próby losowej, to wraz ze wzrostem poziomu ufności
a) maleje długość przedziału ufności
b) rośnie długość przedziału ufności
c) nie zmienia się długość przedziału ufności
d) rośnie wartość szacowanego parametru populacji

37. Hipoteza zerowa


a) dotyczy próby, a nie populacji, z której ta próba pochodzi
b) jest odrzucana, jeśli p-value jest większe od zera
c) jest przyjmowana, jeśli p-value jest poniżej 1
d) żadna z powyższych wypowiedzi nie jest prawdziwa

38. Poziom ufności


a) obliczamy na podstawie próby losowej
b) może być ujemny
c) wybieramy najczęściej z przedziału liczbowego [0,9; 1)
d) żadna z powyższych wypowiedzi nie jest prawdziwa

39. Wynikiem badania statystycznego (wykonanego w oparciu o losową próbę) było stwierdzenie: Więcej, niż
10% dzieci w Polsce ma poziom cholesterolu powyżej normy. W tej sytuacji:
a) Populację stanowiły wszystkie dzieci w Polsce, które miały poziom cholesterolu powyżej normy
b) Jednostką statystyczną było pojedyncze dziecko
c) Próba obejmowała 10% wszystkich dzieci w Polsce
d) Próba obejmowała więcej, niż 10% wszystkich dzieci w Polsce

40. Spośród studentów UJK wylosowano 30 osób i zmierzono ich poziom cholesterolu. W oparciu
o zgromadzone dane zbudowano 95% i 99% przedział ufności dla średniego poziomu cholesterolu. Wśród
poniższych wypowiedzi prawdziwe są:
a) Nie ma gwarancji, że średni poziom cholesterolu wśród studentów UJK leży w którymś z tych dwóch
skonstruowanych przedziałów ufności.
b) 95% przedział ufności jest dłuższy, niż przedział 99%.
c) 30% studentów UJK ma poziom cholesterolu zawarty w 99% przedziale ufności.
d) 99% przedział ufności jest dłuższy, niż 95% przedział ufności.

41. Wśród poniższych wypowiedzi prawdziwe są:


a) Jeśli p-value w teście statystycznym jest równe 0,03, zaś przyjęty poziom istotności testu jest równy
0,05, to należy odrzucić hipotezę zerową.
b) Rozkład z próby jest wyznaczany przy założeniu, że prawdziwa jest hipoteza alternatywna.
c) Obszar krytyczny testu obejmuje najbardziej prawdopodobne wartości statystyki testowej.
d) Jeśli estymator punktowy parametru P jest nieobciążony, to w każdej próbie pobranej z populacji
będzie miał wartość równą parametrowi P w populacji lub bardzo do niego zbliżoną.

42. Badacz planuje wykazać, że średnie stężenia serotoniny wśród chorych na C i zdrowych Z nie są takie same.
Sprawdził, że możliwe jest zastosowanie testu t-Studenta i wobec tego
a) hipoteza zerowa dotyczy populacji i głosi, że średnie stężenia serotoniny w grupie C i Z są nie równe
b) hipoteza zerowa dotyczy populacji i głosi, że średnie stężenia serotoniny w grupie C i Z są równe
str. 6

c) hipoteza alternatywna dotyczy dostępnych w badaniu prób pacjentów i głosi, że średnie stężenia
serotoniny w grupie C i Z są nie równe
d) hipoteza alternatywna dotyczy populacji i głosi, że średnie stężenia serotoniny w grupie C i Z są nie
równe

43. Dla testów chi-kwadrat prawdą jest, że


a) stosujemy je do porównywania średnich w dwóch populacjach
b) przed ich zastosowaniem sprawdzamy normalność rozkładów
c) nie trzeba sprawdzać żadnych założeń przed ich zastosowaniem
d) żadna z wypowiedzi a), b), c) nie jest prawdziwa.

44. Przedmiotem zainteresowania jest porównanie zawartości pewnego mikroelementu A (wyrażonego


liczbowo jako zmienna o charakterze ciągłym) w przeliczeniu na 100 g marchwi w zależności od
zastosowanego nawozu N1, N2 lub N3. W opisanej sytuacji
a) można rozważać wykorzystanie dwuczynnikowej analizy wariancji
b) jeśli nie odrzucimy hipotezy zerowej o równości średnich wartości mikroelementu A w analizowanych
3 grupach, to przeprowadzamy testy post-hoc
c) stosujemy test zgodności chi-kwadrat
d) żadna z wypowiedzi a), b), c) nie jest prawdziwa.

45. W przypadku jednoczynnikowej analizy wariancji


a) zmienna odpowiedzi ma charakter jakościowy
b) należy zweryfikować równość wariancji
c) hipoteza zerowa głosi brak równości średnich wartości zmiennej odpowiedzi w analizowanych grupach
d) żadna z wypowiedzi a), b), c) nie jest prawdziwa.

46. Badacz zamierza przetestować nowy lek L w odniesieniu do jego wpływu na stężenie cholesterolu LDL.
W badaniu bierze udział 100 osób, u których bada się stężenie cholesterolu LDL na początku badania i po 3
miesiącach stosowania leku L. Który z poniższych testów badacz może brać pod uwagę przy analizie
wyników tego badania?
a) test t-Studenta dla danych połączonych w pary
b) test t-Studenta dla danych niepowiązanych (dla prób niezależnych)
c) test znaków rangowanych Wilcoxona
d) test chi-kwadrat

47. Przedmiotem zainteresowania badacza była ocena czasu działania baterii pewnego typu w zależności od
wilgotności powietrza w pomieszczeniu, w którym baterie były użytkowane. Eksperyment przeprowadzono
w 3 pomieszczeniach, w których wilgotność określono na początku eksperymentu odpowiednio jako niską,
średnią lub wysoką. Autor badania sformułował następujący wniosek „Średni czas działania baterii nie
różnił się statystycznie istotnie w zależności od wilgotności powietrza.” Jaki test statystyczny
prawdopodobnie zastosował?
a) jednoczynnikową analizę wariancji
b) test chi-kwadrat
c) test t-Studenta dla grup powiązanych
d) test t-Studenta dla grup niepowiązanych

48. W populacji świnek morskich prawdą jest, że jakościowe cechy A i B są zależne. Przeprowadzono badanie
dotyczące zależności między cechami A i B na próbie losowej złożonej ze 100 świnek okazało się, że
w odpowiednim teście statystycznym wykonanym na poziomie istotności 0,01 wartość p była równa 0,03.
W opisanej wyżej sytuacji prawdą jest, że
a) hipoteza zerowa powinna głosić zależność cech A i B
b) hipoteza alternatywna powinna głosić zależność cech A i B
c) popełniono błąd II rodzaju
d) można przyjąć hipotezę alternatywną

Poniższe wypowiedzi oceń w kategoriach PRAWDA/FAŁSZ:


str. 7

Ocena Wypowiedź
PRAWDA Średnia z próby może być większa, niż średnia w populacji.
FAŁSZ Estymacja punktowa danego parametru populacji polega na tym, że używa się danych z całej populacji
do oszacowania tego parametru.
FAŁSZ W testach nieparametrycznych hipoteza zerowa dotyczy próby, zaś hipoteza alternatywna dotyczy
populacji.
FAŁSZ W rozkładzie normalnym średnia jest większa od mediany.
FAŁSZ Hipoteza zerowa w teście Shapiro-Wilka dotyczy równości parametrów dwóch populacji.
PRAWDA Przedział ufności wyznaczony dla danego parametru populacji może nie pokrywać prawdziwej
wartości tego parametru.
PRAWDA Rozkład prawdopodobieństwa statystyki testowej wyznacza się przy założeniu, że hipoteza zerowa jest
prawdziwa.
PRAWDA Testy post-hoc stosuje się wówczas, gdy uda się odrzucić hipotezę zerową w analizie wariancji.
FAŁSZ W teście niezależności chi-kwadrat hipoteza zerowa głosi, że analizowane cechy są zależne.
FAŁSZ Przed zastosowaniem testu chi-kwadrat należy zbadać normalność rozkładów analizowanych cech.
FAŁSZ Nieparametrycznym testem używanym zamiast jednoczynnikowej analizy wariancji jest test Levene’a.
FAŁSZ Jeśli w teście Shapiro-Wilka otrzymamy p-value mniejsze, niż założony poziom istotności, to nie ma
podstaw do odrzucenia hipotezy o normalności rozkładu cechy.
PRAWDA Duże rozbieżności między wartościami obserwowanymi i oczekiwanymi skłaniają badacza do
odrzucenia hipotezy zerowej w teście chi-kwadrat.

You might also like