Uogólniony indeks Hirscha a dwupróbkowe testy

dla rodziny rozkładów Pareto II rodzaju
Marek Gągolewski
1,2
, Przemysław Grzegorzewski
2,1
{gagolews,pgrzeg}@ibspan.waw.pl
XXXV Konferencja Statystyka Matematyczna
Wisła, 7–11 grudnia 2009 r.
1
Instytut Badań Systemowych
Polska Akademia Nauk
2
Wydział Matematyki
i Nauk Informacyjnych
Politechnika Warszawska
Plan referatu
• Ogólny problem oceny twórców
• Wskaźniki bibliometryczne
• Problem oceny w interpretacji statystycznej
• κ-pozycje i ich estymacja
• Testy do porównywania dwóch prób
• Podsumowanie i problemy otwarte
2 / 69
Ogólny problem oceny twórców
Problem oceny twórców
J
j
1
j
2
j
3
j
4
j
5
Przeliczalny zbiór jednostek (dzieł, produktów): J = {j
1
, j
2
, . . . }.
3 / 69
Ogólny problem oceny twórców
Problem oceny twórców
J
j
1
j
2
j
3
j
4
j
5
v(j
1
) = 7
Przeliczalny zbiór jednostek (dzieł, produktów): J = {j
1
, j
2
, . . . }.
Funkcja oceny jednostek v : J → [0, ∞).
4 / 69
Ogólny problem oceny twórców
Problem oceny twórców
J
A
2
A
1
j
1
j
2
j
3
j
4
j
5
Przeliczalny zbiór jednostek (dzieł, produktów): J = {j
1
, j
2
, . . . }.
Funkcja oceny jednostek v : J → [0, ∞).
Zbiór twórców (autorów, producentów) A = {A
1
, . . . , A
m
}
— pewna rodzina podzbiorów J: (A
1
, . . . , A
m
⊆ J).
Modelem opisywanej rzeczywistości jest trójka (J, A, v).
5 / 69
Ogólny problem oceny twórców
Problem oceny twórców
J
A
2
A
1
j
1
j
2
j
3
j
4
j
5
Przeliczalny zbiór jednostek (dzieł, produktów): J = {j
1
, j
2
, . . . }.
Funkcja oceny jednostek v : J → [0, ∞).
Zbiór twórców (autorów, producentów) A = {A
1
, . . . , A
m
}
— pewna rodzina podzbiorów J: (A
1
, . . . , A
m
⊆ J).
Modelem opisywanej rzeczywistości jest trójka (J, A, v).
6 / 69
Ogólny problem oceny twórców
1 • J — artykuły w recenzowanych czasopismach,
• A — pracownicy naukowi,
• v — liczba cytowań,
2 • J — artykuły w recenzowanych czasopismach,
• A — instytucje naukowe,
• v — punkty z listy czasopism punktowanych MNiSW,
3 • J — strony internetowe,
• A — portale (serwisy WWW),
• v — liczba odwiedzin,
4 • J — dzieła sztuki,
• A — artyści,
• v — cena dzieła na aukcji.
7 / 69
Ogólny problem oceny twórców
1 • J — artykuły w recenzowanych czasopismach,
• A — pracownicy naukowi,
• v — liczba cytowań,
2 • J — artykuły w recenzowanych czasopismach,
• A — instytucje naukowe,
• v — punkty z listy czasopism punktowanych MNiSW,
3 • J — strony internetowe,
• A — portale (serwisy WWW),
• v — liczba odwiedzin,
4 • J — dzieła sztuki,
• A — artyści,
• v — cena dzieła na aukcji.
8 / 69
Ogólny problem oceny twórców
1 • J — artykuły w recenzowanych czasopismach,
• A — pracownicy naukowi,
• v — liczba cytowań,
2 • J — artykuły w recenzowanych czasopismach,
• A — instytucje naukowe,
• v — punkty z listy czasopism punktowanych MNiSW,
3 • J — strony internetowe,
• A — portale (serwisy WWW),
• v — liczba odwiedzin,
4 • J — dzieła sztuki,
• A — artyści,
• v — cena dzieła na aukcji.
9 / 69
Ogólny problem oceny twórców
1 • J — artykuły w recenzowanych czasopismach,
• A — pracownicy naukowi,
• v — liczba cytowań,
2 • J — artykuły w recenzowanych czasopismach,
• A — instytucje naukowe,
• v — punkty z listy czasopism punktowanych MNiSW,
3 • J — strony internetowe,
• A — portale (serwisy WWW),
• v — liczba odwiedzin,
4 • J — dzieła sztuki,
• A — artyści,
• v — cena dzieła na aukcji.
10 / 69
Ogólny problem oceny twórców
1 • J — artykuły w recenzowanych czasopismach,
• A — pracownicy naukowi,
• v — liczba cytowań,
2 • J — artykuły w recenzowanych czasopismach,
• A — instytucje naukowe,
• v — punkty z listy czasopism punktowanych MNiSW,
3 • J — strony internetowe,
• A — portale (serwisy WWW),
• v — liczba odwiedzin,
4 • J — dzieła sztuki,
• A — artyści,
• v — cena dzieła na aukcji.
11 / 69
Ogólny problem oceny twórców
Problem
Na podstawie informacji zawartych w (J, A, v) dokonać „oceny”
twórców z A.
Co oceniać?
• jakość wytworów
• produktywność
Rozpatrujemy twórców cechujących się tą samą produktywnością.
ω
(n)
: [0, ∞)
n
→ [0, ∞) jest funkcją agregującą, jeśli spełnia
następujące warunki (zob. Grabisch i in., 2009):
• ω
(n)
(0, . . . , 0) = 0,
• jest niemalejąca ze względu na każdą zmienną.
12 / 69
Ogólny problem oceny twórców
Problem
Na podstawie informacji zawartych w (J, A, v) dokonać „oceny”
twórców z A.
Co oceniać?
• jakość wytworów
• produktywność
Rozpatrujemy twórców cechujących się tą samą produktywnością.
ω
(n)
: [0, ∞)
n
→ [0, ∞) jest funkcją agregującą, jeśli spełnia
następujące warunki (zob. Grabisch i in., 2009):
• ω
(n)
(0, . . . , 0) = 0,
• jest niemalejąca ze względu na każdą zmienną.
13 / 69
Ogólny problem oceny twórców
Problem
Na podstawie informacji zawartych w (J, A, v) dokonać „oceny”
twórców z A.
Co oceniać?
• jakość wytworów
• produktywność
Rozpatrujemy twórców cechujących się tą samą produktywnością.
ω
(n)
: [0, ∞)
n
→ [0, ∞) jest funkcją agregującą, jeśli spełnia
następujące warunki (zob. Grabisch i in., 2009):
• ω
(n)
(0, . . . , 0) = 0,
• jest niemalejąca ze względu na każdą zmienną.
14 / 69
Ogólny problem oceny twórców
Problem
Na podstawie informacji zawartych w (J, A, v) dokonać „oceny”
twórców z A.
Co oceniać?
• jakość wytworów
• produktywność
Rozpatrujemy twórców cechujących się tą samą produktywnością.
ω
(n)
: [0, ∞)
n
→ [0, ∞) jest funkcją agregującą, jeśli spełnia
następujące warunki (zob. Grabisch i in., 2009):
• ω
(n)
(0, . . . , 0) = 0,
• jest niemalejąca ze względu na każdą zmienną.
15 / 69
Ogólny problem oceny twórców
Problem
Na podstawie informacji zawartych w (J, A, v) dokonać „oceny”
twórców z A.
Co oceniać?
• jakość wytworów
• produktywność
Rozpatrujemy twórców cechujących się tą samą produktywnością.
ω
(n)
: [0, ∞)
n
→ [0, ∞) jest funkcją agregującą, jeśli spełnia
następujące warunki (zob. Grabisch i in., 2009):
• ω
(n)
(0, . . . , 0) = 0,
• jest niemalejąca ze względu na każdą zmienną.
16 / 69
Ogólny problem oceny twórców
Problem
Na podstawie informacji zawartych w (J, A, v) dokonać „oceny”
twórców z A.
Co oceniać?
• jakość wytworów
• produktywność
Rozpatrujemy twórców cechujących się tą samą produktywnością.
ω
(n)
: [0, ∞)
n
→ [0, ∞) jest funkcją agregującą, jeśli spełnia
następujące warunki (zob. Grabisch i in., 2009):
• ω
(n)
(0, . . . , 0) = 0,
• jest niemalejąca ze względu na każdą zmienną.
17 / 69
Wskaźniki bibliometryczne
Wskaźniki bibliometryczne
Przykładowe funkcje agregujące („wskaźniki bibliometryczne”):
• łączna liczba dzieł,
• średnia ocena jakości dzieł,
• indeks h (Hirsch, 2005)
• indeks g (Egghe, 2006)
• indeks w (Woeginger, 2008)
• indeksy „geometryczne” (Gągolewski, Grzegorzewski, 2009)
• . . . . . .
18 / 69
Wskaźniki bibliometryczne
Wskaźniki bibliometryczne
Przykładowe funkcje agregujące („wskaźniki bibliometryczne”):
• łączna liczba dzieł,
• średnia ocena jakości dzieł,
• indeks h (Hirsch, 2005)
• indeks g (Egghe, 2006)
• indeks w (Woeginger, 2008)
• indeksy „geometryczne” (Gągolewski, Grzegorzewski, 2009)
• . . . . . .
19 / 69
Wskaźniki bibliometryczne
Indeks Hirscha
„Autor n prac ma indeks o wartości h, jeżeli h jego prac otrzymało
co najmniej h cytowań, a pozostałe z jego n −h prac otrzymało co
najwyżej h cytowań.”
Definicja
Indeksem Hirscha nazywamy funkcję h : [0, ∞)
n
→ [0, ∞) taką, że
h(x) =

max{i : x
n+1−i:n
i, i = 1, 2, . . . , n} gdy x
n:n
> 0,
0 w p.p.
Np. h(5, 4, 3, 3, 3, 1) = 3.
Np. h(10, 10, 10, 10, 0, 0, 0, 0) = 4.
20 / 69
Wskaźniki bibliometryczne
Indeks Hirscha
„Autor n prac ma indeks o wartości h, jeżeli h jego prac otrzymało
co najmniej h cytowań, a pozostałe z jego n −h prac otrzymało co
najwyżej h cytowań.”
Definicja
Indeksem Hirscha nazywamy funkcję h : [0, ∞)
n
→ [0, ∞) taką, że
h(x) =

max{i : x
n+1−i:n
i, i = 1, 2, . . . , n} gdy x
n:n
> 0,
0 w p.p.
Np. h(5, 4, 3, 3, 3, 1) = 3.
Np. h(10, 10, 10, 10, 0, 0, 0, 0) = 4.
21 / 69
Wskaźniki bibliometryczne
Indeks Hirscha
„Autor n prac ma indeks o wartości h, jeżeli h jego prac otrzymało
co najmniej h cytowań, a pozostałe z jego n −h prac otrzymało co
najwyżej h cytowań.”
Definicja
Indeksem Hirscha nazywamy funkcję h : [0, ∞)
n
→ [0, ∞) taką, że
h(x) =

max{i : x
n+1−i:n
i, i = 1, 2, . . . , n} gdy x
n:n
> 0,
0 w p.p.
Np. h(5, 4, 3, 3, 3, 1) = 3.
Np. h(10, 10, 10, 10, 0, 0, 0, 0) = 4.
22 / 69
Problem oceny w interpretacji statystycznej
Interpretacja statystyczna
Rozważmy X = (X
1
, . . . , X
n
) i.i.d. F, gdzie F – dystrybuanta ciągła,
ściśle rosnąca na [0, ∞), F(x) = 0 dla x < 0.
Interpretacja:
X
i
— ocena jakości i-tego dzieła
F określa zdolności do wytwarzania dzieł o jakości właściwej każdemu
twórcy
Przykład
Dla P2(k, s), k > 0, s 1
F(x) = 1 −

s
s +x

k
dla x > 0 (Burrell, 2008; Gl¨anzel, 2008).
23 / 69
Problem oceny w interpretacji statystycznej
Interpretacja statystyczna
Rozważmy X = (X
1
, . . . , X
n
) i.i.d. F, gdzie F – dystrybuanta ciągła,
ściśle rosnąca na [0, ∞), F(x) = 0 dla x < 0.
Interpretacja:
X
i
— ocena jakości i-tego dzieła
F określa zdolności do wytwarzania dzieł o jakości właściwej każdemu
twórcy
Przykład
Dla P2(k, s), k > 0, s 1
F(x) = 1 −

s
s +x

k
dla x > 0 (Burrell, 2008; Gl¨anzel, 2008).
24 / 69
Problem oceny w interpretacji statystycznej
Interpretacja statystyczna
Rozważmy X = (X
1
, . . . , X
n
) i.i.d. F, gdzie F – dystrybuanta ciągła,
ściśle rosnąca na [0, ∞), F(x) = 0 dla x < 0.
Interpretacja:
X
i
— ocena jakości i-tego dzieła
F określa zdolności do wytwarzania dzieł o jakości właściwej każdemu
twórcy
Przykład
Dla P2(k, s), k > 0, s 1
F(x) = 1 −

s
s +x

k
dla x > 0 (Burrell, 2008; Gl¨anzel, 2008).
25 / 69
Problem oceny w interpretacji statystycznej
Definicja
Komplementarną funkcją kwantylową zmiennej losowej
o dystrybuancie F nazywamy funkcję K : (0, 1) → [0, ∞) daną
wzorem
K(x) = (1 −F(x))
−1
.
Oczywiście K(x) = R
−1
(x).
Definicja
Funkcją kontrolną nazywamy dowolną funkcję κ : [0, 1] → R, która
jest ciągła, niemalejąca i taka, że κ(0) 0, κ(1) > 0.
26 / 69
Problem oceny w interpretacji statystycznej
Definicja
Komplementarną funkcją kwantylową zmiennej losowej
o dystrybuancie F nazywamy funkcję K : (0, 1) → [0, ∞) daną
wzorem
K(x) = (1 −F(x))
−1
.
Oczywiście K(x) = R
−1
(x).
Definicja
Funkcją kontrolną nazywamy dowolną funkcję κ : [0, 1] → R, która
jest ciągła, niemalejąca i taka, że κ(0) 0, κ(1) > 0.
27 / 69
Problem oceny w interpretacji statystycznej
Definicja
Komplementarną funkcją kwantylową zmiennej losowej
o dystrybuancie F nazywamy funkcję K : (0, 1) → [0, ∞) daną
wzorem
K(x) = (1 −F(x))
−1
.
Oczywiście K(x) = R
−1
(x).
Definicja
Funkcją kontrolną nazywamy dowolną funkcję κ : [0, 1] → R, która
jest ciągła, niemalejąca i taka, że κ(0) 0, κ(1) > 0.
28 / 69
κ-pozycje i ich estymacja
κ-pozycje
Definicja
κ-pozycją dla rozkładu danego dystrybuantą F przy funkcji kontrolnej
κ nazywamy liczbę p
κ
∈ (0, 1) będącą rozwiązaniem równania
κ(p
κ
) = K(p
κ
).
29 / 69
κ-pozycje i ich estymacja
Równoważne definicje κ-pozycji:
• κ-pozycją dla rozkładu danego dystrybuantą F nazywamy liczbę
p
κ
∈ (0, 1) będącą rozwiązaniem równania
1 − p
κ
= F(κ(p
κ
))
ozn.
= F ◦ κ(p
κ
).
• κ-pozycją dla rozkładu danego dystrybuantą F nazywamy liczbę
p
κ
∈ (0, 1) będącą rozwiązaniem równania
1 − p
κ
= P(κ
−1
(X
i
) p
κ
).
Uwaga
Przy podanych założeniach κ-pozycja zawsze istnieje i jest
wyznaczona jednoznacznie.
30 / 69
κ-pozycje i ich estymacja
Równoważne definicje κ-pozycji:
• κ-pozycją dla rozkładu danego dystrybuantą F nazywamy liczbę
p
κ
∈ (0, 1) będącą rozwiązaniem równania
1 − p
κ
= F(κ(p
κ
))
ozn.
= F ◦ κ(p
κ
).
• κ-pozycją dla rozkładu danego dystrybuantą F nazywamy liczbę
p
κ
∈ (0, 1) będącą rozwiązaniem równania
1 − p
κ
= P(κ
−1
(X
i
) p
κ
).
Uwaga
Przy podanych założeniach κ-pozycja zawsze istnieje i jest
wyznaczona jednoznacznie.
31 / 69
κ-pozycje i ich estymacja
Równoważne definicje κ-pozycji:
• κ-pozycją dla rozkładu danego dystrybuantą F nazywamy liczbę
p
κ
∈ (0, 1) będącą rozwiązaniem równania
1 − p
κ
= F(κ(p
κ
))
ozn.
= F ◦ κ(p
κ
).
• κ-pozycją dla rozkładu danego dystrybuantą F nazywamy liczbę
p
κ
∈ (0, 1) będącą rozwiązaniem równania
1 − p
κ
= P(κ
−1
(X
i
) p
κ
).
Uwaga
Przy podanych założeniach κ-pozycja zawsze istnieje i jest
wyznaczona jednoznacznie.
32 / 69
κ-pozycje i ich estymacja
Równoważne definicje κ-pozycji:
• κ-pozycją dla rozkładu danego dystrybuantą F nazywamy liczbę
p
κ
∈ (0, 1) będącą rozwiązaniem równania
1 − p
κ
= F(κ(p
κ
))
ozn.
= F ◦ κ(p
κ
).
• κ-pozycją dla rozkładu danego dystrybuantą F nazywamy liczbę
p
κ
∈ (0, 1) będącą rozwiązaniem równania
1 − p
κ
= P(κ
−1
(X
i
) p
κ
).
Uwaga
Przy podanych założeniach κ-pozycja zawsze istnieje i jest
wyznaczona jednoznacznie.
33 / 69
κ-pozycje i ich estymacja
Przykład
Dla P2(1, 1) i κ(x) = x zachodzi
p
κ
=

5 − 1
2
=
1
ϕ
= ϕ− 1 0,618034.
Przykład
Dla dowolnego F i κ ≡ F
−1
zachodzi
p
κ
= 0,5.
34 / 69
κ-pozycje i ich estymacja
Przykład
Dla P2(1, 1) i κ(x) = x zachodzi
p
κ
=

5 − 1
2
=
1
ϕ
= ϕ− 1 0,618034.
Przykład
Dla dowolnego F i κ ≡ F
−1
zachodzi
p
κ
= 0,5.
35 / 69
κ-pozycje i ich estymacja
Estymacja κ-pozycji
Definicja
Dyskretnym κ-indeksem pozycyjnym nazywamy statystykę
´ p
κ
(X) =
1
n
arg max
i=0,...,n
{X
n−i+1:n
κ(i/n)}
=
1
n
arg max
i=0,...,n
{#{X
k
: X
k
κ(i/n)} i} .
36 / 69
κ-pozycje i ich estymacja
Estymacja κ-pozycji
Definicja
Dyskretnym κ-indeksem pozycyjnym nazywamy statystykę
´ p
κ
(X) =
1
n
arg max
i=0,...,n
{X
n−i+1:n
κ(i/n)}
=
1
n
arg max
i=0,...,n
{#{X
k
: X
k
κ(i/n)} i} .
37 / 69
κ-pozycje i ich estymacja
Estymacja κ-pozycji
Lemat 1
Rozkład ´ p
κ
opisany jest dystrybuantą
F
´ p
κ
(p) = 1 −
n

i=pn+1

n
i

1 −F ◦ κ

pn+1
n

i

F ◦ κ

pn+1
n

n−i
= I

F ◦ κ

pn+1
n

; n −pn, pn + 1

dla p ∈ (0, 1), przy czym I(p; a, b) oznacza regularyzowaną
niekompletną funkcję beta, natomiast x = max{i ∈ Z : i x}.
38 / 69
κ-pozycje i ich estymacja
Estymacja κ-pozycji
Stwierdzenie 2
´ p
κ
jest estymatorem asymptotycznie nieobciążonym p
κ
oraz
Var ´ p
κ
→ 0.
Lemat 3
Niech X = (X
1
, . . . , X
n
) i.i.d. F. Wówczas dla funkcji kontrolnej
κ(x) = xn zachodzi
h(X) = n´ p
κ
(X) = max{i = 0, . . . , n : X
n−i+1:n
i}.
39 / 69
κ-pozycje i ich estymacja
Estymacja κ-pozycji
Stwierdzenie 2
´ p
κ
jest estymatorem asymptotycznie nieobciążonym p
κ
oraz
Var ´ p
κ
→ 0.
Lemat 3
Niech X = (X
1
, . . . , X
n
) i.i.d. F. Wówczas dla funkcji kontrolnej
κ(x) = xn zachodzi
h(X) = n´ p
κ
(X) = max{i = 0, . . . , n : X
n−i+1:n
i}.
40 / 69
κ-pozycje i ich estymacja
Estymacja κ-pozycji
Stwierdzenie 4 (O aproksymacji)
Jeśli F ◦ κ jest funkcją analityczną w punkcie p
κ
i dla każdego p
w dowolnie małym otoczeniu p
κ
zachodzi (p − p
κ
)
2
(F ◦ κ)

(p) 0
oraz (p − p
κ
) δ (1 − 2p
κ
+ (p − p
κ
) δ) 0, to dla n →∞
F
´ p
κ
(p) Φ

¸
p −p
κ

p
κ
(1−p
κ
)
n(1+δ)
2

,
gdzie δ := (F ◦ κ)

(p
κ
) = f(κ(p
κ
)) κ

(p
κ
), a Φ jest dystrybuantą
N(0, 1).
41 / 69
Testy do porównywania dwóch prób
Testy do porównywania dwóch prób
X — n-elementowa próba i.i.d. F.
Y — n-elementowa próba i.i.d. G.
Jesteśmy zainteresowani konstrukcją (nieparametrycznego) testu ϕ
na poziomie istotności α do weryfikacji
H
0
: F = G
względem
K : F G.
42 / 69
Testy do porównywania dwóch prób
Testy do porównywania dwóch prób
X — n-elementowa próba i.i.d. F.
Y — n-elementowa próba i.i.d. G.
Jesteśmy zainteresowani konstrukcją (nieparametrycznego) testu ϕ
na poziomie istotności α do weryfikacji
H
0
: F = G
względem
K : F G.
43 / 69
Testy do porównywania dwóch prób
Dla F = G i dostatecznie dużych n mamy
T =

n

2
κ,F
(´ p
κ
(X) − ´ p
κ
(Y)) ∼ N(0, 1) ,
gdzie
σ
2
κ,F
=
p
κ,F
(1 − p
κ,F
)
(1 +δ
κ,F
)
2
oraz δ
κ,F
:= (F ◦ κ)

(p
κ,F
).
H
0
odrzucamy, gdy T > z
1−α
.
44 / 69
Testy do porównywania dwóch prób
Dalej F — dystrybuanta P2(k
1
, s), G — dystrybuanta P2(k
2
, s).
s 1 — ustalone (znane).
Mamy k
1
< k
2
⇒ F G.
κ(x) = nx („indeks Hirscha”).
45 / 69
Testy do porównywania dwóch prób
Dalej F — dystrybuanta P2(k
1
, s), G — dystrybuanta P2(k
2
, s).
s 1 — ustalone (znane).
Mamy k
1
< k
2
⇒ F G.
κ(x) = nx („indeks Hirscha”).
46 / 69
Testy do porównywania dwóch prób
Dalej F — dystrybuanta P2(k
1
, s), G — dystrybuanta P2(k
2
, s).
s 1 — ustalone (znane).
Mamy k
1
< k
2
⇒ F G.
κ(x) = nx („indeks Hirscha”).
47 / 69
Testy do porównywania dwóch prób
Testy do porównania:
1 Test Manna-Whitney’a-Wilcoxona,
2 Test Kołmogorowa-Smirnowa,
3 Test parametryczny oparty na ilorazie wiarogodności.
Statystyka testowa
T =

n
i=1
ln (s +X
i
) −nln s

n
i=1
ln (s +Y
i
) −nln s
H
0
∼ F
[2n,2n]
.
H
0
odrzucamy, gdy T > F
[2n,2n]
1−α
.
48 / 69
Testy do porównywania dwóch prób
Testy do porównania:
1 Test Manna-Whitney’a-Wilcoxona,
2 Test Kołmogorowa-Smirnowa,
3 Test parametryczny oparty na ilorazie wiarogodności.
Statystyka testowa
T =

n
i=1
ln (s +X
i
) −nln s

n
i=1
ln (s +Y
i
) −nln s
H
0
∼ F
[2n,2n]
.
H
0
odrzucamy, gdy T > F
[2n,2n]
1−α
.
49 / 69
Testy do porównywania dwóch prób
Testy do porównania:
1 Test Manna-Whitney’a-Wilcoxona,
2 Test Kołmogorowa-Smirnowa,
3 Test parametryczny oparty na ilorazie wiarogodności.
Statystyka testowa
T =

n
i=1
ln (s +X
i
) −nln s

n
i=1
ln (s +Y
i
) −nln s
H
0
∼ F
[2n,2n]
.
H
0
odrzucamy, gdy T > F
[2n,2n]
1−α
.
50 / 69
Testy do porównywania dwóch prób
Testy do porównania:
1 Test Manna-Whitney’a-Wilcoxona,
2 Test Kołmogorowa-Smirnowa,
3 Test parametryczny oparty na ilorazie wiarogodności.
Statystyka testowa
T =

n
i=1
ln (s +X
i
) −nln s

n
i=1
ln (s +Y
i
) −nln s
H
0
∼ F
[2n,2n]
.
H
0
odrzucamy, gdy T > F
[2n,2n]
1−α
.
51 / 69
Testy do porównywania dwóch prób
1.0 1.5 2.0 2.5 3.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
k1=1, s=2, n=10, MC=10000, alpha=0.05
k2
P
o
w
e
r
Hirsch
Mann−Whitney
K−S
LR−param
52 / 69
Testy do porównywania dwóch prób
1.0 1.5 2.0 2.5 3.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
k1=1, s=2, n=20, MC=10000, alpha=0.05
k2
P
o
w
e
r
Hirsch
Mann−Whitney
K−S
LR−param
53 / 69
Testy do porównywania dwóch prób
1.0 1.5 2.0 2.5 3.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
k1=1, s=2, n=50, MC=10000, alpha=0.05
k2
P
o
w
e
r
Hirsch
Mann−Whitney
K−S
LR−param
54 / 69
Testy do porównywania dwóch prób
1.0 1.5 2.0 2.5 3.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
k1=1, s=2, n=100, MC=10000, alpha=0.05
k2
P
o
w
e
r
Hirsch
Mann−Whitney
K−S
LR−param
55 / 69
Testy do porównywania dwóch prób
1.0 1.5 2.0 2.5 3.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
k1=1, s=2, n=250, MC=10000, alpha=0.05
k2
P
o
w
e
r
Hirsch
Mann−Whitney
K−S
LR−param
56 / 69
Testy do porównywania dwóch prób
0.5 1.0 1.5 2.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
k1=0.3, s=5, n=10, MC=10000, alpha=0.05
k2
P
o
w
e
r
Hirsch
Mann−Whitney
K−S
LR−param
57 / 69
Testy do porównywania dwóch prób
0.5 1.0 1.5 2.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
k1=0.3, s=5, n=20, MC=10000, alpha=0.05
k2
P
o
w
e
r
Hirsch
Mann−Whitney
K−S
LR−param
58 / 69
Testy do porównywania dwóch prób
0.5 1.0 1.5 2.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
k1=0.3, s=5, n=50, MC=10000, alpha=0.05
k2
P
o
w
e
r
Hirsch
Mann−Whitney
K−S
LR−param
59 / 69
Testy do porównywania dwóch prób
0.5 1.0 1.5 2.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
k1=0.3, s=5, n=100, MC=10000, alpha=0.05
k2
P
o
w
e
r
Hirsch
Mann−Whitney
K−S
LR−param
60 / 69
Testy do porównywania dwóch prób
0.5 1.0 1.5 2.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
k1=0.3, s=5, n=250, MC=10000, alpha=0.05
k2
P
o
w
e
r
Hirsch
Mann−Whitney
K−S
LR−param
61 / 69
Testy do porównywania dwóch prób
Podsumowanie i problemy otwarte
• Jakie własności statystyczne miałyby estymatory κ-pozycji
zbudowane dla innych funkcji kontrolnych κ?
• Czy testy budowane na tych estymatorach miałyby lepszą moc
niż test wykorzystujący estymator rozważany w tej pracy?
• Dla jakiej funkcji kontrolnej (być może z określonej rodziny
funkcji) otrzymalibyśmy test o maksymalnej mocy?
• . . . . . .
62 / 69
Testy do porównywania dwóch prób
Podsumowanie i problemy otwarte
• Jakie własności statystyczne miałyby estymatory κ-pozycji
zbudowane dla innych funkcji kontrolnych κ?
• Czy testy budowane na tych estymatorach miałyby lepszą moc
niż test wykorzystujący estymator rozważany w tej pracy?
• Dla jakiej funkcji kontrolnej (być może z określonej rodziny
funkcji) otrzymalibyśmy test o maksymalnej mocy?
• . . . . . .
63 / 69
Testy do porównywania dwóch prób
Podsumowanie i problemy otwarte
• Jakie własności statystyczne miałyby estymatory κ-pozycji
zbudowane dla innych funkcji kontrolnych κ?
• Czy testy budowane na tych estymatorach miałyby lepszą moc
niż test wykorzystujący estymator rozważany w tej pracy?
• Dla jakiej funkcji kontrolnej (być może z określonej rodziny
funkcji) otrzymalibyśmy test o maksymalnej mocy?
• . . . . . .
64 / 69
Testy do porównywania dwóch prób
Podsumowanie i problemy otwarte
• Jakie własności statystyczne miałyby estymatory κ-pozycji
zbudowane dla innych funkcji kontrolnych κ?
• Czy testy budowane na tych estymatorach miałyby lepszą moc
niż test wykorzystujący estymator rozważany w tej pracy?
• Dla jakiej funkcji kontrolnej (być może z określonej rodziny
funkcji) otrzymalibyśmy test o maksymalnej mocy?
• . . . . . .
65 / 69
Testy do porównywania dwóch prób
Podsumowanie i problemy otwarte
• Jakie własności statystyczne miałyby estymatory κ-pozycji
zbudowane dla innych funkcji kontrolnych κ?
• Czy testy budowane na tych estymatorach miałyby lepszą moc
niż test wykorzystujący estymator rozważany w tej pracy?
• Dla jakiej funkcji kontrolnej (być może z określonej rodziny
funkcji) otrzymalibyśmy test o maksymalnej mocy?
• . . . . . .
66 / 69
Testy do porównywania dwóch prób
Dziękujemy za uwagę.
67 / 69
Testy do porównywania dwóch prób
Literatura
• Q. Burrell. On the h-index, the size of the Hirsch core and Jin’s
A-index. Journal of Informetrics 1, 170–177.
• Q. Burrell (2008). Extending Lotkaian informetrics. Information
Processing & Management 44, 1794–1807.
• A. DasGupta (2008). Asymptotic theory of statistics and
probability. Springer Verlag, New York.
• W. Gl¨anzel (2008). On some new bibliometric applications of
statistics related to the h-index. Scientometrics 77(1), 187–196.
• L. Egghe (2006). Theory and practise of the g-index.
Scientometrics 69(1), 131–152.
68 / 69
Testy do porównywania dwóch prób
• M. Gągolewski, P. Grzegorzewski (2009). A geometric approach
to the construction of scientific impact indices. Scientometrics
81(3), 617–634.
• M. Grabisch, E. Pap, J. Marichal, R. Mesiar (2009).
Aggregation Functions, Cambridge.
• J. E. Hirsch (2005). An index to quantify individual’s scientific
research output. PNAS 102(46), 16569–16572.
• R. J. Hyndman, Y. Fan (1996). Sample quantiles in statistical
packages. American Statistician, 50(4), 361–365.
• G. J. Woeginger (2008). An axiomatic characterization of the
Hirsch-index. Mathematical Social Sciences 56(2), 224–232.
69 / 69

Sign up to vote on this title
UsefulNot useful