Professional Documents
Culture Documents
Untitled
Untitled
Přesnost (Precision):
Pro ANO: a/(a+b)
Pro NE: d/(c+d)
Úplnost (Recall):
Pro ANO: a/(a+c)
Pro NE: d/(b+d)
Dokument D má dva destriptory U a V. Váha U je 0,6 a váha V je 0,3. Dotaz [U; 0,2] AND [V;
Y] znamená, že nás zajímají dokumenty, ve kterých se vyskytuje deskriptor U a zároveň
deskriptor V. Váha deskriptoru U v tomto dotazu je 0,2, váha deskriptoru V není známá,
značíme ji Y. Váha tohoto dotazu v dokumentu D vypočítaná v rozšíření boolovského modelu
pomocí fuzzy logiky je rovna 0,12. Pro každou z možných hodnot Y tedy platí?
+ Y >= 0,4
- Y <= 0,6
- Y = 0,3
- Y = sqrt(0,3^2+0,12^2/2)
+ AND bere menší číslo
Dokument D má dva destriptory U a V. Váha U je 0,6 a váha V je 0,3. Dotaz [U; 0,2] OR [V;
Y] znamená, že nás zajímají dokumenty, ve kterých se vyskytuje deskriptor U a zároveň
deskriptor V. Váha deskriptoru U v tomto dotazu je 0,2, váha deskriptoru V není známá,
značíme ji Y. Váha tohoto dotazu v dokumentu D vypočítaná v rozšíření boolovského modelu
pomocí fuzzy logiky je rovna 0,12. Pro každou z možných hodnot Y tedy platí?
+ Y <= 0,4
- Y = 0,5
- Y >= 0,3
- Y = sqrt(0,3^2+0,12^2/2)
+ OR bere větší číslo
Dokument má 2 deskriptory U a V. U je 0,5 a V je 0,4. Dotaz [U; 0,8] OR [V; 0,2]. Váha
tohoto dotazu je X a je rovna?
- X = 0,5
- X = 0,2
-X=1
+ X = 0,4
Jaká je správná syntaxe pro pole obsahující pět čísel 1,2,3,4,5 v JSON?
+ [1,2,3,4,5]
- (1,2,3,4,5)
- <1,2,3,4,5>
- {1,2,3,4,5}
Máme 4polní tabulku a=30 b=x c=y d=8697. Kolik je x, když přesnost je 1/3?
+ 60
- 20
- 30
- 40
Máme 4polní tabulku a=30 b=x c=y d=8697. Kolik je x, když úplnost je 1/2?
- 60
- 20
+ 30
- 40
Máme 4polní tabulku a=235 b=15 c=35 d=265. Jaká je úplnost pro třídu ANO?
- 500/550
+ 235/270
- 265/280
- 235/250
Máme 4polní tabulku a=235 b=15 c=35 d=265. Jaká je přesnost pro třídu ANO?
+ 235/250
- 235/550
- 50/500
- 235/270
Máme 4polní tabulku a=235 b=15 c=35 d=265. Jaká je hodnota false positive?
+ 15
- 235
- 265
- 35
Máme 4polní tabulku a=235 b=15 c=35 d=265. Jaká je hodnota true negative?
- 15
- 235
+ 265
- 35
Máme 4polní tabulku a=235 b=15 c=35 d=265. Jaká je hodnota false negative?
- 15
- 235
- 265
+ 35
Jak se liší poměrný informační zisk použitý v algoritmu C4.5 od informačního zisku ID3?
+ informační zisk preferuje atributy s vysokým počtem hodnot, poměrný informační člen má
normalizační cosi, který to řeší
+ umožňuje zpracovat spojité atributy
- zaručuje optimální řešení
- poměr informačního zisku kořenového a cílového atributu
Pro jaký způsob využití v procesu hodnocení webové stránky na určitý dotaz byl algoritmus
PageRank navržen?
+ Hodnota PR se použije jako jediná míra relevance stránky na daný dotaz. Nejvyšší PR je
první ve výsledích
- Výsledná relevance stránky vznikne zkombinováním hodnoty PR s hub score
- Hodnota PR pro danou stránku se zkombinuje s dalšími měrami relevance stránky na daný
dotaz
- Hodnota PR se použije jako jediná míra relevance stránky na daný dotaz. Nejvyšší PR je
poslední ve výsledích
Uvedený regex \d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3} rozpozná ipv4 adresu, upravte tak, aby třetí
byte byl vždy stejný jako druhý?
+ \d{1,3}\.(\d{1,3})\.\1\.\d{1,3}
- (\d{1,3}\.){2}\d{1,3}\.\d{1,3}
- (=next)(\-\d{1,3})\.\d{1,3}\.\d{1,3}
- (\d{1,3}\.)(=previous)\d{1,3}\.\d{1,3}
Jako konvergenční krit algoritmu Page Rank byl zvolen rozdíl L1 normy oproti předchozí
itineraci. Jaká bude velikost tohoto rozdílu máme-li tyto vektory Pi5=[0,489 0,090 0,465
0,040] a pi6=[0,423 0,090 0,456 0,040]
- 0,073
-1
+ žádná z předchozích
Které z uvedených patří mezi zásady pro zveřejnování propojených dat? asi
- Preferovaným formátem pro propojená data je XML Schema.
- Preferovaným formátem pro propojená data je JSON.
- Preferovaným formátem pro propojená data je CSV.
- Použitá adresa je pouze identifikátorem, neposkytuje popis zdroje přes HTTP protokol
(naopak ano)
Jaká je správná syntaxe pro pole obsahující pět čísel 1,2,3,4,5 v JSON?
+ [1,2,3,4,5]
- (1,2,3,4,5)
- <1,2,3,4,5>
- {1,2,3,4,5}
Máme 4polní tabulku a=30 b=x c=y d=8697. Kolik je x, když přesnost je 1/3?
+ 60
- 20
- 30
- 40
Máme 4polní tabulku a=30 b=x c=y d=8697. Kolik je x, když úplnost je 1/2?
- 60
- 20
+ 30
- 40
Máme 4polní tabulku a=235 b=15 c=35 d=265. Jaká je úplnost pro třídu ANO?
- 500/550
+ 235/270
- 265/280
- 235/250
Máme 4polní tabulku a=235 b=15 c=35 d=265. Jaká je přesnost pro třídu ANO?
+ 235/250
- 235/550
- 50/500
- 235/270
Máme 4polní tabulku a=235 b=15 c=35 d=265. Jaká je hodnota false positive?
+ 15
- 235
- 265
- 35
Máme 4polní tabulku a=235 b=15 c=35 d=265. Jaká je hodnota true negative?
- 15
- 235
+ 265
- 35
Máme 4polní tabulku a=235 b=15 c=35 d=265. Jaká je hodnota false negative?
- 15
- 235
- 265
+ 35
Jaku bude vypadat Google matice při dumping faktoru 1?
+ Totožná s maticí S
Pro jaký způsob využití v procesu hodnocení webové stránky na určitý dotaz
byl algoritmus PageRank navržen?
+ Hodnota PR se použije jako jediná míra relevance stránky na daný dotaz.
Nejvyšší PR je první ve výsledích
- Výsledná relevance stránky vznikne zkombinováním hodnoty PR s hub score
- Hodnota PR pro danou stránku se zkombinuje s dalšími měrami relevance
stránky na daný dotaz
- Hodnota PR se použije jako jediná míra relevance stránky na daný dotaz.
Nejvyšší PR je poslední ve výsledích
Jako konvergenční krit algoritmu Page Rank byl zvolen rozdíl L1 normy
oproti předchozí itineraci. Jaká bude velikost tohoto rozdílu máme-li tyto
vektory Pi5=[0,489 0,090 0,465 0,040] a pi6=[0,423 0,090 0,456 0,040]
- 0,073
- 1
+ žádná z předchozích
0,1
0,25
0,15
žádná z předchozích možností
[ 0 0 1 0]
[0 1 0 0]
[ 1/4 1/4 1/4 1/4]
[ 0 0 0 1]
Výpis 1 uvádí XML Schéma a výpis 2 kazkový XML dokument, který má schématu
odpovídat. Výpis 2 obsahuje dvě položky - první produkt "Fairetta s
guaranou" a druhý "Čaj černý Kilimanjaro". (Výpis1,Výpis2). Tvůrce XML
dokumentu se ale mohl dopustit chyb vůči XML Schématu. Vyberte jen jednu z
následujících odpovědí:
-element DOSTUPNOST se v prvním elementu POLOŽKA může vyskytnout na
libovolném místé, prolože schéma pozici tohoto elementu nedefinuje
-element DOSTUPNOST se může vyskytnout, jako kořenový dokument
-element DOSTUPNOST v prvním elementu POLOŽKA může nabývat hodnoty "0",
protože schéma množinu přípustných hodnot tohoto elementu neomezuje
-element DOSTUPNOST se nesmí v XML dokumentu vyskytnout
"id","produkt"
"1","káva\"super"
"id","produkt"
"1",“"káva"super"
id,produkt
1,káva“super
"id“,"produkt"
"1","káva""super"
nejméně 0x
nejméně 1x
nejvíce 1x
právě jednou
Uvažujete dataset obhasující 10 instací, které jsou popsané atributem
"Akce".
(tabulka)
A nebo B
(obrázek stromu)
15
Nelze zjistit
27
[2 1]
[1 3]
[3 2]
[1 1]
[3 1]
[1 2]
Číslo shluku, X, Y
1: 0.2, 1
2: 0.5 0
3: 0.9 0.4
Do shluku 2
Do shluku 2 a 3
Do shluku 3
Do shluku 1 a 2
A= [4,6,5]
B= [7,9,4]
C= [1,0,0]
[4,5,3]
[6,9,1]
[2,3,1]
Mějme PageRank vektory =[ 0,25 0,5 0,05 0,2] & [ 0,2 0,5 0,15 0,15 ]. Jak
by vypadal PageRank vektor v nulté iteraci?
[0 0 0 0]
Vyhledáváné t u
Nevyhledáváné v w
P= (t+w)/(t+u+v+w)
P= t/(t+v)
P= 1 - ((t+w)/(t+u+v+w))
Vyhledáváné 30 20
R= 30/150
R= 30/(30+20)
R = 30/20
Informace: D2,D3
Počítač: D1,D3,D4
Systém: D1,D2,D4
Tiskárna: D1
{D3,D4}
{D1}