Mihai Modiga

 Algoritm de potriviri de siruri.

 Problema: Fiind dat in sir S de dimensiune n, si un

altul sir, P, de dimensiune m, (n>m), sa se gaseasca toate pozitiile in care sirul P apare in sirul S.
 Sau fiind data o multime de siruri M={P1, P2, … Pk},

fiecare sir Pi, i=1,k de dimensiune mi, n >mi, sa se gaseasca fiecare pozitie in care sirurile Pi apar in sirul S

 Algoritmul fortei brute
 O(n*m)

 Knuth–Morris–Pratt
 O(m +n)

 Boyer–Moore
 O(m*n) - worst case time  O(n / m) – best case time

 Rabin–Karp
 O(m+n) – average and best case time
 O(m*n) – worst case time

 Se gasesc toate apariile unui subsir in altul  Se verifica daca subsirul P este prefix al vreunui sufix al

sirului S
 O(n) – implementare eficienta

 O(n3) – implementare ineficienta
 Etape:
 Prelucrare initiala:  Arborele de sufixe  Vectorul de sufixe  In vectorul de sufixe se gasesc toate aparitiile subsirului dorit

 Caracterul $ de la final expliciteaza sufixele implicite,

in cazul in care ultimul caracter al sirului se mai gaseste pe alta pozitie in sir
a $ 7

?
1 3 2 5 4 6

 Vectorul de sufixe: Se parcurge arborele, din fiecare

nod se pleaca pe muchii in ordine alfabetica a stringului asociat cu fiecare
SA Indice din S Text

 Sirul “a” se gaseste pe

0
1 2 3 4 5 6

7
3 1 4 6 2 5

$
abxc$ axabxc$ bxc$ c$ xabxc$ xc$

pozitiile 1 si 3 in sirul S  Sirul “ax” se gaseste pe pozitia 1  Sirul “c” se gaseste pe pozitia 6  Sirul “xb” nu exista in sirul initial

 Arborele de sufixe:
p a

p

a

4

pa

a

3

1

2

 Vectorul de sufixe:
Indice din S 4

SA 1

sufix a

2
3 4

3
2 1

pa
ppa pppa

Sign up to vote on this title
UsefulNot useful