You are on page 1of 1

Sadržaj — Primena data mining (DM) tehnika već izvesno vreme

predstavljaju nezobilazni deo svakog Business Intelligence


rešenja. One nam daju mogućnost da u podacima otkrijemo
relacije za koje unapred nismo znali da postoje. Spoj DM tehnika
sa podacima dobijenim iz logova o pristupu web serveru naziva
se Web usage mining (WUM). Većinapoznatih web servera
logove sapodacima o prisutupima web serveru čuvaju u
standardnim formatima (CLF i ECLF). Zbog toga su ovakvi
podaci veoma pogodni za primenu neke od DM tehnika. Sam
proces ehstrahovanja znanja iz ovakvih podataka sastoji se iz tri
faze: predprocesiranja podataka, otkrivanja šablona (paterna) i
analize šablona. Rad daje osvrt na WUM prvo kroz prikaz nekih
od pristupa, a potom i kroz konkretan prikaz sve tri faze kroz
studiju slučaja.

Abstracts In the previous years the application of data mining


(DM) techniques have been intergraded into most major Business
Intelligence solutions. These techniques can provide such
knowledge about relations in data which we were not aware even
exist. Application of DM techniques on the data obtained from
web access logs is referred as Web usage mining (WUM). Entries
into Web access logs are stored in standard formats (CLF and
ECLF). Because of this we can use log data as input into some of
DM techniques. The process of extracting knowledge from log
data consists of three phases: data preprocessing, pattern
discovery and pattern analysis. This paper gives an overview of
WUM firstly through some of the approaches to WUM and than
the paper shows all three phases of WUM through a case study.

1. UVOD

Poslovanje danas je u velikoj meri okrenuto Internetu. Da bi se


opstalo među velikim brojem raznih organizacija okrenutih
Internetu, ključna stvar u kreiranju načina na koji se vodi
elektronsko poslovanje mora da bude presonalizacija web
stranica. Kupac (korisnik, posetilac) se viš e zadrž ava na sajtu na
kojem mu je olakš ana navigacija, gde lakše dolazi do potrebnih
informacija, koji mu daje preporuke o kupovini, koji sveukupno
više odgovara njegovim karakteristikama.

Prvi problem koji se javlja je što nije moguće saznati sve


relevantne karakteristike potencijalnih korisnika. DM