Professional Documents
Culture Documents
Bu belgeden alıntı
yapmak için: Edastama, P., Bist, A., & Prambudi, A. (2021). Apriori Algoritması Kullanılarak Gözlük
Satışlarında Veri Madenciliğinin Uygulanması. International Journal of Cyber and IT Service Management
159-172.
(IJCITSM), 1(2), https://iiast-journal.org/ijcitsm/index.php/IJCITSM/article/view/46 adresinden erişildi
Soyut
Optik Nasional, Taşmalaya'nın en önemli optiklerinden biridir. Günlük satış işlemlerinin birçoğu,
hatta daha uzun satışlar, çeşitli markalarla gözlük alıp satma sürecindeki faaliyetleri sonucunda artacaktır.
Kendi haline bırakılırsa, satış işlem verileri gereksiz çöplüğe dönüşür. Teknolojik gelişmelerin yardımıyla, veri
toplama ve işleme yeteneği gelişiyor. Veri madenciliği, büyük miktarda veriden bilgi ve uzmanlık çıkarma
sürecidir. İşlem verileri, firma için bir arşiv işlevi görmenin yanı sıra, iyileştirilmiş satış ve promosyon ürünleri
için yararlı bilgiler oluşturmak için kullanılabilir ve analiz edilebilir. Yazar, ulusal bir optik firmasındaki bir
veritabanı işleminde en popüler ve talep edilen mallar hakkında bilgi elde etmek için Apriori algoritmasını
kullanır, böylece sonuçlar gözlük satış ve pazarlamasının büyümesini iyileştirmek için kullanılabilir.
1. Giriş National
Optics, Taşikmalaya'nın optisyenlerinden biridir. National Optics'in faaliyetleri arasında çeşitli
markalardan gözlük alım satımı; günlük satış işlemlerinin sayısı ve satış verileri zamanla artmaya devam
edecek. Katılımsız bırakılırsa, satış işlemi verileri gereksiz bir israfa dönüşecektir. Veri toplama ve işleme
yeteneği, teknolojik gelişmelerin bir sonucu olarak gelişiyor. Veri madenciliği, büyük miktarda veriden bilgi ve
uzmanlık çıkarma sürecidir. Veri madenciliği, bir veri kümesinin katma değerini, verilerden daha önce
bilinmeyen bilgiler biçiminde belirlemeye yönelik prosedürlerin bir toplamıdır. Veritabanı dünyasında veri
madenciliği, bilgi keşfi (KDD) olarak da bilinir. KKD, verilerin toplanması, analizi ve yorumlanmasının yanı sıra
büyük veri kümelerindeki düzenlilikleri ve kalıpları ortaya çıkarmak için geçmişin kullanımını içeren bir süreçtir.
Kurumsal dünyada, özellikle ürün satışı konusunda uzmanlaşmış firmalarda artan rekabet miktarı,
geliştiricilerin ürün satışlarını ve pazarlamasını genişletmek için bir plan tasarlamasını zorunlu kılıyor,
bunlardan biri de ürün satış verilerini kullanmak. Günlük satış aktivitesi ile,
veriler zamanla büyüyecektir. Veriler, firma için bir arşiv görevi görmenin yanı sıra satışları ve ürün promosyonunu
geliştirmek için kullanılabilir ve faydalı bilgilere dönüştürülebilir.
Yazar, ulusal bir optik firmasında en çok satılan ve talep edilen ürünler hakkında bir işlem veri tabanından
bilgi çıkarmak için a priori bir algoritma kullanır, böylece sonuçlar daha sonra gözlük ürünlerinin satış ve pazarlamasını
oluşturmak için kullanılabilir.
Veri madenciliği, bir veya daha fazla bilgisayar öğrenme tekniğini (makine öğrenimi) kullanan bilgiyi otomatik
olarak analiz etmeye ve çıkarmaya yönelik bir tekniktir. Örneğin tümevarıma dayalı öğrenme, çalışılacak fikirlerin belirli
örneklerini izleyerek genel kavram tanımlarını oluşturma sürecidir. Bilimsel tekniklerin veri madenciliğinde kullanılması,
Veritabanlarında Bilgi Keşfi (KDD) olarak bilinir. Veri madenciliği bu bağlamda KDD sürecinin bir aşamasıdır (Hermawati,
2013).
Veri madenciliği, yeni ilgili korelasyonları, kalıpları ve eğilimleri keşfetmek için istatistiksel ve matematiksel
yaklaşımlar gibi kalıp tanıma tekniklerini kullanarak depoda tutulan çok büyük veri setlerini eleme eylemi olarak
tanımlanır. (Emha taufiq Luthfi, Kuşrini, 2009).
Bu anlamların dışında aşağıda belirtilen birkaç tane daha vardır (Kusrini, Emha taufiq Luthfi, 2009). a. Veri madenciliği,
önceden bilinmeyen bilgiler biçiminde bir veri kaynağından ek değer çıkarmak için bir prosedürler topluluğudur. B. Veri
madenciliği, büyük veya karmaşık verilerin otomatik olarak incelenmesidir.
Ek olarak, veri madenciliği kavramıyla hiçbir ilgisi olmayan veri özellikleri vardır. Alakalı olmayan tüm verilerden
kurtulmak da iyi bir fikirdir. Çünkü
Uluslararası Siber ve BT Hizmet Yönetimi Dergisi (IJCITSM) p-ISSN: 2797-1325 Cilt. 1 No. 2 Ekim 2021 e-ISSN:
2808-554X
işlenen verilerin miktarı ve karmaşıklığı azaltılacak, veri temizliği veri madenciliği tekniklerinin
performansı üzerinde etkili olacaktır. B. Veri entegrasyonu Farklı veritabanlarından gelen verilerin
tek bir yeni veritabanında birleştirilmesi, entegrasyon verileri olarak bilinir. Sıklıkla, veri madenciliği için
gereken veriler, tek bir veritabanından ziyade birkaç veritabanından veya metin dosyasından
kaynaklanır. Veri entegrasyonu, adlar, ürün türleri, sayılar, müşteriler vb. gibi farklı varlıkları
tanımlayan özellikler üzerinde yapılır. Entegrasyon verilerindeki hatalar çarpık bulgular
oluşturabileceğinden ve potansiyel olarak gelecekte yanlış yönde aksiyon alınmasına yol
açabileceğinden, veri entegrasyonu dikkatli bir şekilde yapılmalıdır. Örneğin, ürün türüne dayalı veri
entegrasyonu, çeşitli kategorilerdeki öğelerin birleşimiyle sonuçlanırsa, mevcut olmayan ürünler
arasında bir bağlantı keşfedilecektir. C. Veri Seçimi Veritabanındaki verilerin tamamı
kullanılmadığından, yalnızca analiz için kabul edilebilir veriler veritabanından alınacaktır. İnsanların
yatkınlık değişkenlerinin araştırıldığı bir senaryo düşünün.
A priori algoritma, yüksek frekans modellerini bulmak için en ünlü algoritmadır. A priori algoritma, anlatım
veya geçiş adı verilen birkaç aşamaya bölünmüştür (Setiawati, 2009).
a. Aday k-itemset, önceki aşamada edinilen (k-1)-itemset kombinasyonundan oluşturulur. k-1 öğelerini
içeren alt küme, bir şekilde k-1 uzunluğunun yüksek frekans modeline uymaz.
B. Her aday k-öğe setinden destek hesaplanır. Her aday k-destek ürün seti, veri tabanı taranarak ve tüm
aday k-öğelerini içeren işlem sayısı sayılarak elde edilir. öğe kümeleri Bu aynı zamanda, tam
veritabanı kullanılarak mümkün olduğu kadar çok k-öğe kümesinin hesaplanmasını gerektiren önsel
yaklaşımın bir özelliğidir.
C. Yüksek frekanslı bir desen oluşturun. Desteği minimum destekten daha büyük olan aday k-itemsetleri,
k item veya k-itemset içeren yüksek frekans modelini belirlemek için kullanılır. Yeni bir yüksek
frekans modeli keşfedilmezse prosedür sonlandırılır. Değilse, k bir artırılır ve 1. kısım döndürülür.
Agrawal & Srikant, boolean birliktelik kuralları için sık öğe kümelerini belirlemek için 1994 yılında
Apriori yöntemini tanıttı. Veri madenciliğinde, a priori algoritma bir tür birliktelik kuralıdır. Yakınlık analizi veya
pazar sepeti analizi, birçok nitelik arasındaki ilişkiyi ifade eden kuralları tanımlamak için kullanılan terimlerdir.
Birliktelik kuralı madenciliği olarak da bilinen birliktelik analizinin veri madenciliği yaklaşımı, bir grup öğenin
kurallarını keşfetmek için kullanılır. Yüksek frekanslı örüntü madenciliği, verimli algoritmalar geliştirmek için
birçok akademisyenin dikkatini çeken ilişkilendirme analizi aşamalarından biridir. Bir ilişkinin önemini
değerlendirmek için destek ve güven adı verilen iki ölçüt kullanılabilir. Bu öğelerin veri tabanındaki
kombinasyonunun oranına destek (destek değeri), birliktelik kurallarındaki öğeler arasındaki bağlantının
gücüne güven (kesinlik değeri) denir.
Uluslararası Siber ve BT Hizmet Yönetimi Dergisi (IJCITSM) p-ISSN: 2797-1325 Cilt. 1 No. 2 Ekim 2021 e-ISSN: 2808-554X
Bu adım, veritabanındaki destek değerinin minimum ölçütleriyle eşleşen nesnelerin bir birleşimini arar. Bir öğenin destek
değerini hesaplamak için aşağıdaki formül kullanılır: Destek A = A x %100 İçeren İşlemler Transaksi
Sık öğe kümesi, sağlanan minimum değerden () daha büyük bir oluşum sıklığına sahip öğeleri görüntüler. Değeri 2 olarak
ayarlarsak, ortaya çıkma sıklığı 2 katına eşit veya daha fazla olan tüm öğe kümeleri ortak olarak kabul edilir. Fk, sık
kullanılan k-öğe kümeleri kümesini belirtir.
C. Birliktelik Kurallarının Oluşumu Tüm yüksek frekans modellerini keşfettikten sonra, minimum güven standartlarını
karşılayan birliktelik kurallarını bulmak için ilişkisel kural A->B'nin güvenini hesaplayın. A->B kuralının puan güvenini
1 Tanrıça Kartika 2013 En popüler elektronik öğelerin belirlenmesinde Apriori Algoritmasının kullanımı
Ekmek vurgulanmıştır. (Bölme, 2013)
2 Nugroho Wandi, Rully A. 2012 Bir kullanıcı seçilen bir kitabın içeriğini görüntülediğinde veya
ödünç al, apriori teknikleri ve algoritmaları, kullanıcıların ek kitap önerileri almasına
Hendrawan ve yardımcı olmak için kitap ödünç verme önerileri olarak kullanılan işlemlerdeki kitaplar
Ahmed Mukhlason arasında güçlü ilişkiler olan kitap ödünç verme işlemleri üretir. Nugroho Wandi
(Nugroho Wandi, 2012)
3 Denny Haryanto, 2011 Apriori Algoritmasının ürün tanıtımı için ek kalıpları aramasında kullanılması,
Yetli Oslan, Djoni az satan ürünlerin reklamını azaltmayı amaçlamaktadır. Bağlanma modeli
Dwiyana olmayan malların tanıtımı en aza indirilirse, tüketiciler satın alınmamış ürünlerin
reklamından daha az üzülecektir (Denny Haryanto, Yetli Oslan ve Djoni Dwiyana,
2011).
4 Hapsari Dita 2013 Apriori Algoritması, bir uygulama oluşturmak için kullanılır.
Anggraeni, Ragil Eczanelerin belirli bir aydaki satış eğilimleri şeklinde bilgi edinmelerine
Saputra, S.Si, M.Cs, yardımcı olabilecek bir veri analizi yaklaşımı olan veri madenciliğini
Beta Noranita, S.Si, kullanarak ilaç satış işlem verilerinin pazar sepetini analiz eder.
M.Kom
(Hapsari Dita Anggraeni, Ragil Saputra, S.Si, M.Cs, Beta Noranita, S.Si, M.Kom,
Hapsari Dita Anggraeni, Ragil Saputra, S.Si, M.Cs, Hapsari Dita Anggraeni,
Ragil Saputra, S .Si, M.Cs
2. Araştırma Yöntemi
Yüksek frekans modellerini tespit etmek için en iyi bilinen teknik, a priori algoritmadır. A priori, anlatı
ve geçiş olarak bilinen birçok bölüme ayrılır. Aday k-itemsetleri, önceki turda elde edilen (k-1)-itemset'lerin
birleştirilmesiyle oluşturulur.
k-1 öğelerini içeren alt kümeleri, k-1 uzunluğundaki yüksek frekans modeline dahil edilmeyen potansiyel k-öğe
kümelerinin budanması, a priori algoritmanın bir yöntemidir. Yüksek frekans modellerini belirlemek için a priori
yöntem iyi bilinmektedir. Veri analizi, bir öğe kümesi kalıpları ve kuralları karışımı oluşturmanın ilk adımıdır.
Kullanılan veriler, cam satış işlemlerine ilişkin verilerdir, ardından bir öğe kümeleri modeli kombinasyonunun
geliştirilmesi takip edilir ve son olarak, ilgi çekici bir öğe kümeleri modeli kombinasyonundan birliktelik kuralları
oluşturulur.
Bu durumda, Apriori algoritması, şirketin pazarlama çabaları üzerinde önemli bir etkisi olacak en popüler
öğeleri belirlemek için satış verilerini analiz etme görevine çok uygundur.
Araştırmacının araştırması Taşıkmalaya'da bir optik firmasında yapılmış olup, sonuçların pazarlama
referansı olarak kullanılabilmesi için 2016 yılında en çok hangi marka gözlük satıldığını belirlemek için her ay
değerlendirilen 2016 satış verileri kullanılmıştır. Firma gözlük üretiyor. Optik Nasional Taşmalaya'da bulunan
gözlük markaları aşağıda listelenmiştir.
HAYIR
GÖZLÜK MARKASI
1 ADIDAS
2 BILLABONG
3 BURBERRY
4 BVLGARI
5 CALVIN KLEIN
6 KARİYER
7 KARİYER
8 CELINE
9 KANAL
10 D&G
11 DIOR
12 DUNHILL
13 EMPORIO ARMANI
14 FERRARİ
15 GIORGIO ARMANI
3. Sonuçlar ve tartışma
A priori yöntemin amacı, minimum desteği karşılayan tüm a priori kuralları belirlemektir.
veritabanındaki her bir öğenin kombinasyonları olan kriterler. ve asgari düzeyde
içindeki öğeler arasındaki bağlantının gücünü ifade eden güven (kesinlik değeri)
birliktelik kuralları.
Bu işlemler bir Optik'e Gözlük satma işlemine dayalı olarak toplanabilir.
ülke çapında firma. Tablo 3'te Gözlükler için toplam satış işlemi sayısı gösterilmektedir.
2016 yılında bir yıl boyunca nesne olarak kullanılan Ulusal Optik.
AY ÖĞE SETİ
1 FERRARI,CARTIER,RAYBAN
3 DIOR,GUESS,GUESS,LEVI'S,FERRARI
4 LEVI'S,DUNHILL,GUESS,RAYBAN
5 MERCEDES BENZ,LEVI'S,BVLGARI,BILLABONG,ADIDAS
8 OAKLEY,LEVI'S,POLİS,PUMA,BVLGARI,D&G
Tablo 3'teki verilere dayanarak, aşağıdaki bir dava çözümüdür. C1 üretme süreci
en az %30 destekle 1 öğe kümesi olarak da bilinir. Formül aşağıdaki gibidir:
Destek A = A x %100 İçeren İşlemler
İşlem
FERRARI
%33
RAYBAN
%33
KANAL
%30
DUNHILL
%33
DIOR
%30
GUCCI
%41
LEVI'S
%41
MERCEDES BENZ
%33
BVLGARI
%30
ADIDAS
%30
NIKE
%30
POLİS
%30
D&G
%30
Minimum destek miktarı = %15 ile C2 veya 2 itemset adı verilen oluşturma süreci
aşağıdaki formülle yapılabilir:
FERRARI - BVLGARI
0 %0
FERRARI - ADIDAS
0 %0
FERRARI - NIKE 1 %8
FERRARİ - POLİS
0 %0
FERRARI - D&G 0 %0
RAYBAN - KANAL
1 %8
RAYBAN - DIOR 0 %0
RAYBAN - GUCCI 1 %8
RAYBAN - LEVI'S 1 %8
RAYBAN - NIKE 1 %8
RAYBAN - POLİS 0 %0
CHANEL-DIOR 1 %8
CHANEL - GUCCI 1 %8
CHANEL - LEVI'S 1 %8
Belirtilen minimum destek %15 olduğundan, yerine getirmeyen iki öğe kümesinin herhangi bir kombinasyonu
bu gereklilik, aşağıdaki Tablo 6'da belirtildiği gibi ortadan kaldırılacaktır.
FERRARI - RAYBAN
2 %16
FERRARI - GUCCI
3 %25
CHANEL - DUNHILL
2 %16
Tablo 8, minimum desteğe bağlı olarak nihai birliktelik kurallarının nasıl düzenlendiğini gösterir.
ve güven hesaplanmıştır.
Uluslararası Siber ve BT Hizmet Yönetimi Dergisi (IJCITSM) p-ISSN: 2797-1325 Cilt. 1 No. 2 Ekim 2021 e-ISSN:
2808-554X
Kural
Destek Kendinden emin
FERRARI satın
%75 %75
alırsanız, o zaman GUCCI satın alır
National Optical firmasında en çok satılan gözlük markaları, yukarıda belirtilen birliktelik kurallarına dayalı
olarak aşağıdaki grafikte görülebilir:
4. Sonuç En çok
satılan Gözlük markaları Ferrari ve Gucci'dir ve en çok satılan ürünler yukarıdaki grafiğe dayalı bir a priori
algoritmaya göre bilinmektedir.
Şirketler, ürünün en büyük faydalarının neler olduğunu inceleyerek öğeleri diğer markalarla tanıtmak
için pazarlama planları oluşturmak için Apriori algoritmasını kullanabilir. Gelecekteki araştırmalar için
bazı öneriler şunlardır: verilerin daha doğru olması için araştırmanın amacı sadece bir yılı değil, beş yılı
da kapsamalıdır; ve gelecekteki araştırmalarda, veri işleme için kullanımı basit bir uygulama üzerine
kurulu bir sistem geliştirmek daha iyidir.
Referanslar
[1] Haryanto D, Oslan Y, Dwiyana D. “Motosiklet Parçaları Satışında Apriori Algoritmasını Kullanarak
Alışveriş Sepeti Analizinin Birliktelik Kuralları ile Uygulanması”. 2014;
[2] Susanto S, Suryadi D. “Veri madenciliğine giriş: veri yığınlarından bilgi kazmak”. Andi Yayınevi; 2010.
[3] Setiawati DD. “MİNİMARKET SATIŞ İŞLEM VERİLERİNDE PAZAR SEPETİ ANALİZİ İÇİN APRIORI
YÖNTEMİNİN KULLANILMASI”. Teknik Çalışma Programı Tezini bilgilendirin.
[4] DK bölmesi.” Apriori Algoritması Kullanılarak Elektronik Ürün Satışlarında Veri Madenciliğinin
Uygulanması (Örnek Olay: Kreditplus)”. Pelita, Budi Darma'yı bilgilendirin. 2013;4(3):25–9.
[5] Anggraeni HD, Saputra R, Noranita B. “Apriori Algoritmasını Kullanarak İlaç Satış İşlem Verilerinin
Veri Madenciliği Uygulama Analizi (Eczane Setya Sehat Semarang'da Vaka Çalışması)”. J
Bilişim Tekn. 2014;2(2):24–30.