Welcome to Scribd!

13.efficient Vertical Mining of

Uploaded by

0% found this document useful (0 votes)

4 views1 page

This document proposes an efficient algorithm called dHAUIM for mining high average-utility itemsets from quantitative databases. dHAUIM uses four tight average-utility upper bounds based on a vertical database representation and three pruning strategies to reduce the search space of itemsets. Experimental results show that dHAUIM outperforms four state-of-the-art algorithms in terms of runtime and dramatically reduces the number of candidate itemsets generated.

Original Description:

Original Title

13.Efficient Vertical Mining of

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

4 views1 page

13.efficient Vertical Mining of

Uploaded by

Venky Naidu Balineni

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 1

Search inside document

ABSTRACT:

Mining High Average-Utility Itemsets (HAUIs) in a quantitative database is an extension

of the traditional problem of frequent itemset mining, having several practical applications.
Discovering HAUIs is more challenging than mining frequent itemsets using the traditional
support model since the average-utilities of itemsets do not satisfy the downward-closure
property. To design algorithms for mining HAUIs that reduce the search space of itemsets, prior
studies have proposed various upper-bounds on the average-utilities of itemsets. However, these
algorithms can generate a huge amount of unpromising HAUI candidates, which result in high
memory consumption and long runtimes. To address this problem, this paper proposes four tight
average-utility upper-bounds, based on a vertical database representation, and three efficient
pruning strategies. Furthermore, a novel generic framework for comparing average-utility upper-
bounds is presented. Based on these theoretical results, an efficient algorithm named dHAUIM is
introduced for mining the complete set of HAUIs. dHAUIM represents the search space and
quickly compute upper-bounds using a novel IDUL structure. Extensive experiments show that
dHAUIM outperforms four state-of-the-art algorithms for mining HAUIs in terms of runtime on
both real-life and synthetic databases. Moreover, results show that the proposed pruning
strategies dramatically reduce the number of candidate HAUIs.

Optimal Dimensions For Multi-Deep Storage Systems Under Class-Based Storage Policies
Document15 pages
Optimal Dimensions For Multi-Deep Storage Systems Under Class-Based Storage Policies
Anonymous MNBl0M97f
No ratings yet
Abstractt
Document5 pages
Abstractt
Alfred Jerome
No ratings yet
High-Utility Itemset Mining With Effective Pruning Strategies
Document22 pages
High-Utility Itemset Mining With Effective Pruning Strategies
tvquynh1
No ratings yet
CURE For Cubes: Cubing Using A ROLAP Engine: Konstantinos Morfonios Kmorfo@di - Uoa.gr Yannis Ioannidis Yannis@
Document12 pages
CURE For Cubes: Cubing Using A ROLAP Engine: Konstantinos Morfonios Kmorfo@di - Uoa.gr Yannis Ioannidis Yannis@
wasoft
No ratings yet
Optimizing A Dynamic Order-Picking Process: Yossi Bukchin, Eugene Khmelnitsky, Pini Yakuel
Document26 pages
Optimizing A Dynamic Order-Picking Process: Yossi Bukchin, Eugene Khmelnitsky, Pini Yakuel
Arief Setiawan
No ratings yet
Improving Upgrowth Algorithm Using Top-K Itemset Mining High Utility
Document12 pages
Improving Upgrowth Algorithm Using Top-K Itemset Mining High Utility
Priya Ch
No ratings yet
Gemulla 07 Setsampling
Document29 pages
Gemulla 07 Setsampling
Yash Kanherkar
No ratings yet
14 - Novel High Average Utility Pattern Mining With Tighter UpperBounds
Document78 pages
14 - Novel High Average Utility Pattern Mining With Tighter UpperBounds
Call Me Munna Bhai Arepalli
No ratings yet
Knowledge-Based Systems: Gwangbum Pyun, Unil Yun, Keun Ho Ryu
Document15 pages
Knowledge-Based Systems: Gwangbum Pyun, Unil Yun, Keun Ho Ryu
nomore891
No ratings yet
Multi-Reservoir Operation Rules Multi-Sw
Document21 pages
Multi-Reservoir Operation Rules Multi-Sw
djajadjaja
No ratings yet
Analysis and Implementation of FP & Q-FP Tree With Minimum CPU Utilization in Association Rule Mining
Document6 pages
Analysis and Implementation of FP & Q-FP Tree With Minimum CPU Utilization in Association Rule Mining
WARSE Journals
No ratings yet
Improved Algorithm For Mining of High Utility Patterns in One Phase Based On Map Reduce Framework On Hadoop
Document4 pages
Improved Algorithm For Mining of High Utility Patterns in One Phase Based On Map Reduce Framework On Hadoop
Salim Mehenni
No ratings yet
0909 Main PDF
Document13 pages
0909 Main PDF
Ashish Sharma
No ratings yet
Advanced Engineering Informatics: Chun-Wei Lin, Tzung-Pei Hong, Guo-Cheng Lan, Jia-Wei Wong, Wen-Yang Lin
Document12 pages
Advanced Engineering Informatics: Chun-Wei Lin, Tzung-Pei Hong, Guo-Cheng Lan, Jia-Wei Wong, Wen-Yang Lin
SeminarsPunters
No ratings yet
Mining Frequent Patterns Without Candidate Generation
Document20 pages
Mining Frequent Patterns Without Candidate Generation
Neng Ayat
No ratings yet
Experimental Study of High Performance Priority Queues: David Lan Roche Supervising Professor: Vijaya Ramachandran
Document35 pages
Experimental Study of High Performance Priority Queues: David Lan Roche Supervising Professor: Vijaya Ramachandran
No12n533
No ratings yet
p702 Mansour
Document12 pages
p702 Mansour
Ram1028
No ratings yet
Boosting Cache Performance by Access Time Measurements: Gil Einziger, Omri Himelbrand, Erez Waisbard
Document29 pages
Boosting Cache Performance by Access Time Measurements: Gil Einziger, Omri Himelbrand, Erez Waisbard
Muhammad Khaleel Afzal
No ratings yet
Z (5) Efficient Colossal Pattern Mining in High Dimensional Datasets
Document12 pages
Z (5) Efficient Colossal Pattern Mining in High Dimensional Datasets
tvquynh1
No ratings yet
Data Mining Using Clouds: An Experimental Implementation of Apriori Over Mapreduce
Document8 pages
Data Mining Using Clouds: An Experimental Implementation of Apriori Over Mapreduce
Sudhansu Shekhar Patra
No ratings yet
Caso Alibaba
Document35 pages
Caso Alibaba
Camila Gómez
No ratings yet
Mining Frequent Patterns Without Candidate Generation
Document12 pages
Mining Frequent Patterns Without Candidate Generation
Prakash M
No ratings yet
Telecinese - Kinesis2
Document14 pages
Telecinese - Kinesis2
ralphespanhol
No ratings yet
Performance Evaluation of Database Client Engine
Document4 pages
Performance Evaluation of Database Client Engine
International Journal of Application or Innovation in Engineering & Management
No ratings yet
76-Article Text-107-2-10-20180521
Document4 pages
76-Article Text-107-2-10-20180521
dpkmds
No ratings yet
A Hybrid Filtering Approach For Storage Optimization - 2015 - Egyptian Informat
Document9 pages
A Hybrid Filtering Approach For Storage Optimization - 2015 - Egyptian Informat
phani
No ratings yet
Diane J. Cook R. Craig Varnell
Document28 pages
Diane J. Cook R. Craig Varnell
dsafdsgdfgsdfg
No ratings yet
Adaptive and Resource Aware Mining of FR
Document20 pages
Adaptive and Resource Aware Mining of FR
Romay Victor Pablo
No ratings yet
Experiments With Non Parametric Topic Models
Document10 pages
Experiments With Non Parametric Topic Models
Søren Larson
No ratings yet
More Robust Hashing: Cuckoo Hashing With A Stash: Adam Kirsch Michael Mitzenmacher Udi Wieder
Document25 pages
More Robust Hashing: Cuckoo Hashing With A Stash: Adam Kirsch Michael Mitzenmacher Udi Wieder
Mirza Abdulla
No ratings yet
(IJCST-V12I2P8) :sheel Shalini, Nayancy Kumari
Document10 pages
(IJCST-V12I2P8) :sheel Shalini, Nayancy Kumari
editor1ijcst
No ratings yet
Multi-Threaded Approach in Generating Frequent Itemset of Apriori Algorithm Based On Trie Data Structure
Document12 pages
Multi-Threaded Approach in Generating Frequent Itemset of Apriori Algorithm Based On Trie Data Structure
TELKOMNIKA
No ratings yet
A Survey On Data Mining Algorithms On Apache Hadoop Platform
Document3 pages
A Survey On Data Mining Algorithms On Apache Hadoop Platform
lakhwinder
No ratings yet
IoT Seminar Week 2
Document1 page
IoT Seminar Week 2
Jiahui HE
No ratings yet
Performance Study of Association Rule Mining Algorithms For Dyeing Processing System
Document10 pages
Performance Study of Association Rule Mining Algorithms For Dyeing Processing System
iiste
No ratings yet
Zcache Research Paper
Document12 pages
Zcache Research Paper
sybil11
No ratings yet
Fluids: Application of Machine Learning and Artificial Intelligence in Proxy Modeling For Fluid Flow in Porous Media
Document17 pages
Fluids: Application of Machine Learning and Artificial Intelligence in Proxy Modeling For Fluid Flow in Porous Media
ramatama
No ratings yet
Evolving Fuzzy Model
Document9 pages
Evolving Fuzzy Model
Kệ Thôi
No ratings yet
Literature Survey
Document5 pages
Literature Survey
eclat
No ratings yet
Modelo Revista Henri Poincar
Document11 pages
Modelo Revista Henri Poincar
Vikas Tomar
No ratings yet
Accepted Manuscript: Computers & Industrial Engineering
Document53 pages
Accepted Manuscript: Computers & Industrial Engineering
Risma Irwanie
No ratings yet
Belief Networks in Construction Simulation
Document8 pages
Belief Networks in Construction Simulation
aeroacademic
No ratings yet
Na BIC20122
Document8 pages
Na BIC20122
jefferyleclerc
No ratings yet
An Investigation of Automated Planograms Using A S
Document23 pages
An Investigation of Automated Planograms Using A S
irfan ramadhan
No ratings yet
The Adaptive Radix Tree: Artful Indexing For Main-Memory Databases
Document12 pages
The Adaptive Radix Tree: Artful Indexing For Main-Memory Databases
Gabriella Ella
No ratings yet
TLSAPSO
Document22 pages
TLSAPSO
Andy Syaputra
No ratings yet
A Tree-Based Incremental Overlapping Clustering Method Using The Three-Way Decision Theory
Document15 pages
A Tree-Based Incremental Overlapping Clustering Method Using The Three-Way Decision Theory
Anwar Shah
No ratings yet
Eclat
Document24 pages
Eclat
Made Toke
No ratings yet
Slicing A New Approach To Privacy Preserving Data Publishing
Document19 pages
Slicing A New Approach To Privacy Preserving Data Publishing
keerthana1234
No ratings yet
Design of Hashing Algorithms
Document17 pages
Design of Hashing Algorithms
Lucky Yoh
No ratings yet
A Survey of Correlated High Utility Pattern Mining
Document15 pages
A Survey of Correlated High Utility Pattern Mining
Baranishankar
No ratings yet
A Survey On Periodic Pattern Mining Techniques in Time Series Database
Document4 pages
A Survey On Periodic Pattern Mining Techniques in Time Series Database
Piczy
No ratings yet
Ijiec 2020 25
Document14 pages
Ijiec 2020 25
ajid kos
No ratings yet
Modeling Cache Performance Beyond LRU - Scribd Document by Zafar
Document1 page
Modeling Cache Performance Beyond LRU - Scribd Document by Zafar
Zafar Hussain
No ratings yet
An Improved Discrete Migrating Birds Optimization Algorithm For The No-Wait Flow Shop Scheduling Problem
Document13 pages
An Improved Discrete Migrating Birds Optimization Algorithm For The No-Wait Flow Shop Scheduling Problem
zrdasma01
No ratings yet
Synthetic Trace Driven Simulation
Document8 pages
Synthetic Trace Driven Simulation
reg2reg
No ratings yet
Ijet V4i3p8 PDF
Document12 pages
Ijet V4i3p8 PDF
International Journal of Engineering and Techniques
No ratings yet
Mannila 1997
Document15 pages
Mannila 1997
Enny Kinanthi
No ratings yet
Data Mining For Biological Data Analysis: Glover Eric Leo Cimi Smith Calvin
Document8 pages
Data Mining For Biological Data Analysis: Glover Eric Leo Cimi Smith Calvin
Eric Glover
No ratings yet
An Investigation into the Use of a Neural Tree Classifier for Knowledge Discovery in OLAP Databases
From Everand
An Investigation into the Use of a Neural Tree Classifier for Knowledge Discovery in OLAP Databases
David R Swinburne
No ratings yet
16.heart Disease Prediction
Document1 page
16.heart Disease Prediction
Venky Naidu Balineni
No ratings yet
17.how Data-Driven Entrepreneur Analyzes Imperfect Information For Business Opportunity Evaluation
Document7 pages
17.how Data-Driven Entrepreneur Analyzes Imperfect Information For Business Opportunity Evaluation
Venky Naidu Balineni
No ratings yet
Nerating Wikipedia by Summarizing Long Sequences
Document3 pages
Nerating Wikipedia by Summarizing Long Sequences
Venky Naidu Balineni
No ratings yet
10.Data-Driven Design of Fog Computing Aided
Document5 pages
10.Data-Driven Design of Fog Computing Aided
Venky Naidu Balineni
No ratings yet
11.deep Learning Applications in Medical Image Analysis-Brain Tumor
Document4 pages
11.deep Learning Applications in Medical Image Analysis-Brain Tumor
Venky Naidu Balineni
No ratings yet
9.customer Loan Prediction
Document1 page
9.customer Loan Prediction
Venky Naidu Balineni
No ratings yet
14.exploratory Visual Sequence Mining Based On Pattern Growth
Document1 page
14.exploratory Visual Sequence Mining Based On Pattern Growth
Venky Naidu Balineni
No ratings yet
104 Accident Detection System
Document17 pages
104 Accident Detection System
Venky Naidu Balineni
No ratings yet
92 92.analysis of Women Safety in Indian Cities Using Machine Learning On Tweets
Document4 pages
92 92.analysis of Women Safety in Indian Cities Using Machine Learning On Tweets
Venky Naidu Balineni
No ratings yet
Convolutional Neural
Document13 pages
Convolutional Neural
Venky Naidu Balineni
No ratings yet
92 Analysis of Women Safety in Indian Cities Using Machine Learning On Tweets
Document1 page
92 Analysis of Women Safety in Indian Cities Using Machine Learning On Tweets
Venky Naidu Balineni
No ratings yet