Professional Documents
Culture Documents
Jeszenszky Peter
jeszenszky.peter@inf.unideb.hu
Debreceni Egyetem, Informatikai Kar
R integracio kereskedelmi es egyeb termekekben
Budapest Users of R Network Meetup
2014. oktober 13., Budapest
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 1 / 31
RapidMiner
Vezeto adatbanyaszati es analitikai megoldas, mely elerheto szabad es nylt
forras u szoftverkent is
A fejlesztoceg honlapja szerint 200 000-nel tobb aktv felhasznalo, az
ugyfelek kozott olyan vallalatokkal, mint peldaul a Lufthansa, a
PayPal es a Telenor Group (forras:
http://rapidminer.com/learning/faqs/)
KDnuggets 15th Annual Analytics, Data Mining, Data Science
Software Poll: RapidMiner Continues To Lead. June 7, 2014. url:
http://www.kdnuggets.com/2014/06/kdnuggets-annual-
software-poll-rapidminer-continues-lead.html
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 2 / 31
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 3 / 31
Jellemz ok
Platformf uggetlenseg (Java)
Intuitv grakus felhasznaloi fel ulet
Szamos adatforras tamogatasa (CSV, Excel, XML, relacios
adatbazisok, . . . )
Kiterjeszthetoseg: az alapfunkciokat bovto kiterjesztesek
rendelkezesre allasa (RapidMiner Marketplace)
Aktv felhasznaloi es fejlesztoi kozosseg: forum, konferenciak
(RapidMiner World, korabban: RCOMM)
Kivalo eszkoz adatbanyaszat oktatasahoz
Nem t ul hatekony memoriahasznalat
Bizonyos feladatokat csak nyakatekert modon lehet megoldani benne
Bosszanto hibak, melyek kijavtasa nem t ul gyorsan tortenik
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 4 / 31
Tipikus felhasznalas:
(1) Adatokat adunk at a RapidMiner-b ol az R-nek
(2) Egy R szkript elemzest vagy transzformaci okat vegez az adatokon
(3) Az eredmenyt visszaadjuk a RapidMiner-nek
Az R nagyszer u grakus lehetosegei nem ker ulnek kiaknazasra a fenti
forgatokonyv mellett
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 10 / 31
Pelda a felhasznalasra: adatgeneralas (1)
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 11 / 31
Pelda a felhasznalasra: adatgeneralas (2)
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 12 / 31
Pelda a felhasznalasra: adatgeneralas (3)
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 13 / 31
Pelda a felhasznalasra: adatgeneralas (4)
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 14 / 31
Pelda a felhasznalasra: adatgeneralas (5)
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 15 / 31
Pelda a felhasznalasra: adatfeldolgozas (1)
A k-adik legkozelebbi szomszedoktol mert tavolsag meghatarozasa (peldaul
az parameter ertekenek valasztasahoz a DBSCAN klaszterezesnel):
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 16 / 31
Pelda a felhasznalasra: adatfeldolgozas (2)
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 17 / 31
Pelda a felhasznalasra: adatfeldolgozas (3)
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 18 / 31
Pelda a felhasznalasra: adatfeldolgozas (4)
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 19 / 31
Abrakesztes: RapidMiner vs R
Az R egyik legnagyobb erosseget kivalo grakus kepessegei jelentik
Az R-rel kesztett abrak akar matematikai formulakat is
tartalmazhatnak
A RapidMiner grakus eszkoztaraval kesztett abrak szegenyesek az
R-ben elerheto minoseghez kepest
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 20 / 31
Pelda halad o szint u R grakara (1)
Histogram of x
x
D
e
n
s
i
t
y
0 5 10 15 20 25
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
Gamma distribution with parameters = 5 and = 0.5
g
,
(x) = x
1
e
x
()
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 21 / 31
Pelda halad o szint u R grakara (2)
x <- rgamma(500, 5, 0.5)
h <- hist(x, breaks = 15, freq = FALSE, col = "wheat")
rug(x)
curve(dgamma(x, 5, 0.5), col = "red", lwd = 2, add = TRUE)
title(sub = substitute(
paste("Gamma distribution with parameters ",
alpha == a, " and ", beta == b),
list(a = 5, b = 0.5)))
expr <- expression(
g[list(alpha, beta)](x) == x^{alpha - 1} *
frac(beta^alpha * e^{-beta * x}, Gamma(alpha))
)
arrows(0.75 * max(x), 0.05, max(x) / 2,
dgamma(max(x) / 2, 5, 0.5),
length = 0.15, col = "red", lwd = 2)
text(0.75 * max(x), 0.05, expr, pos = 3)
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 22 / 31
Jelenteskesztes a RapidMiner-ben
A Reporting Extension jelentesek kesztesehez biztost operatorokat
A jelentesek tablakat es abrakat tartalmazhatnak
A tamogatott kimeneti formatumok: HTML, PDF, RTF es Excel
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 23 / 31
Egy sajat fejlesztes
Az R szkriptek altal eloalltott grakus kimenetek nem illeszthetok be
a RapidMiner-rel kesztett jelentesekbe
Ezt a funkciot tobb alkalommal is kertek a felhasznalok a forumon,
melyre a fejlesztok a kovetkezot valaszoltak:
. . . unfortunately this is
currently not possible, but it is already on our todo list. . .
Sajat fejlesztes u megoldas a problemara:
AMOP-4.2.2.C-11/1/KONV-2012-0001
project. The project has been supported by the European Union,
co-nanced by the European Social Fund.
Jeszenszky Peter (Debreceni Egyetem) R es RapidMiner integracio Budapest R Meetup 2014 31 / 31