You are on page 1of 6

Optimaler gebruik van Marketing: Mining van Sociale Netwerken

Mass Marketing
De zoektocht naar een zo groot mogelijke return on investment is binnen de Marketing wereld
een constante. Hoe overtuig ik zoveel mogelijk mensen om mijn product te kopen met een zo laag
mogelijke input? Al sinds decennia beroept men zich op het gebruik van mass marketing, waarbij
wordt gepoogd een zo groot mogelijk aantal mensen te bereiken met een campagne. De
voorbeelden zijn legio, denken we maar aan de dagelijkse portie reclame op TV en radio of aan
de reclameborden langs wegen en pleinen. Hoe langer hoe meer blijkt dat men als het ware
resistent wordt aan deze vorm van marketing door de
overvloed en door gewenning, de response rate daalt terwijl de kosten dit niet doen. Alles kan
beter.....

Direct Marketing
Een recenter fenomeen is het gebruik van direct marketing, waarbij een selecte groep mogelijke
klanten wordt uitgekozen als targets van de campagne, met als doel een grotere response rate.
Data mining is een erg effectief hulpmiddel bij deze taak, er rijzen echter enkele problemen [1].
De data die voorhanden in de paper van Ling en Li [1] bevat alle mogelijke klanten met als
attribuut of ze al dan niet een aankoop hebben gedaan tijdens voorgaande campagnes.
Het eerste probleem is dat de de klasseverdeling kopers/niet-kopers erg onevenwichtig is, de
typische response rate ligt namelijk rond de 1%. De meeste klassieke algoritmes hebben in deze
omstandigheden de logische neiging om als enige regel aan te leren dat een klant niet zal kopen.
Klassieke voorspellende algoritmes hebben verder als mogelijke uitkomst voor een klant enkel 1
van de 2 mogelijke klassen, wat te beperkt is gezien onder andere mogelijke verschillende
strategieën voor verschillende types van mogelijke klanten. Verder kampen we ook met erg grote
datasets.
Ling en Li [1] lossen dit op door gebruik te maken van variaties op Naïve Bayes en C4.5
[Quinlan]. De algoritmes zijn zo aangepast (ada-boost) dat ze een probabiliteit geven waarmee
een mogelijke klant effectief een koper wordt. Als evaluatie criterium maken ze gebruik van een
gewogen som(lift index) van een lift tabel. Deze convergeert naar de ratio van het gebied onder
een cumulatieve liftcurve, welke nauw verwant is met ROC-curves. Deze methode geeft
uiteindelijk een optimale percent van mogelijke klanten die we moeten adresseren voor een zo
hoog mogelijke ROI.

Viral Marketing
De methode uit de vorige paragraaf kan erg winstgevend zijn, maar baseert zich op de klanten
onafhankelijk van elkaar. Uit onze eigen ervaring weten we echter dat mensen elkaar beinvloeden
in keuzes en gedrag. Zo hangt ook de keuze om een bepaald product of dienst te kopen vaak af
van de invloed en keuzes van vrienden, familie of zakenrelaties.[3 & 4] Marketing gebaseerd op
dit soort van mond-aan-mond reclame kan vaak efficienter zijn dan personen op zich te
beschouwen. Denken we maar aan het enorme succes van Hotmail, deze dienst groeide op 9
maand aan tot 12miljoen gebruikers door simpelweg onder elke mail een korte reclame
boodschap voor de dienst te plaatsen, zo waren het de gebruikers zelf die reclame maakten voor
het product door gebruik te maken van hun sociale e-mail netwerk. Dit soort van marketing,
waarbij wordt gebruik gemaakt van verspreiding in sociale netwerken wordt viral marketing
genoemd. In het kader hiervan zien we in de papers van Domingos[3&4] een variant op het
begrip customer value(verwachte winst door verkoop gedurende de hele relatie met de klant).
Wie zien het begrip Network Value opduiken. De netwerkwaarde van iemand wordt bepaald door
de invloed die zij heeft op zijn netwerk. We onderscheiden enkele belangrijke factoren die de
netwerkwaarde mede bepalen: hoe meer verbindingen met anderen iemand heeft, hoe beter. Ten
tweede is het belangrijk om de invloedrijke mensen te vinden, de voortrekkers, iemand met veel
verbindingen die alles beslist op basis van de keuze van anderen is niet interessant vanuit het
standpunt van de marketeer en de belangrijkste factor is hoe die invloed zich propageert doorheen
het hele netwerk van sociale verbindingen.
Uitzoeken welke klanten de grootste invloed hebben op het hele netwerk is dus erg interessant
qua marketing.

Paper Domingos & Richardson


In de paper van Domingos en Richardson[3] wordt een methode voorgesteld om de
netwerkwaarde te quantificeren:
Neem Xi de kans dat een klant i het product koopt indien hij wordt bestookt met een
marketingactie Mi voor product Y en met Xk de mensen van wie geweten is of ze al dan niet
kopen. Verder hebben we Ni onbekende netwerk buren:

P(Xi| Xk ,Y, M) = ∑ P(Xi| (Ni ,Y, M) P(Niu|Xk i ,Y, M)


Voor alle mogelijke configuraties Niu, zijnde de doorsnede van Ni en Xu.

Met behulp van de maximale entropy kunnen we P(Niu|Xk i ,Y, M) benaderen, zo krijgen we een
instantie van een zogenaamd Markov random veld waarbij de bovenstaande kans iteratief kan
worden bepaald. Diepere wiskundige details kunnen in de paper zelf worden gevonden, we
krijgen een formule die de intrinsieke waarde van een klant bepaalt, waarbij f1i (M0) is de functie
waarbij Mi op 1 wordt gezet en de rest van M niet wordt gewijzigd, r0 de inkomsten bij verkoop
aan de klant zonder marketing, r1 in het andere geval en c is de kost voor het marketen zelf.

Uiteindelijk verkrijgen we een formule voor de verwachte stijging in winst bij het marketten naar
een keuze van M klanten:

M0 is de vector met voor alle klanten als waarde 0, dus geen enkele klant wordt bestookt door de
marketing actie M. Doel is M zo te vinden dat ELP wordt gemaximaliseerd.

Algoritmes
In de paper worden 3 benaderende algoritmes gebruikt,.
 Single Pass: Zet voor elke klant i, Mi = 1 als ELP(Xk, Y, f1i (M0))>0 , anders Mi =
0.
 Greedy Search: Begin met M= M0, loop nu over alle Mi en zet Mi= 0 als ELP(Xk,
Y, f1i (M0))> ELP(Xk, Y, M). Blijf dit herhalen tot Mi ’s niet meer wijzigen.
 Hill Climbing Search: Begin met M= M0, Mi1 = 1 voor
Zet dan Mi2 = 1 voor

Herhaal dit totdat er geen i meer is waarvoor Mi= 1 ELP verhoogt.

Elk van deze 3 algoritmes is duurder dan de vorige maar haalt ook betere resultaten.
De totale waarde van een klant (intrinsiek + netwerk) is de ELP bereikt door hem te selecteren
voor marketing:

Algemeen kunnen we de netwerkwaarde van een klant bepalen als het verschil tussen zijn totale
en intrinsieke waarde, deze zal afhangen van welke andere klanten worden aangeschreven door
de marketingactie en welke andere klanten het product al gekocht hebben. We kunnen nu de
optimale persoonlijke kost ci voor klant i bepalen aan de hand van de totale waarde van de klant.

Data
Waar data vroeger te beperkt was om dit te kunnen uitvoeren, zien we tegenwoordig overal op het
net communities opduiken waarbij mensen aanduiden wie hun vrienden zijn en wat hun connectie
is, denken we maar aan Facebook, LinkedIn, MySpace etc... Domingos en Richardson maken
gebruik van data uit collaborative filtering systemen.
Meer bepaald de data uit EachMovie, waarbij gebruikers films kunnen raten.
Hierbij werd de data op voorhand wel bewerkt, enkele uitgevoerde acties omvatten verwijderen
van inactive gebruikers, die maar 1 keer hadden ingelogd om een film te raten, recentere films
waarvoor minder ratings zijn worden er ook uit gefilterd. Inactive gebruikers kunnen wel worden
aangeschreven in marketing omgevingen, maar niet om de probabiliteiten te leren. De resterende
data na het opkuisen werd onderverdeeld in een test en training set.

Bevindingen
In hun experiment gebruikten ze drie soorten marketing: Mass marketing, traditioneel direct
marketing en network-based marketing met de 3 algoritmes.
Ook werden verschillende scenarios getoetst: een scenario met gratis films (r1=0 en c=0,1), met
korting voor films (r1=0,5 en c=0,1) en een advertising scenario (r1=1 en c=0,02). Waarbij de
kans dat bij een marketing campagne gericht op klant i, de klant ook koopt afhangt van de
voorkeur alpha die klant voordien al heeft voor het product.
In alle scenarios kwam mass marketing er uit als verlieslatend. In het geval van traditionele direct
marketing is ook het scenario van de gratis film uiteraard steeds verlieslatend. Algemeen zien we
dat de Greedy en Hill-Climbing algoritmes dicht bij elkaar liggen qua opbrengst waar Hill-
Climbing wel veel langer nodig heeft om zijn resultaat te bekomen.
Paper Kempe, Kleinberg & Tardos [2]
Hier wordt een andere methode gebruikt, niet gebaseerd op probabiliteiten maar op discrete
optimalisatie. Het optimale model vinden is een probleem dat tot NP behoort.
Verder gebruiken men ook operationele modellen in plaats van de eerder beschrijvende modellen
uit de vorige paper. Een sociaal netwerk wordt voorgesteld door een directe graaf, met actieve en
inactieve knopen, waarbij elke knoop’s neiging om actief te worden beinvloed wordt door het
aantal actieve buren.
Het eerste model is een lineair grens model. Elke knoop v wordt beinvloed door zijn buren w met
een gewicht bv,w ,waarbij de som van alle gewichten van de buren van v kleiner dan of gelijk is
aan 1. Elke knoop kiest een grens Ov random uit interval [1;0].
Met een initieel aantal actieve knopen A0 ,loopt het proces in discrete stappen: in stap t zijn alle
knopen actief die dat reeds in stap t-1 waren, verder activeren we alle knopen v voor wie het
totale gewicht van zijn actieve buren boven zijn grens Ov gaat.

Een tweede model is een onafhankelijk cascading model. We beginnen weer met een initieel
actieve set knopen A0 en we werken weer in stappen. Wanneer knoop v actief wordt in stap t
krijgt deze een eenmalige kans om zijn inactieve buurknoop w te activeren onafhankelijk van
andere mogelijke actieve buren van w. Als v succesvol is, wordt w actief in stap t+1. Beide
algoritmes lopen tot er geen nieuwe activaties meer mogelijk zijn.
Voor de initiële set A van actieve knopen kunnen we nu zijn invloed σ(A) bepalen als het
uiteindelijke aantal actieve knopen. Het doel is nu de k knopen te vinden met maximale invloed.
Deze oplossing kan benaderd worden tot 63% van het optimale door een simpel greedy hill-
climbing strategy[3], wat wiskundig wordt bewezen voor beide modellen in de paper.

Voor de experimenten wordt een dataset gebruikt, gebaseerd op een database van auteurs van
papers uit de fysica, met een graaf die co-auteurschap van papers weergeeft. Auteurs zonder
cogeauteerde papers werden er uit gelaten en problemen met aliassen werden opgelost bij pre-
processing.

Er werden 3 invloed-modellen gebruikt: een lineair grens model, gewogen cascade model en
onafhankelijk cascade model. De gebruikte algoritmes zijn enerzijds een greedy algoritme en 2
algoritmes gebaseerd op heuristieken. Het eerste kijkt naar de afstand van knopen ten op zichte
van andere knopen in het netwerk, het andere naar hoe vaak 2 knopen met elkaar verbonden zijn,
dus hoeveel papers 2 auteurs samen hebben geschreven. Als baseline worden random knopen
gekozen als A.
In de resultaten zien we dat het greedy algoritme, de heuristiek-gebaseerde algoritmes telkens
verslaat. Dit omdat het greedy algoritme rekening gaat houden met de dynamiek tussen knopen
en niet enkel kijkt naar eigenschappen van de structuur.

Besluit
We zien dus dat Viral Marketing gebaseerd op netwerkwaarde van een klant betere marketing-
resultaten geeft dan de andere marketing-vormen en dat simpele data-mining algoritmes ons
kunnen helpen om te bepalen welke mensen we moeten bestoken met een marketing campagne
om een zo hoog mogelijke ROI te krijgen binnen een sociaal network.
Bibliografie gebruikte papers

Opgenomen
[1] Charles X. Ling & Chenghui Li - Data Mining for Direct Marketing: Problems and Solutions

[2] Kempe, Kleinberg & Tardos – Maximizing the spread of Influence through a Social Network

[3] Pedro Domingos & Matt Richardson – Mining the Network Value of Customers

[4] Pedro Domingos – Mining Social Networks for Viral Marketing

Gelezen

[5] Hill, Provost & Volinsky - Learning and inference in Massive Social Networks

[6] Hill, Provost & Volinsky – Network-Based Marketing: Indetifying Likely Adopters via
Consumer Networks
[7] Pedro Domingos & Matt Richardson – Mining Knowledge-sharing Site for Viral Marketing

[8] Hartline, Mirrokni & Sundarajan Optimal Marketing Strategies over Social Networks

[9] Chew, Balfanz & Laurie Undermining Privacy in Social Networks

[10] John Kleinberg - Challenges in Social Network Data: Processes, Privacy and Paradoxes
Zie ook : http://videolectures.net/kdd07_kleinberg_cisnd/

You might also like