You are on page 1of 8

HET STIMULEREN VAN ONLINE REVIEWS: INVLOED OP KWALITEIT OF NIET?

Dr.ir. Peeter W.J. Verlegh Universitair Hoofddocent Marketingcommunicatie ASCoR / Departement Communicatiewetenschap, Universiteit van Amsterdam pverlegh@uva.nl Laura de Vries, MSc PR consultant Pride PR Lotte Willemsen, MSc Universitair Docent Marketingcommunicatie ASCoR / Departement Communicatiewetenschap, Universiteit van Amsterdam Linda Schulte CEO en oprichter van Preferenso.nl, review website voor onafhankelijke service ervaringen linda@preferenso.nl

Inleiding Online reviews (ook wel eWOM genoemd) zijn een belangrijke bron van informatie voor consumenten. Verschillende studies laten zien dat consumenten meer vertrouwen hebben in reviews dan in reclame en andere marketingvormen, en reviews worden door consumenten steevast genoemd als een van de belangrijkste invloeden op hun aankoopbeslissingen (Forrester, 2010; Nielsen, 2011). De impact van reviews op consumenten is ook veelvuldig beschreven in de wetenschappelijke literatuur. Zo lieten Chevalier en Mayzlin in 2006 bijvoorbeeld al zien dat boekreviews op Amazon en

Barnes & Nobles een significante invloed hebben op sales. Ze vonden ook dat (1) reviews met name positief zijn (veel 5-sterren), maar dat (2) negatieve reviews (vooral die met 1 ster) een grotere invloed hebben op verkopen. Later onderzoek liet zien dat deze negatieve reviews ook een positieve invloed kunnen hebben op sales, met name als het gaat om minder bekende auteurs (Berger, Sorensen, Rasmussen, 2010), of om nieuwe films (Liu, 2006). In deze gevallen lijken reviews met name te zorgen voor bekendheid, wat een positief effect heeft op verkopen. Het aloude motto “het maakt niet uit hoe ze over je praten, als ze maar over je praten” lijkt dus met name op te gaan voor onbekende of nieuwe producten, hoewel meer onderzoek nodig zou zijn om te bekijken in hoeverre deze bevindingen ook opgaan voor andere producten dan boeken en films. Met name in de communicatiewetenschap, maar ook in informatiewetenschappen, is veel onderzoek naar de waarde die consumenten hechten aan reviews (e.g., Hoe nuttig vond u deze review?). De algemene conclusie van dit onderzoek is dat consumenten verschillen in de manier waarop ze reviews beoordelen, en dat deze beoordelingen verklaard kunnen worden door verschillen in de inhoud van reviews. Zo lieten Willemsen en collega’s (2011) zien dat consumenten niet uitsluitend letten op sterwaarderingen, maar ook letten op inhoudskenmerken die een hogere kwaliteit van de review suggereren. Consumenten hechten bijvoorbeeld meer waarde aan reviews als deze meer argumenten bevatten, en bij deze argumenten zowel de positieve als de negatieve kenmerken van de betreffende producten aan bod komen. Een ander onderzoek (Otterbacher, 2011) toonde aan dat waardevolle reviews (vs. minder waardevolle reviews) meer gebruik maken van retorische technieken en stijlkenmerken die de leesbaarheid van de tekst vergroten

(blanke regels tussen blokken tekst), en minder grammaticale fouten en meervoudige leestekens (bijv., gebruik van !!!) bevatten. De bewezen invloed van reviews op aankoopgedrag, maar ook de toegenomen waardering voor interactie met consumenten (zie bijvoorbeeld de boeken van Steven van Belleghem (2012, 2013) en Jan van den Bergh (2012)) hebben ertoe geleid dat marketeers van producten en diensten, maar ook retailers (zoals Bol.com of Amazon) veel waarde hechten aan consumentenreviews. In toenemende mate zien we daarnaast vergelijkingssites (zoals Kieskeurig) en onafhankelijke review sites (zoals Iens en Preferenso.nl), die consumenten een platform bieden waarop zij hun mening kunnen uiten. Voor al deze partijen is het van cruciaal belang dat consumenten hun meningen willen delen met andere consumenten. Uiteraard staat hierbij de intrinsieke motivatie van de consument centraal; consumenten schrijven vooral reviews omdat ze het prettig vinden om hun mening te delen om zo bijvoorbeeld anderen te helpen, hun status te (be)vestigen, en hun emoties te uiten (zie bijvoorbeeld Hennig-Thurau et al., 2004, en het proefschrift van SWOCC-promovendus Daan Muntinga, 2013). Om ervoor te zorgen dat reviews op hun platform terecht komen, maken reviewsites vaak gebruik van incentives, bijvoorbeeld in de vorm van waardepunten of prijzen. Incentives zouden de hoeveelheid reviews kunnen vergroten (Zie ook onderzoek van Ryu & Feick, 2007). Maar beïnvloeden ze ook de kwaliteit van de reviews? En zo ja, hoe dan? Worden reviews bijvoorbeeld positiever of negatiever? Of worden ze misschien extremer? Doen reviewers nog wel hun best als ze gedreven worden door incentives? Dergelijke vragen zijn tot op heden niet onderzocht. Preferenso stelde data beschikbaar aan de UvA (Peeter Verlegh en afstudeerstudente Laura de Vries), zodat ze wetenschappelijk onderzoek zouden kunnen

doen naar deze vragen. Preferenso is geïnteresseerd in dit onderzoek omdat zij de kwaliteit van haar content wil borgen.

2. Onderzoek Voor deze whitepaper onderzochten we reviews die door consumenten geplaatst zijn op de website van Preferenso.nl. Deze reviews hebben betrekking op de ervaringen van consumenten bij diensten en aankopen in Nederland. Om het aantal reviews op deze website te vergroten wordt met enige regelmaat gebruik gemaakt van acties waarbij incentives gebruikt worden om consumenten aan te zetten tot het plaatsen van een review. In ons onderzoek werd gekeken of reviews die in een actieperiode geplaatst werden verschillen van reguliere reviews, die zonder specifieke actie geplaatst werden. We vergeleken de reguliere reviews met twee reviews uit twee specifieke actieperiodes. In actieperiode 1 werden beperkte middelen ingezet om review te stimuleren: consumenten die 5 reviews plaatsten werden beloond met een bol.com voucher van 5 euro. Deze actie werd onder de aandacht gebracht op de website van Preferenso.nl en via een e-mail actie. In actieperiode 2 maakten consumenten die een review plaatsten kans op 1 van totaal 3 I-pads. Deze actie werd onder de aandacht gebracht via sociale media en via een banner op nu.nl. In totaal werden er 699 random geselecteerde reviews geanalyseerd, die geplaatst werden tussen 9 mei 2011 en 23 januari 2012. Deze reviews hadden betrekking op een groot aantal verschillende diensten, zoals energiebedrijven, telecombedrijven, verzekeraars, banken, maar ook reisbureaus, vliegmaatschappijen, horecagelegenheden, kappers, garages, en vele andere vormen van dienstverlening. Van deze reviews vielen er

201 in de controlegroep, 373 in actieperiode 1 en 125 in actieperiode 2. Voor elk van deze reviews beschikten we over het rapportcijfer voor service en kwaliteit, maar ook over de tekst van de review. Deze tekst werd door twee gertrainde codeurs gescoord op een groot aantal dimensies, die gebaseerd waren op eerder onderzoek naar reviewkwaliteit (o.a. Willemsen et al., 2011). Deze dimensies omvatten de lengte, aantal en diversiteit van de gebruikte argumenten, de valentie van argumenten (aantal positieve en negative argumenten), tekstuele elementen (o.a. aantal spelfouten, meervoudige punctuatie en extra blanke regels), en het gebruik van klassieke retorische stijlelementen (logos, ethos en pathos). Een volledige lijst, alsmede de gebruikte schalen en omschrijvingen is op verzoek verkrijgbaar bij de eerste auteur. Belangrijk om te vermelden is dat (1) de beide codeurs “blind” waren in de zin dat zij niet wisten in welke groep de review viel, en dat (2) de overeenkomst van de oordelen van de reviewers getoetst is op een set van 100 reviews. Deze analyse liet zien dat de overeenkomst in hun oordeel voldoende hoog was om verder te gaan met de analyse (de gemiddelde Cohen’s Kappa was 0.80, voor de geïnteresseerden).

3. Resultaten De drie groepen werden door middel van variantieanalyse en aanvullende post-hoc analyses (bonferroni-corrected) met elkaar vergeleken op alle relevante dimensies. Een volledig overzicht is te verkrijgen bij de eerste auteur. De belangrijkste resultaten waren als volgt: 1. Reviews uit periodes met incentives zijn niet positiever of negatiever dan reviews uit de controleperiode:

a. Het gemiddelde cijfer voor service en kwaliteit was gelijk aan 6,7. De verschillen tussen groepen waren erg klein (maximaal verschil = 0,1) en statistisch niet significant. b. Het aantal positieve argumenten was gemiddeld gelijk aan 3,3, het aantal negatieve aan 2,0. Ook hier waren er geen significante verschillen tussen groepen (p > .51).

2.

Reviews uit de periode met sterke stimulans (kans op iPad) zijn significant extremer dan reviews uit de controleperiode en de periode met lichte incentives (bol.com).

Voor het berekenen van de extremiteit van een review werd de afstand tot de mediaan van de reviews genomen. Bij een mediaan van 6.5 betekent dit dat een review die een 4 scoort een extremiteitsscore van 3.5 krijgt. Datzelfde geldt voor een review met een 9. Voor de reviews uit actiegroep 2 was de gemiddelde extremiteitsscore gelijk aan 2.31, en dit was significant (p < 0.01) hoger dan het gemiddelde in de controlegroep (1,69) en in actiegroep 1 (1,59). Deze laatste twee groepen verschilden significant (p > 0.99).

3.

Reviews uit de periode met sterke stimulans (kans op iPad) vertonen meer gebruik van stijlkenmerken die erop gericht zijn om anderen te beïnvloeden: a. In de groep die sterke stimulans ontvangen had (kans op iPad) was het gebruik van meervoudige interpunctie (bijvoorbeeld !! of ???) en spaties significant hoger; Het gebruik van meervoudige interpunctie kwam in deze groep gemiddeld 0.23 maal voor (versus 0.08 en 0.11 in de andere groepen). Dit verschil is klein maar

significant (p < .001). Datzelfde gold voor het gebruik van extra spaties tussen woorden (2.98 versus 2.00 en 1.84; p < .03). Ook het totaal aantal woorden dat respondenten gebruikte was hoger in de groep met sterke stimulans (76 versus 59 en 63; p < .01). b. Ook de analyse van klassieke retorische technieken toonde verschillen tussen de groepen. In de groep die sterke stimulans ontvangen had (kans op iPad) werd significant minder gebruik gemakt van logos (beroep doen op ratio, gebruik van rationele argumenten) (0,86 versus 0,96 en 0,97; p < .001), en meer van ethos (vermelden van de ervaring of kwalificaties van de reviewer zelf, bv. “ik kom bij dit soort bedrijven); (0,29 versus 0,20 en 0,18; p < .05). Het gebruik van emotionele argumenten (“pathos”) was het grootst in de controlegroep (0,50 versus 0,40 in groep 1 en 0,44 in groep 2; p < .01).

4. Conclusie De resultaten van dit onderzoek suggereren dat het stimuleren van consumenten om reviews te plaatsen geen invloed heeft op de negativiteit of positiviteit van het oordeel: de reviewers geven niet systematisch hogere of lagere cijfers, en zijn ook niet positiever of negatiever in de argumenten die zij geven. Overigens zijn de reviews gematigd positief te noemen, met een gemiddeld cijfer van 6.7 en ruim anderhalf keer zoveel positieve argumenten dan negatieve argumenten (gemiddeld 3,3 versus 2,0). Wel lijken de reviews waarbij gebruik gemaakt werd van een sterke stimulans wat meer uitgesproken te zijn in hun scores, dat wil zeggen: ze geven cijfers die meer afwijken van het gemiddelde. Maar omdat dit zowel naar boven toe als naar beneden toe gebeurt, heeft dit geen invloed op

het gemiddelde. Ook worden er in deze groep iets vaker stijlmiddelen gebruikt die suggereren dat de reviewer de aandacht wil trekken van de lezer (meervoudige punctuatie!!!, extra spaties en minder gebruik van logos (rationele argumenten), maar meer van ethos (vermelden van de eigen kwalificaties van de reviewer). Opvallend genoeg werden er in de controlegroep wel meer emotionele argumenten gebruikt dan in de andere twee groepen. Vervolgonderzoek is nodig om te bekijken of de resultaten geldig zijn voor meerdere actie instrumenten (met name de effecten op extremiteit en stijl zullen verder onderzocht moeten worden). Daarnaast is het belangrijk om te onderzoeken in hoeverre de resultaten specifiek zijn voor de Preferenso.nl reviewsite. Het lijkt aannemelijk dat met name merkeigen reviewsites (dus reviews die geplaatst worden op de site van een hotel of restaurant zelf) anders beïnvloed worden door het gebruik van incentives dan reviews geplaatst op onafhankelijke reviewsites. De conclusie van dit onderzoek is dat het gebruik van incentives om reviews te stimuleren weinig tot geen invloed lijkt te hebben op de teneur (negatief versus positief) of de kwaliteit van de reviews die geplaatst worden op een neutrale reviewsite als die van preferenso.nl.

Een volledige lijst van de gebruikte literatuur is verkrijgbaar bij de eerste auteur.