Bij het maken van een analyse denken veel mensen gelijk aan de term statistiek. Want een analyse bestaat altijd uit statistieken toch? Nee!
Definities
Als data-professional is het noodzakelijk dat je het verschil tussen analyses en statistieken begrijpt. De onderstaande definities maken het verschil duidelijk.
Analyses – helpen je om stellingen (hypotheses) en vragen over een onderwerp te vormen.
Statistieken – helpen je om hypotheses te testen en het antwoord op de vragen te verbeteren.
Voorbeeld
Deze theorie klinkt misschien leuk, maar hoe werkt het in de praktijk? Een voorbeeld maakt het makkelijker.
Stel dat je als data-analist bij een supermarkt werkt. Er wordt je gevraagd om eens in de verkoopcijfers van de cola te duiken. Je hebt zowel de online verkoopresultaten als de winkelorders.
Na wat visualisaties, draaitabellen en data-manipulatie kom je tot de conclusie dat de winkelindeling bepaalt hoe veel cola er verkocht wordt. In de data zie je namelijk dat als cola aan het begin van het gangpad ligt, er gemiddeld een hoger aantal cola-producten verkocht wordt. Ook in de zomer ligt het gemiddelde aantal verkopen hoger.
Je hebt nu het onderwerp geanalyseerd. Je hebt een inhoudelijk stelling over cola-verkopen kunnen opstellen. Ook kun je met nieuwe vragen verder analyseren. Toch heb je nog geen statistieken gebruikt.
Want hoe weet je nu of de stelling klopt? Is de plek in het gangpad echt de reden dat cola meer verkocht wordt of is de stelling niet betrouwbaar?
Om dit te weten te komen ga je de data onderzoeken. Of beter gezegd toetsen.
Wat is de steekproef?
In hoeveel winkels staat cola vooraan het gangpad?
Is deze groep groot genoeg om er iets over te zeggen?
En hoe zit het met de gemiddeldes? In welke mate variëren de resultaten van de winkels onderling? Is het verschil in de gemiddeldes van de twee groepen significant genoeg?
Zijn er nog andere invloeden op de data die gecorrigeerd moeten worden? Zoals kortingen of seizoensinvloeden?
Dit soort vragen gaan niet over de cola-verkopen, maar over de data zelf.
Conclusie: Statistieken toetsen je data, zodat je weet of de data de vragen kan beantwoorden.
Succes met je volgende analyse én nieuwe statistieken!
Leave a Reply