Όχι, το άρθρο δεν είναι για κάποια επίσκεψη που κάναμε στην Google, αλλά για το πρόσφατο project που ολοκλήρωσε η Ierax για μεγάλη εταιρεία SaaS στον χώρο της διασκέδασης. Και τι σχέση έχει λοιπόν η Google; Όπως πολλοί γνωρίζουμε, η Google δεν είναι απλά μία μηχανή αναζήτησης, αλλά μία εταιρεία που επενδύει πολλά δισεκατομμύρια στην έρευνα και την ανάπτυξη. Πριν μερικά χρόνια δημοσίευσε ένα μοντέλο για το “αιτιώδες συμπέρασμα”. Τη μελέτη για το πως και πόσο ένα συγκεκριμένο συμβάν επηρεάζει τη μεταβολή μιας ακολουθίας. Είτε αυτή είναι πωλήσεις, είτε επισκέπτες σε μια ιστοσελίδα ή ένα ηλεκτρονικό/φυσικό κατάστημα.
Τι χρειαζόμαστε όμως για το μοντέλο αυτό; Σίγουρα ένα καλό και με προσοχή σχεδιασμένο πείραμα, όπως και πολλά γκρουπ ανθρώπων από τα οποία, μόνο στο ένα έχει εφαρμοστεί το τεστ. Κάτι σαν A/B τεστ δηλαδή, αλλά με περισσότερα γκρουπ. Έπειτα, με τη βοήθεια της [nerd_mode]Μπαεσιανής ανάλυσης χρονοσειρών[/nerd_mode], μπορούμε όχι μόνο να πούμε με σιγουριά αν το πείραμα είχε κάποια επιρροή στο δοκιμαστικό μας γκρουπ, αλλά να ποσοτικοποιήσουμε και την επιρροή αυτή κάτι που το A/B τεστ δεν μπορεί να κάνει. Να έχουμε δηλαδή μια εικόνα για το πόσο παραπάνω ή παρακάτω θα ήταν οι πωλήσεις ή οι επισκέπτες μας αν δεν είχε γίνει το πείραμα.
Ποιο ήταν το ερώτημα για το project της εταιρείας; Έχει επηρεάσει ο covid19 τις επισκέψεις στην ιστοσελίδας μας και αν ναι σε ποιες περιοχές αξίζει να επενδύσουμε παραπάνω στη διαφήμιση για να προσελκύσουμε νέους πελάτες;
Τρέξαμε το ίδιο πείραμα σε δικά μας δεδομένα για να σας παρουσιάσουμε αν και πόσο έχει επηρεάσει ο covid19 την τάση στις αναζητήσεις σχετικές με το Netflix. Ας δούμε το μοντέλο βήμα βήμα.
Οι ομάδες
- Έλεγχος υπόθεσης στις χώρες Ιταλία, Ελλάδα, Ιράν
- Χώρες που επηρεάστηκαν αργότερα από τις παραπάνω τρεις, οι Αργεντινή, Βουλγαρία, Δανία, Γαλλία, Ολλανδία, Ελβετία, Βενεζουέλα, Σερβία, Σλοβακία, Σλοβενία, Φινλανδία, Σουηδία, Νότια Αφρική
Τα δεδομένα μας
- Ο αριθμός αναζητήσεων στη Google με βάση τα αποτελέσματα του Google Trends ανά χώρα για τους τελευταίους 12 μήνες
- Οι ημερομηνίες που εφαρμόστηκαν ακραία μέτρα για τη μετακίνηση πολιτών στις χώρες που εξετάζουμε
Αφού τρέξουμε το μοντέλο για κάθε χώρα ξεχωριστά, τα αποτελέσματα φαίνονται στα παρακάτω 3 διαγράμματα. Τι ακριβώς βλέπουμε όμως; Σε κάθε περίπτωση, η μαύρη γραμμή είναι τα πραγματικά δεδομένα που έχουμε, ενώ η μπλε διακεκομμένη γραμμή είναι η πρόβλεψη που κάνει το μοντέλο μας στην περίπτωση απουσίας του συμβάντος. Η κάθετη διακεκομμένη γραμμή, είναι το σημείο όπου εφαρμόστηκε το πείραμα-συμβάν. Στην περίπτωση μας, τα μέτρα κατά του covid19 που πήρε η κάθε χώρα.
Το ποσοστό αναζήτησης με βάση το Google Trends για την Ελλάδα είναι 43.5% και η πρόβλεψη του μοντέλου χωρίς το συμβάν, στο 37%. Με 95% πιθανότητα, η βελτίωση που είδαμε στις αναζητήσεις είναι της τάξεως των 6.5 ποσοστιαίων μονάδων. Αντίστοιχα στην Ιταλία προβλέψαμε αύξηση κατά 26 ποσοστιαίες μονάδες και στο Ιράν αύξηση κατά 14.5 ποσοστιαίες μονάδες.
Σε κάθε περίπτωση επαληθεύουμε την επιρροή που είχε ο covid19 στις χώρες Ελλάδα, Ιταλία και Ιραν σχετικά με τις αναζητήσεις στο Google για την υπηρεσία Netflix, αλλά επίσης ποσοτικοποιούμε και την επιρροή αυτή.
Πως θα μπορούσε όμως μία εταιρεία στην Ελλάδα να εφαρμόσει παρόμοιο πείραμα χωρίς να περιμένει έναν ακόμη κορονοϊό; Ας δούμε δύο παραδείγματα.
- Αλυσίδα franchise στην εστίαση με take-away. Θέλουμε να ελέγξουμε κατά πόσο μία προσφορά μπορεί να επηρεάσει τις πωλήσεις και κατά πόσο θα τις επηρεάσει, βγάζοντας τον παράγοντα να έχει επηρεαστεί από κάτι τρίτο. Τρέχουμε την προσφορά σε επιλεγμένα καταστήματα και κρατάμε τα υπόλοιπα χωρίς την προσφορά. Έτσι, θα μπορούμε να εξετάσουμε την υπόθεση που θέλουμε.
- Εταιρεία λιανικού εμπορίου με ηλεκτρονικό κατάστημα. Θέλουμε να ελέγξουμε αν η αλλαγή ενός από τα banners ή μια προσθήκη ενός βίντεο στη σελίδα του προϊόντος θα αυξήσει τις πωλήσεις. Αντίστοιχα, μια άλλη αλλαγή θα μπορούσε να είναι αν θα μειώσει το ποσοστό των επισκεπτών που κλείνουν άμεσα τη σελίδα βλέποντας το banner στην αρχική σελίδα. Με το ίδιο σκεπτικό, η αλλαγή πραγματοποιείται σε ένα μέρος των επισκεπτών και χρησιμοποιούμε το υπόλοιπο για να ποσοτικοποιήσουμε την επιρροή που θα έχει μια τέτοια αλλαγή και αν αυτή αξίζει πραγματικά να γίνει.