19.05.2018

06:49
d

Κατηγορίες

Ierax

TAGS

Συσχέτιση και αιτιότητα, το αγαπημένο ζευγάρι των big data

Οι άνθρωποι λατρεύουμε τα σχέδια και τα μοτίβα. Άλλωστε, η ικανότητά μας να μελετάμε το περιβάλλον γύρω μας και να προσαρμοζόμαστε σε αυτό, είναι ένας από τους λόγους που έχουμε κυριαρχήσει ως είδος στη Γη. Ως κυνηγοί παρατηρούσαμε πώς κινούνται τα θηράματά μας και ανάλογα στήναμε την επίθεσή μας. Μετά «κρατούσαμε σημειώσεις» για φυσικά φαινόμενα, […]
SHARE

Οι άνθρωποι λατρεύουμε τα σχέδια και τα μοτίβα. Άλλωστε, η ικανότητά μας να μελετάμε το περιβάλλον γύρω μας και να προσαρμοζόμαστε σε αυτό, είναι ένας από τους λόγους που έχουμε κυριαρχήσει ως είδος στη Γη. Ως κυνηγοί παρατηρούσαμε πώς κινούνται τα θηράματά μας και ανάλογα στήναμε την επίθεσή μας. Μετά «κρατούσαμε σημειώσεις» για φυσικά φαινόμενα, όπως η έκλειψη ηλίου, η παλίρροια και οι αλλαγές στις θέσεις των άστρων και ταξιδεύαμε ανάλογα. Μελετήσαμε πώς λειτουργεί το σώμα μας και οι ιοί, και έτσι βρήκαμε θεραπείες για εκατοντάδες αρρώστιες.

Όμως όσο η επιστήμη προχωρά με υπολογιστές που αναλύουν και αποθηκεύουν τεράστια πακέτα δεδομένων και όσο δημιουργούμε και μετράμε οι ίδιοι περισσότερες πληροφορίες, τόσο θα αρχίσουμε να βλέπουμε μοτίβα και συσχετίσεις εκεί που δεν υπάρχουν. Οι αναλυτές ψάχνουν και συνδυάζουν κάθε είδους πληροφορίες, ενώ οι υπολογιστές και η τεχνητή νοημοσύνη μαθαίνουν από τη συμπεριφορά μας και ανακαλύπτουν απίστευτα πράγματα. Το δικό μου ερώτημα είναι αν όλα αυτά αξίζουν για τις εταιρείες και τους διαφημιστές. Η απάντηση είναι κάπως πιο δύσκολη από ό,τι περίμενα.

Σίγουρα πολλά παραδείγματα, όπως της παραπάνω φωτογραφίας, όπου φαίνεται πως η αύξηση της μέσης θερμοκρασίας στον πλανήτη τα τελευταία 200 χρόνια, ακολουθείται από μείωση των πειρατών είναι μεν άσχημα για όλους εμάς που ψάχναμε την ευκαιρία για μια καριέρα σε ένα πειρατικό καράβι, αλλά δεν προσφέρει πραγματική αξία σε μια εταιρεία που ασχολείται π.χ. με την πώληση κατεψυγμένων λαχανικών, καθώς δεν εξηγείται ώστε να μπορεί να χρησιμοποιηθεί. Όμως, η συσχέτιση μεταξύ των πωλήσεων μπύρας και των προϊόντων τύπου Pampers σε μια αλυσίδα σούπερ μάρκετ της Αμερικής έχει αξία, γιατί οι διαφημιστές μπορούν να την εκμεταλλευτούν για να αυξήσουν τα έσοδά τους. Οι νέοι μπαμπάδες αγοράζουν πολύ συχνά πάνες από τοπικά καταστήματα και, παράλληλα, αγοράζουν μπύρες, ώστε να αντέξουν εκείνη την «γλυκιά» περίοδο, που ένα νέο μωρό στο σπίτι έχει την προσοχή της μητέρας του 24 ώρες το 24ωρο και κλαίει ασταμάτητα.

Είχα μια συζήτηση πριν λίγο καιρό με έναν μεγάλο και γνωστό χρηματιστή στην Αθήνα, που μου ανέλυε το πώς οι αλγόριθμοι της εταιρείας του συνδέουν τελείως διαφορετικούς παραμέτρους για να προβλέψουν το πώς θα κινηθεί μια μετοχή. Τον άκουγα με προσοχή και ενδιαφέρον, αλλά δυσκολεύουν να δω πώς γίνεται να χρησιμοποιηθεί αυτή η πληροφορία ποιοτικά και με μεγαλύτερο ρεαλισμό από μια εταιρεία που παράγει προϊόντα. Σίγουρα η αύξηση της τιμής ενός συμπληρωματικού για το προϊόν μας αγαθού π.χ. αύξηση τιμής ελαστικών, θα μειώσει τα κέρδη μις αυτοκινητοβιομηχανίας, αλλά τέτοια παραδείγματα είναι αυτό που λέμε κοινή γνώση και σίγουρα δεν απαιτούν έναν αναλυτή δεδομένων για να μας το πει. Αλλά η πρόβλεψη και χειραγώγηση της συμπεριφοράς των ψηφοφόρων σε μια εκλογική αναμέτρηση με βάση το προφίλ τους στα κοινωνικά δίκτυα, απαιτεί απίστευτες γνώσεις και μπορεί να το εκμεταλλευτούν όσοι έχουν αντίστοιχα συμφέροντα (το γνωστό μας πλέον σκάνδαλο της Cambridge Analytica και του Facebook).

Έτσι θεωρώ πως η απάντηση βρίσκεται κάπου στη μέση. Ναι, είμαστε τυχεροί που ζούμε σε μια εποχή που μπορούμε να μελετάμε τόσες συσχετίσεις με τόσο διαφορετικούς παράγοντες, για να βελτιώσουμε τις επιχειρήσεις μας. Όμως πρέπει να αναλογιστούμε ακριβώς ποιες πληροφορίες χρειαζόμαστε και να μελετήσουμε τα δεδομένα ποιοτικά, ώστε να μπορούμε να τα αναπαράγουμε για να βελτιώνουμε την επιχείρησή μας. Αλλιώς απλώς θα καταλήξουμε να παρουσιάζουμε μελέτες για το πώς η συμπεριφορά της γάτας μας επηρεάζει την ποιότητα των ελαστικών μας! Το σημείο κλειδί για κάθε επιχείρηση είναι να μπορεί να απομονώσει τη συσχέτιση 2 ή περισσοτέρων παραμέτρων και να την ελέγξει, ώστε να μπορεί να την διατηρεί/επαναλαμβάνει προς όφελός της.