Απομυθοποιώντας τη βαθιά εκμάθηση: πως η Sophos δημιουργεί μοντέλα μηχανικής εκμάθησης

24 Αυγούστου, 2017

Στην βιομηχανία της κυβερνοασφαλείας, ο όρος “μηχανική εκμάθηση” χρησιμοποιείτε πολύ συχνά και για τόσους πολλούς διαφορετικούς όρους που είναι δύσκολο πια να κατανοήσει κάποιος τι σημαίνει πραγματικά. Αν το επάγγελμα σας ήταν “data scientist” και λέγατε όπως η Madeline Schiappa σε άλλους ότι δημιουργείτε μοντέλα μηχανικής εκμάθησης, το πιθανότερο είναι να εισπράττατε κενά βλέμματα.

Η Sophos έχει εστιάσει ειδικά στη βαθιά εκμάθηση, που είναι μία προηγμένη μορφή της μηχανικής εκμάθησης. Σε μία προσπάθεια να αποκρυπτογραφήσει τη μηχανική εκμάθηση, η Sophos δημιούργησε ένα τεχνικό άρθρο για να εισαγάγει τις έννοιες που καθιστούν τη συγκεκριμένη τεχνολογία τόσο ισχυρή, την επιστήμη που βρίσκεται πίσω από τη δημιουργία μοντέλων μηχανικής εκμάθησης και τους λόγους που όλα τα μοντέλα δεν δημιουργούνται ίσα και όμοια. Επιπλέον, ένα τέτοιο τεχνικό άρθρο ενδεχομένως και να βοηθήσει τη συγγραφέα του, να αντιμετωπίσει μελλοντικά τα… κενά βλέμματα όταν περιγράφει τη δουλειά της.

Το άρθρο καλύπτει μία σειρά από θέματα που θα χρησιμεύσουν ως “αλφαβητάρι” για τη βαθιά εκμάθηση. Επίσης, στο άρθρο η συγγραφέας εξετάζει τη διαδικασία που ακολουθεί για την ανάπτυξη ενός μοντέλου βαθιάς εκμάθησης, συμπεριλαμβανομένης της συλλογής μεγάλων ποσοτήτων δεδομένων, της σχεδίασης των χαρακτηριστικών, της οικοδόμησης της αρχιτεκτονικής, της κατάρτισης του μοντέλου, της δοκιμής του μοντέλου και της αξιολόγησής του.

Πριν ωστόσο ξεκινήσετε το διάβασμα, το πρώτο πράγμα που θα πρέπει να κατανοήσετε είναι η ίδια η έννοια της βαθιάς εκμάθησης. Αυτό το είδος μηχανικής εκμάθησης είναι ότι πιο κοντινό στον ανθρώπινο εγκέφαλο επειδή περιλαμβάνει πολλά επίπεδα νευρώνων. Από εδώ ακριβώς προέρχεται ο όρος “τεχνητό νευρωνικό δίκτυο”. Το “τεχνητό”, σε αυτή τη περίπτωση, σημαίνει ότι πρόκειται για μίμηση του νευρωνικού δικτύου του εγκεφάλου.

Τόσο το νευρωνικό δίκτυο του εγκεφάλου όσο και ένα τεχνητό δίκτυο δέχονται -δεδομένα- στην είσοδο, διαχειρίζονται την είσοδο με κάποιο τρόπο και εξάγουν πληροφορίες σε άλλους νευρώνες. Η κύρια διαφορά είναι ότι ο ανθρώπινος εγκέφαλος περιέχει περίπου εκατό δισεκατομμύρια νευρώνες ενώ ένα τεχνητό νευρωνικό δίκτυο δεν περιέχει ούτε καν ένα κλάσμα από αυτόν τον αριθμό. Όπως όλοι οι τύποι μηχανικής εκμάθησης, στη βαθιά εκμάθηση χρησιμοποιεί μαθηματικά μοντέλα για να μάθει χωρίς να έχει προγραμματιστεί συγκεκριμένα ή ρητά στις ιδιαιτερότητες ενός συγκεκριμένου προβλήματος. Χρησιμοποιώντας μεγάλο αριθμό δεδομένων, παράγεται ένα γενικό μοντέλο που είναι σε θέση να περιγράψει με ακρίβεια τα δεδομένα. Στην περίπτωση της Sophos, τα συγκεκριμένα δεδομένα θα μπορούσαν να είναι κακόβουλα προγράμματα, κακόβουλες διευθύνσεις URL ή άλλα προβλήματα ασφαλείας που προσπαθεί να επιλύσει η εταιρεία.

Εφόσον μιλάμε για γενικά μοντέλα που προσπαθούν να ερμηνεύσουν συγκεκριμένα φαινόμενα, δεν είναι δυνατόν να γνωρίζουμε αν το μοντέλο μηχανικής μάθησης έχει μάθει σωστά να προβλέπει. Αυτός είναι ο λόγος που κάθε μοντέλο που αναπτύσσεται συνδυάζεται πάντα με ένα αυστηρό σύνολο αξιολογήσεων.

Για να συνεχίσετε μαθαίνετε για τη βαθιά εκμάθηση, πατήστε εδώ για να κατεβάσετε το πλήρες τεχνικό άρθρο. Σύντομα, η Sophos θα μοιραστεί και άλλες, περισσότερες πληροφορίες από την ομάδα δεδομένων της.

Μπορείτε να διαβάσετε το πλήρες άρθρο, εδώ.