Τι είναι το έργο DeepInvest

  Ένα από τα βασικότερα προβλήματα στο τομέα των χρηματοοικονομικών επενδύσεων είναι η ικανότητα πρόβλεψης των μεταβολών των τιμών περιουσιακών στοιχείων, με έμφαση στις κινητές αξίες (asset/securities prediction) και στη συνέχεια η δημιουργία “βέλτιστου” χαρτοφυλακίου. 
 
Το έργο DeepInvest αποσκοπεί στην ανάπτυξη καινοτόμων μοντέλων μηχανικής μάθησης και την εφαρμογή τους σε πραγματικές συνθήκες, με τη δημιουργία πραγματικών χαρτοφυλακίων για πρόβλεψη των αποδόσεων των κινητών αξιών και βελτιστοποίηση των αποφάσεων σχετικά με τη σύνθεση του χαρτοφυλακίου. Για το σκοπό αυτό η πρόταση περιγράφει ένα πρόγραμμα έρευνας και παράλληλης ανάπτυξης “πρακτικών” εργαλείων πρόβλεψης αποδόσεων και σύνθεσης χαρτοφυλακίου, το οποίο θα οδηγήσει σε:

  1. καινοτόμα μοντέλα μηχανικής μάθησης, προσαρμοσμένα καλά στις παραπάνω περιοχές, τα οποία θα επιτρέψουν την αποτελεσματικότερη και γρηγορότερη (σε σχέση με την τρέχουσα βιβλιογραφία ) πρόβλεψη των αποδόσεων των κινητών αξιών, στηριζόμενα σε πρόσφατες εξελίξεις στο χώρο των νευρωνικών δικτύων, και πρώιμα ενθαρρυντικά αποτελέσματα από μέλη των ερευνητικών ομάδων, και
  2. λογισμικό αυτόματης διαχείρισης χαρτοφυλακίου, το οποίο θα απευθύνεται σε επενδυτές και επενδυτικές εταιρείες και το οποίο θα επιτυγχάνει αποδόσεις σημαντικά υψηλότερες από αυτές της αγοράς (π.χ. χρηματιστηριακοί δείκτες), λαμβάνοντας υπόψη και το προφίλ των επενδυτών σε σχέση με το ρίσκο. Η αυτοματοποιημένη διαχείριση θα υποκαταστήσει εν μέρει τη διαχείριση από ανθρώπους, θα είναι γρηγορότερη και εξατομικευμένη με λιγότερο κόστος, και οικονομία κλίμακας.

  Κύριος στόχος του έργου DeepInvest είναι η ανάπτυξη καινοτόμων μεθόδων για την αποδοτική πρόβλεψη τιμών μετοχών, που βασίζονται σε νέες μεθοδολογίες στο χώρο των νευρωνικών δικτύων. Για αυτό το λόγο, θα διερευνηθούν και υλοποιηθούν οι ακόλουθες τεχνικές βελτιστοποίησης πρόβλεψης:

  1. Νευρωνικά δίκτυα βασισμένα σε μονάδες LSTM (long short-term memory) για την πρόβλεψη των αποδόσεων πολλών κινητών αξιών στη μονάδα του χρόνου, χωρίς να χρειαστεί εκπαίδευση σε κάθε μία από αυτές χωριστά. Η τεχνική αυτή θα επιτρέπει την πρόβλεψη μεγάλου αριθμού κινητών αξιών (αντί μεμονωμένων δεικτών), λαμβάνοντας ως είσοδο του δικτύου δεδομένου μήκους χρονοσειρές των μετοχών, με στόχο την πολλαπλή πρόβλεψη των αποδόσεων όλων των κινητών αξιών. 
  2. Διερεύνηση τεχνικών "sequence-to-sequence", όπου θα υλοποιηθούν δύο LSTM νευρωνικά δίκτυα, με το ένα να “χειρίζεται” την φάση της κωδικοποίησης (encoding) και το άλλο την φάση της από-κωδικοποίησης (decoding). Στη φάση της αποκωδικοποίησης, ο πίνακας αρχικοποιεί το δεύτερο δίκτυο, στο οποίο μπορεί να δοθούν ως είσοδος επιπρόσθετα δεδομένα διαφορετικής φύσεως σε σχέση με το πρώτο. Η προσπάθεια αυτή θα έχει τον ίδιο στόχο, δηλαδή την υψηλής ποιότητας γρήγορη πρόβλεψη για μεγάλο πλήθος κινητών αξιών, χρησιμοποιώντας πληροφορίες που αφορούν το σύνολό τους από ιστορικά δεδομένα σε διαφορετικά βάθη χρόνου ή με διαφορετική συχνότητα.
  3. Διερεύνηση πιθανών ασύμμετρων loss function για την εκμετάλλευση “περισσότερης” από την πληροφορία της προς-πρόβλεψη χρονοσειράς, ενσωματώνοντας και το πρόσημο και το μέγεθος της απόκλισης της προβλεπόμενης απόδοσης από την πραγματική. Με την τεχνική αυτή, προβλέψεις που έχουν ίση απόκλιση από την πραγματική απόδοση αλλά δεν συμφωνούν σε πρόσημο θα έχουν διαφορετική “μεταχείριση”, ώστετο νευρωνικό δίκτυο να “εστιάσει” (και) στην πρόβλεψη της σωστής “κίνησης” της απόδοσης.
  4. Διερεύνηση της πρόσφατα προταθείσας τεχνικής “attention” κατά τη διάρκεια εκπαίδευσης των νευρωνικών δικτύων, ώστε αυτά να εκμεταλλεύονται μεγαλύτερο μέρος της χρονοσειράς εισόδου, με διαφορετικό βάρος εστίασης σε διαφορετικά δείγματα αυτής. Η επιτυχής εφαρμογή και βελτίωση της παραπάνω τεχνικής θα έχει σαν αποτέλεσμα τη σημαντική μείωση του χρόνου εκπαίδευσης και των αναγκών σε δεδομένα.
  5. Υλοποίηση τεχνικών βελτιστοποίησης με τη χρήση των αναμενόμενων αποδόσεων χαρτοφυλακίου, με σκοπό τον προσδιορισμό της ποσότητας (“βάρη”) αγοράς κάθε κινητής αξίας.
Ελληνικά