Partensor
Παράλληλοι Αλγόριθμοι και Υλοποιήσεις για Επεξεργασία πολύ Μεγάλων Τανυστών
- Χρηματοδότηση: Ευρωπαϊκή Ένωση, Εθνικοί Πόροι
- Project Acronym: Partensor
- Πρόγραμμα: Γενική Γραμματεία Έρευνας & Καινοτομίςα “ΕΡΕΥΝΩ – ΔΗΜΙΟΥΡΓΩ – ΚΑΙΝΟΤΟΜΩ”
- Προϋπολογισμός:
- Ημερομηνία Έναρξης: 28η Ιουνίου 2018
- Διάρκεια: 36 μήνες
- Website(s): www
Πληροφορίες
ΤΑΝΥΣΤΕΣ
Oι τανυστές (tensors) είναι μαθηματικά αντικείμενα τα οποία, πρόσφατα, έχουν προσελκύσει σημαντικό ερευνητικό ενδιαφέρον, εξαιτίας της δυνατότητάς τους να μοντελοποιούν πολυδιάστατα δεδομένα. Η παραγοντοποίηση (factorization) τανυστών σε λανθάνοντες παράγοντες (latent factors) είναι πολύ χρήσιμη για διαδικασίες όπως επιλογή χαρακτηριστικών, μείωση διαστάσεων, συμπίεση, οπτικοποίηση, και ερμηνεία δεδομένων. H πλήρωση (completion) τανυστών, όπου καλούμαστε να “προβλέψουμε” τις τιμές αγνώστων στοιχείων των τανυστών, είναι εξαιρετικά σημαντική σε εφαρμογές όπως συστήματα συστάσεων (recommendation systems). Τα τελευταία χρόνια έχουν αναπτυχθεί αρκετά πακέτα λογισμικού (n-way Toolbox, Tensorlab, Tensor-Toolbox) για την επεξεργασία τανυστών, γεγονός το οποίο αναδεικνύει την αυξανόμενη σπουδαιότητά τους. Σε πολλές και σημαντικές εφαρμογές, οι τανυστές τους οποίους καλούμαστε να χειριστούμε έχουν δισεκατομμύρια στοιχεία, γεγονός το οποίο κάνει εξαιρετικά δύσκολη την επεξεργασία τους σε συμβατικούς υπολογιστές. Τα διαθέσιμα πακέτα λογισμικού είναι κυρίως σειριακές υλοποιήσεις βασισμένες σε MATLAB, με αποτέλεσμα να μην είναι κατάλληλα για την επεξεργασία πολύ μεγάλων τανυστών. Εκτιμούμε ότι ο μόνος βιώσιμος τρόπος επεξεργασίας πολύ μεγάλων τανυστών είναι μέσω παράλληλων υπερυπολογιστών.
FMRI
H λειτουργική απεικόνιση μαγνητικού τομογράφου (fMRI) αποτελεί πλέον μία από τις δημοφιλέστερες μεθόδους στη μελέτη του ανθρώπινου εγκεφάλου. Πρόκειται για μια τεχνική, η οποία χρησιμοποιεί την απεικόνιση μαγνητικών αντηχήσεων (MRI) ώστε να εκτιμηθεί η εγκεφαλική δραστηριότητα μέσω της ανίχνευσης τοπικών μεταβολών στα επίπεδα οξυγόνου του αίματος.
Το fMRI χρησιμοποιείται τόσο για έρευνες σχετικά με την λειτουργία του εγκεφάλου, όσο και ως διαγνωστικό εργαλείο. Μέσω του fMRI είναι δυνατή η μελέτη των νευρωνικών δικτύων, που σχηματίζονται στον ανθρώπινο εγκέφαλο προκειμένου να επιτελεστούν εγκεφαλικές λειτουργίες, σε επίπεδο τοπολογίας και δομής. H εξαγωγή συμπερασμάτων πάνω στην εγκεφαλική λειτουργία, όπως η δομή και η μορφολογία των νευρωνικών δικτύων, επιτυγχάνεται εξετάζοντας πολλαπλά υγιή υποκείμενα που επιτελούν κοινές λειτουργίες. Η χρήση του fMRI ως διαγνωστικό εργαλείο έχει προταθεί για πολλές ασθένειες μέσα από έναν μεγάλο αριθμό εργασιών. Τυχόν αποκλίσεις και αλλοιώσεις στα χαρακτηριστικά των νευρωνικών δικτύων μπορούν να διαπιστωθούν εγκαίρως, ακόμα και σε προσυμπτωματικό στάδιο, με αποτέλεσμα την έγκαιρη διάγνωση νευροεκφυλιστικών ασθενειών (νόσος του Alzheimer, νόσος του Parkinson, κ.α.) ή ψυχικών διαταραχών (σχιζοφρένεια, διπολική διαταραχή, κ.α).
Η ανάλυση των fMRI δεδομένων είναι ιδιαιτέρως σύνθετη, κυρίως λόγω δύο παραγόντων. Ο πρώτος παράγοντας συνδέεται με την ανάγκη για υψηλή χωρική και χρονική ευκρίνεια, το οποίο οδηγεί στην δημιουργία δεδομένων μεγάλου όγκου. Ο δεύτερος παράγοντας αφορά στη φύση των δεδομένων. Το fMRI σήμα δεν σχετίζεται άμεσα με τη νευρωνική δραστηριότητα, αλλά με τις μεταβολές στα επίπεδα οξυγόνου που παρατηρούνται τοπικά και συνδέονται με τις μεταβολικές απαιτήσεις των νευρώνων (συσχετισμένων και ασυσχέτιστων με μια συγκεκριμένη εγκεφαλική λειτουργία). Επιπλέον, το fMRI σήμα είναι ασθενές και επικαλύπτεται από πολλές πηγές θορύβου που σχετίζονται με τη διαδικασία λήψης του σήματος. Επομένως, η επεξεργασία του fMRI αποτελείται από την απομάκρυνση του θορύβου (προ-επεξεργασία), όπως και των ασυσχέτιστων με τη μελετώμενη εγκεφαλική λειτουργία συνιστωσών, καθώς και στην εξαγωγή πληροφορίας για τη νευρωνική λειτουργία.
Οι μέθοδοι επεξεργασίας του fMRI σήματος, μετά το στάδιο της προ-επεξεργασίας, χωρίζονται σε 2 κατηγορίες. Στην πρώτη κατηγορία εμφανίζονται οι μέθοδοι ανάλυσης μίας μεταβλητής (univariate analysis methods), οι οποίες βασίζονται στην ανάλυση του σήματος που προκύπτει από κάθε περιοχή του εγκεφάλου ξεχωριστά (voxel-wise signal analysis). Στη δεύτερη κατηγορία εμφανίζονται οι μέθοδοι ανάλυσης πολλών μεταβλητών (multivariate analysis methods), οι οποίες αναλύουν μαζίκα τα σήματα που προκύπτουν από κάθε περιοχή του εγκεφάλου και στοχεύουν στην εξαγωγή συμπερασμάτων πάνω στον τρόπο με τον οποίο μια εγκεφαλική λειτουργία επιτελείται σε έναν ανθρώπινο εγκεφάλο (εύρεση νευρωνικών δικτύων συσχετισμένα με μια εγκεφαλική λειτουργία και χρονική συμπεριφορά αυτών).
Μια νέα τάση στις μεθόδους ανάλυσης πολλών μεταβλητών αποτελεί η χρήση τανυστικών μοντέλων (PARAFAC και TUCKER). Σε αντίθεση με τις δημοφιλέστερες μεθόδους ανάλυσης πολλών μεταβλητών (PCA, ICA, κ.α) , η χρήση τανυστικών μοντέλων επιτρέπει την ανάλυση δεδομένων διατηρώντας την πολυδιάστατη δομή τους και προσφέρει μοναδικές αποσυνθέσεις των δεδομένων (μοντέλο PARAFAC) σε συνιστώσες, όπου κάθε μια εκφράζεται από ένα σύνολο μονοδιάστατων υπογραφών, καθιστώντας ευκολότερη την ερμηνεία των αποτελεσμάτων. Όταν τα δεδομένα δεν χαρακτηρίζονται από την πολυγραμμική δομή του μοντέλου PARAFAC, παρουσιάζονται φαινόμενα εκφυλισμού κατά τη διαδικασία αποσύνθεσης με αποτέλεσμα την εξαγωγή συνιστώσων που παρουσιάζουν έντονη συγγραμικότητα και είναι άνευ χρήσιμης προς ερμηνεία πληροφορίας.
Τα fMRI δεδομένα δεν ακολουθούν την πολυγραμμική δομή του μοντέλου PARAFAC, καθώς τα σήματα που αντιστοιχούν σε γειτονικές περιοχές παρουσιάζουν φαινόμενα καθυστερήμενης συσχέτισης λόγω των αιμοδυναμικών φαινομένων που αναπτύσσονται στο εσωτερικού του εγκεφάλου. Προκειμένου να καταστεί εφικτή η επεξεργασία των fMRI δεδομένων έχουν προταθεί στη βιβλιογράφια παραλλαγές του μοντέλου PARAFAC, όπου οι καθυστερήσεις μεταξύ σημάτων που προέρχονται από γειτονικές περιοχές του εγκεφάλου έχουν προβλεφθεί. Συγκεκριμένα, έχουν προταθεί μοντέλα που ενσωματώνουν την ύπαρξη μοναδικών καθυστερήσεων για κάθε voxel ανά συνιστώσα (Shift Invariant PARAFAC), όπως και την ύπαρξη ενός παραμετροποιήσιμου πλήθους καθυστερήσεων για κάθε voxel ανά συνιστώσα (Convolutive PARAFAC). Ωστόσω, η διαδικασία αποσύνθεσης, και για τα δύο μοντέλα, είναι ιδιαιτέρα χρονοβόρα και δεν έχει προταθεί κάποιο σχήμα παράλληλης αποσύνθεσης, όπως και κάποια μέθοδος εκτίμησης του ενδεδειγμένου πλήθους συνιστωσών.