Πλοήγηση ανά Συγγραφέα "Panagou, Fotini"
Τώρα δείχνει 1 - 1 από 1
- Αποτελέσματα ανά σελίδα
- Επιλογές ταξινόμησης
Τεκμήριο Model based clustering for count and mixed mode data(28-09-2022) Πανάγου, Φωτεινή; Panagou, Fotini; Athens University of Economics and Business, Department of Statistics; Papageorgiou, Ioulia; Gormley, Claire; Kosmidis, Ioannis; Rau, Andrea; Ntzoufras, Ioannis; Papastamoulis, Panagiotis; Karlis, DimitriosΟι μέθοδοι ομαδοποίησης που βασίζονται σε μοντέλα κατανομής για τον πληθυσμό, είναι μια κοινή προσέγγιση για τη μοντελοποίηση δεδομένων με τη χρήση πεπερασμένων μίξεων παραμετρικών κατανομών. Για μετρήσιμα δεδομένα, η επιλογή της πολυμεταβλητής κατανομής Poisson μπορεί να οδηγήσει σε αυξημένο υπολογιστικό κόστος. Η έννοια της μεθόδου της σύνθετης πιθανοφάνειας με τη χρήση διμεταβλητών περιθώριων κατανομών μπορεί να προσφέρει ευελιξία στις εκτιμήσεις. Προκειμένου να μειωθεί περαιτέρω ο χρόνος εκτίμησης των παραμέτρων που σχετίζονται με τη σύνθετη μέθοδο πιθανοφάνειας, εισάγουμε μεθόδους δειγματοληψίας που μπορούν να προσφέρουν επαρκή αποτελέσματα, ειδικά σε μεγάλων διαστάσεων δεδομένα. Όσον αφορά τα δεδομένα μεικτού τύπου, η από κοινού κατανομή δεν είναι πάντα εύκολο να βρεθεί. Τα copulas είναι ευρέως γνωστά ως ευέλικτα μοντέλα που επιτρέπουν τη δημιουργία πολυμεταβλητών κατανομών όταν δίνονται οι περιθώριες κατανομές. Ως εκ τούτου, μπορούν να δημιουργήσουν μια πληθώρα πολυμεταβλητών μοντέλων συμπεριλαμβανομένων μοντέλων με διαφορετικές περιθώριες. Σκοπός της παρούσας διπλωματικής εργασίας είναι κυρίως να επεκτείνει τα μέχρι τώρα αποτελέσματα της χρήσης μοντέλων που βασίζονται σε copula για εφαρμογές ομαδοποίησης. Το Gaussian Copula προσφέρει ευελιξία για την περιγραφή των συσχετίσεων μεταξύ διαφορετικών τύπων μεταβλητών. Στόχος μας είναι να μειώσουμε περαιτέρω το υπολογιστικό κόστος που προκύπτει από τη χρήση του Gaussian copula και του πλήρως παραμετροποιημένου μοντέλου που μελετήσαμε εκτενώς, καθώς αυτή η προσέγγιση είναι χρονοβόρα, γεγονός που προκύπτει από την προσθήκη διαφορετικών πινάκων συσχέτισης για κάθε ομάδα που πρέπει να εκτιμηθεί. Έτσι, ο κύριος στόχος είναι να επιτευχθεί ευελιξία στην εκτίμηση με τη χρήση κατάλληλων τεχνικών. Στην παρούσα διατριβή έχουμε προτείνει ευέλικτες εναλλακτικές που βασίζονται σε προσεγγίσεις μείωσης των διαστάσεων, όπως η ανάλυση παραγόντων ή έξυπνες αναπαραστάσεις των πινάκων συσχέτισης (δομημένοι πίνακες συσχέτισης).