επιστροφη στην αρχικη σελιδαεπικοινωνήστε μαζί μαςχαρτης ιστοσελιδαςπροσθηκη στα αγαπημεναπληροφοριες

 

 

H Ανάλυση Δεδομένων

Οι μέθοδοι της Πολυδιάστατης Στατιστικής Ανάλυσης και ιδιαίτερα οι εφαρμογές της εφαρμόζονται σε όλους σχεδόν τους τομείς της επιστήμης και της κοινωνίας. Ένας διακριτός κλάδος της ενότητας των μεθόδων της Πολυδιάστατης Στατιστικής Ανάλυσης είναι η Ανάλυση Δεδομένων (Geometric Data Analysis στα αγγλικά, Analyse des Données στα γαλλικά).

Σκοπός των μεθόδων της ΑΔ είναι να αναδείξουν και να περιγράψουν λανθάνουσες δομές που ενδεχομένως εμπεριέχονται σε πολυδιάστατους πίνακες δεδομένων. Αυτό επιτυγχάνεται μέσα από διαδικασίες αλλαγής και ελάττωσης των διαστάσεων του αρχικού χώρου, στον οποίο το υπό εξέταση φαινόμενο μπορεί να περιγραφεί. Οι μέθοδοι της ΑΔ δεν απαιτούν την προσαρμογή των δεδομένων σε κάποιο στοχαστικό υπόδειγμα και η αντίστοιχη συμπερασματολογία δεν υπάγεται σε κάποιο μηχανισμό επαγωγικού συλλογισμού με την έννοια της στατιστικής σημαντικότητας.

Οι μέθοδοι της ΑΔ γνώρισαν σχεδόν παράλληλη εξέλιξη σε αρκετές χώρες, όπως οι ΗΠΑ, η Μεγάλη Βρετανία, ο Καναδάς, η Γαλλία, η Ολλανδία και η Ιαπωνία, κάτι που είχε ως αποτέλεσμα να δημιουργηθούν ποικίλες προσεγγίσεις και κατευθύνσεις, τόσο ως προς το θεωρητικό όσο και ως προς το αλγοριθμικό - υπολογιστικό υπόβαθρο των μεθόδων. Οι δύο κυρίαρχες μεθοδολογικές προσεγγίσεις ή σχολές της ΑΔ είναι η Γαλλική και η Ολλανδική. Μερικές από τις πιο σημαντικές προσωπικότητες στην ιστορία της ΑΔ είναι οι Jean-Paul Benzécri, Louis Guttman, Chikio Hayashi, Douglas Carroll και Roger N. Shepard.

Οι πιο γνωστές και διαδεδομένες σε εφαρμογές μέθοδοι της Ανάλυσης Δεδομένων είναι:

•  Η Ανάλυση σε Κύριες Συνιστώσες (Principal Component Analysis)

•  Η Παραγοντική Ανάλυση των Αντιστοιχιών (Correspondence Analysis)

•  Η Ανάλυση Κανονικοποιημένης Συσχέτισης (Canonical Correlation Analysis)

•  Η Ιεραρχική Ανάλυση σε Συστάδες (Hierarchical Cluster Analysis)

•  Η Πολυδιάστατη Κλιμακοποίηση (Multidimensional Scaling)

Ποια είναι όμως η ιστορία της Ανάλυσης Δεδομένων στην Ελλάδα;

Η Ανάλυση Δεδομένων στην Ελλάδα, Γ. Παπαδημητρίου

Το 1970 ιδρύθηκε στο γαλλικό Πανεπιστήμιο PARIS IV το μεταπτυχιακό τμήμα «Στατιστική-Ανάλυση Δεδομένων» με διευθυντή τον Καθηγητή Jean-Paul Benzécri. Πολλοί πτυχιούχοι ελληνικών μαθηματικών τμημάτων παρακολουθήσαμε τα μαθήματα αυτού του μεταπτυχιακού τμήματος.

Από τη μνήμη όλων όσων επιστρέψαμε, δύσκολα φεύγει ο διάδρομος 45-55 του δευτέρου ορόφου του Πανεπιστημίου Pierre et Marie Curie - Paris VI στο Jussieu του Παρισιού, όπου κάθε Δευτέρα, μεταξύ πρωινού και απογευματινού μαθήματος, συνωστιζόμαστε για μια επικοινωνία με το γενειοφόρο, με μορφή Αγίου βυζαντινής αγιογραφίας, καθηγητή Benzécri. Για όσους δεν τον γνώριζαν η περιγραφή αυτή νομίζω ότι ανταποκρίνεται πιστά στην πραγματικότητα. Για να ενισχυθεί αυτή μου η άποψη, αναφέρω ότι ο τότε τετράχρονος γιος μου, όταν τον πρωτοαντίκρυσε αυτόματα πήγε να κάνει το σταυρό του.

Όλοι θυμόμαστε την γραμματέα του τμήματος Mme Laraise και τους συνεργάτες του Roux, Jambu, Lebart, Stephan και άλλους. Δεν είναι δυνατό να λησμονηθεί η ταλαιπωρία και ο θόρυβος των διατρητικών μηχανών, όπου περνούσαμε τα Δεδομένα σε κάρτες και τις δίναμε για επεξεργασία στον κεντρικό υπολογιστή του υπογείου περιμένοντας την επόμενη μέρα τα αποτελέσματα.

Μετά την απόκτηση του μεταπτυχιακού τίτλου (D.E.A.) ή διδακτορικού διπλώματος επιστρέψαμε στην Ελλάδα και αναζητήσαμε ακαδημαϊκούς ή άλλους χώρους όπου θα μας δινόταν η ευκαιρία να αναπτύξουμε και να εφαρμόσουμε μεθόδους Ανάλυσης Δεδομένων.

Πολλοί από εμάς, άλλοι λίγο πριν, άλλοι λίγο μετά το 1980, εκλεγήκαμε σε διάφορα τμήματα ελληνικών πανεπιστημίων, όπου αντιμετωπίσαμε την ελληνική ακαδημαϊκή πραγματικότητα. Δεν είναι υπερβολή να πω ότι αισθανθήκαμε σαν πλασιέ ενός νέου προϊόντος, αγνώστου στο αγγλοσαξονικό κατεστημένο των Ελλήνων στατιστικών. Παρά τις έντονες και επίμονες προσπάθειές μας, οι μέθοδοι της Ανάλυσης Δεδομένων, έγιναν αποδεκτές από την ελληνική πανεπιστημιακή κοινότητα, μόνο όταν περιελήφθησαν στα αμερικάνικα στατιστικά λογισμικά πακέτα των ηλεκτρονικών υπολογιστών. Διαπιστώθηκε έτσι, για μια ακόμη φορά, η εξάρτηση της ελληνικής στατιστικής σκέψης από το αγγλοσαξονικό σύστημα, ή αν θέλετε, διαπιστώθηκαν οι συνέπειες υποβάθμισης της γαλλικής πολιτισμικής παρουσίας στην Ελλάδα. Είναι πιθανό, αυτή η επιφυλακτικότητα των Ελλήνων στατιστικών να οφείλεται και στη νοοτροπία των Γάλλων στατιστικών να δημοσιεύουν μόνο σε γαλλόφωνα περιοδικά.

Ανεξάρτητα των αιτιών, όσοι από εμάς βρεθήκαμε μέσα στα ελληνικά ΑΕΙ αντιμετωπίσαμε κάποιες δυσκολίες, μερικοί δυστυχώς τις αντιμετωπίζουν ακόμη και σήμερα, παρόλο που προκηρύσσονται πλέον θέσεις ΔΕΠ σε ορισμένα πανεπιστημιακά τμήματα στο γνωστικό αντικείμενο «Στατιστική-Ανάλυση Δεδομένων». Με υπομονή και επιμονή, κατορθώσαμε τελικά να πετύχουμε την πρώτη προκήρυξη θέσεως στο γνωστικό αντικείμενο «Στατιστική-Ανάλυση Δεδομένων» το 1986, παρά το ότι το μάθημα της Ανάλυσης Δεδομένων διδασκόταν ήδη σε διάφορα πανεπιστημιακά τμήματα.

Μεταξύ των συνεχών προσπαθειών και ενεργειών που κατεβλήθησαν από τους Έλληνες στατιστικούς της Ανάλυσης Δεδομένων για να καθιερωθεί ο κλάδος και να πάρει την αρμόζουσα θέση μέσα στο χώρο της Στατιστικής Επιστήμης, αναφέρουμε ότι:

  • Aπό το 1985 καθιερώθηκαν μαθήματα Ανάλυσης Δεδομένων σε διάφορα τμήματα, εκδόθηκαν βιβλία και απενεμήθησαν διδακτορικοί τίτλοι στο χώρο της Ανάλυσης Δεδομένων.

  • Tο 1986 πραγματοποιήθηκε στα Χανιά η «Σχολή της Άνοιξης Ανάλυσης Δεδομένων», όπου για μια βδομάδα παρουσιάστηκαν οι μέχρι τότε εξελίξεις των μεθόδων αυτών καθώς και οι δυνατότητες εφαρμογών τους. Από το σύνολο των Γάλλων ακαδημαϊκών αναφέρω ενδεικτικά τους: E.Diday, J. Pagés, A. Morineau, M. Greenacre, M. Tenenhaus, J.-P. Fenelon, G. Der Megreditchian, M. Suma.

  • Η παρουσία μας στο Ελληνικό Στατιστικό Ινστιτούτο (Ε.Σ.Ι.) και στα ετήσια συνέδρια του υπήρξε ανελλιπής.

  • Το 2001 στην Κομοτηνή πραγματοποιήθηκε με επιτυχία το 1ο Πανελλήνιο Συνέδριο Ανάλυσης Δεδομένων και ακολούθησαν το 2ο (Κομοτηνή, 2003), το 3ο (Χαλκιδική, 2005), το (Καρδίτσα, 2007), το 5ο (Ρέθυμνο, 2009)και το 6ο Πανελλήνιο Συνέδριο με Διεθνή Συμμετοχή (Θεσσαλονίκη 2011). Το 7ο Πανελλήνιο Συνέδριο Ανάλυσης Δεδομένων θα πραγματοποιηθεί στην Καβάλα τον Σεμπτέμβριο του 2013.

  • Από το 2002 εκδίδεται το επιστημονικό περιοδικό Τετράδια Ανάλυσης Δεδομένων (Data Analysis Bulletin) που φιλοξενεί εργασίες στο ερευνητικό πεδίο της Ανάλυσης Δεδομένων.