ΕΠ51-Ανάκτηση Πληροφορίας και Επεξεργασία Φυσικής Γλώσσας
Πληροφορίες
Κωδικός : ΕΠ51
Τύπος : Επιλογής
SΕξάμηνο : 8
Μονάδες ECTS: 5
URL: https://eclass.hua.gr/courses/DIT288/
Μαθησιακά Αποτελέσματα
- Επάρκεια σε διάφορα μοντέλα αναπαράστασης κειμένου που χρησιμοποιούνται στη Φυσική Γλωσσική Επεξεργασία (NLP) και την Ανάκτηση Πληροφοριών (IR).
- Ικανότητα να εφαρμόζει και να χρησιμοποιεί τεχνικές Bag of Words και tf-idf για την αναπαράσταση κειμένου και την εξαγωγή χαρακτηριστικών.
- Κατανόηση των θεμελιωδών αρχών της ανάκτησης πληροφοριών και των διαφόρων μεθόδων της.
- Εξειδίκευση στη χρήση μεθόδων διανυσματικού χώρου για εργασίες ανάκτησης πληροφοριών.
- Γνώση των μετρικών αξιολόγησης που χρησιμοποιούνται για την αξιολόγηση της απόδοσης των συστημάτων ανάκτησης πληροφοριών.
- Κατανόηση διαφορετικών μοντέλων γλωσσικής ανάλυσης που χρησιμοποιούνται ειδικά στην ανάκτηση πληροφοριών.
- Επάρκεια σε διάφορα μοντέλα αναπαράστασης λέξεων/προτάσεων που χρησιμοποιούνται σε εργασίες NLP.
- Δυνατότητα εργασίας με ενσωμάτωση λέξεων όπως το word2vec για σημασιολογική αναπαράσταση των λέξεων.
- Κατανόηση και πρακτικές γνώσεις για τα μοντέλα βασισμένα σε Transformers όπως το BERT και το GPT για εργασίες κατανόησης και δημιουργίας γλώσσας.
- Δυνατότητα εφαρμογής τεχνικών NLP σε διάφορους εφαρμοσμένους τομείς, όπως ανάλυση συναισθήματος, ταξινόμηση κειμένου ή αναγνώριση ονοματικών οντοτήτων.
- Κατανόηση τεχνικών που χρησιμοποιούνται σε συστήματα ανάκτησης πολυμέσων βασισμένα στο περιεχόμενο.
Περιέχομενο
Μοντέλα αναπαράστασης κειμένου
Bag of words, tf-idf
Ανάκτηση πληροφοριών
Διανυσματικές μέθοδοι για την Ανάκτηση Πληροφοριών
Μετρικές αξιολόγησης Ανάκτησης Πληροφοριών
Ανάκτηση πληροφορίας και γλωσσικά μοντέλα
Μοντέλα αναπαράστασης λέξεων
Ενσωματώσεις λέξεων (word2vec)
RNN-LSTM
Transformers - BERT, GPT
Εφαρμογές ειδικές στην Επεξεργασία Φυσικής Γλώσσας
Ανάκτηση πολυμέσων με βάση το περιεχόμενο
Τρόπος Αξιολόγησης
η-τάξη, παρουσιάσεις, παραδείγματα κώδικα
Bibliοgraphy