Υποχρεωτικά μεταδεδομένα

Το σχήμα μεταδεδομένων έχει στοιχεία των οποίων η αναγκαιότητα, δηλαδή κατά πόσο θεωρούνται απαραίτητα για την περιγραφή ενός πόρου, ποικίλλει. Ανεξάρτητα από τον τρόπο που επιλέγεται για τη δημιουργία ενός πόρου (μέσω του περιβάλλοντος τεκμηρίωσης και ανάρτησης 1 ή μέσω μεταφόρτωσης αρχείου μεταδεδομένων XML), τα υποχρεωτικά μεταδεδομένα πρέπει να συμπληρωθούν. Διαφορετικά, η εγγραφή δεν θα αποθηκευτεί ή το αρχείο XML δεν θα μπορέσει να εισαχθεί στην υποδομή για την δημιουργία εγγραφής. Οι ακόλουθες ενότητες περιέχουν εικόνες που προσφέρουν μια επισκόπηση αυτών των μεταδεδομένων ανά τύπο πόρου και εξηγούνται εν συντομία. Τα μεταδεδομένα που επισημαίνονται με αστερίσκο (*) είναι υπό συνθήκη υποχρεωτικά. Αυτό σημαίνει ότι η αναγκαιότητά τους πηγάζει από τις τιμές άλλων μεταδεδομένων που επιλέγει ο χρήστης. Οι εικόνες αναπαράγουν το περιβάλλον τεκμηρίωσης και ανάρτησης πόρων (με τις ενότητες να βρίσκονται οριζόντια και τις επιμέρους καρτέλες κάθε ενότητας κάθετα) ώστε να μπορείτε εύκολα να εντοπίσετε κάθε μεταδεδομένο. Μέσα στο περιβάλλον τεκμηρίωσης, όλα τα μεταδεδομένα, υποχρεωτικά και μη, επεξηγούνται με ορισμούς και παραδείγματα.

Κοινά υποχρεωτικά μεταδεδομένα

Πρακτική συμβουλή

Κάποια μεταδεδομένα είναι υποχρεωτικά για όλους τους πόρους!

Για να περιγράψετε έναν πόρο αποτελεσματικά, πρέπει να του δώσετε ένα όνομα (resource name) και να δημιουργήσετε μια μικρή περιγραφή (description). Για να διευκολύνετε τον αναγνώστη και να κάνετε πιο ελκυστική την περιγραφή σας, χρησιμοποιήστε τις λειτουργικότητες που προσφέρονται για διαμόρφωση του κειμένου (στυλ, μορφοποίηση, υπερσύνδεση, στοίχιση κλπ.) όπως φαίνονται στην ακόλουθη εικόνα.

../../_images/RichEd.png

Στη συνέχεια δηλώστε τον αριθμό της έκδοσής (version) του πόρου. Αν δεν δώσετε εσείς αριθμό έκδοσης, το σύστημα θεωρεί αυτομάτως ότι η έκδοση είναι η πρώτη και την προσθέτει (v1.0.0.). Θα χρειαστεί να βάλετε, ακόμη, μία ή περισσότερες λέξεις κλειδιά (keywords) και ένα email ή μια ιστοσελίδα (landing page) για όποιον επιθυμεί να έχει περισσότερες πληροφορίες σχετικά με τον πόρο.

Αυτά τα μεταδεδομένα βρίσκονται στην ενότητα Language Resource/Technology (Γλωσσικός πόρος/Γλωσσική τεχνολογία) στην καρτέλα Identity (Ταυτότητα).

Πρέπει επίσης να περιγράψετε ανεξάρτητα κάθε τρόπο διανομής του πόρου. Όλους, δηλαδή, τους τρόπους με τους οποίους ο χρήστης μπορεί να τον αποκτήσει, είτε σε συμπαγή μορφή, ως CD-ROM για παράδειγμα, είτε από διάφορα URL, όπως είναι η τοποθεσία πρόσβασης (access location), η τοποθεσία λήψης/καταφόρτωσης (download location) και η τοποθεσία διανομής (distribution location). Ταυτόχρονα, θα πρέπει να δηλώσετε τους όρους χρήσης (licence terms) κάθε μορφής διάθεσης του πόρου (δείτε εδώ το Προτεινόμενο Σχήμα Αδειοδότησης Γλωσσικών Πόρων).

Αυτά τα μεταδεδομένα βρίσκονται στην ενότητα Distribution (Διανομή) στην καρτέλα Technical (Τεχνικά).

Υποχρεωτικά μεταδεδομένα ανά τύπο πόρου

Μία γρήγορη ματιά σε ένα σώμα κειμένων

../../_images/CorpusM.png

Πέρα από τα κοινά υποχρεωτικά μεταδεδομένα, για να περιγραφεί ένα σώμα κειμένων απαιτούνται επίσης πληροφορίες σχετικά με την υποκατηγορία (subclass) του, αν είναι δηλαδή τα δεδομένα πρωτογενή (raw) ή επισημειώμενα (annotated), και αν περιλαμβάνονται προσωπικά (personal) ή ευαίσθητα προσωπικά (sensitive) δεδομένα. Εάν συμβαίνει αυτό, πρέπει να αναφέρετε εάν έχουν ανωνυμοποιηθεί (anonymized). Το σώμα κειμένων μπορεί επίσης να απαρτίζεται από διάφορα είδη μέσων (media types), όπως είναι το κείμενο (text), το βίντεο (video), ο ήχος (audio), η εικόνα (image) και το textNumerical, μία υποκατηγορία κειμένου με αριθμητικά δεδομένα. Κάθε ένα από αυτά τα μέρη πρέπει να περιγραφεί ανεξάρτητα. Για παράδειγμα, αν έχετε ένα σώμα κειμένου με απομαγνητοφωνημένες συζητήσεις μαζί με τα αρχεία ήχου, πρέπει να δώσετε πληροφορίες και για τα δύο μέσα, αναφέροντας το μέγεθος (size) και τo μορφότυπο (data format) του κάθε μέσου.

Πρακτική συμβουλή

Δείτε εδώ παραδείγματα περιγραφών μεταδεδομένων σε XML για σώματα κειμένων.

Μία γρήγορη ματιά σε ένα εργαλείο

../../_images/ToolM.png

Πέρα από τα κοινά υποχρεωτικά μεταδεδομένα, για να περιγραφεί ένα εργαλείο πρέπει να αναφέρετε ποια λειτουργία (function) επιτελεί, καθώς επίσης και αν έχει δημιουργηθεί για επεξεργασία υλικού σε συγκεκριμένη γλώσσα (language dependent), ή όχι. Εάν ισχύει κάτι τέτοιο, πρέπει να δηλώσετε μία ή περισσότερες γλώσσες (languages) που μπορεί να χειριστεί το εργαλείο. Πρέπει επίσης να οριστεί ο τύπος πόρου (resource type) τον οποίο δέχεται στην είσοδό (input) του (π.χ. σώμα κειμένων).

Πρακτική συμβουλή

Δείτε εδώ παραδείγματα περιγραφών μεταδεδομένων σε XML για εργαλεία.

Μία γρήγορη ματιά σε έναν λεξικό/εννοιολογικό πόρο

../../_images/LCRM.png

Πέρα από τα κοινά υποχρεωτικά μεταδεδομένα, για να περιγραφεί ένας λεξικός/εννοιολογικός πόρος, απαιτούνται επίσης πληροφορίες σχετικά με το επίπεδο κωδικοποίησης (encoding level), δηλαδή το επίπεδο γλωσσικής ανάλυσης (π.χ. μορφολογία, φωνολογία, σημασιολογία κλπ.) και αν περιλαμβάνονται προσωπικά (personal) ή ευαίσθητα προσωπικά (sensitive) δεδομένα. Εάν συμβαίνει αυτό, πρέπει να αναφέρετε εάν έχουν ανωνυμοποιηθεί (anonymized). Ο λεξικός/εννοιολογικός πόρος μπορεί επίσης να απαρτίζεται από διάφορα είδη μέσων (media types), όπως είναι το κείμενο (text), το βίντεο (video), ο ήχος (audio) και η εικόνα (image). Κάθε ένα από αυτά τα μέρη πρέπει να περιγραφεί ανεξάρτητα. Για παράδειγμα, εάν έχετε ένα ψηφιακό λεξικό με ορισμούς σε κειμενική μορφή και ηχητικά αρχεία για την προφορά, πρέπει να δώσετε πληροφορίες και για τα δύο μέσα, αναφέροντας το μέγεθος (size) και τo μορφότυπο (data format) του κάθε μέσου.

Πρακτική συμβουλή

Δείτε εδώ παραδείγματα περιγραφών μεταδεδομένων σε XML για λεξικούς/εννοιολογικούς πόρους.

Μία γρήγορη ματιά σε μία γλωσσική περιγραφή

../../_images/LDM.png

Πέρα από τα κοινά υποχρεωτικά μεταδεδομένα, για να περιγραφεί μια γλωσσική περιγραφή απαιτούνται επίσης πληροφορίες σχετικά με την υποκατηγορία (subclass) της, αν είναι δηλαδή γραμματική (grammar) ή ένα μοντέλο ML (ML model) ή ένα μοντέλο n-gram (n-gram model) και αν περιλαμβάνονται προσωπικά (personal) ή ευαίσθητα προσωπικά (sensitive) δεδομένα. Εάν συμβαίνει αυτό, πρέπει να αναφέρετε εάν έχουν ανωνυμοποιηθεί (anonymized). Η γλωσσική περιγραφή μπορεί επίσης να απαρτίζεται από διάφορα μέρη με ποικίλα είδη μέσων (media types), όπως είναι το κείμενο (text), το βίντεο (video), ο ήχος (audio) και η εικόνα (image). Κάθε ένα από αυτά τα μέρη πρέπει να περιγραφεί ανεξάρτητα. Για παράδειγμα, αν έχετε μια γραμματική σε κειμενική μορφή μαζί με τα αρχεία βίντεο όπου παρουσιάζονται παραδείγματα, πρέπει να δώσετε πληροφορίες και για τα δύο μέσα, αναφέροντας το μέγεθος (size) και τoν μορφότυπο (data format) του κάθε μέσου.

Πρακτική συμβουλή

Δείτε εδώ παραδείγματα περιγραφών μεταδεδομένων σε XML για γλωσσικές περιγραφές.

Προσοχή

Παρόλο που μόνο τα υποχρεωτικά μεταδεδομένα απαιτούνται για τη δημιουργία μιας εγγραφής, η περιγραφή ενός πόρου είναι πληρέστερη εάν έχουν συμπληρωθεί και τα συνιστώμενα (recommended) μεταδεδομένα.

1

Οι αγγλικοί όροι που αναφέρονται στο περιβάλλον τεκμηρίωσης και ανάρτησης πόρων (metadata editor και editor) χρησιμοποιούνται εναλλακτικά χωρίς διαφορά στη σημασία.