ΠΡΟΓΡΑΜΜΑ ΦΩΝΗΤΙΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΟΝΟΜΑΤΩΝ (PAPVOC)

 

ΓΕΝΙΚΑ - ΕΙΣΑΓΩΓΗ.. 1

ΑΠΑΙΤΗΣΕΙΣ ΕΓΚΑΤΑΣΤΑΣΗΣ. 1

ΚΛΗΣΗ ΠΡΟΓΡΑΜΜΑΤΟΣ – ΠΡΟΣΑΡΜΟΓΗ ΕΦΑΡΜΟΓΩΝ.. 1

ΠΛΕΟΝΕΚΤΗΜΑΤΑ.. 2

ΦΩΝΗΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ.. 3

ΟΙΚΟΝΟΜΙΚΑ ΣΤΟΙΧΕΙΑ.. 4

 

ΓΕΝΙΚΑ - ΕΙΣΑΓΩΓΗ

Η ανάγκη χρήσης προγράμματος φωνητικής επεξεργασίας ονομάτων, προκύπτει όταν έχουμε καταχωρημένα σε ηλεκτρονική μορφή πρόσωπα ή άλλα ονόματα και θέλουμε να έχουμε «έξυπνες» αναζητήσεις που να μην περιορίζονται από την ορθογραφία, τη γραφή (Ελληνικά – Λατινικά) τη σειρά γραφής των στοιχείων των ονομάτων καθώς επίσης και από τυχόν μικρά λάθη που θα γίνουν τόσο κατά τη καταχώρηση όσο και κατά την αναζήτηση αυτών.

Μετά από εντατική ενασχόλησή μας με το αντικείμενο για πάνω από δεκαπέντε χρόνια, δημιουργήσαμε μία εφαρμογή η οποία καλύπτει με επιτυχία όλες τις παραπάνω απαιτήσεις. Οι φωνητικοί κανόνες που χρησιμοποιούνται είναι ενσωματωμένοι σε ένα ευέλικτο παραμετρικό περιβάλλον, το οποίο επιτρέπει άμεση διόρθωσή τους, έλεγχο των επιπτώσεων και εφαρμογή τους σε υπάρχουσες βάσεις αυτόματα και χωρίς να διαταραχτεί η ομαλή λειτουργία των εφαρμογών.

 Το πρόγραμμα φωνητικής επεξεργασίας που έχουμε αναπτύξει έχει τη δυνατότητα να ενσωματώνεται πάρα πολύ εύκολα σε οποιαδήποτε εφαρμογή χρησιμοποιεί τη βάση δεδομένων ORACLE τόσο σε περιβάλλον WINDOWS όσο και σε περιβάλλον UNIX.

Λόγω της τεχνικής που χρησιμοποιείται, μπορεί να εξυπηρετήσει εγκαταστάσεις όλων των μεγεθών με πολύ υψηλές απαιτήσεις σε όγκο και ταχύτητα, δεδομένου ότι πρόκειται για πρόγραμμα που επιβαρύνει ελάχιστα τη CPU του συστήματος, ενώ χρησιμοποιεί τις βέλτιστες μεθόδους ώστε να μην επιβαρύνει άσκοπα το Ι/Ο του συστήματος ή το φόρτο του δικτύου.

ΑΠΑΙΤΗΣΕΙΣ ΕΓΚΑΤΑΣΤΑΣΗΣ

Απαιτείται να υπάρχει C compiler και βάση δεδομένων Oracle 8 ή νεώτερη. Η διαδικασία εγκατάστασης της εφαρμογής,  είναι πολύ απλή και τυποποιημένη. Γίνεται το compilation του C προγράμματος στο νέο σύστημα καθώς και το creation στη βάση δεδομένων ενός Package. Σε περιβάλλον βάσης δεδομένων επίσης δημιουργείται πίνακας παραμέτρων λειτουργίας του φωνητικού. Σε αυτόν θα οριστούν από τον υπεύθυνο του συστήματος (DBA) οι πίνακες  ατόμων για τους οποίους θα τηρούνται φωνητικά ευρετήρια, οι ονομασίες των ευρετηρίων αυτών καθώς και παράμετροι αναζητήσεων.

ΚΛΗΣΗ ΠΡΟΓΡΑΜΜΑΤΟΣ – ΠΡΟΣΑΡΜΟΓΗ ΕΦΑΡΜΟΓΩΝ

Για την ενημέρωση των φωνητικών ευρετηρίων, οι χρήστες δεν απαιτείται να κάνουν καμία αλλαγή-προσαρμογή στις εφαρμογές ενημέρωσης, δεδομένου ότι τα φωνητικά ευρετήρια ενημερώνονται αυτόματα με triggers που δημιουργούνται στους βασικούς πίνακες των ατόμων (on insert, on update, on delete).

Κατά την αναζήτηση των ατόμων, όπου οι απαιτήσεις για συνδυασμούς στοιχείων ή για αναζητήσεις ταυτόχρονα από περισσότερους πίνακες είναι μεγάλες, η διαδικασία είναι πάρα πολύ απλή. Όπου απαιτείται αναζήτηση, γίνεται κλήση ενός Package με παράμετρο τα στοιχεία ταυτότητας του ατόμου. Το Package αυτό αναλαμβάνει να κάνει όλη τη δουλειά. Κάνει τη φωνητική ανάλυση των ονομάτων και κάνει την αναζήτηση στα φωνητικά ευρετήρια που έχει ορίσει ο χρήστης στο πίνακα παραμέτρων. Σε περίπτωση εντοπισμού κάποιων εγγραφών στα φωνητικά ευρετήρια, συνεχίζει την αναζήτηση στους αντίστοιχους βασικούς πίνακες  και τις εγγραφές που βρίσκει τις επιστρέφει στο πρόγραμμα κλήσης σε ομάδες και σε μορφή που ορίζει ο χρήστης στο πίνακα παραμέτρων. (Αυτόματη αποκωδικοποίηση των κωδικοποιημένων στοιχείων, σειρά πεδίων, format, κλπ).

Έτσι το πρόγραμμα ενημέρωσης πρέπει να φροντίσει μόνο με την ενημέρωση του βασικού πίνακα των ατόμων, ενώ το πρόγραμμα αναζήτησης πρέπει να παρακάμψει όλες τις διαδικασίες αναζήτησης που είχε μέχρι τώρα και να αναλάβει μόνο την εμφάνιση των δεδομένων στην οθόνη και να μην ασχοληθεί καθόλου με queries στη βάση δεδομένων.

Η εφαρμογή περιλαμβάνει επίσης και διαδικασίες ελέγχου και διόρθωσης των φωνητικών ευρετηρίων σε περίπτωση αλλαγής των φωνητικών κανόνων ή σε περίπτωση μαζικής ενημέρωσης των βασικών πινάκων, όπου πιθανόν για λόγους ταχύτητας ενημέρωσης να απενεργοποιήσουμε τα triggers.

ΠΛΕΟΝΕΚΤΗΜΑΤΑ

Με τη τήρηση φωνητικών ευρετηρίων και την αναζήτηση μέσω της εφαρμογής μας επιτυγχάνεται:

·        Αξιοπιστία στις αναζητήσεις των ατόμων από τη βάση δεδομένων αφού παρέχεται η δυνατότητα ακόμη και εσφαλμένης πληκτρολόγησης ονομάτων σε πολλές περιπτώσεις. Αναλυτικά οι δυνατότητες που παρέχονται αναφέρονται σε ειδική παράγραφο (Φωνητικοί συνδυασμοί).  

·        Αν και προστίθενται επιπλέον δυνατότητες στις αναζητήσεις, τα προγράμματα απλοποιούνται και έχουν ελάχιστη επαφή με τη βάση (κλήση ενός Package). Αυτό βοηθάει πολύ στην ανάπτυξη εφαρμογών σε περιβάλλοντα ανοιχτά, όπου η πρόσβαση στη βάση δεδομένων είναι αρκετά  πολύπλοκη. (π.χ. JAVA).

·        Σε περιβάλλον clientserver εφαρμογών, περιορίζεται στο ελάχιστο ο φόρτος του δικτύου, αφού ταξιδεύουν σε αυτό μόνο οι απαραίτητες πληροφορίες και από ένα απόλυτα ελεγχόμενο περιβάλλον.

·        Αυξάνεται η ταχύτητα απόκρισης προς τον τελικό χρήστη, δεδομένου ότι κάθε αναζήτηση περιορίζεται σε ένα αίτημα και μία απάντηση, χωρίς να απαιτούνται πολλαπλές ερωταποκρίσεις όπως συμβαίνει συνήθως.

·        Επιτρέπεται εύκολη αλλαγή των δομών των πινάκων χωρίς να χρειάζεται κατ΄ ανάγκη και αλλαγή στα προγράμματα αναζήτησης-ενημέρωσης.

·        Επιτρέπεται εύκολη αλλαγή των δομών και των κανόνων αναζήτησης από τα φωνητικά ευρετήρια οι οποίες αυτόματα ενσωματώνονται σε όλες τις εφαρμογές χωρίς πρόσθετη παρέμβαση.

·        Προλαμβάνονται τυχόν λάθη στο συνδυασμό των φωνητικών στοιχείων που πιθανόν να είχαμε αν κάθε εφαρμογή διαχειριζόταν ξεχωριστά τόσο τη φωνητική ανάλυση όσο και την αναζήτηση στα φωνητικά ευρετήρια και στη συνέχεια στους βασικούς πίνακες.

ΦΩΝΗΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ

Με τον όρο φωνητική επεξεργασία εννοούμε την όλη επεξεργασία των στοιχείων ταυτότητας ενός ατόμου και αφορά τον τρόπο επεξεργασίας και καταχώρησής του στα φωνητικά ευρετήρια καθώς και την αντίστοιχη διαδικασία που εκτελείται κατά τη διαδικασία αναζήτησης.

Όταν καταχωρείται ένα άτομο στη Βάση Δεδομένων (ΒΔ) και αναζητείται ακριβώς με τα ίδια στοιχεία, τότε ασφαλώς δεν υπάρχει κανένα πρόβλημα στην ανεύρεση του ατόμου αυτού. Επειδή όμως υπεισέρχεται ο ανθρώπινος παράγοντας και αυτό δεν είναι δυνατόν να συμβαίνει πάντα, έρχεται η φωνητική επεξεργασία να καλύψει το κενό που υπάρχει στις αναζητήσεις.

Παρακάτω αναφέρονται χαρακτηριστικές περιπτώσεις όπου η φωνητική επεξεργασία εξασφαλίζει την ανεύρεση ενός ατόμου όταν αυτό αναζητείται με διαφορετικό τρόπο γραφής από αυτόν της καταχώρησης  στη ΒΔ:

1.  Όταν η διαφορά μεταξύ καταχωρημένων και αναζητούμενων στοιχείων είναι κάποιο κοινό ορθογραφικό λάθος. (Η - Ι, Ε - ΑΙ, διπλά γράμματα, κλπ).

2.  Όταν υπάρχει διαφορά στη γραφή των ονομάτων από Ελληνικά σε Λατινικά και αντίστροφα, αρκεί η μετατροπή αυτή να γίνεται με τους οριζόμενους από τον ELOT κανόνες μεταγλώττισης και να μην γίνεται αυθαίρετα (ΠΑΠΠΑΣ ΡΑΡΡΑS).

3.  Όταν η διαφορά οφείλεται σε διαφορετική γραφή του ίδιου ονόματος σε διαφορετικές γλώσσες ή αφορά χαϊδευτικό όνομα (ΓΙΑΝΝΗΣ - JOHN, MOHAMED - MΑΗOΜΕD, κλπ). Υπάρχει θησαυρός ονομάτων (Ελληνικών και ξένων) που έχουν πολλές επίσημες γραφές. Ειδικότερα, για τα Αραβικά ονόματα, όπου παρουσιάζεται έντονο το πρόβλημα, έχει γίνει έρευνα και έχει βρεθεί μία πλειάδα από παραλλαγές σε αρκετά ονόματα, τα οποία λαμβάνονται υπόψη κατά τη φωνητική επεξεργασία.

4.  Άτομα με πολλαπλά στοιχεία ταυτότητας (Επώνυμα, ονόματα) αναζητούνται με οποιοδήποτε συνθετικό των ονομάτων αυτών δοθεί. Το γένος εγγάμων γυναικών λαμβάνεται σαν δεύτερο επώνυμο ενώ το όνομα συζύγου και σαν πατρώνυμο.

5.  Διαφορές που οφείλονται σε γνωστές αλλαγές των ονομάτων τους (κυρίως τις καταλήξεις) που κάνουν  οι Έλληνες στο εξωτερικό (π.χ. η κυρία ΚΑΖΑΚΟΥ  γίνεται ΚΑΖΑΚΟS).

6.  Όταν η διαφορά οφείλεται σε φθόγγους οι οποίοι όμως δεν επηρεάζουν ακουστικά το όνομα (π.χ. ΤΕΤΖΕΡΗΣ, ΤΕΝΤΖΕΡΗΣ, ΤΕΤΣΕΡΗΣ κλπ).

7.  Όταν η σειρά γραφής των στοιχείων ταυτότητας δεν συμπίπτει. Είναι γνωστό το πρόβλημα με τα Αραβικά, Κινέζικα, κλπ ονόματα όπου δεν γνωρίζουμε πιο από όλα τα στοιχεία είναι επώνυμο ή όνομα και συμβατικά τα καταχωρούμε σχεδόν πάντα αυθαίρετα. Ειδικά για τα ονόματα της κατηγορίας αυτής εξασφαλίζεται η επιτυχής αναζήτηση ακόμη και αν έχουμε γραφή του ονόματος σαν επώνυμο ή πατρώνυμο και αντίστροφα.

8.  Αγνοούνται συνθετικά μόρια των ονομάτων που δεν είναι σημαντικά (VAN, DE, AL, EL, κλπ).

Ο θησαυρός των φωνητικών συνδυασμών - απλοποιήσεων μπορεί στη πορεία να εμπλουτίζεται ώστε να καλύψει νέες περιπτώσεις ονομάτων που τώρα πιθανόν να μην καλύπτονται.

ΟΙΚΟΝΟΜΙΚΑ ΣΤΟΙΧΕΙΑ

Το αρχικό κόστος εγκατάστασης του λογισμικού κλιμακώνεται ανάλογα με τις άδειες χρήσης που υπάρχουν για τη ΒΔ Oracle στο File Server της εγκατάστασης.

Για περισσότερες πληροφορίες ζητήστε μας αναλυτικούς πίνακες.