οπτική αναγνώριση χαρακτήρων (OCR) είναι η μετάφραση του οπτικά σαρωμένες εικόνες bitmap των εντύπων ή γραπτών χαρακτήρες κειμένου σε κωδικούς χαρακτήρων, όπως ASCII. Αυτός είναι ένας αποτελεσματικός τρόπος για να μετατρέψει τα υλικά σε έντυπη μορφή σε αρχεία δεδομένων που μπορούν να επεξεργαστούν και άλλο χειρισμό σε έναν υπολογιστή. Αυτή είναι η τεχνολογία που χρησιμοποιείται από καιρό βιβλιοθήκες και τους κρατικούς φορείς να κάνουν χρονοβόρες έγγραφα γρήγορα διαθέσιμα σε ηλεκτρονική μορφή. Οι πρόοδοι στην τεχνολογία OCR έχουν κεντρίσει αυξανόμενη χρήση του από τις επιχειρήσεις. Για πολλά καθήκοντα έγγραφο εισόδου, OCR είναι η πιο οικονομικά αποδοτική και ταχεία μέθοδος διαθέσιμη. Και κάθε χρόνο, η τεχνολογία απελευθερώνει στρέμματα του χώρου αποθήκευσης μόλις δοθεί για αρχειοθήκες και κουτιά γεμάτα από έγγραφα σε χαρτί. Πριν μπορεί να χρησιμοποιηθεί OCR, η πρώτη ύλη πρέπει να σαρωθεί χρησιμοποιώντας ένα οπτικό σαρωτή (και μερικές φορές ένα εξειδικευμένο κύκλωμα του σκάφους στο PC) για να διαβάσετε στη σελίδα ως bitmap (ένα μοτίβο από κουκκίδες). Λογισμικό για να αναγνωρίσουν τις εικόνες είναι επίσης απαραίτητη.
Πακέτο λογισμικού μας προτείνει να λυθεί το χαρακτηρισμό των απομονωμένων χειρόγραφες χαρακτήρες και ψηφία των χαρακτήρων UJI Σετ στυλό δεδομένων με χρήση νευρωνικών δικτύων. Τα δεδομένα αποτελούνται από δείγματα 26 χαρακτήρες και 10 ψηφία γραμμένα από 11 συγγραφείς σε ένα tablet PC. Οι χαρακτήρες (σε τυπική μορφή UNIPEN) γραμμένα με κεφαλαία και πεζά και υπάρχει μια ολόκληρη δύο σετ των χαρακτήρων ανά συγγραφέα. Έτσι, η έξοδος θα πρέπει να είναι σε μία από τις 35 κατηγορίες. Ο απώτερος στόχος είναι η οικοδόμηση ενός συγγραφέα ανεξάρτητο μοντέλο για κάθε χαρακτήρα.
Η επιλογή του πολύτιμα χαρακτηριστικά είναι ζωτικής σημασίας για την αναγνώριση χαρακτήρων, ως εκ τούτου, μια νέα και ουσιαστική σύνολο των χαρακτηριστικών, ο Ενιαίος διαφορικό κανονικοποιημένο Συντεταγμένες (UDNC), που θεσπίστηκε από τον C. Agell, εγκρίνεται. Αυτά τα χαρακτηριστικά που εμφανίζονται να βελτιώσει το ποσοστό αναγνώρισης με τη χρήση απλών αλγορίθμων ταξινόμησης έτσι ώστε να χρησιμοποιούνται για να εκπαιδεύσει ένα νευρωνικό δίκτυο και να δοκιμάσουν τις επιδόσεις της στην UJI Pen Χαρακτήρες σύνολο δεδομένων.
Όροι Δείκτης:. Matlab, πηγή, κώδικα, OCR, οπτική αναγνώριση χαρακτήρων, σαρωμένο κείμενο, γραπτό κείμενο, ASCII, απομονωμένος χαρακτήρας
Απαιτήσεις :
Matlab
Τα σχόλια δεν βρέθηκε