PdfParser είναι ένα open source, φορητό, δωρεάν, ανεξάρτητα από την πλατφόρμα, web-based και αυτόνομο βιβλιοθήκη λογισμικού που αποτελείται από διάφορα βοηθητικά προγράμματα για την εξαγωγή δεδομένων από PDF (Portable Document Format) files.Features σε glanceIt έχει κατασκευαστεί σε τέτοιες ένας τρόπος που μπορεί να φορτώσει και να αναλύσει τις κεφαλίδες και τα αντικείμενα, εξάγει μεταδεδομένα πληροφορίες (περιγραφή, συγγραφέας ή λέξεις-κλειδιά), υποστηρίζει συμπιεσμένα έγγραφα PDF, καθώς και αποσπάσματα κειμένων από διέταξε σελίδες.
Επιπλέον, το λογισμικό υποστηρίζει διάφορες κωδικοποιήσεις σύνολο χαρακτήρων (Mac OS Ρωμαϊκή και Windows ANSI), είναι πλήρως συμβατό με τα πρότυπα PSR-0 και PSR-1, και συμβατή με τον συνθέτη. Επίσης, μπορεί να χειριστεί οκταδικό και το περιεχόμενο εξα κωδικοποιήσεις σε τμήματα κειμένου.
Δυστυχώς, αυτή τη στιγμή, το λογισμικό της βιβλιοθήκης PdfParser δεν υποστηρίζει εξασφάλισε έγγραφα PDF. Ως εκ τούτου, αν θέλετε να αναλύσει τα αρχεία PDF που έχουν κρυπτογραφηθεί ή προστατεύεται με κωδικό πρόσβασης, κερδίσατε & rsquo? T να είναι σε θέση να το κάνουμε αυτό με αυτό software.Getting ξεκίνησε με το λογισμικό PdfParserThe PdfParser έχει σχεδιαστεί για να τρέχει πάνω από ένα web server. Είναι & rsquo? Sa βιβλιοθήκη της PHP, γι 'αυτό θα απαιτήσει την PHP 5.3 ή νεότερη έκδοση εγκατεστημένο στον server σας. Προέρχεται από το λογισμικό TCPDF βιβλιοθήκη parser.
Εγκατάσταση PdfParser είναι αρκετά εύκολο, καθώς η συσκευασία μπορεί να κατεβάσει αυτόματα στον κεντρικό υπολογιστή σας χρησιμοποιώντας το πρόγραμμα Συνθέτης γραμμής εντολών. Ως εκ τούτου, θα πρέπει πρώτα να προσθέσετε το λογισμικό στο αρχείο composer.json σας και, στη συνέχεια, χρησιμοποιήστε το & lsquo? Ενημέρωση συνθέτης smalot / pdfparser & rsquo? εντολή για να το κατεβάσετε.
Όπως αναφέρθηκε, PdfParser μπορούν επίσης να χρησιμοποιηθούν ως αυτόνομη βιβλιοθήκη. Για το σκοπό αυτό, θα πρέπει να αρπάξει τον πηγαίο κώδικα του από GitHub, στη συνέχεια, εκτελέστε το & lsquo? Συνθέτης ενημέρωση & rsquo? εντολή για να κατεβάσετε αυτόματα τυχόν εξαρτήσεις και τη δημιουργία του αρχείου autoload.php. Περισσότερες λεπτομέρειες μπορείτε να βρείτε στο έργο & rsquo? S ιστοσελίδα (βλέπε σύνδεσμο παρακάτω) .Under την κουκούλα και υποστηριζόμενο λειτουργικό systemsLooking κάτω από την κουκούλα του PdfParser, μπορούμε να παρατηρήσουμε ότι το πρόγραμμα είναι γραμμένο σε γλώσσα PHP server-side προγραμματισμό. Αυτό σημαίνει ότι μπορεί να χρησιμοποιηθεί σε οποιοδήποτε λειτουργικό σύστημα, υποστηρίζει και 32-bit και το σετ εντολών 64-bit αρχιτεκτονικές
Τι είναι καινούργιο σε αυτή την έκδοση:.
- Συγχώνευση έλξη αίτημα # 41 από scotam / τεύχος-33
- Διόρθωση για κλάσεις αντικειμένων επέστρεψε ως Γραμματοσειρές
Τι είναι καινούργιο στην έκδοση 0.9.20:
- Αυτή η έκδοση διορθώνει κάποια σφάλματα στο parsing (γραμματοσειρά, εξασφαλισμένα αρχεία, κλπ.).
- Η εξάρτηση TCPDF πρέπει να ενημερωθεί.
Τι είναι καινούργιο στην έκδοση 0.9.19:
- Αυτή η έκδοση σταθερού xobject εξόρυξη κειμένου και πρόσθεσε Εναλλακτικό κείμενο σε περίπτωση γραμματοσειρές που λείπουν.
Απαιτήσεις :
- PHP
Τα σχόλια δεν βρέθηκε