PDFTextStream

Screenshot Λογισμικό:
PDFTextStream
Στοιχεία Λογισμικού:
Εκδοχή: 2.6.0
Ανεβάστε ημερομηνία: 20 Feb 15
Προγραμματιστής: Snowtide Informatics Systems, Inc.
Άδεια: Shareware
Τιμή: 1900.00 $
Δημοτικότητα: 2

Rating: nan/5 (Total Votes: 0)

PDFTextStream έργο είναι μια βιβλιοθήκη εξαγωγή PDF κειμένου και μεταδεδομένα που είναι διαθέσιμα για Java, Python, και .NET.
Υποστηρίζει όλες τις εκδόσεις των προδιαγραφών του εγγράφου PDF, (συμπεριλαμβανομένων v1.6, που χρησιμοποιείται από το Acrobat 7), η εξαγωγή του κειμένου κωδικοποιούνται χρησιμοποιώντας σύνολα χαρακτήρων δύο byte (συμπεριλαμβανομένης της Κίνας, της Ιαπωνίας, της Κορέας και), αποκρυπτογράφηση των 40-bit και 128- λίγο κρυπτογραφημένα έγγραφα, και εξαγωγή όλων των μεταδεδομένων εγγράφων που προβλέπονται από τα έγγραφα PDF (συμπεριλαμβανομένων των δεδομένων φόρμας, σελιδοδείκτες και τους σχολιασμούς).
Εύκολη ενσωμάτωση με Τζακάρτα Lucene συμπεριλαμβάνεται

Τι είναι καινούργιο σε αυτή την έκδοση:.

  • Αυτή η έκδοση περιλαμβάνει μια ποικιλία από τις ενημερώσεις κώδικα που για να εξασφαλίσει PDFTextStream είναι ικανή για την εξαγωγή κειμένου από έγγραφα PDF που είναι μη συμμορφούμενων με τις προδιαγραφές PDF.
  • Περιλαμβάνει επίσης μια ποικιλία από βελτιώσεις στις επιδόσεις.

Τι είναι καινούργιο στην έκδοση 2.3.0:

  • Προστέθηκε μια μέθοδο .isStruckThrough () για να com. snowtide.pdf.TextUnit, αναφέροντας αν ένας χαρακτήρας έχει διαγράμμιση που μέσα από αυτό.
  • Βελτιωμένη υποστήριξη PDFTextStream για ενσωματωμένα αντιστοιχίσεις χαρακτήρα.
  • Ο υπολογισμός του κενού διαστήματος μεταξύ των λέξεων έχει καθοριστεί για την ορθή αντιπροσωπεύουν κενά που κωδικοποιείται ρητά στα έγγραφα PDF πηγή.
  • Βελτίωση του χειρισμού PDFTextStream των σύνθετων κωδικοποιήσεις περιεχομένου, η οποία στο παρελθόν θα μπορούσε να αποτύχει με αποτέλεσμα σε ορισμένες περιοχές του περιεχομένου PDF να «αγνοείται» κατά την εκχύλιση.
  • Διορθώθηκε ένα bug στο VisualOutputTarget όπου το κείμενο από μια ενιαία γραμμή θα χωριστεί σε πολλαπλές γραμμές
  • Βελτιωμένη κάθετη ευθυγράμμιση του κειμένου με εκχύλιση με VisualOutputTarget
  • Βελτιωμένη VisualOutputTarget παράγονται εκχυλίσματα για την εξάλειψη των παρασιτικών επιπλέον κενά μεταξύ στενά παρακείμενων λέξεις

Τι είναι καινούργιο στην έκδοση 2.2.5:

  • Αυτή η έκδοση προσθέτει υποστήριξη για την εξαγωγή δεδομένων XFA μορφές όπως XML.
  • Βελτιώνει σημαντικά την απόδοση της εξόρυξης κειμένου χρησιμοποιώντας VisualOutputTarget. Υποστήριξη για έγγραφα PDF μεγαλύτερα από 2GB.
  • Μια ενημέρωση κώδικα για ένα bug όπου οι κωδικοποιήσεις από ενσωματωμένες γραμματοσειρές Type1 ήταν προηγουμένως δεν εφαρμόζονται σωστά σε ορισμένες περιπτώσεις.
  • Μια λύση για ένα πρόβλημα όπου ο νεότερος περιεχόμενο στα επικαιροποιημένα έγγραφα PDF μερικές φορές αγνοούνται.
  • Μια λύση για ένα πρόβλημα όπου PDFDocEncoding-κωδικοποιημένα σελιδοδείκτες και τα μεταδεδομένα δεν έχει αποκωδικοποιηθεί σωστά.
  • Ένα .getDestinationName () μέθοδο com.snowtide.pdf.Bookmark.

Απαιτήσεις :

  • Apache Lucene

Σχόλια για PDFTextStream

Τα σχόλια δεν βρέθηκε
προσθήκη σχολίου
Ενεργοποιήστε τις εικόνες!