ByteScout PDF Extractor SDK

Screenshot Λογισμικό:
ByteScout PDF Extractor SDK
Στοιχεία Λογισμικού:
Εκδοχή: 9.0.0.3079 επικαιροποιημένο
Ανεβάστε ημερομηνία: 15 Aug 18
Προγραμματιστής: ByteScout
Άδεια: Shareware
Τιμή: 10.00 $
Δημοτικότητα: 193
Μέγεθος: 596 Kb

Rating: 3.3/5 (Total Votes: 4)


        PDF Extractor SDK για προγραμματιστές λογισμικού Windows: PDF σε κείμενο, PDF σε XML, εικόνες από PDF, ανάγνωση PDF, PDF σε CSV για Excel.

Το Bytescout PDF Extractor SDK επιτρέπει τη μετατροπή PDF σε κείμενο, PDF σε XML, PDF σε CSV, εξαγωγή εικόνων από PDF, εξαγωγή πληροφοριών σχετικά με αρχεία PDF σε διασυνδέσεις .NET και ActiveX χωρίς επιπλέον λογισμικό.


Οφέλη:
 μετατρέπει το PDF σε απλό κείμενο (και μπορεί να ακολουθήσει στήλες εάν μετατρέπετε εφημερίδα σε μορφή PDF) - συμπεριλαμβανομένης της αόρατης εξαγωγής κειμένου.
 μετατρέπει τους πίνακες σε μορφή PDF σε Excel (CSV) διαβάζοντας κελιά από δεδομένο ορθογώνιο.
 μετατρέπει πίνακες σε αρχεία PDF σε αρχεία XML.
 εξάγει τα μεταδεδομένα του αρχείου PDF (τίτλος, συγγραφέας, περιγραφή) και να πάρει άλλες πληροφορίες σχετικά με το αρχείο (αριθμός σελίδων, κρυπτογραφημένο ή όχι)?
 εξάγει ενσωματωμένες εικόνες από έγγραφο PDF (σε ASP.NET, VB.NET, C #, VB6 και VBScript).
 Διεπαφές και κλάσεις DocumentMerger και DocumentSplitter για τη συγχώνευση και διάσπαση εγγράφων PDF.
δεν απαιτεί την εγκατάσταση του Adobe Reader ή άλλου λογισμικού ανάγνωσης PDF.
 παρέχει διασυνδέσεις .NET και ActiveX.
 με κωδικό C # που διαχειρίζεται 100%.
    

Τι νέο υπάρχει σε αυτήν την έκδοση:

Έκδοση 9.0.0.3079: Προστέθηκε φιλτράρισμα του εξαγόμενου περιεχομένου ανά όνομα γραμματοσειράς, μέγεθος γραμματοσειράς και χρώμα.
Ενημερώσατε τον κινητήρα OCR στην πιο πρόσφατη έκδοση. Ενημερώστε τα αρχεία γλώσσας από το φάκελο 'tessdata'.
Βελτιωμένη εξαγωγή κειμένου, ομαδοποίηση γραμμών σε πίνακες δεδομένων, απόδοση, εξαγωγή φορμών XFA, TableDetector, σταθερά ζητήματα ανάλυσης PDF.

Τι νέο υπάρχει στην έκδοση 8.7.0.2980:

Προστέθηκε φιλτράρισμα του εξαγόμενου περιεχομένου ανά όνομα γραμματοσειράς, μέγεθος γραμματοσειράς και χρώμα.
Ενημερώσατε τον κινητήρα OCR στην πιο πρόσφατη έκδοση. Ενημερώστε τα αρχεία γλώσσας από το φάκελο 'tessdata'.
Βελτιωμένη εξαγωγή κειμένου, ομαδοποίηση γραμμών σε πίνακες δεδομένων, απόδοση, εξαγωγή φορμών XFA, TableDetector, σταθερά ζητήματα ανάλυσης PDF.

Τι νέο υπάρχει στην έκδοση 8.6.0.2911:

Προστέθηκε φιλτράρισμα του εξαγόμενου περιεχομένου ανά όνομα γραμματοσειράς, μέγεθος γραμματοσειράς και χρώμα.
Ενημερώσατε τον κινητήρα OCR στην πιο πρόσφατη έκδοση. Ενημερώστε τα αρχεία γλώσσας από το φάκελο 'tessdata'.
Βελτιωμένη εξαγωγή κειμένου, ομαδοποίηση γραμμών σε πίνακες δεδομένων, απόδοση, εξαγωγή φορμών XFA, TableDetector, σταθερά ζητήματα ανάλυσης PDF.

Τι νέο υπάρχει στην έκδοση 8.2.0.2699:

Η έκδοση 8.2.0.2699 μπορεί να περιλαμβάνει ενημερώσεις, βελτιώσεις ή διορθώσεις σφαλμάτων που δεν έχουν προσδιοριστεί.

Τι είναι καινούργιο στην έκδοση 8.0.0.2528:

  • Προστέθηκε φιλτράρισμα του εξαγόμενου περιεχομένου ανά όνομα γραμματοσειράς, μέγεθος γραμματοσειράς και χρώμα.
  • Ενημερώθηκε ο μηχανισμός OCR στην πιο πρόσφατη έκδοση. Ενημέρωση αρχείων γλώσσας από το φάκελο "tessdata".
  • Βελτιωμένη εξαγωγή κειμένου.
  • Βελτιωμένη ομαδοποίηση γραμμών σε πίνακες δεδομένων.
  • Βελτιωμένη απόδοση.
  • Βελτιωμένη εξαγωγή φορμών XFA.
  • Βελτιωμένο TableDetector.
  • Σταθερά ζητήματα ανάλυσης PDF.
  • Αποκωδικοποίηση σταθερών εικόνων JBIG.
  • ImageExtractor: σταθερή εκτύπωση εικόνας ανά σελίδα.
  • MultimediaExtractor: σταθερή εξαγωγή στον ενσωματωμένο ήχο MPEG.
  • TextExtractor: σταθερή μη λειτουργούσα ιδιότητα RemoveHyphenation.
  • Άλλες δευτερεύουσες βελτιώσεις και διορθώσεις σφαλμάτων
  • Τι είναι καινούργια στην έκδοση 7.0.0.2474:

    Έκδοση 7.0.0.2474:

    • προστέθηκε νέα κλάση χρησιμότητας DocumentPrinter που επιτρέπει την εκτύπωση εγγράφων PDF σιωπηλά (χωρίς διαλόγους χρηστών)
    • προστέθηκε νέα κλάση JSONExtractor
    • Προστέθηκε παράκαμψη για τη μέθοδο DocumentSplitter.Split () που επιτρέπει τον καθορισμό του φακέλου εξόδου για τα δημιουργημένα αρχεία
    • Σταθερό σφάλμα πολλαπλών σπειρωμάτων στο DocumentSplitter
    • Το tableDetector σέβεται τώρα την περιοχή εξόρυξης που έχει οριστεί από τη μέθοδο SetExtractionArea ()
    • νέες ιδιότητες στις κλάσεις εξαγωγής: ExtractionColumns - περιέχει συντεταγμένες εντοπισμένων στηλών. CustomExtractionColumns - επιτρέπει την αντικατάσταση της ανίχνευσης στήλης
    • Οι μέθοδοι GetPageRect * δεν έλαβαν υπόψη την περιστροφή της σελίδας.
      Σταθερά σφάλματα στο πρόγραμμα εγκατάστασης που προκάλεσαν κάποια αρχεία από προηγούμενη εγκατάσταση παρεμποδίζουν τις ενημερώσεις
    • Επεξεργαστήκατε τον έλεγχο εγγραφής. Τώρα, η βιβλιοθήκη δεν θα ρίξει μια εξαίρεση, αλλά θα δουλέψει σε κατάσταση demo, αν χάσετε ή εισαγάγετε λάθος RegistrationName και RegistrationKey
    • PDF πολλαπλών εργαλείων: Προστέθηκε πρόσφατη λίστα εγγράφων στο κουμπί "Άνοιγμα εγγράφου PDF"
    • PDF πολλαπλών εργαλείων: Η επιλογή μπορεί να αλλάξει τώρα
    • PDF εργαλείο πολλαπλών εργαλείων: Προστέθηκε η δυνατότητα εξαγωγής JSON
    • PDF εργαλείο πολλαπλών εργαλείων: βελτιωμένο περιβάλλον χρήστη ανίχνευσης πίνακα
    • PDF εργαλείο πολλαπλών εργαλείων: Εξαιρετικά βελτιωμένη ποιότητα γραμματοσειράς
    • PDF εργαλείο πολλαπλών εργαλείων: Προστέθηκε η δυνατότητα εντοπισμού σφαλμάτων "Εμφάνιση ανιχνευμένων στήλων εξαγωγής" στο μενού περιβάλλοντος για την εμφάνιση των ανιχνευμένων στηλών στην τρέχουσα σελίδα. Γίνεται ορατό μόνο αφού εκτελέσετε οποιαδήποτε εξαγωγή σε σχέση με την τρέχουσα σελίδα που εμφανίζεται
    • PDF εργαλείο πολλαπλών εργαλείων: Σκληρό πρόβλημα εμφάνισης γραμματοσειράς σε Windows 32-bit
    • άλλες δευτερεύουσες βελτιώσεις και διορθώσεις σφαλμάτων

    Τι νέο υπάρχει στην έκδοση 6.30.0.2421:

    Version 6.30.0.2421:

    • Προστέθηκε η κλάση βοηθητικού προγράμματος TextComparer (διαθέσιμη μόνο σε συναρμολογήσεις .NET 4.0) που επιτρέπει τη σύγκριση κειμένου σε δύο έγγραφα PDF και τη δημιουργία αναφοράς.
    • Βελτιωμένη υποστήριξη των προφίλ χρωμάτων ICC.
    • Εισαγόμενος χειρισμός ενσωματωμένων γραμματοσειρών.
    • Βελτιωμένος εξολκέας προσάρτησης.
    • Σταθερή μέθοδος XMLExtractor.SaveXMLToStream ().
    • Διόρθωση εξαγόμενου κειμένου όταν χρησιμοποιείται η επιλογή OCRCacheMode.WholePage.
    • Άλλες διορθώσεις και βελτιώσεις σφαλμάτων.

    Τι νέο υπάρχει στην έκδοση 6.20.2354:

    Έκδοση 6.20.2354:

    • PDF σε κείμενο, PDF σε CSV, PDF Λειτουργίες XML βελτιωμένες
    • Νέα εξαγωγή βίντεο, εξαγωγή παραδείγματα ήχου
    • Οι εξαγνιστές CSV και XML βελτίωσαν την υποστήριξη για πίνακες με κενές στήλες μέσα
    • νέο MultimediaExtractor για την εξαγωγή βίντεο και ήχου από PDF
    • νέα ιδιότητα PageDataCaching
    • νέο παράδειγμα "MemoryCareProcessingOfHugeFiles"
    • σταθερή μηδενική εξαίρεση όταν προσπαθείτε να διαθέσετε ήδη διατεταγμένες σελίδες
    • XLSExtractor: βελτιώνει την υποστήριξη γραμματοσειρών
    • Το SkipInvisibleText παρακάμπτει τώρα το κείμενο που έχει αποκοπεί (το οποίο δεν είναι ορατό)
    • βελτιωμένη απόδοση εξόδου κειμένου
    • XFDF Extractor: πρόσθετη υποστήριξη για πλαίσια ελέγχου
    • Η έξοδος των εικόνων βελτιώθηκε για να υποστηρίξει περισσότερες υπο-μορφές
    • Ο χειρισμός κειμένου Unicode βελτιώθηκε

    Τι νέο υπάρχει στην έκδοση 6.11.2149:

    Έκδοση 6.11.2149:

    • Επεξεργασία παρτίδας ενημερωμένων δειγμάτων για να δείξει τη χρήση της μεθόδου Επαναφορά ()
    • Προστέθηκε το δείγμα κώδικα C ++ για την Εξαγωγή σελίδων
    • DocumentMerger προσθέτει τη μέθοδο Merge2 (inputfile1, inputfile2, outputfile) για συγχώνευση 2 αρχείων
    • XLS Extractor διορθώσεις μικρών σφαλμάτων
    • Το PDF Multitool επιτρέπει πλέον την ενεργοποίηση / απενεργοποίηση κειμένου, εικόνας, διανυσματικών επιπέδων, προσθέτει σύνθετες ρυθμίσεις για την εξαγωγή κειμένου
    • XML, CSV, εξαγωγή πίνακα βελτιώνει την υποστήριξη για πίνακες με κελιά emtpry μέσα σε στήλες
    • Εξαιρετική ιδιότητα ExtractShadowLikeText βελτιώθηκε: καλύτερη διήθηση για σκιασμένο κείμενο

    Τι νέο υπάρχει στην έκδοση 6.10.2136:

    Έκδοση 6.10.2136:

    • PDF σε XML, PDF σε CSV, PDF σε λειτουργικότητα κειμένου βελτιωμένη
    • PDF Το δείγμα της γραμμής εντολών XLS προστέθηκε (με βάση το vbscript)
    • PDF Στο SDK HTML προσθέτει νέα ιδιότητα .DetectHyperLinks (TRUE από προεπιλογή) για την ενεργοποίηση / απενεργοποίηση της αυτόματης ανίχνευσης συνδέσεων στο κείμενο
    • το νέο SearchablePDFMaker (διαθέσιμο για τις άδειες PRO) για τη μετατροπή του PDF σε αρχεία PDF με δυνατότητα αναζήτησης
    • νέες ιδιότητες στον εξαγνιστή: ConsiderFontNames, ConsiderFontSizes, ConsiderFontColors, ConsiderVerticalBorders σε αρχεία CFG
    • Ανίχνευση στηλών κεφαλίδας (όταν το AutoAlighHeaderToColumns = true) βελτιώθηκε
    • .DetectLinesInsteadOfParagraphs αντικαταστάθηκε με νέο .LineGroupingMode για τον έλεγχο της συγχώνευσης των γραμμών σε παραγράφους
    • ΣΗΜΑΝΤΙΚΟ! PDF To XML διορθώνει το μεγάλο χρονικό ζήτημα με εσφαλμένη συντεταγμένη Y για αντικείμενα κειμένου (ήταν το σημείο προς τα κάτω αριστερά αντί για πάνω αριστερά)
    • Τα χαρακτηριστικάTableXMinIntersectionRequiredInPercents και .TableYMinIntersectionRequiredInPercents προστέθηκαν
    • Προστέθηκε το δείγμα κώδικα C ++
    • Το XML Extractor διορθώνει λείπει κενές στήλες στο PreserveFormatting = true mode
    • Μικρές διορθώσεις σε χρώματα σε ορισμένα αρχεία PDF
    • υποστήριξη για την προσθήκη πολλών γλωσσών OCR
    • PDF GUI πολλαπλών εργαλείων: προσθέτει το κουμπί Αντιγραφή στο Πρόχειρο σε διαλόγους TXT, CSV, XML και raster renderer
    • XLSExtractor: προσθέτει την ιδιότητα PageToWorksheet για την ενεργοποίηση / απενεργοποίηση της δημιουργίας ξεχωριστών φύλλων εργασίας ανά σελίδα
    • νέα ιδιότητα .TextEncodingCodePage
    • PDFViewerControl: προσθέτει το ValidateContextMenu που επιτρέπει στο χρήστη να προσθέσει προσαρμοσμένα στοιχεία στο μενού περιβάλλοντος
    • Έλεγχος προβολής PDF: προσθέτει ιδιότητες ShowTextObjects, ShowImageObjects, ShowVectorObjects
    • Το XMLExtractor προσθέτει τώρα το χαρακτηριστικό "OCRConfidence" για αναγνωρισμένο κείμενο
    • Λειτουργικότητα ελέγχου PDF / A (σε έκδοση beta)
    • βελτίωση των ελέγχων και του ελέγχου κειμένου και της ευθυγράμμισης σύμφωνα με την αρχική διάταξη. Το ζήτημα προκλήθηκε από τη μετατόπιση των συντεταγμένων Υ στους ελέγχους κατά την ανάλυση: αυτό ήταν λανθασμένο. Ο σωστός τρόπος είναι να ...
    • XML Extractor ενημερώθηκε: τώρα παράγει ετικέτα CONTROL για πλαίσια ελέγχου και πεδία κειμένου
    • άλλαξε με χρήση του τρέχοντος καταλόγου σε temp directory
    • πλαίσια ελέγχου, ραδιοτηλεφωνικά κουτάκια, κουτιά επεξεργασίας, ενισχυτικά πλαίσια υποστηρίζονται καλύτερα
    • τώρα επιτρέπει κλήσεις μερικής εμπιστοσύνης

    Τι είναι καινούργιο στην έκδοση 5.80.1781:

    Έκδοση 5.80.1781:

    • ενημερώθηκε η λειτουργικότητα PDF σε XML, PDF σε CSV, PDF σε κείμενο
    • Το OCRMode παρέχει τώρα 9 λειτουργίες
    • .DetectLineInsteadOfParagraph τώρα λειτουργεί πολύ καλύτερα. Ρυθμίστε το σε Ψευδές για να συλλάβετε κείμενο πολλαπλών γραμμών σε κελιά πίνακα!
    • Ο έλεγχος του PDF υποστηρίζεται βελτιωμένος
    • Εξαγωγή δεδομένων FDF και XFDF

      Τι είναι καινούργιο στην έκδοση 5.10.1747:

      Έκδοση 5.10.1747:

      • Βελτιωμένες λειτουργίες PDF σε XML, PDF σε CSV, PDF σε κείμενο
      • τώρα υποστηρίζει την εξαγωγή κειμένου από τα στοιχεία ελέγχου κειμένου
      • Ο εκχυλιστής XML προσθέτει τώρα ετικέτες σε στυλ γραμματοσειράς, μέγεθος, όνομα, συντεταγμένες κειμένου
      • Προστέθηκε δείγμα ASP.NET για χρήση OCR
      • νέα ιδιότητα OCRLanguageDataFolder για να καθορίσετε τη θέση του φακέλου "tessdata"
      • βελτιωμένη υποστήριξη αρχείων PDF
      • βελτιώνει την υποστήριξη για το περιστρεφόμενο κείμενο
      • ενημερωμένα δείγματα πηγαίου κώδικα
      • ενημερωμένη τεκμηρίωση
      • μικρές βελτιώσεις και διορθώσεις

      Τι νέο υπάρχει στην έκδοση 5.00.1626:

      Έκδοση 5.00.1626:

      • Προστέθηκε λειτουργικότητα OCR (κείμενο από εικόνες): τώρα μπορείτε να εξαγάγετε κείμενο από ενσωματωμένες εικόνες και να επιδιορθώσετε κατεστραμμένο κείμενο
      • πρόβλημα που έχει καθοριστεί με CSV και XML Extractor που λείπουν από τις τελευταίες στήλες με κάποιες ρυθμίσεις
      • βελτιωμένη υποστήριξη για κατεστραμμένα αρχεία PDF
      • Λειτουργία αναζήτησης πολλαπλών γραμμών αναζήτησης με τρόπους αντιστοίχισης λέξεων τώρα υποστηρίζεται
      • τώρα μπορείτε να αναζητήσετε κείμενο με παύλες και σε διαφορετικές γραμμές: δείτε νέο δείγμα πηγαίου κώδικα Εύρεση κειμένου με ύφους
      • νέα ιδιότητα .RTLTextAutoDetectionEnabled (εσφαλμένη από προεπιλογή) για την αυτόματη ανίχνευση γλωσσών RTL
      • Το demo του PDF Viewer GUI βελτιώθηκε
      • μικρές βελτιώσεις και διορθώσεις

        Απαιτήσεις :

        .NET Framework 2.0 ή νεότερα

        Περιορισμοί

        strong>:

        Οθόνη Nag, υδατογράφημα στην έξοδο

    Υποστηριζόμενα συστήματα λειτουργίας

    Παρόμοια λογισμικά

    Άλλο λογισμικό του προγραμματιστή ByteScout

    Σχόλια για ByteScout PDF Extractor SDK

    Τα σχόλια δεν βρέθηκε
    προσθήκη σχολίου
    Ενεργοποιήστε τις εικόνες!