Κατεβάστε το δωρεάν ByteScout PDF Extractor SDK για Windows 10 ::: Εξαρτήματα & Βιβλιοθήκες

ByteScout PDF Extractor SDK

Screenshot Λογισμικό:

Στοιχεία Λογισμικού:

Εκδοχή: 9.0.0.3079 ^{επικαιροποιημένο}

Ανεβάστε ημερομηνία: 15 Aug 18

Προγραμματιστής: ByteScout

Άδεια: Shareware

Τιμή: 10.00 $

Δημοτικότητα: 193

Μέγεθος: 596 Kb

κατεβάσετε

Currently 3.40/5
1
2
3
4
5

Rating: 3.4/5 (Total Votes: 5)

PDF Extractor SDK για προγραμματιστές λογισμικού Windows: PDF σε κείμενο, PDF σε XML, εικόνες από PDF, ανάγνωση PDF, PDF σε CSV για Excel.

Το Bytescout PDF Extractor SDK επιτρέπει τη μετατροπή PDF σε κείμενο, PDF σε XML, PDF σε CSV, εξαγωγή εικόνων από PDF, εξαγωγή πληροφοριών σχετικά με αρχεία PDF σε διασυνδέσεις .NET και ActiveX χωρίς επιπλέον λογισμικό.

Οφέλη:
μετατρέπει το PDF σε απλό κείμενο (και μπορεί να ακολουθήσει στήλες εάν μετατρέπετε εφημερίδα σε μορφή PDF) - συμπεριλαμβανομένης της αόρατης εξαγωγής κειμένου.
μετατρέπει τους πίνακες σε μορφή PDF σε Excel (CSV) διαβάζοντας κελιά από δεδομένο ορθογώνιο.
μετατρέπει πίνακες σε αρχεία PDF σε αρχεία XML.
εξάγει τα μεταδεδομένα του αρχείου PDF (τίτλος, συγγραφέας, περιγραφή) και να πάρει άλλες πληροφορίες σχετικά με το αρχείο (αριθμός σελίδων, κρυπτογραφημένο ή όχι)?
εξάγει ενσωματωμένες εικόνες από έγγραφο PDF (σε ASP.NET, VB.NET, C #, VB6 και VBScript).
Διεπαφές και κλάσεις DocumentMerger και DocumentSplitter για τη συγχώνευση και διάσπαση εγγράφων PDF.
δεν απαιτεί την εγκατάσταση του Adobe Reader ή άλλου λογισμικού ανάγνωσης PDF.
παρέχει διασυνδέσεις .NET και ActiveX.
με κωδικό C # που διαχειρίζεται 100%.

Τι νέο υπάρχει σε αυτήν την έκδοση:

Έκδοση 9.0.0.3079: Προστέθηκε φιλτράρισμα του εξαγόμενου περιεχομένου ανά όνομα γραμματοσειράς, μέγεθος γραμματοσειράς και χρώμα.
Ενημερώσατε τον κινητήρα OCR στην πιο πρόσφατη έκδοση. Ενημερώστε τα αρχεία γλώσσας από το φάκελο 'tessdata'.
Βελτιωμένη εξαγωγή κειμένου, ομαδοποίηση γραμμών σε πίνακες δεδομένων, απόδοση, εξαγωγή φορμών XFA, TableDetector, σταθερά ζητήματα ανάλυσης PDF.

Τι νέο υπάρχει στην έκδοση 8.7.0.2980:

Προστέθηκε φιλτράρισμα του εξαγόμενου περιεχομένου ανά όνομα γραμματοσειράς, μέγεθος γραμματοσειράς και χρώμα.
Ενημερώσατε τον κινητήρα OCR στην πιο πρόσφατη έκδοση. Ενημερώστε τα αρχεία γλώσσας από το φάκελο 'tessdata'.
Βελτιωμένη εξαγωγή κειμένου, ομαδοποίηση γραμμών σε πίνακες δεδομένων, απόδοση, εξαγωγή φορμών XFA, TableDetector, σταθερά ζητήματα ανάλυσης PDF.

Τι νέο υπάρχει στην έκδοση 8.6.0.2911:

Τι νέο υπάρχει στην έκδοση 8.2.0.2699:

Η έκδοση 8.2.0.2699 μπορεί να περιλαμβάνει ενημερώσεις, βελτιώσεις ή διορθώσεις σφαλμάτων που δεν έχουν προσδιοριστεί.

Τι είναι καινούργιο στην έκδοση 8.0.0.2528:

Προστέθηκε φιλτράρισμα του εξαγόμενου περιεχομένου ανά όνομα γραμματοσειράς, μέγεθος γραμματοσειράς και χρώμα.

Ενημερώθηκε ο μηχανισμός OCR στην πιο πρόσφατη έκδοση. Ενημέρωση αρχείων γλώσσας από το φάκελο "tessdata".

Βελτιωμένη εξαγωγή κειμένου.

Βελτιωμένη ομαδοποίηση γραμμών σε πίνακες δεδομένων.

Βελτιωμένη απόδοση.

Βελτιωμένη εξαγωγή φορμών XFA.

Βελτιωμένο TableDetector.

Σταθερά ζητήματα ανάλυσης PDF.

Αποκωδικοποίηση σταθερών εικόνων JBIG.

ImageExtractor: σταθερή εκτύπωση εικόνας ανά σελίδα.

MultimediaExtractor: σταθερή εξαγωγή στον ενσωματωμένο ήχο MPEG.

TextExtractor: σταθερή μη λειτουργούσα ιδιότητα RemoveHyphenation.

Άλλες δευτερεύουσες βελτιώσεις και διορθώσεις σφαλμάτων

Τι είναι καινούργια στην έκδοση 7.0.0.2474:

Έκδοση 7.0.0.2474:

προστέθηκε νέα κλάση χρησιμότητας DocumentPrinter που επιτρέπει την εκτύπωση εγγράφων PDF σιωπηλά (χωρίς διαλόγους χρηστών)
προστέθηκε νέα κλάση JSONExtractor
Προστέθηκε παράκαμψη για τη μέθοδο DocumentSplitter.Split () που επιτρέπει τον καθορισμό του φακέλου εξόδου για τα δημιουργημένα αρχεία
Σταθερό σφάλμα πολλαπλών σπειρωμάτων στο DocumentSplitter
Το tableDetector σέβεται τώρα την περιοχή εξόρυξης που έχει οριστεί από τη μέθοδο SetExtractionArea ()
νέες ιδιότητες στις κλάσεις εξαγωγής: ExtractionColumns - περιέχει συντεταγμένες εντοπισμένων στηλών. CustomExtractionColumns - επιτρέπει την αντικατάσταση της ανίχνευσης στήλης
Οι μέθοδοι GetPageRect * δεν έλαβαν υπόψη την περιστροφή της σελίδας.
Σταθερά σφάλματα στο πρόγραμμα εγκατάστασης που προκάλεσαν κάποια αρχεία από προηγούμενη εγκατάσταση παρεμποδίζουν τις ενημερώσεις
Επεξεργαστήκατε τον έλεγχο εγγραφής. Τώρα, η βιβλιοθήκη δεν θα ρίξει μια εξαίρεση, αλλά θα δουλέψει σε κατάσταση demo, αν χάσετε ή εισαγάγετε λάθος RegistrationName και RegistrationKey
PDF πολλαπλών εργαλείων: Προστέθηκε πρόσφατη λίστα εγγράφων στο κουμπί "Άνοιγμα εγγράφου PDF"
PDF πολλαπλών εργαλείων: Η επιλογή μπορεί να αλλάξει τώρα
PDF εργαλείο πολλαπλών εργαλείων: Προστέθηκε η δυνατότητα εξαγωγής JSON
PDF εργαλείο πολλαπλών εργαλείων: βελτιωμένο περιβάλλον χρήστη ανίχνευσης πίνακα

PDF εργαλείο πολλαπλών εργαλείων: Εξαιρετικά βελτιωμένη ποιότητα γραμματοσειράς
PDF εργαλείο πολλαπλών εργαλείων: Προστέθηκε η δυνατότητα εντοπισμού σφαλμάτων "Εμφάνιση ανιχνευμένων στήλων εξαγωγής" στο μενού περιβάλλοντος για την εμφάνιση των ανιχνευμένων στηλών στην τρέχουσα σελίδα. Γίνεται ορατό μόνο αφού εκτελέσετε οποιαδήποτε εξαγωγή σε σχέση με την τρέχουσα σελίδα που εμφανίζεται
PDF εργαλείο πολλαπλών εργαλείων: Σκληρό πρόβλημα εμφάνισης γραμματοσειράς σε Windows 32-bit
άλλες δευτερεύουσες βελτιώσεις και διορθώσεις σφαλμάτων

Τι νέο υπάρχει στην έκδοση 6.30.0.2421:

Version 6.30.0.2421:

Προστέθηκε η κλάση βοηθητικού προγράμματος TextComparer (διαθέσιμη μόνο σε συναρμολογήσεις .NET 4.0) που επιτρέπει τη σύγκριση κειμένου σε δύο έγγραφα PDF και τη δημιουργία αναφοράς.
Βελτιωμένη υποστήριξη των προφίλ χρωμάτων ICC.
Εισαγόμενος χειρισμός ενσωματωμένων γραμματοσειρών.
Βελτιωμένος εξολκέας προσάρτησης.
Σταθερή μέθοδος XMLExtractor.SaveXMLToStream ().
Διόρθωση εξαγόμενου κειμένου όταν χρησιμοποιείται η επιλογή OCRCacheMode.WholePage.
Άλλες διορθώσεις και βελτιώσεις σφαλμάτων.

Τι νέο υπάρχει στην έκδοση 6.20.2354:

Έκδοση 6.20.2354:

PDF σε κείμενο, PDF σε CSV, PDF Λειτουργίες XML βελτιωμένες
Νέα εξαγωγή βίντεο, εξαγωγή παραδείγματα ήχου
Οι εξαγνιστές CSV και XML βελτίωσαν την υποστήριξη για πίνακες με κενές στήλες μέσα
νέο MultimediaExtractor για την εξαγωγή βίντεο και ήχου από PDF
νέα ιδιότητα PageDataCaching
νέο παράδειγμα "MemoryCareProcessingOfHugeFiles"
σταθερή μηδενική εξαίρεση όταν προσπαθείτε να διαθέσετε ήδη διατεταγμένες σελίδες
XLSExtractor: βελτιώνει την υποστήριξη γραμματοσειρών
Το SkipInvisibleText παρακάμπτει τώρα το κείμενο που έχει αποκοπεί (το οποίο δεν είναι ορατό)
βελτιωμένη απόδοση εξόδου κειμένου
XFDF Extractor: πρόσθετη υποστήριξη για πλαίσια ελέγχου
Η έξοδος των εικόνων βελτιώθηκε για να υποστηρίξει περισσότερες υπο-μορφές
Ο χειρισμός κειμένου Unicode βελτιώθηκε

Τι νέο υπάρχει στην έκδοση 6.11.2149:

Έκδοση 6.11.2149:

Επεξεργασία παρτίδας ενημερωμένων δειγμάτων για να δείξει τη χρήση της μεθόδου Επαναφορά ()
Προστέθηκε το δείγμα κώδικα C ++ για την Εξαγωγή σελίδων
DocumentMerger προσθέτει τη μέθοδο Merge2 (inputfile1, inputfile2, outputfile) για συγχώνευση 2 αρχείων
XLS Extractor διορθώσεις μικρών σφαλμάτων
Το PDF Multitool επιτρέπει πλέον την ενεργοποίηση / απενεργοποίηση κειμένου, εικόνας, διανυσματικών επιπέδων, προσθέτει σύνθετες ρυθμίσεις για την εξαγωγή κειμένου
XML, CSV, εξαγωγή πίνακα βελτιώνει την υποστήριξη για πίνακες με κελιά emtpry μέσα σε στήλες
Εξαιρετική ιδιότητα ExtractShadowLikeText βελτιώθηκε: καλύτερη διήθηση για σκιασμένο κείμενο

Τι νέο υπάρχει στην έκδοση 6.10.2136:

Έκδοση 6.10.2136:

PDF σε XML, PDF σε CSV, PDF σε λειτουργικότητα κειμένου βελτιωμένη
PDF Το δείγμα της γραμμής εντολών XLS προστέθηκε (με βάση το vbscript)
PDF Στο SDK HTML προσθέτει νέα ιδιότητα .DetectHyperLinks (TRUE από προεπιλογή) για την ενεργοποίηση / απενεργοποίηση της αυτόματης ανίχνευσης συνδέσεων στο κείμενο
το νέο SearchablePDFMaker (διαθέσιμο για τις άδειες PRO) για τη μετατροπή του PDF σε αρχεία PDF με δυνατότητα αναζήτησης
νέες ιδιότητες στον εξαγνιστή: ConsiderFontNames, ConsiderFontSizes, ConsiderFontColors, ConsiderVerticalBorders σε αρχεία CFG
Ανίχνευση στηλών κεφαλίδας (όταν το AutoAlighHeaderToColumns = true) βελτιώθηκε
.DetectLinesInsteadOfParagraphs αντικαταστάθηκε με νέο .LineGroupingMode για τον έλεγχο της συγχώνευσης των γραμμών σε παραγράφους
ΣΗΜΑΝΤΙΚΟ! PDF To XML διορθώνει το μεγάλο χρονικό ζήτημα με εσφαλμένη συντεταγμένη Y για αντικείμενα κειμένου (ήταν το σημείο προς τα κάτω αριστερά αντί για πάνω αριστερά)
Τα χαρακτηριστικάTableXMinIntersectionRequiredInPercents και .TableYMinIntersectionRequiredInPercents προστέθηκαν
Προστέθηκε το δείγμα κώδικα C ++
Το XML Extractor διορθώνει λείπει κενές στήλες στο PreserveFormatting = true mode
Μικρές διορθώσεις σε χρώματα σε ορισμένα αρχεία PDF
υποστήριξη για την προσθήκη πολλών γλωσσών OCR

PDF GUI πολλαπλών εργαλείων: προσθέτει το κουμπί Αντιγραφή στο Πρόχειρο σε διαλόγους TXT, CSV, XML και raster renderer
XLSExtractor: προσθέτει την ιδιότητα PageToWorksheet για την ενεργοποίηση / απενεργοποίηση της δημιουργίας ξεχωριστών φύλλων εργασίας ανά σελίδα
νέα ιδιότητα .TextEncodingCodePage
PDFViewerControl: προσθέτει το ValidateContextMenu που επιτρέπει στο χρήστη να προσθέσει προσαρμοσμένα στοιχεία στο μενού περιβάλλοντος
Έλεγχος προβολής PDF: προσθέτει ιδιότητες ShowTextObjects, ShowImageObjects, ShowVectorObjects
Το XMLExtractor προσθέτει τώρα το χαρακτηριστικό "OCRConfidence" για αναγνωρισμένο κείμενο
Λειτουργικότητα ελέγχου PDF / A (σε έκδοση beta)
βελτίωση των ελέγχων και του ελέγχου κειμένου και της ευθυγράμμισης σύμφωνα με την αρχική διάταξη. Το ζήτημα προκλήθηκε από τη μετατόπιση των συντεταγμένων Υ στους ελέγχους κατά την ανάλυση: αυτό ήταν λανθασμένο. Ο σωστός τρόπος είναι να ...
XML Extractor ενημερώθηκε: τώρα παράγει ετικέτα CONTROL για πλαίσια ελέγχου και πεδία κειμένου
άλλαξε με χρήση του τρέχοντος καταλόγου σε temp directory
πλαίσια ελέγχου, ραδιοτηλεφωνικά κουτάκια, κουτιά επεξεργασίας, ενισχυτικά πλαίσια υποστηρίζονται καλύτερα
τώρα επιτρέπει κλήσεις μερικής εμπιστοσύνης

Τι είναι καινούργιο στην έκδοση 5.80.1781:

Έκδοση 5.80.1781:

ενημερώθηκε η λειτουργικότητα PDF σε XML, PDF σε CSV, PDF σε κείμενο
Το OCRMode παρέχει τώρα 9 λειτουργίες
.DetectLineInsteadOfParagraph τώρα λειτουργεί πολύ καλύτερα. Ρυθμίστε το σε Ψευδές για να συλλάβετε κείμενο πολλαπλών γραμμών σε κελιά πίνακα!
Ο έλεγχος του PDF υποστηρίζεται βελτιωμένος
Εξαγωγή δεδομένων FDF και XFDF

Τι είναι καινούργιο στην έκδοση 5.10.1747:

Έκδοση 5.10.1747:
- Βελτιωμένες λειτουργίες PDF σε XML, PDF σε CSV, PDF σε κείμενο
- τώρα υποστηρίζει την εξαγωγή κειμένου από τα στοιχεία ελέγχου κειμένου
- Ο εκχυλιστής XML προσθέτει τώρα ετικέτες σε στυλ γραμματοσειράς, μέγεθος, όνομα, συντεταγμένες κειμένου
- Προστέθηκε δείγμα ASP.NET για χρήση OCR
- νέα ιδιότητα OCRLanguageDataFolder για να καθορίσετε τη θέση του φακέλου "tessdata"
- βελτιωμένη υποστήριξη αρχείων PDF
- βελτιώνει την υποστήριξη για το περιστρεφόμενο κείμενο
- ενημερωμένα δείγματα πηγαίου κώδικα
- ενημερωμένη τεκμηρίωση
- μικρές βελτιώσεις και διορθώσεις
Τι νέο υπάρχει στην έκδοση 5.00.1626:

Έκδοση 5.00.1626:
- Προστέθηκε λειτουργικότητα OCR (κείμενο από εικόνες): τώρα μπορείτε να εξαγάγετε κείμενο από ενσωματωμένες εικόνες και να επιδιορθώσετε κατεστραμμένο κείμενο
- πρόβλημα που έχει καθοριστεί με CSV και XML Extractor που λείπουν από τις τελευταίες στήλες με κάποιες ρυθμίσεις
- βελτιωμένη υποστήριξη για κατεστραμμένα αρχεία PDF
- Λειτουργία αναζήτησης πολλαπλών γραμμών αναζήτησης με τρόπους αντιστοίχισης λέξεων τώρα υποστηρίζεται
- τώρα μπορείτε να αναζητήσετε κείμενο με παύλες και σε διαφορετικές γραμμές: δείτε νέο δείγμα πηγαίου κώδικα Εύρεση κειμένου με ύφους
- νέα ιδιότητα .RTLTextAutoDetectionEnabled (εσφαλμένη από προεπιλογή) για την αυτόματη ανίχνευση γλωσσών RTL
- Το demo του PDF Viewer GUI βελτιώθηκε
- μικρές βελτιώσεις και διορθώσεις
  Απαιτήσεις :
  
  .NET Framework 2.0 ή νεότερα
  
  Περιορισμοί
  strong>:
  
  Οθόνη Nag, υδατογράφημα στην έξοδο
  
  15 Aug 18 σε Εργαλεία για προγραμματιστές, Εξαρτήματα & Βιβλιοθήκες