Apache Lucene

Screenshot Λογισμικό:
Apache Lucene
Στοιχεία Λογισμικού:
Εκδοχή: 5.3.1 / 4.10.4 / 3.6.2 επικαιροποιημένο
Ανεβάστε ημερομηνία: 10 Dec 15
Προγραμματιστής: Apache Software Foundation
Άδεια: Δωρεάν
Δημοτικότητα: 241

Rating: nan/5 (Total Votes: 0)

Apache Lucene είναι κατάλληλο για κάθε εφαρμογή που απαιτεί υποστήριξη για αναζήτηση πλήρους κειμένου, διατηρώντας παράλληλα και την κατανάλωση πόρων διακομιστή κάτω και την παραγωγή γρήγορη και υψηλής ακρίβειας αποτελέσματα.

Lucene θεωρείται ευρέως ως ένας από τους καλύτερους μηχανές αναζήτησης γύρω, όντας στο επίκεντρο πολλών άλλων εργαλείων αναζήτησης, το πιο διάσημο ον Apache SOLR .

Lucene είναι γραμμένο εξ ολοκλήρου σε Java και από τότε που δημοσιεύθηκε από το Ίδρυμα Apache, έχει μεταφερθεί σε πολλές άλλες γλώσσες και διάφορα δεσίματα και περιτυλίγματα υπάρχουν ως τρίτων ανέπτυξε λογισμικό.

Τι είναι καινούργιο σε αυτή την έκδοση:

  • Για την πρόσβαση σε φάκελο τώρα χρησιμοποιεί τα API της Java NIO.2 που δίνουν Lucene ισχυρότερη ασφάλεια δείκτης όσον αφορά την καλύτερη αντιμετώπιση των λαθών και ασφαλέστερη commits.
  • Κάθε τμήμα Lucene τώρα αποθηκεύει ένα μοναδικό αναγνωριστικό ανά τμήμα και ανά δεσμεύονται να βοηθήσουν στην ακριβή αντιγραφή των αρχείων ευρετηρίου.
  • Κατά τη συγχώνευση, IndexWriter τώρα ελέγχει πάντα τα εισερχόμενα τμήματα για τη διαφθορά πριν από τη συγχώνευση. Αυτό μπορεί να σημαίνει, για την αναβάθμιση σε 5.0.0, ότι η συγχώνευση μπορεί να αποκαλύψει μακροχρόνια λανθάνουσα διαφθορά σε μια παλαιότερη δείκτη 4.x.

Τι είναι καινούργιο στην έκδοση 5.2.1 / 4.10.4 / 3.6.2:

  • Όλες αρχείο Πρόσβαση τώρα χρησιμοποιεί τα API της Java NIO.2 που δίνουν Lucene ισχυρότερη ασφάλεια δείκτης όσον αφορά την καλύτερη αντιμετώπιση των λαθών και ασφαλέστερη commits.
  • Κάθε τμήμα Lucene τώρα αποθηκεύει ένα μοναδικό αναγνωριστικό ανά τμήμα και ανά δεσμεύονται να βοηθήσουν στην ακριβή αντιγραφή των αρχείων ευρετηρίου.
  • Κατά τη συγχώνευση, IndexWriter τώρα ελέγχει πάντα τα εισερχόμενα τμήματα για τη διαφθορά πριν από τη συγχώνευση. Αυτό μπορεί να σημαίνει, για την αναβάθμιση σε 5.0.0, ότι η συγχώνευση μπορεί να αποκαλύψει μακροχρόνια λανθάνουσα διαφθορά σε μια παλαιότερη δείκτη 4.x.

Τι είναι καινούργιο στην έκδοση 5.1.0 / 4.10.4 / 3.6.2:

  • Όλες αρχείο Πρόσβαση τώρα χρησιμοποιεί τα API της Java NIO.2 που δίνουν Lucene ισχυρότερη ασφάλεια δείκτης όσον αφορά την καλύτερη αντιμετώπιση των λαθών και ασφαλέστερη commits.
  • Κάθε τμήμα Lucene τώρα αποθηκεύει ένα μοναδικό αναγνωριστικό ανά τμήμα και ανά δεσμεύονται να βοηθήσουν στην ακριβή αντιγραφή των αρχείων ευρετηρίου.
  • Κατά τη συγχώνευση, IndexWriter τώρα ελέγχει πάντα τα εισερχόμενα τμήματα για τη διαφθορά πριν από τη συγχώνευση. Αυτό μπορεί να σημαίνει, για την αναβάθμιση σε 5.0.0, ότι η συγχώνευση μπορεί να αποκαλύψει μακροχρόνια λανθάνουσα διαφθορά σε μια παλαιότερη δείκτη 4.x.

Τι είναι καινούργιο στην έκδοση 5.0.0 / 4.10.3 / 3.6.2:

  • Νέα Όροι .getMin / Max μεθόδους για την ανάκτηση των χαμηλότερων και των υψηλότερων όρων ανά τομέα.
  • Νέα IDVersionPostingsFormat, βελτιστοποιημένη για αναζητήσεις αναγνωριστικό που συνδέουν ένα μονοτονικά αυξανόμενη έκδοση ανά ταυτότητας.
  • Ατομικής επικαιροποίηση μιας σειράς doc τιμές πεδίων.
  • Πολλές βελτιστοποιήσεις για την απόδοση τιμών doc αναζήτηση απασχόλησης.
  • Νέα (προεπιλογή) Lucene49NormsFormat να συμπιέσει καλύτερα ορισμένες περιπτώσεις, όπως σε πολύ σύντομο πεδία.
  • Νέα SORTED_NUMERIC docvalues ​​τύπου για την αποτελεσματική επεξεργασία των πολλαπλών αποτιμάται αριθμητικά πεδία.
  • ευρετήριο περνάει προηγούμενο συμβολικό ρεύμα για ευκολότερη χρήση τους.
  • MoreLikeThis δέχεται πολλές τιμές για κάθε τομέα.
  • Όλες οι κλάσεις που εκτιμούν μνήμη RAM χρήση τους να εφαρμόσουν τώρα ένα νέο υπεύθυνο σημείο επαφής.
  • Τα αρχεία Lucene γραφτεί από τώρα (Αρχείο) OutputStream σε όλες τις πλατφόρμες, απαγορεύοντας εντελώς επιδιώκοντας με απλοποιημένες IO APIs.
  • Να βελτιωθεί η σύγχυση μήνυμα λάθους όταν MMapDirectory δεν μπορεί να δημιουργήσει ένα νέο χάρτη.

Τι είναι καινούργιο στην έκδοση 4.8.0:

  • Lucene έχει ένα νέο Rescorer / QueryRescorer API για την εκτέλεση δεύτερη-pass αναβαθμολόγησης ή αναταξινόμηση των αποτελεσμάτων αναζήτησης με χρήση ακριβότερων λειτουργίες βαθμολόγησης μετά τη συλλογή πρώτης διόδου χτύπημα.
  • AnalyzingInfixSuggester υποστηρίζει πλέον σχεδόν σε πραγματικό χρόνο autosuggest.
  • Απλοποιημένη επιπτώσεων ταξινομημένο αποσπάσεις (χρησιμοποιώντας SortingMergePolicy και EarlyTerminatingCollector) να χρησιμοποιούν τάξη Ταξινόμηση Lucene για να εκφράσουν τη σειρά ταξινόμησης.
  • Μαζική σκορ και κανονική iterator με βάση το σκορ διαχωρίζονται, έτσι ώστε ορισμένα ερωτήματα μπορούν να κάνουν μαζικές βαθμολόγησης πιο αποτελεσματικά.
  • Εναλλαγή σε MurmurHash3 για τον κατακερματισμό όρους κατά τη διάρκεια της ευρετηρίασης.
  • IndexWriter υποστηρίζει τώρα την ενημέρωση των δυαδικά πεδία αξία έγγρ.
  • HunspellStemFilter χρησιμοποιεί τώρα 10 έως 100x λιγότερη μνήμη RAM. Φορτώνει επίσης όλα τα γνωστά λεξικά OpenOffice χωρίς σφάλμα.
  • Lucene τώρα fsyncs επίσης τα μεταδεδομένα κατάλογο στον δεσμεύεται, εάν το λειτουργικό σύστημα και το σύστημα αρχείων του (Linux, MacOSX είναι γνωστό ότι λειτουργούν) επιτρέπουν.
  • Lucene τώρα χρησιμοποιεί Java 7 λειτουργίες του συστήματος αρχείων κάτω από την κουκούλα, έτσι ώστε τα αρχεία δείκτη μπορεί να διαγραφεί από τα Windows, ακόμα και όταν οι αναγνώστες είναι ακόμα ανοιχτή.
  • Ένα σοβαρό σφάλμα στο NativeFSLockFactory έχει καθοριστεί, το οποίο θα μπορούσε να επιτρέψει πολλαπλές IndexWriters να αποκτήσει την ίδια κλειδαριά. Το αρχείο κλειδώματος δεν είναι πλέον διαγραφεί από τον κατάλογο δείκτη, ακόμη και όταν η κλειδαριά δεν πραγματοποιήθηκε.

Τι είναι καινούργιο στην έκδοση 4.7.0:

  • Όταν ταξινόμηση κατά String (SortField.STRING), μπορείτε τώρα να καθορίσετε αν τις τιμές που λείπουν θα πρέπει να ταξινομούνται πρώτα (η προεπιλογή), ή η τελευταία.
  • NRT υποστήριξη για συστήματα αρχείων που δεν έχουν διαγράψει την τελευταία κλείσιμο ή δεν μπορεί να διαγράψει, ενώ αναφέρεται σημασιολογία.
  • Προστέθηκε LongBitSet για τη διαχείριση πάνω από 2.1β bits (αλλιώς χρησιμοποιήστε FixedBitSet).
  • Προστέθηκε Αναλυτής για την κουρδική γλώσσα.
  • Προστέθηκε υποστήριξη για ωφέλιμο φορτίο FileDictionary (Αποστολή) και να το καταστήσει πιο παραμετροποιήσιμο.
  • Προστέθηκε μια νέα BlendedInfixSuggester, η οποία είναι σαν AnalyzingInfixSuggester αλλά ενισχύει τις προτάσεις που να ταιριάζουν με τις μάρκες με χαμηλότερες θέσεις.
  • Προστέθηκε SimpleQueryParser:. parser για την ανθρώπινη εισήλθε ερωτήματα
  • Προστέθηκε multitermquery (μπαλαντέρ, πρόθεμα, κλπ) για να PostingsHighlighter.

Τι είναι καινούργιο στην έκδοση 4.6.0:

  • Προστέθηκε υποστήριξη για ενημερώσεις πεδίο NumericDocValues ​​(χωρίς εκ νέου ευρετηρίαση του εγγράφου) μέσω IndexWriter.updateNumericDocValue (Term, String, Long).
  • Νέα FreeTextSuggester μπορεί να προβλέψει την επόμενη λέξη χρησιμοποιώντας ένα απλό ngram γλώσσα μοντέλο χρήσιμο για & quot? μακρά ουρά & quot? προτάσεις.
  • Μια νέα μονάδα έκφρασης επιτρέπει την εξατομικευμένη κατάταξη με δέσμες ενεργειών, όπως η σύνταξη.
  • Μια νέα DirectDocValuesFormat μπορεί να κρατήσει όλες τις τιμές DOC στο σωρό, όπως ασυμπίεστο java μητρική συστοιχίες.
  • Term.hasFreqs μπορεί πλέον να προσδιοριστεί αν ένα συγκεκριμένο τομέα αναπροσαρμόζονται ανά-doc
  • όρος συχνότητες.

Τι είναι καινούργιο στην έκδοση 4.5.0:

  • Νέα στη μνήμη εφαρμογές DocIdSet που είναι ιδιαίτερα καλύτερα από FixedBitSet για μικρά σύνολα:. WAH8DocIdSet, PFORDeltaDocIdSet και EliasFanoDocIdSet
  • CachingWrapperFilter αποθηκεύει τώρα φίλτρα με WAH8DocIdSet από προεπιλογή, η οποία έχει την ίδια χρήση μνήμης ως FixedBitSet στη χειρότερη περίπτωση, αλλά είναι μικρότερα και γρηγορότερα σε μικρά σύνολα.
  • TokenStreams που τώρα τη θέση προσαύξηση τέλος (), έτσι ώστε να μπορεί να χειριστεί σύροντας τρύπες.
  • IndexWriter κλωνοποιεί δεν είναι πλέον δεδομένη η IndexWriterConfig.
  • Διάφορα διορθώσεις και βελτιστοποιήσεις από την 4.4 έκδοση.

Τι είναι καινούργιο στην έκδοση 4.4.0:

  • ενότητα Νέα αντιγραφέα: αναπαράγουν τις αναθεωρήσεις του δείκτη μεταξύ του διακομιστή και πελάτη.
  • Νέα AnalyzingInfixSuggester:. βρίσκει τις προτάσεις με βάση τα παιχνίδια με τα διακριτικά της πρόταση, όχι μόνο με βάση την καθαρή πρόθεμα αντιστοίχιση
  • Νέα PatternCaptureGroupTokenFilter:. εκπέμπουν πολλαπλά κουπόνια, ένα για κάθε ομάδα σύλληψης σε μία ή περισσότερες regexes Java
  • ενότητα Νέα Lucene Πτυχή.

Τι είναι καινούργιο στην έκδοση 4.3.0:

  • Νέα SearcherTaxonomyManager κατάφερε σχεδόν σε πραγματικό χρόνο ξανανοίγει της τόσο IndexSearcher και TaxonomyReader (για εδρικοποίηση).
  • Προστέθηκε νέα μέθοδο πτυχή στη μονάδα όψη για τον υπολογισμό πτυχή μετράει χρησιμοποιώντας SortedSetDocValuesField, χωρίς ξεχωριστό δείκτη ταξινομίας.
  • Σημαντικές βελτιώσεις απόδοσης για minShouldMatch BooleanQuery λόγω παρακάμπτοντας με αποτέλεσμα μέχρι το 4000% γρηγορότερα ερωτήματα.
  • Διάφορα διορθώσεις και βελτιστοποιήσεις από την 4.2.1 έκδοση.

Τι είναι καινούργιο στην έκδοση 4.1.0:

  • Lucene δεν επιδιώκει κατά το γράψιμο αρχείων (όλα τα πεδία έχουν συνταχθεί στην προσάρτησης-μόνο τρόπο). Αυτό σημαίνει ότι λειτουργεί εξ ορισμού με προσάρτησης-μόνο ρέματα, ΚΑΕ, κλπ ..
  • Νέα προτείνουν εφαρμογές: AnalyzingSuggester, όπου η υποκείμενη μορφή (υπολογίζεται από Lucene Αναλυτής) που χρησιμοποιείται για τις προτάσεις είναι ξεχωριστό από το κείμενο και επέστρεψε FuzzySuggester, η οποία επιτρέπει επιπλέον για ανακριβείς ταιριάζουν στην είσοδο
  • .
  • Κοντά σε πραγματικό χρόνο-στήριξη προστέθηκε στην ενότητα έκφανση.
  • Νέα Επισήμανση (postingshighlighter) προστίθεται στην ενότητα επισήμανσης.
  • Προστέθηκε FilterStrategy να FilteredQuery για μεγαλύτερη ευελιξία στη φιλτραρισμένη εκτέλεσης του ερωτήματος.
  • Προστέθηκε CommonTermsQuery να επιταχύνει τα ερωτήματα με πολύ μεγάλη συχνότητα όρους. Συχνότητες όρος αποτελεσματικά εντοπίστηκε κατά τη διάρκεια επερώτησης. - Καθόλου χρόνο δείκτης απαιτείται προετοιμασία
  • Αρκετές διορθώσεις και βελτιστοποιήσεις μετά την κυκλοφορία 4.0.

Τι είναι καινούργιο στην έκδοση 4.0-άλφα:

  • Οι μορφές του δείκτη για τους όρους, τις λίστες τοποθετήσεων, αποθηκεύονται πεδία, όρος
  • φορείς, κλπ είναι συνδεόμενο μέσω του API Codec. Μπορείτε να επιλέξετε από τις παρεχόμενες εφαρμογές ή να προσαρμόσετε τη μορφή δείκτη με το δικό σας Codec για να ικανοποιήσουν τις ανάγκες σας.
  • Ουσιαστικά ταχύτερη απόδοση κατά τη χρήση ενός φίλτρου κατά την αναζήτηση.

  • καταλόγους με βάση
  • Αρχείο συστήματος μπορεί να βαθμολογήσετε το όριο IO (MB / sec) νημάτων συγχώνευσης, να μειώσει IO έριδος μεταξύ των συγχωνευομένων και αναζήτηση νήματα.
  • FuzzyQuery είναι 100-200 φορές πιο γρήγορα από ό, τι σε προηγούμενες εκδόσεις.
  • Ένα νέο ορθογράφο, DirectSpellChecker, βρίσκει ενδεχόμενες διορθώσεις
  • ευθέως κατά τον κύριο δείκτη της αναζήτησης χωρίς να απαιτείται ξεχωριστό δείκτη.

Τι είναι καινούργιο στην έκδοση 3.6.0:

  • Εκτός Java 5 και 6 της Java, αυτή η απελευθέρωση έχει τώρα την πλήρη υποστήριξη Java 7 (ελάχιστη απαιτούμενη 7u1 JDK).
  • φίλτρα TypeTokenFilter μάρκες με βάση την TypeAttribute τους.
  • Σταθερή αντισταθμίσει τα σφάλματα σε μια σειρά από CharFilters, Tokenizers και TokenFilters που θα μπορούσαν να οδηγήσουν σε εξαιρέσεις κατά την προβολή.
  • Προστέθηκε φωνητική κωδικοποιητές: Metaphone, Soundex, Caverphone, Beider-Μορς, etc
  • .
  • CJKBigramFilter και CJKWidthFilter αντικαταστήσει CJKTokenizer.
  • Kuromoji μορφολογικού αναλυτή tokenizes ιαπωνικό κείμενο, που παράγουν τόσο σύνθετες λέξεις και τον κατακερματισμό τους.
  • Στατική δείκτη κλάδεμα (Carmel κλάδεμα) αφαιρεί αναρτήσεις με χαμηλή συχνότητα όρου μέσα-έγγραφο.
  • QueryParser ερμηνεύει τώρα «*» ως ένα ανοικτό άκρο για επερωτήσεις εύρους.
  • FieldValueFilter εξαιρεί τα έγγραφα που λείπουν το συγκεκριμένο πεδίο.
  • CheckIndex και IndexUpgrader σας επιτρέπουν να καθορίσετε τη συγκεκριμένη εφαρμογή FSDirectory να χρησιμοποιήσετε με τη νέα επιλογή -dir-impl γραμμής εντολών.
  • FSTs μπορούν τώρα να κάνουν αντίστροφη αναζήτηση (από έξοδο), σε ορισμένες περιπτώσεις, και μπορεί να είναι συσκευασμένα για τη μείωση του μεγέθους τους. Υπάρχει τώρα μια μέθοδος για να ανακτήσετε κορυφή Ν συντομότερα μονοπάτια από έναν κόμβο αφετηρίας σε FST.
  • Νέα WFSTCompletionLookup υποδηλών υποστηρίζει λεπτόκοκκο κατάταξης για τις προτάσεις.
  • FST suggesters βάση χρησιμοποιούν πλέον εκτός σύνδεσης (disk-based) είδος, αντί στη μνήμη του είδους, όταν προ-διαλογή των προτάσεων.
  • ToChildBlockJoinQuery ενώνει την αντίθετη κατεύθυνση (γονέα προς τα κάτω στα έγγραφα του παιδιού).
  • Νέο ερώτημα χρόνου ενώνει είναι πιο ευέλικτο (αλλά λιγότερο αποδοτικοί) από ό, τι ο δείκτης απασχόλησης ενώνει.
  • Προστέθηκε HTMLStripCharFilter να αφαιρέσει τη σήμανση HTML.

Τι είναι καινούργιο στην έκδοση 3.5.0:

  • Προστέθηκε μια πολύ σημαντική (3-5Χ) RAM μείωση που απαιτείται για να κρατήσει το δείκτη όρους για το άνοιγμα IndexReader.
  • Προστέθηκε IndexSearcher.searchAfter που επιστρέφει αποτελέσματα μετά από ένα καθορισμένο ScoreDoc (π.χ. τελευταίο έγγραφο στην προηγούμενη σελίδα) για να υποστηρίξει τις περιπτώσεις βαθιά χρήση σελιδοποίησης.
  • Προστέθηκε SearcherManager να διαχειριστεί την ανταλλαγή και την επαναλειτουργία IndexSearchers σε πολλαπλά νήματα αναζήτηση. Υποκείμενο περιπτώσεις IndexReader κλείνουν με ασφάλεια, αν δεν αναφέρεται πια.
  • Προστέθηκε SearcherLifetimeManager που παρέχει ασφάλεια μια συνεκτική εικόνα του δείκτη σε πολλαπλές αιτήσεις (π.χ. τηλε-ειδοποίησης / drilldown).
  • Μετονομάστηκε IndexWriter.optimize να forceMerge να αποθαρρύνουν τη χρήση της μεθόδου αυτής, δεδομένου ότι είναι απαίσια δαπανηρή και σπάνια δικαιολογείται πλέον.

Τι είναι καινούργιο στην έκδοση 3.3.0:

  • Η μονάδα ορθογράφος περιλαμβάνει τώρα δείχνουν / αυτόματη συμπλήρωση λειτουργικότητα, με τρεις εφαρμογές:. Jaspell, τρίγωνο Trie, και πεπερασμένων μέλος
  • Υποστήριξη για τη συγχώνευση αποτελέσματα από πολλαπλά θραύσματα, τόσο για & quot? κανονικές & quot? Αποτελέσματα αναζήτησης (TopDocs.merge) καθώς και τα ομαδοποιημένα αποτελέσματα με την ομαδοποίηση μονάδα (SearchGroup.merge, TopGroups.merge).
  • Μια βελτιστοποιημένη εφαρμογή των KStem, μια λιγότερο επιθετική αναχαιτίζων για τα αγγλικά.
  • Single-pass ομαδοποίηση εφαρμογή βασίζεται σε ευρετηρίαση έγγραφο μπλοκ.
  • Βελτιώσεις στα MMapDirectory (τώρα επίσης η προεπιλεγμένη εφαρμογή επέστρεψε από FSDirectory.open σε 64-bit Linux).
  • NRTManager απλοποιεί το χειρισμό σχεδόν σε πραγματικό χρόνο αναζήτηση με πολλαπλά threads αναζήτησης, επιτρέποντας στην εφαρμογή τον έλεγχο οποίο ευρετηρίαση αλλαγές πρέπει να είναι ορατή στους οποίους αιτήματα αναζήτησης.
  • TwoPhaseCommitTool διευκολύνει την εκτέλεση πολλαπλών πόρων σε δύο φάσεις διαπράττουν, συμπεριλαμβανομένων IndexWriter.
  • Η προεπιλεγμένη πολιτική συγχώνευση, TieredMergePolicy, έχει μια νέα μέθοδο (σετ / getReclaimDeletesWeight) να ελέγχει πόσο επιθετικά στοχεύει τμήματα με διαγραφές, και τώρα είναι πιο επιθετική από ό, τι πριν από προεπιλογή.
  • εργαλείο PKIndexSplitter χωρίζει ένα ευρετήριο με ενδιάμεση σημείο.

Τι είναι καινούργιο στην έκδοση 3.2.0:

  • Ένα νέο module όμιλος, υπό Lucene / contrib / ομαδοποίηση, δίνει τα αποτελέσματα αναζήτησης πρέπει να ομαδοποιούνται ανά ένα ενιαίο ευρετήριο αξιόλογο τομέα.
  • Ένα νέο εργαλείο που μετατρέπει πλήρως IndexUpgrader ένα παλιό δείκτη στην τρέχουσα μορφή.
  • Μια νέα εφαρμογή Directory, NRTCachingDirectory, αποθηκεύει μικρά τμήματα στη μνήμη RAM, για να μειώσει το φορτίο I / O για εφαρμογές με γρήγορες NRT ξανανοίξει τιμές.
  • Μια νέα εφαρμογή Συλλέκτης, CachingCollector, είναι σε θέση να συγκεντρώσει hits αναζήτησης (αναγνωριστικά εγγράφων και προαιρετικά βαθμολογίες) και, στη συνέχεια, επαναλάβετε αυτά. Αυτό είναι χρήσιμο για Συλλέκτες που απαιτούν δύο ή περισσότερα περάσματα για να παράγουν αποτελέσματα.
  • Δείκτης ένα μπλοκ έγγραφο χρήση νέων addDocuments ή updateDocuments μεθόδους IndexWriter του. Αυτά τα πειραματικά API διασφαλίσει ότι το μπλοκ των εγγράφων θα παραμείνει για πάντα συνεχόμενα στο ευρετήριο, επιτρέποντας ενδιαφέρουσες μελλοντικές δραστηριότητες όπως τα ομαδοποίηση και ενώνει.
  • Μια νέα προεπιλεγμένη πολιτική συγχώνευση, TieredMergePolicy, η οποία είναι πιο αποτελεσματική λόγω του ότι είναι σε θέση να συγχωνεύσει μη συνεχόμενα τμήματα.
  • NumericField τώρα επέστρεψε σωστά όταν φορτώσετε ένα αποθηκευμένο έγγραφο (προηγουμένως έχετε λάβει ένα κανονικό πεδίο πίσω, με το κορδόνι μετατραπεί αριθμητική τιμή).

Τι είναι καινούργιο στην έκδοση 3.1.0:.

  • ConstantScoreQuery επιτρέπει πλέον άμεσα το τύλιγμα ενός ερωτήματος
  • IndexWriter πλέον ρυθμιστεί με ένα νέο ξεχωριστό οικοδόμος API, IndexWriterConfig. Μπορείτε τώρα να ελέγχετε καθορίστηκε προηγουμένως εσωτερικό όριο νήμα IndexWriter, καλώντας setMaxThreadStates.
  • IndexWriter.getReader αντικαθίσταται από IndexReader.open (IndexWriter). Επιπλέον, μπορείτε τώρα να καθορίσετε αν διαγραφές θα πρέπει να επιλυθεί κατά το άνοιγμα ενός αναγνώστη NRT.
  • MultiSearcher έχει καταργηθεί? ParallelMultiSearcher έχει απορροφηθεί άμεσα σε IndexSearcher.
  • Σε 64bit Windows και το Solaris JVMs, MMapDirectory είναι τώρα η προεπιλεγμένη εφαρμογή (επέστρεψε από FSDirectory.open). MMapDirectory επιτρέπει επίσης αποχαρτογράφηση αν το JVM υποστηρίζει.
  • Νέα TotalHitCountCollector μετρά μόλις συνολικός αριθμός των επισκέψεων.
  • ReaderFinishedListener API επιτρέπει στους εξωτερικούς κρύπτες να εκδιώξει εγγραφές φορά ένα τμήμα έχει τελειώσει.

Τι είναι καινούργιο στην έκδοση 3.0.1:.

  • Κατάργηση περιττών συγχρονισμού στο FuzzyTermEnum
  • Όταν επίλυση φράση που έχει διαγραφεί, να το πράξουν στο όρος σειρά ταξινόμησης για καλύτερη απόδοση.
  • Μην κρατάτε σωστά προειδοποίηση σχετικά με την ίδια τεράστια μακροπρόθεσμα, όταν IndexWriter.infoStream είναι σχετικά.
  • Διορθώστε Min / MaxPayloadFunction επιστρέφει 0 όταν μόνο ένα ωφέλιμο φορτίο είναι παρούσα.
  • Ερωτήματα που αποτελείται από όλες τις ρήτρες μηδενικής ώθηση (για παράδειγμα, το κείμενο: foo ^ 0) ταξινομούνται λανθασμένα και παράγονται άκυρο docids
  • .
  • Αφαιρέθηκε η προστατευμένη εσωτερική τάξη ScoreTerm από FuzzyQuery. Ήταν απαραίτητη η αλλαγή, διότι η σύγκρισης αυτής της κατηγορίας είχαν να αλλάξει σε ένα μη συμβατό τρόπο. Η τάξη ποτέ δεν προορίζεται να είναι δημόσια.

Τι είναι καινούργιο στην έκδοση 2.9.2:

  • BooleanQuery αγνοούσε disableCoord σε hashCode του και ισούται με μεθόδους , να προκαλέσει κακά πράγματα να συμβαίνουν όταν caching BooleanQueries.
  • Μην κρατάτε σωστά προειδοποίηση σχετικά με την ίδια τεράστια μακροπρόθεσμα, όταν IndexWriter.infoStream είναι σχετικά.
  • Σε υψηλούς ρυθμούς ευρετηρίασης, NRT αναγνώστης θα μπορούσε να χάσει προσωρινά διαγραφές.

Τι είναι καινούργιο στην έκδοση 3.0.0:

  • Αφαιρέθηκε το ακίνητο σύστημα για να ρυθμίσετε την εφαρμογή SegmentReader τάξη.
  • Αλλαγή τύπου επιστροφή των SnapshotDeletionPolicy # στιγμιότυπο () από IndexCommitPoint να IndexCommit. Κώδικα που χρησιμοποιεί αυτή τη μέθοδο θα πρέπει να γίνεται ανασύνθεση κατά 3,0 Lucene, προκειμένου να εργαστούν. Η παρελθόν αποδοκιμαστεί IndexCommitPoint αφαιρείται επίσης.
  • Δώστε μια καλύτερη εξυπηρέτησή AttributeFactory που δημιουργεί ένα παράδειγμα Token για όλες τις βασικές ιδιότητες.
  • Κατάργηση αναδρομή στο NumericRangeTermEnum.
  • Βελτιστοποίηση Levenshtein Απόσταση υπολογισμός σε FuzzyQuery.

Παρόμοια λογισμικά

Apache Nutch
Apache Nutch

1 Mar 15

solrpy
solrpy

12 May 15

Apache Blur
Apache Blur

13 Apr 15

useful.filter.js
useful.filter.js

12 May 15

Άλλο λογισμικό του προγραμματιστή Apache Software Foundation

Σχόλια για Apache Lucene

Τα σχόλια δεν βρέθηκε
προσθήκη σχολίου
Ενεργοποιήστε τις εικόνες!
Αναζήτηση ανά κατηγορία