ASPseek

Screenshot Λογισμικό:
ASPseek
Στοιχεία Λογισμικού:
Εκδοχή: 1.2.10
Ανεβάστε ημερομηνία: 3 Jun 15
Προγραμματιστής: SWsoft
Άδεια: Δωρεάν
Δημοτικότητα: 4

Rating: nan/5 (Total Votes: 0)

ASPseek είναι ένα λογισμικό στο Διαδίκτυο μηχανή αναζήτησης που αναπτύχθηκε από SWsoft και διαθέτει άδεια ως ελεύθερο λογισμικό σύμφωνα με την GNU GPL.
ASPseek αποτελείται από ένα ρομπότ ευρετηρίασης, ένα δαίμονα αναζήτησης, και ένα frontend αναζήτηση CGI. Μπορεί δείκτης όσο μερικά εκατομμύρια διευθύνσεις URL και να αναζητήσετε λέξεις και φράσεις, μπαλαντέρ χρήση, και να κάνουμε μια Boolean αναζήτηση. Τα αποτελέσματα αναζήτησης μπορούν να περιορίζεται σε χρονικό διάστημα που δίνεται ιστοσελίδα ή δικτυακό χώρο (σύνολο χώρων) και ταξινομούνται με βάση τη συνάφεια (PageRank χρησιμοποιείται) ή την ημερομηνία.
ASPseek έχει βελτιστοποιηθεί για πολλαπλές θέσεις (σπείρωμα δείκτη, ασύγχρονη αναζητήσεις DNS, ομαδοποιώντας τα αποτελέσματα από την ιστοσελίδα, χώρους Web), αλλά μπορεί να χρησιμοποιηθεί για την αναζήτηση ενός τόπου, όπως καλά. ASPseek μπορεί να λειτουργήσει με πολλαπλές γλώσσες / κωδικοποιήσεις ταυτόχρονα (συμπεριλαμβανομένων των κωδικοποιήσεων πολλαπλών byte, όπως η κινεζική) λόγω του τρόπου αποθήκευσης Unicode. Άλλα χαρακτηριστικά περιλαμβάνουν εξαιρούμενες λέξεις και ispell υποστήριξη, ένα σύνολο χαρακτήρων και τη γλώσσα guesser, πρότυπα HTML για τα αποτελέσματα αναζήτησης, αποσπάσματα, και τα λόγια προβολή ερωτημάτων.
ASPseek είναι γραμμένο σε C ++ με χρήση της βιβλιοθήκης STL, και χρησιμοποιεί μείγμα της βάσης δεδομένων SQL και δυαδικών αρχείων για την αποθήκευση.
Εδώ είναι μερικά βασικά χαρακτηριστικά του "ASPseek":
Δυνατότητα να δείκτη και αναζήτησης μέσω πολλών εκατομμυρίων εγγράφων
 
· Χρησιμοποιώντας ASPseek, μπορείτε να δημιουργήσετε μια βάση δεδομένων και να ψάξετε μέσα από πολλές τοποθεσίες, και τα αποτελέσματα για κάθε ερώτημα θα επιστρέψει γρήγορα, ακόμη και αν έχετε μερικά εκατομμύρια έγγραφα στο ευρετήριο. Φυσικά, αυτό εξαρτάται από το υλικό, οπότε μην περιμένετε "παλιό καλό" μηχάνημα i486 να χειριστεί κάθε τόπου σε .com τομέα. Τα πάντα εξαρτώνται από CPU (s), μνήμη, ταχύτητα του δίσκου κ.λπ. Έτσι κάνετε το δικό σας τεστ, πριν να αγοράσετε ειδικό εξοπλισμό.
 
· Το γεγονός ότι ASPseek είναι βελτιστοποιημένη για μεγάλες ποσότητες δεν πρέπει να σας σταματήσει από το να το χρησιμοποιεί για να αναζητήσετε το δικό σας site που περιέχει μερικές εκατοντάδες των εγγράφων - που λειτουργεί εκεί.
 
Πολύ καλή σχετικότητα των αποτελεσμάτων
 
· Ο σκοπός της μηχανής αναζήτησης είναι να βρείτε αυτό που ο χρήστης επιθυμεί. Μπορεί να υπάρχουν χιλιάδες ηλεκτρονικές διευθύνσεις ως αποτέλεσμα το ερώτημα αναζήτησης, αλλά μπορεί όλα να είναι άνευ σημασίας, έτσι ώστε ο χρήστης θα είναι δυσαρεστημένοι.
 
· Τα αποτελέσματα της εξόδου σε ASPseek κατατάσσονται σύμφωνα με τη σχετικότητα (ή τάξη), αλλά ο υπολογισμός τάξη δεν είναι ένα εύκολο έργο. Προγραμματιστές δοκιμάσει το καλύτερό τους να ενσωματώσουν μεγαλύτερο και πιο πρόσφατες τεχνικές σε ASPseek κινητήρα, διατηρώντας παράλληλα καλή ταχύτητα αναζήτησης.
 
Υποστήριξη ispell
 
· Όταν ASPseek χρησιμοποιείται με την υποστήριξη ispell, searchd (1) μπορεί προαιρετικά να βρείτε όλα τα έντυπα για όλα τα καθορισμένα λέξεις (παράδειγμα: δημιουργήσει -> Δημιουργία ή παράγονται ή δημιουργεί). Έτσι, σας επιτρέπει να βρείτε τη λέξη σε όλες τις διαφορετικές μορφές.
 
Λειτουργία αποθήκευσης Unicode
 
· ASPseek μπορεί να αποθηκεύσει πληροφορίες σχετικά με τα έγγραφα σε μορφή Unicode, καθιστώντας έτσι δυνατή την υλοποίηση μιας μηχανής αναζήτησης σε πολλές γλώσσες. Έτσι, μπορείτε να δείκτη και αναζήτησης των εγγράφων στα αγγλικά, ρωσικά και ακόμα και οι Κινέζοι, όλα σε μία βάση δεδομένων.
 
HTTP, HTTPS, μεσολάβησης HTTP, FTP (μέσω proxy) πρωτόκολλα
 
· Όπως ASPseek είναι μια μηχανή αναζήτησης Ιστού, που χρησιμοποιεί το πρωτόκολλο HTTP για ευρετήριο τόπων. ASPseek υποστηρίζει επίσης ασφαλές πρωτόκολλο https: //. FTP πρωτόκολλο δεν υποστηρίζεται άμεσα, αλλά μπορείτε να χρησιμοποιήσετε proxy (όπως καλαμάρια) και ευρετήριο τόπων FTP μέσω πληρεξουσίου.
 
· ASPseek υποστηρίζει τη "βασική άδεια" του HTTP, έτσι ώστε να μπορεί δείκτη κωδικό πρόσβασης προστατευόμενες περιοχές (π.χ. ιδιωτικές πληροφορίες σας intranet).
 
Text / html και text / plain στήριξη τύπους εγγράφων
 
· ASPseek μπορεί να καταλάβει έγγραφα γραμμένα σε HTML και έγγραφα απλού κειμένου. Αυτές είναι οι πιο δημοφιλείς μορφές στο Διαδίκτυο.
 
· Άλλες μορφές, όπως PDF, RTF, κλπ, μπορεί να υποστηριχθεί με τη βοήθεια οποιασδήποτε εξωτερικής πρόγραμμα / script το οποίο είναι σε θέση να μετατρέψει ότι μορφές σε HTML ή απλό κείμενο.
 
Πολυνηματικός σχεδιασμό, ασύγχρονη επίλυσης DNS κ.λπ.
 
· ASPseek χρησιμοποιεί νήματα POSIX, αυτό σημαίνει ότι μία διαδικασία έχει πολλά θέματα που τρέχουν παράλληλα. Έτσι, ο δείκτης λήψεις έγγραφα από πολλές περιοχές, και τις διαδικασίες αναζήτησης δαίμονα πολλά ερωτήματα αναζήτησης ταυτόχρονα. Αυτό δεν βοηθά μόνο ASPseek να κλιμακώνεται καλά σε συστήματα SMP (πολλαπλών), αλλά επίσης βελτιώνει την ταχύτητα ευρετηρίαση, επειδή σε περίπτωση μιας νήμα περισσότερος χρόνος θα δαπανηθούν στην αναμονή για τα δεδομένα από το δίκτυο.
 
· Ένα πράγμα ότι η αργή διαδικασία ευρετηρίασης κάτω από μια παρτίδα αναζήτηση DNS (μια διαδικασία καθορισμού διεύθυνσης IP χρησιμοποιώντας το όνομα του διακομιστή). Για να αποφευχθούν οι καθυστερήσεις, οι ασύγχρονη αναζητήσεις (αναζήτηση γίνεται με ξεχωριστό ειδικές διαδικασίες) και τη διεύθυνση IP της κρυφής μνήμης σε εφαρμογή.
 
Εξαιρούμενες λέξεις
 
· Εξαιρούμενες λέξεις είναι μια φράση που δεν έχουν κανένα νόημα από μόνη της. Παραδείγματα: είναι, είναι, σε, αυτό. Ψάχνοντας για είναι άχρηστο, έτσι ώστε αυτές οι λέξεις εξαιρούνται από το ερώτημα αναζήτησης. Εξαιρούμενες λέξεις εξαιρούνται επίσης από τη βάση δεδομένων κατά τη διάρκεια της ευρετηρίασης, έτσι βάσης δεδομένων γίνεται μικρότερο και πιο γρήγορα.
 
· Δεν υπάρχει "ενσωματωμένη" εξαιρούμενες λέξεις στο ASPseek, που φορτώνονται κατά την εκκίνηση από αρχεία. Πολλά αρχεία stopword για διαφορετικές γλώσσες έρχεται με ASPseek.
 
Charset guesse
 
· Μερικά σπασμένα ή εσφαλμένες διακομιστές δεν μπορούν να πουν στους πελάτες της το σύνολο χαρακτήρων στο οποίο παρέχουν περιεχόμενο. Εάν είστε ευρετηρίαση όπως servers, ή χρησιμοποιώντας ASPseek σε διακομιστές δείκτη FTP (πρωτόκολλο FTP δεν γνωρίζει τίποτα σχετικά με σύνολα χαρακτήρων), charset guesser μπορεί να χρησιμοποιηθεί για να ασχοληθεί με το θέμα. Charset guesser χρησιμοποιεί πίνακες συχνότητας λέξεων (ονομάζεται langmaps) για να καθορίσει τη σωστή σύνολο χαρακτήρων.
 
Πρότυπο αποκλεισμού ρομπότ (robots.txt) στήριξη
 
· ASPseek υποστηρίζει πλήρως αυτό το πρότυπο. Προορίζεται για τους συγγραφείς web site για την αφήγηση του ρομπότ (για παράδειγμα, ο δείκτης ASPseek (1)) για να παρακάμψετε ευρετηρίαση κάποια καταλόγους των τόπων τους.
 
· Για περισσότερες πληροφορίες δείτε http://www.robotstxt.org/wc/robots.html
 
Ρυθμίσεις για τον έλεγχο της χρήσης του εύρους ζώνης του δικτύου και οι διακομιστές Web φορτίο
 
· Μπορείτε να ελέγχετε με ακρίβεια το εύρος ζώνης του δικτύου ότι ο δείκτης (1) χρησιμοποιεί. Ακριβώς, μπορείτε να περιορίσετε το εύρος ζώνης (που εκφράζεται σε bytes ανά δευτερόλεπτο) που χρησιμοποιούνται σύμφωνα με το δείκτη (1) για τη δεδομένη χρονική στιγμή της ημέρας. Για παράδειγμα, μπορείτε να περιορίσετε το εύρος ζώνης κατά τις εργάσιμες ώρες, ώστε οι άνθρωποι στο γραφείο σας δεν θα αντιμετωπίσετε αργή Διαδίκτυο.
 
· Μπορείτε επίσης να ρυθμίσετε τον ελάχιστο χρόνο ανάμεσα σε δύο ερωτήματα στον ίδιο διακομιστή Web, έτσι δεν θα υπερφορτωθεί και πήρε κάτω στα γόνατά του, ενώ τρέχετε δείκτη (1).
 
Σε πραγματικό χρόνο ασύγχρονη ευρετηρίασης
 
· Ορισμένες μηχανές αναζήτησης απαιτεί ότι η αναζήτηση θα πρέπει να διακόπτεται για το χρονικό διάστημα από ενημέρωση της βάσης δεδομένων. ASPseek δεν το χρειάζεται, ώστε να μπορείτε να αναζητήσετε non-stop.
 
· Περισσότερο να πω, υπάρχει μια ειδική λειτουργία της ευρετηρίασης που ονομάζεται "πραγματικό χρόνο" indexing. Μπορείτε να το χρησιμοποιήσετε για μικρό αριθμό εγγράφων, και στο βαθμό που το εν λόγω έγγραφο γίνεται λήψη και επεξεργασία, οι αλλαγές είναι άμεσα ορατά σε διεπαφή αναζήτησης. Αυτό το χαρακτηριστικό είναι μια μεγάλη βοήθεια εάν είστε οικοδόμηση μηχανή αναζήτησης για τις σελίδες με ταχέως μεταβαλλόμενο περιεχόμενο, όπως σε απευθείας σύνδεση ειδήσεις κ.λπ.
 
· Σημειώνεται ότι ο αριθμός των εγγράφων σε "πραγματικό χρόνο" βάση δεδομένων είναι περιορισμένη. Είναι περίπου 1000 σχετικά με το υλικό μας (απόσταση σε μίλια σας μπορεί να ποικίλει), και τα περισσότερα έγγραφα που έχουν στη βάση δεδομένων «πραγματικό χρόνο», τόσο πιο αργή θα είναι η ταχύτητα της ευρετηρίασης σε εκείνη (και μόνο) της βάσης δεδομένων. Αυτό δεν θα επηρεάσει την ταχύτητα αναζήτησης, όμως.
 
• Έγγραφα από τη βάση δεδομένων σε «πραγματικό χρόνο» μεταφέρονται στην κανονική βάση δεδομένων μετά την εκτέλεση του δείκτη (1) σε ένα κανονικό τρόπο.
 
Ταξινόμηση των αποτελεσμάτων με βάση τη συνάφεια ή από την ημερομηνία
 
· Οι μηχανές αναζήτησης επιστρέφει συνήθως πιο σχετικά αποτελέσματα πρώτα. Αλλά αν ψάχνετε για τις τελευταίες σελίδες, μπορείτε να πείτε ASPseek να ταξινομήσετε τα αποτελέσματα από την τελευταία ημερομηνία τροποποίησης, έτσι τροποποίησε πρόσφατα (ή δημιουργούνται) σελίδες θα εμφανίζονται πρώτες.
 
Αποσπάσματα, λέξεις προβολή ερωτημάτων
· Απόσπασμα είναι ένα κομμάτι του βρέθηκε έγγραφο με τις λέξεις έψαξε για υπογράμμισε, ακριβώς για να δώσει μια ιδέα του τι το έγγραφο είναι περίπου. Μπορείτε να προσαρμόσετε τον αριθμό των αποσπασμάτων εμφάνιση και το μήκος τους. Εάν θα απενεργοποιήσετε αποσπάσματα, θα εμφανιστεί στην αρχή του εγγράφου.
 
· Κάθε βρέθηκε έγγραφο αυτό συνοδεύεται με την "Αποθηκευμένη" σύνδεσμο. ASPseek κρατά ένα τοπικό συμπιεσμένο αντίγραφο κάθε εγγράφου σε επεξεργασία, έτσι ώστε ο χρήστης μπορεί να δει το ολόκληρο το έγγραφο με το (προαιρετικό) τονισμένες λέξεις που αναζητείται, ακόμη και αν αυτό έχει αφαιρεθεί από την αρχική ιστοσελίδα (αυτό συμβαίνει μερικές φορές).
 
Ομαδοποίηση αποτελεσμάτων από το site
 
· Αποτελέσματα από μία τοποθεσία μπορούν να ομαδοποιηθούν. Αν ομαδοποίηση από τις περιοχές είναι σχετικά, μόνο δύο αποτελέσματα που εμφανίζονται από την ίδια περιοχή, από προεπιλογή, και ο χρήστης μπορεί να δει άλλες σελίδες από τον ίδιο χώρο, ακολουθώντας μια "Περισσότερα αποτελέσματα από ..." σύνδεσμο.
 
Κλώνοι
 
· Οι κλώνοι είναι ταυτόσημα έγγραφα σε διαφορετικές θέσεις. Έχουν εντοπιστεί και να συνενωθούν, έτσι ώστε ο χρήστης δεν θα πρέπει να παρουσιάζονται με μια πλήρη σελίδα των διευθύνσεων URL με τα πανομοιότυπα έγγραφα.
 
· Ανίχνευση Clone συνήθως περιορίζεται από ένα χώρο (τόσο όμοια έγγραφα από διαφορετικές τοποθεσίες δεν υπολογίζονται ως κλώνοι), αλλά μπορείτε να το αλλάξετε αυτό με την μεταγλώττιση του ASPseek με --disable-κλώνους ανά τοποθεσία ή επιλογή.
 
Χώρους και υποσύνολα
 
· Το διάστημα είναι το σύνολο των τόπων. Έτσι, εάν θέλετε να παράσχει την αναζήτηση περιορίστηκε σε κάποια περιοχή, μπορείτε να δημιουργήσετε ένα χώρο και να ψάξετε μέσα σε αυτόν τον χώρο. Μόνο ολόκληρο τοποθεσίες (π.χ. http://www.mysite.com/) επιτρέπεται να συμπεριληφθούν στο χώρο.
 
· Υποομάδες μπορεί επίσης να χρησιμοποιηθεί για να περιορίσει την αναζήτηση. Μπορείτε να δημιουργήσετε υποσύνολο και βάλτε τη μάσκα URL (όπως http://www.mysite.com/mydir/%) σε αυτό, και στη συνέχεια να περιοριστεί το πεδίο αναζήτησης για να δίνεται μόνο υποσύνολο.
 
· Μπορείτε να περιοριστεί το πεδίο εφαρμογής αναζήτηση όχι μόνο ένα αλλά πολλά υποσύνολα ή χώρους.
 
Πρότυπα HTML για εύκολη-να-προσαρμογή των αποτελεσμάτων αναζήτησης
 
· Μπορείτε να προσαρμόσετε τις σελίδες αναζήτησή σας, έτσι θα μοιάζουν και να συνεργάζονται άψογα με το υπόλοιπο του site σας. Αυτό γίνεται με την απλή επεξεργασία του αρχείου προτύπου αναζήτησης.
Εγκατάσταση
gzip -DC aspseek-1.2.10.tar.gz | XF πίσσα -
cd aspseek-1.2.10. / διαμόρφωση
κάνω
su
make install

Άλλο λογισμικό του προγραμματιστή SWsoft

Plesk for Windows
Plesk for Windows

22 Sep 15

OpenVZ Live CD
OpenVZ Live CD

2 Jun 15

OpenVZ kernel
OpenVZ kernel

2 Jun 15

Σχόλια για ASPseek

Τα σχόλια δεν βρέθηκε
προσθήκη σχολίου
Ενεργοποιήστε τις εικόνες!