speedparser είναι ένα μαύρο κουτί νέας υλοποίησης της Οικουμενικής Parser ζωοτροφών. Χρησιμοποιεί lxml για την ανάλυση των ζωοτροφών και για την προαιρετική καθαρισμό HTML & nbsp?. Speedparser συμβατότητα με feedparser είναι πολύ καλό για ένα αυστηρό υποσύνολο των πεδίων, αλλά κακή για τους τομείς εκτός του εν λόγω υποσύνολο. Βλέπε δοκιμών / speedparsertests.py για περισσότερες πληροφορίες σχετικά με τα οποία πεδία είναι περισσότερο ή λιγότερο συμβατά και τα οποία δεν είναι.
Σε έναν επεξεργαστή Intel Core i5 750, που τρέχει μόνο σε έναν πυρήνα, feedparser διαχειρίζεται 2,5 τροφές / sec για το σύνολο των ζωοτροφών δοκιμή (περίπου 4200 "τροφοδοτεί" σε δοκιμές / feeds.tar.bz2), ενώ speedparser διαχειρίζεται περίπου 65 τροφές / sec με την HTML . καθαρισμού σε 200 τροφές και / sec με τον καθαρισμό μακριά
Απαιτήσεις :
- Python
- lxml
Τα σχόλια δεν βρέθηκε