Στοιχεία Λογισμικού:
Εκδοχή: 1.0.3
Ανεβάστε ημερομηνία: 13 Apr 15
Άδεια: Δωρεάν
Δημοτικότητα: 77
Σχεδιασμένο ως ένα περιτύλιγμα γύρω από lxml, επεκτείνεται τώρα lxml με όλα τα χαρακτηριστικά που απαιτούνται κανονικά στην εξόρυξη δεδομένων HTML
Χαρακτηριστικά :.
- Γενικά χαρακτηριστικά:
- Νίκαια jQuery-όπως επιλογείς CSS
- Απλή πρόσβαση στο στοιχείο Χαρακτηριστικά
- Εύκολος τρόπος για να μετατρέψετε HTML σε άλλη μορφή (BBcode, Markdown, κλπ)
- Λίγα ωραία λειτουργίες για την εργασία με κείμενο
- Αποθηκεύει όλα τα αυθεντικά χαρακτηριστικά του lxml
- Λειτουργίες να συνεργαστεί με καθαρό κείμενο:
- to_unicode - Μετατροπή συμβολοσειράς σε Unicode συμβολοσειρά
- strip_accents - εμφάσεις της Γάζας από μια σειρά
- strip_symbols - Γάζας άσχημο χαρακτήρες Unicode από μια σειρά
- strip_spaces - Γάζας περίσσεια χώρους από μια σειρά
- strip_linebreaks - Γάζας περίσσεια αλλαγές γραμμής από μια σειρά
Απαιτήσεις :
- lxml
Τα σχόλια δεν βρέθηκε