Sanitize

Screenshot Λογισμικό:
Sanitize
Στοιχεία Λογισμικού:
Εκδοχή: 4.0.0 επικαιροποιημένο
Ανεβάστε ημερομηνία: 12 May 15
Προγραμματιστής: Ryan Grove
Άδεια: Δωρεάν
Δημοτικότητα: 38

Rating: nan/5 (Total Votes: 0)

Με βάση το πρόγραμμα ανάλυσης Nokogiri HTML για Ruby, απολυμάνετε είναι ένα σύστημα που βασίζεται σε λευκή λίστα για την αφαίρεση HTML από ένα μπλοκ του κειμένου.
Η "λευκή λίστα" τεχνική θα επιτρέψει στους προγραμματιστές να στήσετε μια λίστα των ετικετών HTML που αποστειρώνουν θα χρησιμοποιήσει ως σημείο αναφοράς για το τι θεωρεί «αποδεκτή» HTML.
Κάθε άλλη ετικέτα HTML δεν περιλαμβάνεται στη λίστα, θα πρέπει να αφαιρεθεί από το κείμενο αναλύεται.
Αποστειρώνουν μπορεί να λειτουργήσει με συμβατός με τα πρότυπα ή με ακατάλληλο HTML.
Η βιβλιοθήκη μπορεί να ανιχνεύσει και να φιλτράρει τις ετικέτες HTML, τα χαρακτηριστικά και τα πρωτόκολλα.
Το καθαρίζονται κείμενο θα είναι πάντα να εξάγεται ως έγκυρη HTML ή XHTML.
Για να βοηθήσει τους προγραμματιστές να ξεκινήσετε για τα έργα τους, απολυμάνετε έρχεται με μερικά έτοιμα διαμορφώσεις περιλαμβάνονται. Ελέγξτε το αρχείο README για περισσότερες λεπτομέρειες

Τι είναι καινούργιο σε αυτή την έκδοση:.

  • προστεθούν δύο νέες ρυθμίσεις CSS config,: at_rules_with_properties και:. at_rules_with_styles
  • Προστέθηκε την πλήρη υποστήριξη για τους κανόνες CSS @ Page στο χαλαρό ρυθμίσεων, συμπεριλαμβανομένης της υποστήριξης για όλους τους κανόνες κουτί σελίδα περιθωρίου.
  • προστίθενται τα ακόλουθα CSS σε-κανόνες για την χαλαρή config.
  • Προστέθηκε ένα σωρό ιδιότητες CSS στη χαλαρή config. Δείτε την πλήρη λίστα εδώ.
  • Μικρές βελτιώσεις απόδοσης.
  • Αναβαθμισμένες Crass σε 1.0.2 για να πάρει μια αποτύπωση που επηρέασε το parsing των κανόνων CSS @ Page.

Τι είναι καινούργιο στην έκδοση 3.1.2:

  • Σταθερή: #document και #fragment απέτυχε στο κατεψυγμένο χορδές, και θα μπορούσε κατά λάθος να τροποποιήσετε παγωμένα χορδές και αν χρησιμοποιηθεί μια κωδικοποίηση εκτός των UTF-8 ή εάν περιέχουν χαρακτήρες που δεν επιτρέπονται σε μορφή HTML.

Τι είναι καινούργιο στην έκδοση 3.0.2:

  • Ενημέρωση Nokogumbo σε 1.1.12, επειδή 1.1. 11 επανήλθε σιωπηλά την αλλαγή προσπαθούσαμε να πάρει στην τελευταία έκδοση.

Τι είναι καινούργιο στην έκδοση 3.0.0:

  • Προστέθηκε υποστήριξη προηγμένων CSS εξυγίανση χρησιμοποιώντας Crass, οι οποίες είναι πλήρως συμβατό με το CSS Σύνταξη Module Level 3 parsing spec. Τα περιεχόμενα της λευκής λίστας & # X3C? Στυλ & # x3e? στοιχεία και χαρακτηριστικά στυλ στην HTML θα εξυγιανθεί, όπως CSS, ή μπορείτε να χρησιμοποιήσετε το αποστειρώνουν :: κλάσης CSS για να αποστειρώνουν το χέρι σελίδων CSS ή ιδιότητες.
  • Προστέθηκε ένα: allow_doctype ρύθμιση. Όταν η αληθινή, καλοσχηματισμένα ορισμούς doctype θα επιτραπεί σε έγγραφα. Όταν ψευδής (η προεπιλογή), οι ορισμοί doctype θα πρέπει να αφαιρεθεί από τα έγγραφα. Ορισμοί doctype δεν επιτρέπονται σε θραύσματα, ανεξάρτητα από τη ρύθμιση αυτή.
  • Προστέθηκε τα ακόλουθα στοιχεία για την χαλαρή config, εκτός από διάφορα χαρακτηριστικά:. Το άρθρο, μέρος, το σώμα, τα δεδομένα, div, υποσέλιδο, το κεφάλι, κεφαλίδα, html, κύρια, nav, ενότητα, διάρκεια, το στυλ, τίτλος
  • Η: whitespace_elements config είναι τώρα ένα Hash, και σας επιτρέπει να καθορίσετε το κείμενο που θα πρέπει να έχει τοποθετηθεί πριν και μετά από αυτά τα στοιχεία όταν είναι αφαιρεθεί. Η σειρά με βάση την αξία config παλιό στιλ εξακολουθεί να υποστηρίζεται για συμβατότητα προς τα πίσω.
  • Ακατάλληλα χαρακτήρες Unicode είναι τώρα απομακρύνονται από την HTML προτού να αναλυθεί.
  • Σταθερή:
  • παρένθεση μη-tag στην είσοδο, όπως & quot? 1 & # x3e? 2 και 2 & # X3C? 1 & quot? Τώρα αναλύεται και διέφυγαν σωστά σύμφωνα με την προδιαγραφή HTML5, όλο και & quot? 1 & gt? 2 και 2 & lt? 1 & quot?.
  • Τα αδέλφια προστίθεται μετά τον τρέχοντα κόμβο κατά τη διάρκεια της διάσχισης είναι τώρα επίσης διασχίζεται. Σε προηγούμενες εκδόσεις είχαν απλώς παραλειφθεί.
  • Nokogiri έχει χαστούκισε και έδωσε εντολή να σταματήσει να προσθέτει νέες γραμμές μετά από ορισμένα στοιχεία, γιατί αν ο κόσμος ήθελε νέες γραμμές εκεί που θα έχουν τα βάλουν εκεί, διάολε.

Τι είναι καινούργιο στην έκδοση 2.0.6:

  • Version 2.0.5 περιλαμβάνονται ακούσια κάποια εργασία στο Πρόοδος αλλαγές που δεν θα έπρεπε να κάνει τον τρόπο τους στον κύριο κλάδο.

Τι είναι καινούργιο στην έκδοση 1.2.1:

  • Προστέθηκε: remove_contents ρύθμιση config. Αν οριστεί σε true, απολυμάνετε θα αφαιρέσει το περιεχόμενο όλων των μη-Άσπρη στοιχεία εκτός από τα ίδια τα στοιχεία. Αν οριστεί σε μια σειρά από ονόματα στοιχείων, απολυμάνετε θα αφαιρέσει τα περιεχόμενα του μόνο τα στοιχεία αυτά (όταν φιλτράρονται), και να αφήσει τα περιεχόμενα των άλλων φιλτράρεται στοιχεία. [Ευχαριστούμε Rafael Souza για την επιλογή Array]
  • Προστέθηκε ένα: output_encoding config ρύθμιση για να επιτρέψουν την κωδικοποίηση χαρακτήρων για έξοδο HTML που θα καθοριστεί. Η προεπιλογή είναι "utf-8".
  • Η κατακερματισμού περιβάλλον πέρασε σε μετασχηματιστές περιλαμβάνει τώρα: στοιχείο node_name που περιέχει το πεζό όνομα του τρέχοντος κόμβου HTML (π.χ. & quot? Div & quot?)
  • .
  • Επιστρέφοντας οτιδήποτε άλλο εκτός από ένα Hash ή μηδενική από ένα μετασχηματιστή θα αυξήσει τώρα μια σημαντική εξαίρεση αποστειρώνουν :: Σφάλμα όχι ακούσια NameError.

Απαιτήσεις :

  • Ruby 1.9.2 ή νεότερη έκδοση
  • Nokogiri 1.4.4 ή νεότερη έκδοση

Παρόμοια λογισμικά

symdiff
symdiff

6 Jun 15

VisSense.js
VisSense.js

10 Dec 15

JSCapture
JSCapture

13 May 15

Άλλο λογισμικό του προγραμματιστή Ryan Grove

jsmin-php
jsmin-php

5 Jun 15

Net::Amazon::S3
Net::Amazon::S3

11 May 15

JSHint
JSHint

10 Apr 16

Σχόλια για Sanitize

Τα σχόλια δεν βρέθηκε
προσθήκη σχολίου
Ενεργοποιήστε τις εικόνες!
Αναζήτηση ανά κατηγορία