DSTK - Το Data Science Toolkit 3 είναι ένα σύνολο λογισμικών δεδομένων και εξόρυξης κειμένου, ακολουθώντας το μοντέλο CRISP DM. Το DSTK προσφέρει κατανόηση δεδομένων χρησιμοποιώντας στατιστική ανάλυση και ανάλυση κειμένων, προετοιμασία δεδομένων με χρήση κανονικοποίησης και επεξεργασίας κειμένου, μοντελοποίηση και αξιολόγηση μηχανικών μάθησης και αλγορίθμων στατιστικής μάθησης.
Το DSTK 3 θα προσφέρει ελκυστικά χαρακτηριστικά όπως Deep Neural Network (Deep Learning), Ανάλυση συνδέσεων κειμένου με απεικονίσεις, KMeans Clustering. Ορισμένες από αυτές τις λειτουργίες ενδέχεται να εμφανίζονται σε παλαιότερη έκδοση, αλλά επειδή οι αλγόριθμοι ξαναγράφονταν για να μειώσουν τη χρήση εξωτερικών βιβλιοθηκών όπως η Weka για να μειώσουν το μέγεθος του αρχείου, χρειαζόμαστε περισσότερο χρόνο για να τις αναπτύξουμε. Ο κινητήρας DSTK βρίσκεται ακόμα σε στάδιο beta, επομένως μπορεί να υπάρχουν κάποια σφάλματα και ανακρίβεια.
Το DSTK 3 αποτελείται από το DSTK Engine, το DSTK ScriptWriter, το DSTK Studio και το DSTK Explorer. Ο μηχανισμός DSTK είναι απλοποιημένος, εστιάζοντας στην εξόρυξη δεδομένων. Το DSTK ScriptWriter προσφέρει GUI για να γράψει σενάριο για το DSTK Engine. Το DSTK Studio προσφέρει στατιστικά στοιχεία SPSS όπως GUI για εξόρυξη δεδομένων και το DSTK Text Explorer προσφέρει GUI για εξόρυξη κειμένου.
Απαιτήσεις :
Java Runtime Environment, Microsoft. Net Framework
Περιορισμοί :
Δοκιμή 10 χρήσεων
Τα σχόλια δεν βρέθηκε