Arem είναι μια βάση για τα MAC (μοντέλο ανάλυσης Βασισμένο για τσιπ Seq δεδομένων).
Αλληλουχίας υψηλής απόδοσης συζευγμένη με χρωματίνη άνοσο- κατακρήμνισης (τσιπ Seq) χρησιμοποιείται ευρέως για τον χαρακτηρισμό του γονιδιώματος σε επίπεδο πρόσδεσης μοτίβα των παραγόντων μεταγραφής, συμπαράγοντες, τροποποιητές χρωματίνης, και άλλες πρωτεΐνες που δεσμεύονται με DNA. Ένα βασικό βήμα στην ανάλυση δεδομένων τσιπ Seq είναι να χαρτογραφηθεί μικρή διαβάζει από αλληλούχιση υψηλής απόδοσης για ένα γονιδίωμα αναφοράς και τον εντοπισμό περιοχών κορυφής εμπλουτισμένο με σύντομη διαβάζει.
Παρά το γεγονός ότι αρκετές μέθοδοι έχουν προταθεί για τσιπ Seq ανάλυση, οι περισσότεροι εκ των μεθόδων στάμενη εξετάσει μόνο αναφέρει ότι μπορεί μοναδικά να τοποθετηθούν στο γονιδίωμα αναφοράς και ως εκ τούτου έχουν χαμηλή ισχύ για την ανίχνευση κορυφών το- cated εντός επαναλαμβανόμενες αλληλουχίες. Εδώ έχουμε εισαγάγει μια πιθανολογική προ- σέγγιση για την ανάλυση των δεδομένων των τσιπ Seq που χρησιμοποιεί όλα τα διαβάζει, παρέχοντας μια πραγματικά γονιδίωμα-ευρεία άποψη των δεσμευτικών προτύπων.
Διαβάζει διαμορφώνονται χρησιμοποιώντας ένα μοντέλο μείγμα που αντιστοιχεί στο K εμπλουτισμένο περιοχές και μια μηδενική γονιδιωματική φόντο. Χρησιμοποιούμε μέγιστης πιθανότητας να εκτιμήσει τις θέσεις των εμπλουτίζεται περιοχές, και να εφαρμόσει μια προσδοκία μεγιστοποίησης (ΕΜ) αλγόριθμος, που ονομάζεται Arem, για να ενημερώσετε οι πιθανότητες ευθυγράμμισης του καθενός να διαβάσετε σε διαφορετικές γονιδιακές θέσεις εντοπισμού.
Για περισσότερες πληροφορίες, δείτε το χαρτί μας στην RECOMB 2011 ή επισκεφθείτε την ιστοσελίδα μας: http://cbcl.ics.uci.edu/AREM
Arem βασίζεται στο δημοφιλές κορυφή MACS καλούντος, όπως περιγράφεται παρακάτω:
Με τη βελτίωση των τεχνικών προσδιορισμού της αλληλουχίας, ανοσοκατακρήμνισης χρωματίνης που ακολουθείται από υψηλό αλληλουχίας απόδοση (τσιπ Seq) γίνεται όλο και δημοφιλής για τη μελέτη του γονιδιώματος σε επίπεδο αλληλεπιδράσεις πρωτεΐνης-DNA. Για να αντιμετωπιστεί η έλλειψη ισχυρών μεθόδου ανάλυσης τσιπ Seq, παρουσιάζουμε ένα νέο αλγόριθμο, που ονομάζεται μοντέλο με βάση την ανάλυση των τσιπ Seq (MAC), για τον προσδιορισμό του παράγοντα μεταγραφής θέσεις πρόσδεσης.
MACS συλλαμβάνει την επιρροή της πολυπλοκότητας του γονιδιώματος για να αξιολογηθεί η σημασία των περιοχών εμπλουτισμένο ChIP, και MACS βελτιώνει τη χωρική ανάλυση των θέσεων δέσμευσης μέσω συνδυασμού των πληροφοριών και των δύο θέσεων ετικέτας αλληλουχίας και προσανατολισμό. . Υπολογιστές Mac μπορούν εύκολα να χρησιμοποιηθούν για τσιπ Seq δεδομένων και μόνο, ή με δείγμα ελέγχου με την αύξηση της ειδικότητας
Απαιτήσεις :
- Python
Τα σχόλια δεν βρέθηκε