Κάθε χρόνο, οι φαρμακευτικές εταιρείες αντιμετωπίζουν την απαιτητική πρόκληση να αυξήσουν την αποτελεσματικότητα της διαδικασίας ανάπτυξης νέων, αποδοτικών και φθηνών φαρμάκων. Τις τελευταίες δεκαετίες, μέθοδοι μηχανικής μάθησης έχουν εκμεταλλευτεί τα μεγάλα σύνολα δεδομένων που ήταν διαθέσιμα στις μεγάλες φαρμακευτικές εταιρείες και έχουν φτάσει στο σημείο να αποτελούν μια βιώσιμη εναλλακτική λύση για την ανάπτυξη νέων φαρμάκων. Σκοπός της παρούσας διπλωματικής εργασίας ήταν ο πειραματισμός με διαφορετικές μεθόδους πολλαπλών ετικετών που λαμβάνουν υπόψη την ανισορροπία των κλάσεων, πάνω στο πρόβλημα της πρόβλεψης της αλληλεπίδρασης φαρμάκου-βιολογικού στόχου. Οι μέθοδοι που εφαρμόσαμε περιλαμβάνουν την κλασική προσέγγιση της δυαδικής συνάφειας, το σύνολο των ταξινομητών αλυσίδας με τυχαία υποδειγματοληψία και τη μέθοδο συν-μάθησης πολλαπλών ετικετών. Τα πειράματα μας έγιναν πάνω σε δύο διαφορετικά σύνολα δεδομένων, ένα με μέγεθος που μπορεί να συγκριθεί με αυτό που χρησιμοποιούν οι φαρμακευτικές εταιρείες στα ερευνητικά τους τμήματα και ένα πολύ μικρότερο σύνολο δεδομένων που χρησιμοποιείται ευρέως από ερευνητές στον τομέα της πρόβλεψης αλληλεπίδρασης φαρμάκου-βιολογικού στόχου. Επίσης εξετάσαμε διαφορετικές προσεγγίσεις του προβλήματος της πρόβλεψης αλληλεπιδράσεων φαρμάκων-βιολογικών στόχων και δείξαμε ότι κάποιες προσεγγίσεις μπορούν να αποδειχθούν μη ρεαλιστικές και τελικά να ενισχύσουν με εσφαλμένο τρόπο την απόδοση των μεθόδων που χρησιμοποιούνται σε αυτόν τον τομέα
Ali EzzatMin WuXiaoli LiChee Keong Kwoh
Παπαδόπουλος, Δημήτριος Γεωργίου
Shi-Yu TianZhiguang ZhouXin SuYu-Feng Li
Min-Ling ZhangYukun LiXuying LiuXu-Ying Liu