This item is provided by the institution :
/aggregator-openarchives/portal/institutions/uoa   

Repository :
Pergamos Digital Library   

see the original item page
in the repository's web site and access all digital files if the item*



Detecting Hate Speech Online using Machine Learning

ΔΑΝΕΖΗΣ ΑΝΤΩΝΙΟΣ (EL)
DANEZIS ANTONIOS (EN)

Τις δύο τελευταίες δεκαετίες παρατηρήσαμε την ταχεία επέκταση του Διαδικτύου ως πλατφόρμα ανάπτυξης κοινοτήτων. Μεγάλες διαδικτυακές κοινότητες έχουν δημιουργηθεί σε μέσα κοινωνικής δικτύωσης, φόρουμ, πλατφόρμες εκπομπών, εφαρμογές ανταλλαγής μηνυμάτων (chat rooms) και διαδικτυακά βιντεοπαιχνίδια. Ωστόσο, με όλη αυτή την αύξηση της δημοτικότητας αυτών των πλατφορμών, έχει αυξηθεί και η δυσκολία ελέγχου τους. Σε αυτό το άρθρο, θα προτείνουμε πολλαπλά μοντέλα βαθιάς μάθησης που έχουν εκπαιδευτεί σε ένα σύνολο τοξικών σχολίων, θα τα αξιολογήσουμε και θα τα συγκρίνουμε. Λόγω της φύσης του συνόλου δεδομένων μας, τα μοντέλα μας προορίζονται κυρίως για χρήση σε φόρουμ και μέσα κοινωνικής δικτύωσης όπου το μήκος του μηνύματος είναι μεγαλύτερο. Θα μελετήσουμε το σύνολο δεδομένων εκπαίδευσης και θα συζητήσουμε τα προβλήματά του. Τέλος, θα παρουσιάσουμε διαφορετικές τεχνικές προεπεξεργασίας και θα αποφασίσουμε ποιες είναι επωφελείς για τα μοντέλα μας και ποιες είναι επιζήμιες. (EL)
For the past two decades we’ve witnessed rapid growth of the internet as a platform to grow communities. Large online communities have formed on social media, forums, broadcasting platforms, live chats and online video games. However, with all this rise in popularity of these platforms, so has the difficulty of moderating them. In this paper, we’ll propose several deep learning models trained on a toxic comment dataset, evaluate and compare them. Due to the nature of our dataset our models are mostly aimed for use in forums and social media where the message length is longer. We will study the training dataset and discuss its issues. Finally, we will demonstrate different preprocessing techniques and decide which ones are beneficial to our models and which are detrimental. (EN)

born_digital_graduate_thesis
Πτυχιακή Εργασία (EL)
Graduate Thesis (EN)

Τεχνολογία – Πληροφορική (EL)
Technology - Computer science (EN)


English

2020

https://pergamos.lib.uoa.gr/uoa/dl/object/uoadl:2929906
uoadl:2929906





*Institutions are responsible for keeping their URLs functional (digital file, item page in repository site)