Über Système de détection du cyber-trolling
Les discours haineux et le harcèlement sont très répandus dans la communication en ligne, en raison de la liberté et de l'anonymat des utilisateurs et de l'absence de réglementation des médias sociaux. C'est pourquoi le trolling et l'intimidation en ligne constituent un problème majeur dans une société. Pour surmonter ce problème, nous pouvons utiliser la capacité de l'apprentissage automatique pour la détection des discours de haine afin de capturer les propriétés communes des ensembles de données génériques et de transférer ces connaissances pour reconnaître les manifestations spécifiques de discours de haine en utilisant la PNL, l'apprentissage automatique et l'analyse. Notre objectif principal est d'appliquer ce modèle sophistiqué et efficace sur des données textuelles pour obtenir des résultats optimaux et précis. Nous avons utilisé différentes techniques d'apprentissage automatique et d'apprentissage profond, y compris des approches multimodales. Nous utilisons un ensemble de données divisé en sujets spécifiques comme la misogynie, le sexisme, le racisme, la xénophobie et l'homophobie. L'entraînement d'un modèle sur une combinaison de plusieurs (ensembles d'entraînement provenant de plusieurs) ensembles de données spécifiques à un sujet est plus efficace que l'entraînement d'un modèle sur un ensemble de données génériques atopiques. Les données peuvent être collectées à partir de diverses sources telles que YouTubeAPI, Twitter API, web-scrapping ou diverses sources gouvernementales. Notre objectif est d'effectuer un prétraitement et une analyse exploratoire des données collectées et d'en tirer des conclusions,
Mehr anzeigen