Une étude pour identifier les pensées suicidaires sur les réseaux sociaux

Il s'agit d'une ligne de recherche continue qui identifie les caractéristiques linguistiques des utilisateurs de Facebook et Twitter au Mexique. L'objectif est de créer des applications pour aider les professionnels de la santé à concevoir des programmes de prévention.

Une étude pour identifier les pensées suicidaires sur les réseaux sociaux
Une étude pour identifier les pensées suicidaires sur les réseaux sociaux. Photo by Karsten Winegeart / Unsplash

Un groupe multidisciplinaire de scientifiques de l'UNAM progresse dans un projet visant à détecter les idées suicidaires présumées dans les textes des utilisateurs de réseaux sociaux tels que Facebook et Twitter, en utilisant des techniques de linguistique informatique. La recherche est dirigée par Gerardo Sierra Martínez, chef du groupe d'ingénierie linguistique de l'Institut d'ingénierie (II), et Patricia Andrade Palos, universitaire de troisième cycle à la faculté de psychologie (FP) de l'UNAM.

L'un des moyens émergents d'exprimer l'intention de commettre cet acte est de recourir aux plateformes et aux espaces analogiques qui existent sur l'internet. Elle s'exprime textuellement sur ces sites par la discussion et, dans le pire des cas, par la promotion. Il est donc nécessaire de comprendre les dynamiques de son expression qui sont spécifiques à ces environnements virtuels et d'utiliser des méthodes telles que l'analyse du langage afin de développer des outils de détection qui contribuent au travail de prévention.

Le projet vise à trouver des caractéristiques linguistiques qui peuvent être identifiées et traitées pour détecter un risque, ce qui permettrait de détecter les personnes qui souhaitent hypothétiquement attenter à votre personne. Un comptage et une comparaison du lexique dans des groupes d'utilisateurs de Facebook et Twitter (ceux-ci sont confidentiels, leur identité n'est donc pas connue car leurs profils n'ont pas été consultés) ont été effectués par rapport à des textes aléatoires sur d'autres sujets.

Une différence linguistique a été établie entre les personnes qui pointent du doigt un risque supposé et celles qui parlent de n'importe quoi d'autre de commun. Comment cela a-t-il été réalisé ? Par le biais d'un comptage de mots, les utilisateurs à risque ont été regroupés en différentes catégories linguistiques et psychologiques, parmi lesquelles le fait de parler d'eux-mêmes, toujours à la première personne, de ne pas utiliser le pluriel, le "nous" ou le "vous".

Les phrases comportant des idées suicidaires présumées peuvent contenir : "je me sens comme ça" ; "je pense" ; "pourquoi cela m'arrive-t-il" ; "cela m'est arrivé...". Des concepts tels que "pleurer", "désespoir", "solitude", "frustration", "déprimé", "pessimiste" sont également intégrés. De même, les catégories de mots qui témoignent de l'anxiété, de l'angoisse, de la tristesse ou de la mort, mais qui sont inéluctablement accompagnés du "je".

En somme, trois ensembles différents de textes ont été analysés, dont le contenu portait sur la dépression et le suicide d'une part, et sur des sujets aléatoires d'autre part. L'analyse entre les deux a donné des résultats probants indiquant qu'il existe effectivement des différences linguistiques significatives qui sont un signe de risque de suicide.

Outils

Les résultats du projet sont sans précédent pour le pays et pour la langue espagnole mexicaine. Cependant, d'autres recherches sont nécessaires pour confirmer et élargir les données de cette première approche du phénomène, afin de disposer d'éléments concluants sur l'utilisation de la langue pour la détection des cas à risque. Afin d'avoir une analyse plus approfondie du langage, un dictionnaire Netspeak (mots et abréviations utilisés dans la communication sur Internet) a été créé, qui contient une variété de termes utilisés dans la blogosphère.

Pour le diagnostic du risque suicidaire, cette bibliothèque virtuelle a joué un rôle important, car ces termes étaient fréquents dans les textes examinés et leur évaluation d'un point de vue psychologique était possible grâce à l'intégration de ces mots. En plus du développement de cet outil, un compteur de mots a été généré sur la base du programme LIWC (Linguistic Inquiry Word Counter), qui classe les mots dans une série de catégories linguistiques et psychologiques.

L'étape suivante consisterait à développer un logiciel qui effectuerait cette recherche continue et automatisée dans les réseaux sociaux. Sinon, il faudrait suivre et analyser un nombre considérable de tweets et de messages Facebook, avec les autorisations respectives. Le développement progressif de ces méthodes générera des applications qui serviront à identifier les éventuels cas urgents nécessitant une prise en charge psychologique.

Ils aideront également les professionnels de la santé à concevoir des programmes de prévention fondés sur des informations claires et spécifiques concernant les pensées et les émotions que les gens éprouvent. La première partie de ce projet de recherche a abouti à la rédaction de l'article scientifique "Suicide Risk Factors : A Language Analysis Approach in Social Networks", publié dans le Journal of Language and Social Psychology.