Dernière mise à jour : le 15/07/2024 à 15:50
icône Logo CatNat s'abonner

ALERTES EN COURS

  • 15 au 18/07 : alerte aux fortes chaleurs pour le Midwest et le centre Nord-Est des USA
  • 15 et 16/07 : alerte dépression tropicale (Three) pour le centre du Vietnam et le Sud du Laos
  • 15/07 : alerte aux fortes pluies pour la Bretagne et aux orages violents des Pyrénées au Nord-Est de la France
  • 16/06 au 06/07 : alerte aux fortes pluies et inondations torrentielles pour plusieurs provinces chinoises

 

suricatenet 150724
suricatenet 150724

Les catastrophes naturelles à évolution rapide qui touchent de vastes régions en peu de temps plongent souvent les responsables de la gestion de crise (préfectures, municipalités, services de secours…) dans l'incertitude quant à la situation exacte. Cette confusion peut durer plusieurs heures, le temps nécessaire pour recueillir, analyser et croiser les informations du terrain. La construction d'une « connaissance situationnelle » est cruciale pour mieux orienter et anticiper les décisions à prendre. Il s'agit de comprendre l'origine, l'intensité, les possibles évolutions ainsi que l'ampleur des pertes matérielles, humaines, fonctionnelles, etc. Toutefois, cette démarche est entravée par de nombreux obstacles, notamment la lenteur dans la remontée des informations jusqu'à leur analyse et la prise de décisions.

Comme l’a montré la crue éclair de l’Aude en octobre 2018 (qui a entraîné 14 décès et d’importants dégâts matériels), les événements à cinétique rapide mettent à mal la capacité des organisations à saisir rapidement la situation sur le terrain.

Par conséquent, il est tentant de recueillir en temps réel les témoignages diffusés sur les réseaux sociaux par les victimes et les témoins directs. L'intelligence artificielle (IA) se révèle être un atout essentiel dans cette tâche, tout en étant un partenaire en constante évolution. Les réseaux sociaux peuvent se révéler de précieux alliés… à condition qu'ils acceptent de partager ces données avec les gestionnaires de crise.

Le téléphone et les réseaux sociaux sont désormais intégrés dans notre quotidien. En situation de danger, les utilisateurs deviennent des vecteurs de communication privilégiés, partageant leurs expériences en direct, que ce soit avec leurs proches ou des inconnus du monde entier. Cette pratique a été maintes fois observée après des catastrophes naturelles, comme le séisme du Teil en 2019 ou lors de la tempête Alex en 2020.

Ce flot diversifié d’informations, bien que souvent fragmentaire, permet de récolter des données particulièrement utiles pour la gestion de crise, à condition de pouvoir identifier les informations cruciales parmi les millions de posts publiés chaque minute, puis de les analyser.

Cette mission est aujourd’hui menée avec un succès certain par des équipes de « soutien opérationnel virtuel » (bénévoles soutenant les actions des autorités via la surveillance des réseaux sociaux et la lutte contre les rumeurs infondées), comme en témoigne l’association VISOV. Cependant, ce modèle d’analyse manuelle des réseaux sociaux, bien que précieux, montre ses limites face à l’énorme quantité de données à traiter. Il est donc nécessaire de développer des outils numériques capables d’analyser automatiquement ces flux pour en extraire des informations pertinentes.

C’est le constat établi en 2020 par une équipe interdisciplinaire composée du BRGM, de l’IMT Mines Albi, de l’Université Paris-Dauphine et de la société PREDICT-Services, aboutissant au lancement en 2021 du projet RéSoCIO, soutenu par l’Agence nationale de la recherche.

Comme de nombreuses études similaires à travers le monde à cette époque, l’équipe du projet RéSoCIO s'est concentrée sur le réseau social Twitter. Avec ses 12 millions d’utilisateurs actifs en France et ses messages courts, Twitter était particulièrement adapté au partage de témoignages instantanés.

En outre, Twitter proposait une API gratuite permettant d’automatiser la collecte de données, utilisée notamment par le BRGM pour développer une plate-forme d’analyse des tweets en cas de catastrophes naturelles.

Parmi les objectifs initiaux du projet, il s’agissait en premier lieu de :

- Identifier la pertinence potentielle des tweets pour les gestionnaires de crise,
- Localiser géographiquement les informations mentionnées et les représenter sur une carte,
- Classer les informations en catégories d’intérêt pour, par exemple, filtrer les messages signalant des dommages ou émanant de témoins directs.

Pour ce faire, l’usage de techniques d’intelligence artificielle était bien entendu prévu. Mais l'IA nécessite des données pour apprendre et analyser les messages postés sur les réseaux sociaux.

Nous avons d’abord entraîné cette IA avec des données « froides » (tweets sélectionnés lors d’événements passés). Ensuite, en ajustant les modèles prédictifs ainsi constitués, nous avons pu les utiliser en temps réel pour analyser des données « chaudes », c’est-à-dire des tweets captés en direct.

« Si c’est gratuit, c’est que vous êtes le produit », dit l’adage. Les grandes plate-formes de réseaux sociaux ont rapidement compris la valeur des milliards de données générées quotidiennement par leurs utilisateurs et en tirent profit depuis plus de quinze ans. Ainsi, la plupart des API permettant d’accéder à ces données sont payantes.

Twitter faisait exception, notamment pour les recherches académiques. Le réseau permettait jusqu’à début 2023 d’utiliser une partie de ses données gratuitement, via des applications tierces comme TweetDeck.

Cependant, après son rachat par Elon Musk, Twitter, rebaptisé X, a changé son modèle économique en supprimant son API gratuite, remplacée par des solutions payantes à des tarifs prohibitifs.

Pour le projet RéSoCIO, cette évolution a rendu nos modèles d’analyse des tweets inutilisables, frustrant les acteurs « utilisateurs » tels que les pompiers des Alpes-Maritimes, les services de la ville de Cannes ou les bénévoles de VISOV, en rendant impossible toute application concrète des travaux en cours.

Une autre difficulté rencontrée réside dans l’évolution rapide des modèles d’IA. En 2020, lors de la conception du projet, nous avions opté pour l’apprentissage supervisé, qui permet aux modèles de prédire à partir d'exemples annotés. Cependant, cette approche nécessite de grandes quantités de données annotées manuellement.

En parallèle, nous avions reconnu l’intérêt des nouveaux modèles de langage, comme BERT développé par Google en 2018, pour analyser les messages courts en français. Ces modèles ont révolutionné le traitement du langage naturel en permettant de créer des modèles performants avec un nombre limité de données annotées.

L’avancée rapide des techniques d’IA et la montée en puissance des « grands modèles de langage » (LLM), comme ChatGPT, ont bouleversé notre programme de travail. Après avoir passé des mois à constituer des jeux de données pertinentes et à élaborer des modèles prédictifs, nous avons été surpris de constater qu’un outil d’IA générative tel que ChatGPT pouvait, en quelques lignes de code, atteindre des performances comparables voire supérieures.

De nombreux projets de recherche, dont le nôtre, sont confrontés à des difficultés liées à l’accessibilité des données et à l’évolution rapide de l’IA. Les chercheurs souhaitant exploiter les réseaux sociaux pour la gestion de crise doivent naviguer entre des règles fluctuantes et des coûts d’accès souvent prohibitifs.

Devant ces défis, les acteurs de la recherche et de la sécurité civile cherchent chacun des solutions de manière dispersée. Ce manque de coordination ne permet pas de présenter une voix forte et unifiée aux grandes plate-formes.

À l’heure où ces dernières se vantent de leurs politiques de « data for good », nous estimons qu'une réflexion plus large est nécessaire. Il faut garantir un accès privilégié aux données des réseaux sociaux aux chercheurs et aux développeurs d’outils à fort impact social, mais souvent dépourvus de viabilité financière, tout en respectant des règles strictes pour éviter les abus.

Cette évolution rapide soulève des enjeux éthiques. Trouver un équilibre entre l’acceptabilité et le bénéfice des IA pour les praticiens de la gestion de crise est crucial. De plus, comment bâtir des projets de recherche sur plusieurs années si les hypothèses de travail peuvent devenir obsolètes du jour au lendemain avec les progrès de l’IA ?

 

 

Dernières actualités des risques

Newsletter CATNAT Info

Recevez GRATUITEMENT tous les samedis les articles publiés durant la semaine écoulée grâce à notre lettre d'information "CATNAT Info"

Statistiques base BD CATNAT

Nombre d’événements recensés depuis 2001 (vu au 14/07/2024)
  • En France / DOM : 2.061
  • Dans le monde : 21.402
Nombre de victimes recensées depuis 2001 (vu au 14/07/2024)
  • En France / DOM : 25.617
  • Dans le monde : 1.668.376
Coût depuis 2001 en millions de $ (vu au 14/07/2024)
  • En France / DOM : 82.236
  • Dans le monde : 4.553.746
Accès à la BD CATNAT
Statistiques en temps réel

CATNAT SUR X