Intelligence artificielle

Intelligence artificielle

Depuis sa création, la Cité internationale des Oiseaux travaille à des projets liant intelligence artificielle (« machine learning ») et biodiversité. Nous sommes notamment l’organisme porteur du projet Microfaune, qui a été bénéficié à deux reprises du soutien de DataForGood. L’ensemble des programmes développés est publié sous licence Open Source, et disponible sur Github.

Microfaune : un projet d’IA au service du recensement de l’avifaune

Microfaune est une suite d’outils, en cours de développement, qui facilitent le suivi et le recensement des populations d’oiseaux, particulièrement en milieu urbain. Un projet pilote vise le parc de la Cité internationale, à Paris.

La première saison de collaboration avec DataForGood a abouti à 3 principaux produits :

  1. Une plateforme d’annotation permettant de labéliser la présence de chants d’oiseaux sur les enregistrements (les utilisateurs annotent des portions de piste son). Elle permet également de visualiser les performances du modèle de deep learning et de comprendre ses forces et faiblesses de manière à itérer et l’améliorer.
  2. Un algorithme de deep learning permettant la détection de chants d’oiseaux. La détection se fait en s’appuyant sur la labellisation réalisée par les utilisateurs.
  3. Une base de données labélisée qui sera mise à disposition en open-source.

Il s’agit d’une première étape permettant de détecter les moments où des chants d’oiseaux sont présents sur les enregistrements. La deuxième saison (2020) était axée sur l’identification des espèces présentes sur les sites (environ une cinquantaine d’espèces à la Cité internationale).

Plateforme d’annotation

Nous avons constaté qu’une tâche qui paraît simple, comme l’annotation de la présence de chants d’oiseau, pose certaines difficultés comme par exemple :

  • Le regroupement des sons d’oiseaux proche dans le temps.
  • Le rapport signal sur bruit parfois faible pouvant donner des avis contrastés entre les annotateurs.

Pour cela, la plateforme d’annotation que nous avons construite sous forme de Web App permet de réaliser une review des annotations par plusieurs personnes. Cela permet d’assurer la qualité des labels de la base de données.

Prétraitement et Modèle

Les pistes audio de la base de données sont tout d’abord converties en spectrogrammes qui est le format d’entrée du modèle. Les spectrogrammes sont considérés comme des images, et les architectures de deep learning utilisées sont similaire à des réseaux pour du traitement d’images.

Nous travaillons également sur une autre piste consistant à l’augmentation des données de notre base : des extraits d’enregistrements faits à la Cité sans oiseaux ont été ajoutés à des extraits de bases de données externes avec présence d’oiseaux. L’évaluation du gain de performance liée à l’augmentation est en cours d’évaluation.

Le modèle que nous avons créé est inspiré de l’article de Morfi & Stowell (2018) et contient des couches convolutionnelles et récurrentes. Le modèle permet d’entraîner à partir de données labélisées de manière globale (un label présence/absence de chants d’oiseaux pour un extrait de 10s), puis de faire des prédictions locales : à quel moment dans l’extrait un oiseau chante-t-il ? Ces prédictions locales sont visualisées sur notre plateforme d’annotation.

Base de données

La base de données est labélisée grâce à la plateforme d’annotation et permet d’obtenir des labels temporels indiquant le début et la fin des chants d’oiseaux. Cela est une amélioration par rapport aux bases de données existantes qui comportent des labels à l’échelle de l’extrait sonore (par exemple 5 ou 10 secondes).

De manière à assurer la qualité de la base de données, un système de review est utilisé sur la plateforme d’annotation. Les données qui n’ont pas encore été labellisées le seront par notre équipe et éventuellement par le biais de crowd-sourcing.