top of page
Writer's pictureMaxence Longle

Les ennemis et les ennemis de l'étiquetage manuel des images aériennes

L'étiquetage est au cœur du travail des biologistes sur Whale Seeker, mais à première vue, cette tâche semble d'une simplicité enfantine : regarder une photo et indiquer les baleines qui s'y trouvent, cela nécessite-t-il vraiment des diplômes universitaires et des années d'expérience ? Autant laisser cette tâche pour un système Captcha, ou pour occuper les enfants qui s'ennuient pendant leurs vacances !


En effet, l'être humain possède un cortex visuel très développé et, dès son plus jeune âge, il peut facilement distinguer les variations subtiles de tons et de textures, rechercher des formes dans un assemblage complexe et interpréter correctement des images. Grâce aux excellentes capacités de généralisation du cerveau humain, nos yeux sont rarement troublés par des facteurs tels qu'un changement d'arrière-plan ou la présentation d'un objet dans une position différente. Par exemple, si vous voyez d'abord une photo d'un dalmatien couché dans l'herbe, vous comprendrez facilement qu'il s'agit du même chien si vous le voyez ensuite debout sur un skateboard, mais ce scénario induirait probablement en erreur un algorithme de vision par ordinateur, à moins qu'il n'ait été spécifiquement entraîné à cette fin. En outre, une personne peut se concentrer sur les parties d'une image riches en informations, apprendre à reconnaître les détails importants sur lesquels elle peut s'appuyer, puis expliquer et discuter ses choix.


L’humain est-il donc la parfaite machine à étiqueter des images? Non, précisément parce qu’il n’est pas une machine. Identifier une baleine dans une image de bonne qualité en gros plan est facile, mais étendez cette tâche à de photos prises à haute altitude, de qualité variable et encombrées d’objets aux formes et aux couleurs similaires, et les facultés humaines montreront leurs limites. Comme une photo aérienne aplatit plusieurs centaines de mètres en deux dimensions, un observateur qui n’est pas alerte et expérimenté peut perdre ses repères d’échelle et confondre des baleines avec non seulement des vagues et des morceaux de glace, mais même des oiseaux en vol!


Si l'on multiplie ces défis par des centaines de milliers d'images, il faudra des jours ou des semaines pour les parcourir, la fatigue et l'ennui s'installeront, et des facteurs émotionnels entreront en jeu: si le jeu de données comporte peu de baleines, on aura tendance à marquer les observations incertaines pour éviter d'avoir l'impression de travailler pour rien. Inversement, si les images comportent de nombreux groupes de mammifères marins, l'observateur peut inconsciemment laisser de côté certaines cibles moins évidentes. Par conséquent, il est très difficile de maintenir une bonne cohérence lors de l'étiquetage de grands ensembles de données, en particulier si plusieurs observateurs travaillent simultanément.


Möbius a été mis au point par l'équipe de Whale Seeker pour pallier les insuffisances de l'étiquetage manuel. Un algorithme seul n'atteindra probablement jamais le niveau de précision et de fiabilité d'un observateur humain, pour des raisons expliquées dans un récent article de blog. C'est pourquoi une solution d'IA avec un humain dans la boucle est le meilleur moyen de combiner les forces complémentaires de l'homme et de l'ordinateur. L'algorithme se charge de la tâche répétitive et fastidieuse d'analyser des milliers d'images, en s'appuyant sur diverses techniques de détection et de segmentation d'images. Il fonctionne à une vitesse surhumaine, sans jamais se fatiguer, produisant des résultats cohérents et standardisés, puis transmet les cas incertains et plus difficiles à l'expert en chair et en os. Ce dernier peut alors consacrer toute sa concentration et son énergie aux cas qui bénéficieront le plus de son expertise et de son jugement. Globalement, l'analyse d'images avec Möbius est environ 80 % plus rapide que l'annotation manuelle seule !


Suivant les valeurs de B Corp, Whale Seeker offre de bonnes conditions de travail aux étiqueteurs, qui sont payés pour leur temps, et non à la tâche, un salaire qui tient compte du coût de la vie. Cela permet de fournir des données précises et fiables en un temps record, tout en respectant des principes éthiques solides. Utiliser les technologies de pointe pour préserver les espèces et les écosystèmes, tout en offrant un travail intéressant et gratifiant et une bonne qualité de vie aux humains : telle est notre vision de la bonne science pour aujourd'hui et pour demain !

bottom of page