L’IA appliquée à la géo-information a clairement démontrée son potentiel et ouvert nombre de perspectives intéressantes dans ce domaine. L’enjeu majeur aujourd’hui est de sortir l’IA et ses outils du monde de la recherche afin de la mettre entre les mains des experts métiers.
Dans l’écosystème de la géo-informatique, des outils donnant accès à l’IA apparaissent de plus en plus. Cette étape est importante, mais l’accompagnement des experts métiers reste encore lacunaire.
L’objectif de ce deuxième webinaire est ainsi de proposer un premier accompagnement de la mise en œuvre de l’IA géographique, en présentant l’ensemble des étapes nécessaires, leurs coûts et leurs défis, afin de donner une vision claire de l’ensemble de la chaîne de traitement IA.
Les considérations techniques seront ainsi abordées dans le but d’armer les experts métiers face à ces nouveaux outils en détaillant le cycle de vie d’un réseau de neurones, de l’entraînement à son utilisation.
[Musique] bonjour à toutes et à tous nous vous souhaitons la bienvenue et nous vous remercions d’avoir accepté cette nouvelle invitation d’Arc cité pour suivre le ce cycle de webinaire dédié à l’intelligence artificielle au service de l’information géographique alors ce webinaire est le second volet d’une série d’expertises proposé par Arc
CIT et traitant de la goia le premier webinaire qui s’est déroulé fin juin 2023 était importé à connaissance de quelques clés de compréhension sur cette thématique cette seconde partie aujourd’hui a pour but d’aller plus loin dans la démarche du machine learning au service de la donnée et nous avons
L’honneur et le plaisir de partager ce webinaire avec le swiisss territorial data laab que je vous présenterai dans dans quelques instants le trè volet euh sous forme d’audit et d’assistance technique sur mesure sera individualisé au service de votre propre stratégie de la donnée alors comment va se dérouler ce
Webinaire euh on est sur une durée totale de 2h la présentation euh de Nils et puis de Gwenael va durer à peu près 1h30 1h 40 en fonction et puis euh la modération les échanges les questions-réponses euh vont se dérouler à la fin de ce webinaire et duront entre entre 20 et 30
Minutes alors vos interlocuteurs du jour je suis Fabrice lartigou je serai votre modérateur eu le premier intervenant sera monsieur Nils Amel il est en charge de la goia euh chez ARCT il est développeur EV et data scientiste et puis la seconde intervenante sera madame Gwenaelle Salamin qui est géodata
Scientiste au Suisse territorial data laab alors ce webinaire n’est pas interactif en live vos micros et vos caméras sont donc par défaut coupés s’ils ne le sont pas je vous demanderai de bien vouloir ici les désactiver afin de ne pas générer d’interv d’interférence sonore ou visuel pour cette séance alors elle n’est pas
Interactive en mode Live ça veut dire que si vous posez des questions on y répondra pas en direct mais par contre vous pouvez très très bien et je vous invite évidemment à poser des questions sur la partie Q qui est accessible le panneau est accessible à partir de ce
Bouton ce que je ferai en tant que modérateur c’est que je recenserai je regrouperai l’ensemble des questions pour un temps d’échange avec avec Nils et Gwenael qui qui est prévu donc dans la dernière partie de ce webinaire après les après les deux présentations donc hésitez pas à utiliser ce panneau QR et
À poser vos questions je les regrouperai pour en faire une série d’échanges alors deux mots sur de présentation sur les deux organismes arcit et le stdl d’abord d’abord arccit arc CIT est un cabinet d’ingénieur conseil en en information géographique nous avons euh plus de 20 ans 20 ans d’expérience maintenant nous sommes une
Trentaine de collaborateurs entre la Suisse et les différentes agences entre la Suisse et la France nous travaillons nous avons de de très nombreuses références on a la chance d’avoir pu et de continuer de travailler dans de très nombreux pays à l’étranger globalement considérer qu’Arc CIT a une approche résolument qualité
RSE nous sommes certifiés ISO 9001 et ISO 14001 le cœur de notre métier c’est bien l’information géographique l’ensemble de nos activités vont vont du conseil au renforcement des capacités en passant par le développement d’application métier sur mesure de l’information géographique nous sommes un un organisme de formation professionnelle certifié
Caliopie Vous avez à votre disposition un portail dédié à la formation sur formationg.com sachez que depuis très très longtemps travaille dans la recherche et l’innovation de sur différentes sur différents sujets le sujet qui nous importe aujourd’hui et l’intelligence artificielle au service de l’information géographique c’est un des axes de développement de notre
Activité comme je vous l’indiquais en introduction nous avons le plaisir d’accueillir aujourd’hui pour ce webinaire le le stdl alors le le swiisss territorial datalab est une initiative Suisse financée par la stratégie Suisse pour la géoinformation euh quel est la quel est son but c’est d’encourager l’innovation dans les différentes administrations publiques
Elle a plusieurs missions euh la première première mission est de proposer un espace d’expérimentation pour favoriser l’innovation collective au sein des cantons et de la Confédération et puis c’est de trouver également un nouveau moyen de valoriser les données du territoire grâce à la à la science de l’information géographique
Et de la donnée et puis enfin sa dernière mission est de comer combler ce fossé qu’il y a trop souvent évidemment entre les résultats de la recherche et puis la résolution de problématiques concrètes des administration publique Gwenael fera une démonstration par l’exemple tout à l’heure dans la deuxème partie de de ce
Webinaire alors commençons juste quelques instants pour un par par un retour sur les thèmes abordés lors du premier webinaire qui s’est déroulé en en juin 2023 nous avons vu l’histoire et l’émergence de l’intelligence artificielle suite à à différentes techniques et l’introduction de de réseau de neuron l’outil à la base de de
L’intelligence artificielle on a vu également cette notion de réseau son son fonctionnement son architecture et en quoi consiste l’apprentissage la détermination des poids au travers de calcul de optimisation enfin on a vu également des cas d’usage en lien avec la GO information et les différentes utilisations de l’intelligence
Artificielle et puis nous avons conclu sur un tour d’horizon des applications et des perspectives possibles dans la géoinformation conclusion de ce premier de ce premier volet c’était de de de montrer que l’intelligence artificiel a évidemment des avantages mais aussi des inconvénients avec des person persective et des limites alors vous
Pouvez revoir retrouver l’enregistrement de ce premier webinaire sur l’espace YouTube d’ CIT dont dont vous avez le lien ici n’hésitez pas à revenir sur ce premier volet pour pour prendre connaissance des notions de des notions de base alors ce second webinaire aujourd’hui va se dérouler en deux parties une première partie sur la
Théorie de la mise en œuvre de l’intelligence artificielle par par Nils et puis une deuxième partie qui est une application concrète de la démarche intelligence artificiel par par Gwenael euh je vous souhaite un bon webinaire et puis je vous invite de nouveau à poser toutes vos questions sur la partie QR de
De teams et je passe tout de suite la parole à Nils qui va nous présenter cette première partie bon webinaire à tous merci famaris écoutez bienvenue euh pour ce cette partie théorique qui euh constituera la première partie de ce webinaire donc ici dans cette partie théorique on va essayer de faire un
Petit peu écho aux éléments qu’on avait un peu introduits dans le premier webinaire et on va essayer de regarder un petit peu plus dans le détail on va aller dans les un petit peu approfondir ces différents aspects et vraiment ici on va essayer de se concentrer sur ce
Qu’on pour appeler la mise en œuvre de Lia donc vraiment essayer de regarder le détail des différentes étapes qui sont nécessaires pour essayer de mettre mettre en place une démarche a pour réussir à obtenir un outil au travers de li donc on ira au travers de ces grandes
Étapes donc il y aura évidemment l’étape qu’on pourrait appeler principale donc là ce qui consiste à mettre en à initier une solution y donc tout ce qui concerne cet aspect d’entraînement donc ça ce sera la partie la plus fournie donc elle est chapitrée donc on ira au travers des
Sous- étapes de cette grande étape de mise en œuvre de l’IA on s’intéressera ensuite à la mise en œuvre c’est-à-dire opérationnelle c’est c’est-àdire une fois qu’on a obtenu un outil Ia efficace qu’est-ce qui se passe qu’est-ce que ça signifie de le mettre en opération et on terminera aussi par une autre grande
Étape qui est le suivi de cette utilisation opérationnelle d’une solution Ia évidemment on finira par une petite synthèse mais on commence tout d’abord par essayer de cerner un tout petit peu plus les objectifs de cette partie théorique de ce webinaire donc ici donc si vraiment les objectifs euh
De ce webinaire de cet aspect théorique de ce webinaire c’est vraiment d’essayer de comprendre cette démarche et vraiment d’essayer de comprendre ce qu’on pourrait appeler les coût de la mise en œuvre de l’ya vraiment ici on va se focaliser dans un contexte évidemment géographique on va essayer de regarder
Quelles sont les ces grandes étapes de mise en œuvre de l’a on va essayer de comprendre aussi quelle est la complexité de ces de ces différentes étapes et on va aussi essayer d’un petit peu mieux comprendre finalement d’où viennent les résultats de liya est effectivement un outil dont on parle
Beaucoup mais des fois on a un petit peu de de mal à comprendre réellement d’où viennent les résultats qui sont produits par hier donc c’est vraiment l’objectif ici c’est d’essayer de vous mettre les clés en main pour essayer de comprendre pourquoi il a performe parfois de façon efficace et pourquoi dans certaines
Circonstances on peut avoir de mauvaises performances à travers le déploiement d’une solution Ia donc ici vraiment c’est essayer de de comprendre cette notion de mise en œuvre de l’IA vraiment dans un contexte géographique en partant de la donnée jusqu’à un outil opérationnel que l’on peut déployer en tant qu’outil donc ici l’idée c’est
Vraiment aussi d’essayer de vous mettre les clés en main pour mieux aborder mieux comprendre les outils qui sont en train d’apparaître et qui donnent accès à la mise en œuvre de Lia dans un contexte géographique alors ce que je vous propose ici euh c’est de commencer par cette première grande étape donc c’est
Vraiment l’entraînement c’est-à-dire la mise en place de la solution Ia donc elle est faite de sous-étapes que nous que nous détailleront d’un point de vue technique on regardera ensuite effectivement comment on utilise cette cette C solution une fois qu’on a réussi à l’entraîner mais on va commencer d’abord par cette première sous-partie
De cette grande étape qui est l’entraînement la mise en place d’une solution IAC et donc le choix du problème et l’analyse du problème auquel on cherche à se confronter donc évidemment ça c’est la première étape c’est une étape qui est importante c’est de bien analyser de bien comprendre le
Problème auquel on se confronte et qu’on va chercher à résoudre au travers de l’ donc ici il y a un certain nombre de questions qui sont importantes et qui doivent être posées initialement avant d’amorcer une démarchea donc c’est une des premières question que l’on doit se poser c’est est-ce que vraiment
L’élément sur lequel on va s’attarder est quelque chose qui est suffisamment clair est-ce qu’il a suffisamment de caractéristique est-ce qu’il est suffisamment euh discriminable par rapport aux différents autres éléments qui pourraient apparaître dans les données qu’on considère une question corollaire qui est un petit peu plus
Subtile qui est est-ce que le concept de cet élément est-il lui aussi bien circonstré est-ce qu’on le comprend correctement c’est une question plus subtile qu’on avait un petit peu abordé dans le premier webinaire au travers de cet exemple des bâtiments on a vu qu’un un concept aussi simple que celui de
Bâtiment peut quand même conduire à des questions qui sont parfois un petit peu déroutantes une autre question importante c’est vraiment est-ce que cet élément que l’on cherche à détecter avec la solu une solution Ia est quelque chose qu’on peut réellement distinguer donc est-ce qui va pas être trop confondu avec d’autres éléments
Territoriaux qui pourraient avoir des des caractéristiques similaires finalement une autre question qui est importante c’est est-ce qu’on a effectivement les données à disposition est-ce qu’on va réellement pouvoir mettre en place les données nécessaires pour PIR entraîner une solution il a pour résoudre le problème auquel on se
Confronte donc ce sont des questions qui sont très importantes à se poser d’emblé avant de mettre en œuvre une solution il a parce que ça va nous éviter un certain nombre de surprises et surtout ça va nous éviter d’essayer de faire de de faire un certain nombre d’efforts de
Mise en œuvre de la dans des contextes où finalement on aurait pu déterminer dès le départ que liya ne pouvait pas résoudre le problème auquel on se confronte donc c’est des questions qui sont un petit peu déroutante quand on est nouveau par rapport à ce domaine de
Li mais c’est des réflexes qui doivent se mettre en place et à force de de de d’expérience c’est quelque chose qui sera de plus en plus facile et automatique euh non seulement de se poser ces questions mais aussi d’y répondre alors ici pour un petit peu guider notre webinaire on vous propose
Ici de prendre un petit cas d’usage donc un un exemple qui va nous servir un petit peu de fil rouge au travers de ce webinaire donc c’est un cas simple qui consiste en la détection des bâtiments sur les images aériennes et c’est une sorte de fil rouge que l’on va utiliser
Tout au long de ce webinaire pour essayer d’illustrer don une illustration concrète des tous les aspects théoriques que l’on va discuter au travers de ce de ces de ce cette partie théorique de ce webinaire donc ici en se focalisant sur la détection des bâtiments on se
Focalise un peu sur ce qu’on appelle la détection d’objets donc on va un tout petit peu perdre en généralité par rapport à la démarche Ia mais on va garder quand même toutes les grandes étapes nécessaires de la mise en œuvre de l’IA et normalement on gardera une
Vue assez ample de cette mise en œuvre donc ici évidemment la détection des bâtiments n’est pas choisie au hasard c’est quelque chose qui va satisfaire les questions qu’on vient de se poser donc c’est un objet qui est plutôt clair le concept l’est aussi même si effectivement il y a parfois des
Questions assez déroutantes qui se posent même dans un cas comme celui-là c’est un élément qui est distingable il ne pose pas trop de de problème il n’est pas trop confondu avec d’autres éléments territoriales évidemment concernant les bâtiments on a une donnée qui est abondante qui est très disponible et qui
Ne pose pas de problème donc c’est vraiment un fil rouge qu’on va utiliser tout au long de ce webinaire qui nous servira avec un exemple concret très parlant qui nous permettra d’illustrer les différents aspects et concept théorique que l’on va regarder alors une fois qu’on s’est posé
Les questions une fois qu’on a compris effectivement qu’on pouvait engager de Lia par rapport à un problème auquel on se confronte il va falloir que l’on mette en place le corpus donc ce corpus c’est ce qu’on avait vu au précédent webinaire c’est vraiment ce qui reste au centre de la démarcheia c’est vraiment
Ce que l’on va utiliser pour circonscrire le problème afin de pouvoir l’expliquer au réseaux de neuron et lui faire comprendre le problème que l’on cherche à résoudre alors tout d’abord quand on commence avec la mise en œuvre euh avec la mise en place d’un corpus la première
Chose que l’on doit faire c’est choisir une zone de travail donc cette zone de travail est importante parce que c’est de cette zone qu’on va extraire des exemples qui vont constituer notre corpus et donc c’est sur cette zone là que notre réseau de neurone va apprendre à résoudre le problème auquel on se
Confronte donc c’est une zone en général qu’on va choisir relativement vaste parce qu’il faut en effet que cette zone soit représentative de l’élément territorial que l’on cherche à détecter donc tant en terme de ses caractéristiques mais aussi en terme de ses de du compte contexte territorial dans lequel il peut apparaître donc il
Faut pour mettre en place un corpus avoir beaucoup d’exemples variés que l’on va pouvoir extraire de cette zone de travail elle doit quand même rester relativement raisonnable pour obtenir quand même un corpus qui reste gérable d’un point de vue informatique et qui ne conduise pas à des données trop
Volumineuses alors une fois qu’on a choisi une zone quand on cherche à choisir une zone de travail on a essentiellement deux grandes possibilités donc on peut choisir soit une zone qui est continue soit une zone qui était parce qui est fait de morceau à disparître sur le territoire alors une
Zone continue a un avantage intéressant c’est que c’est une une une zone qui sera assez homogène et donc on va maximiser la probabilité que les données soient assez homogènes qu’elles viennent de sources assez limité et du coup on aura un corpus qui sera techniquement plus simple à mettre en place si on
Utilise une zone continue par contre une zone éparce elle aura plus facilement une représentativité plus importante de l’objet que l’on cherche à détecter par contre elle demandera peut-être plus d’effort techni parce que effectivement dans un dans le cas d’une zone éparce il y aura peut-être des données à aller
Chercher à différents endroits donc il va falloir mettre en place des efforts de collecte de cette données et de fusion de cette données pour pouvoir la transformer en un corpus donc ici le choix entre une zone continue et une zone éparse est essentiellement déterminé par la donnée qui est disponible par la disponibilité
De la donnée mais aussi par la complexité de l’élément à détecter puis un élément est complexe plus il va falloir essayer de mettre en place un corpus représentatif et donc on aura peut-être plus la la possibilité de partir sur des zones épars donc il faut essayer de trouver un espèce d’équilibre
Entre la représentativité de l’objet que l’on aura dans notre zone de travail et les données qui sont disponibles par rapport à ces différentes zones de travail alors une fois qu’on a choisi notre zone de travail la zone sur laquelle on va extraire notre corpus il va falloir la soumettre au réseau de
Neurone afin qu’il puisse apprendre de cette zone àvidemment un réseau de neurone lui a une capacité d’injestionestion de données qui est limitée c’est-à-dire qu’on ne peut pas lui donner un un gros morceau territorial il va falloir que l’on découpe cette donnée cette zone de travail pour pouvoir la donner morceau
Par morceau au réseau du neuron on va donc procéder à ce qu’on appelle un tuilage donc un découpage de cette zone de travail en des tuiles géographiques et on va pouvoir soumettre ces hilees individuellement aux réseau de neuron usuellement on va essayer de d’utiliser des tuiles qui sont
Relativement possibles en y a il est pas rare effectivement d’avoir des tuiles qui peuvent avoir 256 pixels de côté ce qui peut paraître assez faible regarde des standards d’image actuel mais dans la majorité des cas aussi on va se contenter de prendre des tuiles carrées en effet il n’a pas tellement de raison
De nécessité d’utiliser autre chose que des tuiles carrées euh on peut aussi avoir un tuilage qui va recouvrir entièrement la zone de travail on peut aussi avoir un tuilage qui va être strictement inscrit dans la zone de travail donc ça ce sont des petits détails techniques qui vont dépendre de
Notre capacité réelle à euh certifier du contenu de chaque tuile alors une fois que on a compris qu’il fallait réaliser ce tuilage ce découpage de la zone de travail il va falloir que l’on définisse une stratégie pour cette découpe donc on a essentiellement trois grandes questions
Qui vont à nous guider pour essayer de mettre en place cette stratégie la première question c’est quelle résolution à donner pour nos Tuil est-ce qu’on veut favoriser des résolutions FAI ou plutôt des résolutions élevées on va aussi devoir se poser la question de la taille géographique ou de la surface
Géographique des tuiles que l’on va définir est-ce qu’il faut favoriser des petites tuiles en grand nombre ou des tuiles plus grandes mais en nombre plus restreints et une troisème question qui est intéressante c’est est-ce qu’on doit finalement considérer toutes les tuiles que l’on va obtenir lorsqu’on va découper notre zone de travail donc
Évidemment pour répondre à ces trois questions ça va dépendre en grande partie de l’élément que l’on cherche à détecter son aspect ses caractéristiques territoriales mais dans tous les cas on va quand même essayer de garder un nombre de Tuil qui soit raisonnable alors il faut qu’il soit élevé pour
Avoir une bonne représentativité mais on va quand même essayer de garder des corpus qui sont relativement raisonnables qui sont gérables en plus on va essayer toujours d’avoir la résolution la plus grossière que possible ble ici l’idée c’est vraiment d’essayer d’alléger les tuiles au maximum et de limiter les temps de
Calcul notamment pendant l’entraînement euh que va engendrer le corpus que l’on va calculer donc ces paramètres que ce soit la résolution ou la taille géographique de cette huile sont typiquement des aspects qui seront optimiser donc c’est-à-dire qu’on va faire un certain nombre d’entraînements successifs qui vont nous permettre de
Faire varier légèrement ces différents paramètres pour essayer de trouver les paramètres les plus optimaux pour découper notre zone de travail alors on peut commencer par le choix de la résolution donc il s’agit vraiment ici de la taille en pixel de notre huile donc la taille que l’on va
Donner à notre huile territoriale donc évidemment pour fixer la résolution on va se laisser guider essentiellement par les caractéristiques de l’objet que l’on cherche à détecter donc il faut impérativement que les caractéristiques de l’objet que l’on cherche à détecter soi suffisamment clair et visible avec la résolution que l’on va choisir donc
Il faut choisir une résolution en conséquence on va quand même essayer de garder dans tous les cas une résolution qui est la plus grossière possible donc là vraiment on va essayer de limiter cette complexité des tuiles et la lourdeur de ces Tuil et du corpus donc c’est une étape qui n’est pas réellement
Simple on commence souvent par se laisser guider par notre intuition et ensuite cette intuition va légèrement l’affiner l’optimiser avec un certain nombre de d’entraînements successifs pour quoi l’on conduira souvent de façon systématique afin d’ajuster ce paramètre de résolution alors une fois qu’on a euh pardon si on illustre ça avec notre
Problème fil rouge donc cette idée de détection des bâtiments sur euh des images aériennes donc si on regarde par exemple l’image de gauche on voit clairement ici un choix de résolution qui est beaucoup trop faible donc on distingue à peine les bâtiments mais on ne voit pas leurs caractéristiques donc
Ici c’est typiquement une résolution qui est trop grossière on aura pas suffisamment de caractérisation des objets pour pouvoir les détecter sur l’image de droite on voit un bâtiment qui est vu de beaucoup plus près donc ici on voit vraiment que le bâtiment est vu avec toutes ses caractéristiques alors c’est quelque chose qui
Fonctionnerait mais c’est quelque chose qui est aussi assez donc c’est quelque chose c’est une résolution qui montre un petit peu trop les caractéristiques de l’objet c’est-à-dire que les caractéristiques consomment d’une certaine manière un peu trop de pixels donc ici ce que l’on va chercher un petit peu à faire c’est un compromis et
On a l’image centrale qui va nous donner une résolution qui est assez correcte pour le problème de détection des bâtiments sur les images aériennes on voit clairement les bâtiments on les voit apparaître dans leur contexte on voit leurs caractéristiques essentielles mais on arrive à garder une résolution qui est relativement grossière et donc
Des tuiles qui ne sont pas trop lourdes alors ici quand il est question de ce choix de résolution on n pas de recette miracle malheureusement donc on doit se laisser un petit peu guider par notre intuition dans un premier temps et c’est ensuite au travers d’entraînement successif et d’optimisation des
Paramètres d’entraînement qu’on va réussir à dégager la résolution qui est la plus efficace et qui permet aussi la plus grande légèreté de notre corpus alors ensuite une fois qu’on a fixé le choix de la résolution il va falloir s’attaquer au choix de la taille géographique donc de la surface de notre
Huile qui vont donc recouvrir notre zone de travail donc il faut évidemment garder à l’esprit que quand on va fixer la taille géographique on devra certainement retourner vers la résolution et peut-être l’ajuster un petit peu donc on a toujours ce jeu où l’un dépend de l’autre donc la
Résolution dépend de la surface et inversément ici pour choisir euh la taille géographique de notre tuile on est essentiellement guidé par deux grandes questions donc on a tout d’abord la zone de travail donc si on a choisi une zone de travail qui est très grande qui est très ample on va avoir
Naturellement tendance à choisir des tuiles qui sont assez larges pour essayer de limiter le nombre de tuiles qui vont vont recouvrir cette zone de travail mais il y a aussi la nature de l’objet qui va aussi nous guider quant au choix de la taille territoriale de
Nots tuile en effet plus un objet est grand plus il est vaste d’un point de vue territorial puis on va avoir tendance à choisir des tuiles grosses pour essayer de voir l’objet dans toute sa complexité dans tout son ensemble donc là vraiment c’est aussi une question d’équilibre il faut trouver un
Espèce d’équilibre entre la résolution qu’on va utiliser pour notre huile ainsi que leur surface géographique pour répondre aux nécessités du réseau de neurone donc c’est-à-dire de d’avoir un objet qui apparaît avec toutes C s caractéristiques pour qu’il soit suffisamment reconnaissable et que le réseau neurone soit capable de le
Discerner par rapport par rapport aux autres éléments qui pourraient apparaître sur l’image alors une fois qu’on a défini notre stratégie de tuilage on va pouvoir procéder au découpe de la zone de travail donc on va utiliser ces caractéristiques de taille et de résolution pour découper l’image aérienne que l’on a choisi sur notre
Zone de travail donc ici c’est vraiment la première partie de notre corpus donc ce sont les tuiles territoriales c’est les éléments qui vont entrer dans le R zone neuron mais il manque une autre partie pour finaliser notre corpus comme on l’avait vu la dernière fois c’est ce que l’on appelle les annotations donc
Les annotations c’est ce qui va indiquer sur chacune de ces tuiles au réseau de neuron exactement ce que l’on cherche à détecter donc ici dans notre cas il faudra marquer par exemple la présence des bâtiments sur les imagériennes afin que le réseau de neuron puisse comprendre que ce sont bien les
Bâtiments qu’on cherche à détecter donc dans un certain nombre de cas on peut s’appuyer sur des couches existantes donc typiquement dans le cas des bâtiments c’est une uneination qui va exister sous la forme de couches géographique préexistante il faudra quand même qu’on vérifie la compatibilité de ces annotations donc de
Ces couches géographique en perspective des images pour bien vérifier qu’on a une cohérence entre les deux souvent évidemment quand on utilise de l’IA on va s’intéresser à des objets justement qui échappe à ces données territoriales qui ne font pas l’objet de couches disponies et du coup dans ces
Circonstancesl sur chaque tuile que l’on a défini avec notre stratégie de découpage il va falloir annoter manuellement la présence de l’objet donc ça ça illustre bien un des coup les plus importants de la mise en œuvre de l’a c’est vraiment cette notion de devoir annoter de devoir faire un effort
D’annotation pour pouvoir faire comprendre le problème au réseau de neuron donc c’est d’autant plus coûteux dans ces circonstances de faire des annotations que souvent les objets sont assez subtiles en tout cas plus subtile qu’on l’imagine et il faut souvent le concours d’un expert métier pour pouvoir réaliser cette annotation ou au moins à
Minima de pouvoir valider cette annotation alors une dernière question qui reste en suspens qu’on s’était posée c’est la question doit-on conserver toutes les tuiles qui constituent notre corpus qui ont été obtenu par le découpage de notre zone de travail en effet cette question est légitime parce que les annotations peuvent manquer sur
Certaines tuiles si on prend l’exemple des bâtiments par exemple si on a une tuile territoriale qui nous montre je sais pas par exemple un morceau de forêt elle peut tout à fait ne comporter aucun bâtiment et donc cette tuuile n’aura pas d’annotation et du coup la question c’est est-ce qu’on doit garder ces
Huiles qui n’auront aucune annotation aucune information de l’élément qui nous intéresse alors le plus souvent dans la pratique ce qu’on va faire c’est qu’on va aller les éliminer la raison sous-jacente à cette élimination c’est que il n’y a pas réellement de nécessité de conserver ces hiles en effet les tuiles qui ont des
Annotations vont nous montrer suffisamment d’exemples de non objet qui nous intéressent donc par exemple dans le cas des bâtiments d’exemples de non bâtiment pour qu’il soi nécessaire de rajouter encore des tuiles qui montrent plus d’exemples de non élément qui donc sont vides d’annotation alors on pourrait dans certains cas souhaiter garder ces ces
Huile VI en effet dans un certain nombre de cas on peut avoir un réseau de neuron qui a tendance à faire un certain nombre de fausses détections et ces fausses détections peuvent un peu polluer les prédictions qui vont qu’on va obtenir au travers de l’outil donc ça c’est quelque
Chose qui peut être contrebalissé justement en utilisant des tuiles vides mais la plupart du temps on va vraiment attendre d’être confrontter à ce problème pour considérer ces tuiles vides et la plupart du temps on va les éliminer de notre corpus qui permet aussi un petit peu de
L’alléger alors à partir de là doncon a compris cette notion cette nécessité de constituer un corpus on a vu un petit peu les contrainte que cela implique ce que je vous propose ici c’est de regarder un petit peu un exemple concret et pour illustrer cette notion de constitution de corpus je vous propose
Donc qu’on reparte sur notre problème F rouge donc la détection des bâtiments sur les images aériennes et donc on peut faire cet exercice d’analyse du problème donc est-ce que l’objet est clair et reconnaissable dans le cas du bâtiment effectivement c’est quelque chose auquel on peut répondre assez facilement le
Concept sous-jacent de bâtiment est lui aussi assez clair il n’y a pas trop de problème même si comme on l’IT vu au dernier webinaire il y a quand même quelques questions parfois un peu déconcerté qui peuvent se poser normalement les bâtiments ne sont pas trop confondus avec d’autres éléments
Territoriaux donc en plus on a des données qui sont abondantes on a des images abondantes et des annotations qui sont abondantes pour le casad des bâtiments donc ici avec ces questions là on peut effectivement comprendre qu’on peut réellement aborder le problème de la détection des bâtiments avec le
Déploiement d’une solution i on doit donc commencer par choisir une zone de travail il va falloir qu’on définisse une stratégie de découpage de cette zone de travail qui soit adaptée à la détection des bâtiments et ensuite on va pouvoir adjoindre des annotations afin d’expliquer au réseau de neuron ce qu’on
Cherche à faire alors dans le casre de la détection des bâtiments en fait en Europe on a l’embarrage du choix en effet concernant les bâtiments euh quasiment toutes les zones en Europe peuvent servir de zone de travail on va ira quand même à tenir compte de ce qu’on pourrait appeler les spécificités
Architecturales euh de l’endroit sur lequel on va travailler en effet concernant les bâtiments il peut y avoir un certain nombre de spécificités architecturales dont il va falloir tenir compte parce que si l’on change ces spécificités ses spécificités architecturelles on pourrait avoir un réseon de rond qui pourrait baisser en
Performance alors il faut aussi garder à l’esprit que ça ce n’est pas un problème insurmontable dans le sens où on pourra toujours un peu respécialiser un réseau de neurone afin que il s’adapte à ses spécificités architecturales mais on gardera quand même cet élément en tête donc il faut choisir une zone qui soit
Suffisamment raisonnable he ici euh avec une zone raisonnable on peut tout à fait obtenir la richesse nécessaire s’agissant de la détection des bâtiments ici on a choisi une zone continue euh pour donner un exemple alors ici ça aurait fait sens de choisir une zone plus épar on aurait pu par
Exemple dans le cas des bâtiments choisir une zone urbaine une zone périurbaine et une zone rurale par exemple pour essayer d’obtenir une une représentativité idéale euh de la détection pour la détection des bâtiments ici on choisit de garder les choses simples pour cet exemple au théorïque alors une fois que on a choisi
Notre zone de travail il va falloir qu’on mette en place cette stratégie de tulage donc cette stratégie de découpe qui va nous permettre de soumettre cette emprise territorial au réseau pour son apprentissage donc ici on cherche à détecter donc des bâtiments sur les images donc il faut que leurs caractéristiques soient clairement
Visies pour que le résseau de neuron puisse apprendre correctement le problème ici on va essayer aussi comme on l’a dit de garder la la résolution la plus grossière que possible pour essayer de conserver une certaine légèreté pour les tuiles qui vont constituer notre corpus et essayer de garder des temps de
Calcul et d’entraînement qui vont rester raisonnables donc on essaie de réaliser cet cet équilibre entre la résolution des tuiles la caractéristique de de de objet qu’on cherche à détecter ainsi que un nombre de tuiles qui reste relativement raisonnable et gérable alors ici pour donner un exemple concret
He on va essayer de définir des paramètres de tuile pour notre découpe de notre zone de travail donc ici comme annoncé on va se laisser guider initialement par notre intuition donc on optimisera ensuite les premiers choix qu’on a fait par un certain nombre d’entraînements successifs et en analysant les performances que l’on
Obtient mais si typiquement dans le cas des bâtiments on pourrait choisir des tuiles avec une taille territoriale par exemple de 500 m qui recouvrirait donc notre zone de travail d’un certain nombre de tuiles en nombre relativement raisonnable parallèlement on pourrait choisir ici de choisir une résolution de 256 pixels pour nos nos tuiles
Territoriales donc ici avec ces deux paramètres on aurait une une taille de pixel donc une taille territoriale de pixel qu’on appelle aussi La ground sampling distance qui serait d’environ 2 m donc c’est quelque chose qui est assez grossier mais qui permet quand même de voir assez clairement les bâtiments et leurs caractéristiques
Principal donc ici on arrive à peu près à réaliser cet équilibre qu’on cherchait à obtenir entre la résolution la légèreté les caractéristiques et le nombre de tuiles donc évidemment ici ce sont des paramètres qui typiquement seraient ajustés dans la pratique avec un certain nombre d’entraînement jusqu’à qu’on trouve des paramètres qui soient
Les plus optimaux et les plus euh qui conduisent aux performances les plus les plus optimales possibles donc avec notre stratégie de découpe ici on peut donc s’attaquer à la découpe de notre zone territoriale donc il existe ici plusieurs manière de découper une une zone territoriale avec une stratégie de tuilage on pourrait par
Exemple choisir une origine différente pour la grille de découpe on pourrait aussi imaginer imposer une rotation pour faire tourner les tuiles territoriales dans la pratique en général donc se passe de ce genre de raffinement en effet ça n’a pas une grande importance d’ajuster les tuiles donc on se contente
Simplement de découper la zone de travail avec les caractéristiques qu’on va souvent simplement au plus simple donc ici on voit qu’avec notre zone de travail et les caractéristiques de découpe de cette zone on obtient un nombre assez important de tuiles ce qui est une bonne chose parce qu’il nous
Faudra effectivement des exemples les plus variés possibles pour pouvoir faire comprendre le problème au réseau de neuron mais si on voit quand même qu’on arrive à garder un certain nombre de tuiles en nombre relativement raisonnable alors sachez que dans la pratique on pourrait aussi essayer de minimiser le nombre de tuiles donc on
Pourrait essayer d’optimiser au maximum le nombre de tuiles pour qu’il soit le plus petit possible pour obtenir les performance que l’on cherche alors ça c’est quelque chose d’assez complexe c’est un domaine de recherche qui est encore aujourd’hui actif et dans la pratique on ne s’attarde pas trop sur
Cet aspect- là on va se contenter du nombre de tuiles que l’on a malgré le fait qu’on aurait pu peut-être effectivement alléger le corpus alors on a à présent avec cette stratégie de découple la première partie de notre corpus donc ce sont les tuiles territoriales qu’on va pouvoir soumettre
Au réseau de neurones de façon individuelle donc il va falloir qu’on mette en place la deuxième partie de notre corpus qui sont donc les annotations les annotations c’est vraiment ce qui va montrer au réseau de neuron sur les images qu’on lui soumet quel est l’élément territorial qui nous
Intéresse donc ici avec l’exemple de la détection des bâtiments on peut typiquement utiliser des couches géographiques qui existent en effet en Europe en suite Suisse en France les couches géographiques de bâtiments sont à bonomre donc ici on a fait le choix de par exemple utiliser la coche des
Bâtiments qui viennent d’Open Street Map alors une fois qu’on a ajouté ces annotations à not tuile on peut facilement détecter les tuiles qui seront vides d’annotation et on peut procéder à leur élimination pour obtenir notre corpus donc ici à ce stade nous avons un corpus qui est utilisable qui
Est constitué qu’on peut vraiment utiliser avec un réseau neurone pour expliquer ce problème de la détection des bâtiments sur des images aériennes alors ici j’ai passé un petit peu vite sur un aspect qui est quand même assez important c’est que dans le cas où on choisit des annotations qui viennent
D’une couche existante comme on l’a fait nous avec Open Street Map il va falloir se poser un certain nombre de questions quant à la cohérence de ces deux de ces des annotations qu’on va apposer aux images en effet les images aériennes et les annotations qu’on va utiliser sont
Deux sources de données distinctes donc elles ont des cycles de maintien des cycles de misise à jour qui leur sont propres et qui sont souvent décorrélés donc on aura souvent des problèmes de synchronisation qui peuvent être sptial ou qui peuvent être temporelles entre les annotations et les imageir donc il
Va falloir faire un effort d’analyse tuile par tuile où il faudra vérifier la cohérence des annotations par rapport aux images qu’on utilise et ça c’est typiquement un cûpt assez important de l’IA c’est cette validation cette vérification même dans le cas où on utilise des données qui préexistent pour
Les utiliser comme annotation donc ici typiquement le travail qu’il faudrait faire c’est vérifier tuile par tuile que les annotations sont bien synchronisées spatialement qu’elles sont bien synchronisées temporellement il va falloir ajouter les annotations qui pourraient manquer mais il va falloir aussi de temps en temps éliminer des des annotations qui viendraient
Entreutes donc à ce stade on a un corpus qui est constitué donc l’étape suivante pour pouvoir mettre en œuvre une solution il a c’est de choisir le réseau c’est-à-dire que on va choisir l’architecture du réseau qui va nous permettre de résoudre le problème auquel on s’attarde alors ici s’agissant
D’architecture de réseauond on ira ici pas trop dans les détails donc ça sort un petit peu de de de du contexte théorique de ce webinaire qu’on veut garder quand même à abordable et simple comme on l’avait vu au précédent webinaire en terme d’architecture de réseau de neurones il en existe une très
Grand nombre pour s’adapté à un très grand nombre de problèmes et plus encore même pour un même problème il peut y avoir plusieurs architectures qui sont à disposition qui sont à même de résoudre ce problème donc aujourd’hui euh le choix du réseau de neurone c’est quelque
Chose qui reste encore à la charge du Data scientiste en eff fait il faut une certaine expertise d’IA pour pouvoir choisir correctement le réseau de neurone par rapport au problèmes que l’on cherche à résoudre il y a quand même dans un dans la plupart des cas ce que l’on va faire
Quand même c’est d’utiliser des réseaux qui sont éprouvés donc c’est des architectures qui sont existantes qui ont déjà été utilisé dans d’utrre contexte et qu’on sait qu’on on sait qu’effectivement elles ont des bonnes performances sur certains types de problèmes et souvent même ce sont des des architectures qui sont préentraînées
Donc en géo information on fait beaucoup ça c’estàdire qu’on essaie de tirer parti de l’existante à la fois des des architectures mais aussi des préentraînements queon va simplement se contenter de spécialiser en utilisant les corpus que l’on constitue pour s’attarder sur des problèmes territoriaux dans un proche avenir il
Est assez probable que des banques de d’architecture de réseau de neuron se mettent de plus en plus en place et qui nous donne donc de plus en plus accès à ces différentes architectures et donc cela permettra vraisemblablement d’ici quelques années aux expert métier de pouvoir se passer du Data scientiste et
De pouvoir aller chercher dans ces banques de réseau de neuron le réseau de neuron qui est le plus adapté pour le problème qu’il cherche à résoudre mais encore aujourd’hui la le concours d’un Data scientist est encore souhaité lorsqu’il est question de choisir un réseau de neurone pour une solution
Ia alors on va quand même juste un tout petit peu s’attarder sur une architecture un peu particulière donc c’est une architecture qui est beaucoup considérée en géformation parce qu’elle est très utile par rapport au problèmes auquel on se confronte en géformation donc ici c’est une une architecture euh
Qui découle de ce qu’on appelle une architecture d’autoencodeur donc l’autoencodeur c’est un une architecture simple de réseaux de neurones qui a engendré beaucoup de réseaux de neurones du même type qui sont aujourd’hui beaucoup utilisé notamment qu’on utilise beaucoup en géoinformation donc ici l’idée d’une architecture d’autoencodeur qu’on utilise beaucoup en géoinformation
C’est d’avoir une première couche à travers laquelle on va faire entrer les données donc dans notre cas avec nos corpus souvent ce qui va entrer du côté gauche de du réseau de nuron c’est une image aérienne ensuite l’architecture du réseau de neurone fait que les couches vont se rétrécir jusqu’à atteindre une
Couche minimale au centre du réseau de neurone et passer cette couche minimale on va avoir une architecture en en miroir où les couches vont regagner en importance jusqu’à une sortie qui elle sera constituée de la même taille donc des qui aura les mêmes caractéristiques que ce qui est entré dans le réseau de
Neuron donc dans le cas d’une image aérienne on aurait une image qui sortirait du réseau de neuron alors pourquoi est-ce qu’on utilise ce genre d’architecture c’est euh quelque chose d’intéressant qui crée par la couche centrale une source qu’on pourrait appeler une sorte de goulot d’étranglement et du coup on va
Interdire d’une certaine manière à l’ensemble de l’information de l’image de passer de parer d’autres du réseau de neurone et on espère que par cette cette astuce on va forcer le réseau de neurone à se focaliser sur les caractéristiques les plus essentielles de l’image et qui va donc essayer favoriser sa
Compréhension des images et son analyse donc ici ce qu’ l’on obtient typiquement quand on utilise une telle architecture c’est une donnée qui est similaire à celle qui est entrée dans le réseau de neuron donc si on regarde un tout petit peu plus dans les détails ce qui se
Passe en terme d’entrée et de sortie donc on entrer typiquement au géinformation on aura une image aérienne et le réseau de neurone de ce type d’architecture va typiquement nous fournir en sorti une image qui aura les mêmes caractéristiques mais dont le contenu sera différent donc en sorti ce
Que l’on va obtenir c’est une image qui va marquer la présence des éléments territoriaux qui nous intéressent donc si on reprend notre exemple des bâtiments détectés sur les images aériennes on voit ici un exemple où la sortie de ce type de réseau de neuron c’est vraiment le marquage sur l’image à
L’aide de pixel de l’emplacement de chaque bâtiment qui ont été détecté par le réseau de neuron donc on comprend aussi que cette sortie ne peut pas être utilisée tel quelle en dans dans dans dans le le cadre de la géoformation et on comprend donc qu’il faut encore des efforts de traitement pour pouvoir
Traiter cette sortie en des géométries qui pourraent être utilisé dans un contexte du GIS et des outils GIS usuel on comprend aussi quelque chose d’intéressant c’est que quand on obtient une sortie de cette nature en sortie d’un réseau de neuron on a une certaine liberté quant à l’interprétation qu’on
Va on faireire donc par exemple on peut garder l’ensemble de l’image et donc on pourrait obtenir ce qu’on pourrait appeler une classification complète de l’image aérienne qui est entr donc ici dans le cadre des bâtiments on pourrait avoir des pixels qui nous indiquent deux catégories ici ce serait bâtiment et non
Bâtiment une deuxième interprétation intéressante possible de ce genre de sortie c’est qu’on peut regrouper les pixels Connex et essayer d’isoler chaque bâtiment qui ont été détectés qu’on pourra ensuite traduire en des géométries qui nous donnera accès à une sorte de protocadastre des bâtiments et ça c’est ce qu’on appelle en en
Intelligence artificielle de la segmentation d’instance on pourrait encore aller plus loin dans la simplification o on pourrait réduire l’ensemble de ces groupes de de pixels Connex à simplement des points ou alors à des rectangles enlobant et là on serait vraiment dans la perspective de la détection d’objets donc vraiment dans
Une perspective d’inventaire d’éléments territoriaux donc c’est beaucoup c’est ce type d’architecture qui sera utilisée en gformation justement parce qu’elle est producti productrice de masques et ces masques nous laissent aussi une certaine liberté d’interprétation par rapport au résultats qu’on cherche à obtenir alors dans notre cas si on
Reprend notre exemple fil rouge de la détection des bâtiments il nous faudrait donc effectivement choisir une architecture pour de réseau de neuron pour pouvoir résoudre notre problème donc ici typiquement c’est typiquement un des cas d’usage où on choisirait l’utilisation d’un de ces de ces réseaux neurones qui sont producteurs de masques
Justement parce qu’ils ils permettent de résoudre le problème qu’on cherche auquel on cherche à à s’attaquer mais qui permettent aussi une certaine souplesse en sortie en terme d’interprétation des résultats qu’on va obtenir ici on peut citer qu’on aurait pu utiliser une architecture de type unette euh c’est par exemple une
Architecture qui a été utilisée pour le calcul de la couverture du sol par l’hgn donc c’est cette cette fameuse couche cosossaï qui a été calculée récemment par l’IGN donc ici avec notre choix d’architecture de réseau de producteur de masque donc on pourra effectivement bien détecter l’emprise des bâtiments et
On pourra surtout en déduire et traduire ces emprises en une couche géométrique que l’on pourra par ailleurs utiliser dans le contexte de la V information donc à partir de là on a constitué un corpus on en a vu un exemple on a choisi notre réseau de neuron donc maintenant il reste à
Entraîner notre réseau de neuron donc à essayer de lui faire comprendre euh cette notion euh pardon de nous faire de lui faire comprendre ce que l’on cherche effectivement à résoudre donc ici comme on l’IT vu au précédent webinaire donc l’entraînement d’un réseau de neuron c’est vraiment une application du calcul
D’optimisation donc le but ici vraiment c’est de minimiser ce qu’on avait vu la dernière fois c’est-à-dire une fonction de cût donc la fonction de cût ce qu’elle va nous décrire c’est en gros les erreurs que commet le réseau de neurones en terme des sorties qu’il produit par rapport aux sorties qu’on
Aurait attendu donc c’est là que le corpus intervient c’est-à-dire que c’est du corpus que l’on peut comprendre ce que l’on aurait attendu du réseau de neurone et qu’on puisse comparer effectivement ce qu’il nous répond par rapport à ce qu’on aurait attendu donc ici le but du réseau de neuron et de son
Entraînement c’est vraiment de forcer le réseau neuron à se conformer aux sorties que l’on attend et de ce fait on espère l’espoir c’est réellement de de faire en sorte que le le raison de Neon finisse par comprendre le problème auquel on s’attaque et qui soit Infiné capable de
Le résoudre en toute généralité donc c’est cette notion qu’on avait vu au passé dans webinaire qui consiste en cette notion de généralisation donc cette cet état dans lequel le réseau de neurone atteint des performances telles qu’il a fini par comprendre entièrement le problème auquel on s’attaque donc c’est vraiment cette fonction de cûp
Donc cette minimisation de fonction de cûp qui est au centre de l’apprentissage d’un réseau de neurone et c’est donc elle que l’on va suivre tout au long de l’apprentissage pour pouvoir le conduire et le guider alors pour donner un tout petit peu plus de corps à cette notion
De fonction de cou ici je vous propose de regarder un tout petit peu plus près comment effectivement on calcule cette fonction de coup donc dans notre cas on a une image aérienne qui va entrer dans le réseau de neurone et ce qui va sortir c’est une image donc un masque mais qui
Reste une image qui est formée de pixels d’un autre côté nous avons les annotations qui viennent du corpus donc on peut reproduire les masques que l’on aurait attendu en sortie du réseau de neurone et de ce fait on peut comparer le masque attendu du masque réellement produit par le réseau de neuron pixel
Par pixel donc on peut prendre chaque pixel de la sortie la comparer avec la sortie attendue et obtenir une sorte d’erreur pour ce pixel on peut ensuite faire la somme de l’ensemble des erreurs de tous les pixels de l’image pour obtenir l’erreur globale sur l’image elle-même on répète ensuite cette cette
Opération pour faire la somme de toutes les erreurs sur l’ensemble du corpus et donc ça ça nous donne cette quantité donc cette fonction de coût qui va effectivement nous indiquer quelle est l’erreur que le réseau le réseau de neurone commet à l’échelle du corpus tout entier donc ça c’est une exemple
Assez simple de fonction de cû donc c’est une fonction de cûp qui peut tout à fait être utilisée dans le cadre de la géinformation sachez aujourd’hui qu’on préfère des fonctions de cou CP qui sont un petit peu plus complexes que celles-là qui sortent un petit peu du
Cadre théorique de ce webinaire on les utilise parce qu’elles fournissent de meilleurs résultats elles sont plus performances mais cette fonction de cou que je vous décris ici en sommant les erreurs sur les pixels est une fonction de cou qui est tout à fait utilisable et qui surtout a le mérite de nous faire
Comprendre un peu mieux ce que l’on entend par fonction de cou et par erreur global commise par le réseau de neurone par rapport à ce qu’on attendrait de lui alors avant de pouvoir entraîner un réseau neond on va faire une opération qui est un petit peu particulière qui
Est un petit peu déroutante de de primeord ce qu’on va faire c’est qu’on va découper notre notre corpus avant de l’utiliser pour l’entraînement donc on va prendre les exemples qui constituent le corpus et on va les séparer dans trois groupes distincts donc on a un premier groupe qu’on appelle le groupe
D’entraînement donc ce groupe d’entraînement va contenir les exemples donc les tuiles anoté les tuiles territoriales anoté qui vont réellement être utilisés pour faire apprendre le réseau de neuron donc ce sont ces tuiles qui vont provoquer le changement des poids internes du réseau qu’on avait détaillé dans le précédent webinaire et
Qui donc vont réellement modifier l’état interne du du réseau demande afin qu’il l’apprenne du problème que l’on cherche à résoudre on a un deuxième groupe que l’on va définir qu’on appelle cette fois-ci le groupe de validation et dans ce groupe-là on va considérer des exemples qui ne seront pas utilisés pour
Faire apprendre le réseau de neurone mais on va quand même les utiliser pour calculer qu’on pour appeler une fonction de coût auxiliaire c’est-à-dire qu’on va quand même soumettre ces exemples au raisseau de neuron il ne va pas appendre dessus mais il va quand même calculer les erreurs qu’il commet sur ce groupe
De validation et ça ça nous donne accès à une deuxième fonction de cûp une fonction de coup auxiliaire qui s’ajoute à celle de du groupe d’entraînement et qui nous le verrons est très utile pour suivre effectivement guider l’entraînement d’un réseau de neurone alors on termine aussi cette segmentation en avec un troisième
Groupeon appellera le groupe de test ça c’est un groupe qu’on va garder hors de tout contexte d’entraînement donc on ne va absolument pas l’utiliser durant la phase d’entraînement et c’est un groupe qu’on va utiliser par ailleurs à la fin de l’entraînement pour pouvoir vérifier et certifier des performances réelles de
Réseau de neuron et ainsi éviter d’induire un certain certain nombre de BIA en utilisant des données qui ont été effectivement utilisées pour former le raisau de alors il y a pas tellement de standard établis quant à cette segmentation en général évidemment on va favoriser le groupe d’entraînement c’est
Celui qui occupera le plus euh qui qui contiendra le plus d’exemples d’entraînement souvent on est entre 80 70 60 % pour ce groupe et ensuite on va distribuer les exemples qui restent en deux parties égales pour le set de validation et le set de tests alors du coup pourquoi est-ce
Qu’on doit faire ça pourquoi est-ce qu’on doit séparer ces exemples qui viennent du corpus en trois groupes distincts donc on pourrait croire naïvement en fait que il faille montrer le plus d’exemples possibles à un réseau de N pour qu’il apprenne le plus efficacement possible et on pourrait aussi s’imaginer que finalement cette
Fonction de cûpt que l’on cherche à minimiser ben en fait il faut essayer de la minimiser le plus possible parce qu’elle est synonyme d’absence d’erreur et donc on pourrait croire que c’est ce qu’on cherche lorsqu’on cherche à entraîner un réseau de neurone alors ici en nia c’est absolument pas le cas c’est
Un petit peu déroutant au départ mais si on regarde ici ce graphique qui est à l’écran donc on voit les deux de fonction de cout leur valeur au fil des itérations de l’entraînement donc on voit en bleu la courbe d’entraînement en orange la courbe de validation et on
Voit que dans un premier temps les deux vont descendre donc ça c’est la phase dans laquelle le réseau neuron va effectivement apprendre il va améliorer ses performances au bout d’un moment la fonction de coût de la associé au groupe de validation va arrêter de descendre et
Va repartir à la hausse et ce point d’inflexion la fonction de validation va repartir à la hausse est typiquement le point qui est censé matérialiser la plus grande pro limité à la généralisation du réseau de neurone donc c’est théoriquement le point où le réseau de neurone est le plus efficace on voit
Aussi que la fonction de cût qui est liée à l’entraînement elle va continuer à descendre et justement c’est le signe que le réseau de neurone passer ce point d’inflexion est en train de trop s’attarder sur les exemple d’entraînement donc il va suapprendre du réseau d’entraînement donc il va devenir
Très très bon sur ce dernier mais en fait il va devenir de plus en plus incompétent sur tout ce qui va sortir de ces huile d’entraînement sur les qu’il il est en train d’apprendre donc c’est pour ça qu’on utilise à la fois un set d’entraînement et un set de validation
C’est justement pour pouvoir repérer l’arrivée de ce point d’inflexion de pouvoir détecter cet optimum de l’apprentissage et pouvoir justement atteindre arrêter l’entraînement au bon moment donc ici à partir de maintenant donc on a vu qu’on a réussi à construire un corpus on a choisi un réseau de
Neurone on a compris comment il fallait l’entraîner comment il fallait l’arrêter au plus optimal donc ici à ce stade idéalement on a un outil joia qui est utile qui est performant et donc peut l’utiliser comme un outil opérationnel donc je vous propose ici qu’on s’attarde
À la deuxième grande étape de la mise en œuvre de la donc c’est la phase opérationnelle d’un réseau de neurone comment finalement est-ce qu’on utilise un réseau de neurone sous la forme d’un outil une fois qu’il a été entraîné alors tout d’abord euh il faut comprendre qu’un réseau de Neon une fois
Qu’il a été entraîné une fois qu’on le considère comme un outil opérationnel c’est quelque chose qui devient un petit peu plus autonome c’est-à-dire que on a plus d’exemples ici c’est-à-dire que on est hors du corpus donc le réseon de neurone va effectivement recevoir des entrées mais on a plus de
Comparaison possible on ne peut plus vérifier la qualité de de des prédictions parce qu’on a plus de corpus on a plus d’annotation et donc on ne peut plus vérifier euh si le réseau de neuron nous fournit des prédictions qui sont à propos par rapport aux données qu’on lui soumet
Donc idéalement on espère que quand on déploie un risseau neurone bah il va conserver les performances qui ont été déterminées sur le le le le groupe de tests qu’on avait défini préblement euh mais on ne peut plus le quantifier donc c’est-à-dire qu’on est un petit peu à
L’aveugle quand un réseau de neurone est utilisé en opérationnel B il reçoit des données il fournit des prédictions mais on ne peut plus vraiment certifier de la qualité de ces prédictions une autre chose importante c’est que lorsqu’on va utiliser un réseau de neurone de façon opérationnelle si on veut par exemple
Faire des prédictions sur une vaste zone géographique on va retrouver les mêmes problèmes qu’on avait dans la la la constitution du corpus c’est-à-dire que on ne peut pas soumettre une zone d’un seul tenant à zone neurone donc qui là il conserve cette capacité limitée d’ingestion de données donc il va
Falloir retuiler redécouper la zone sur laquelle on va faire des prédictions pour pouvoir la soumettre au réseau de neurone et va donc nous fournir une prédiction pour chaque tuile individuelle donc on va ici essayer de faire en sorte de garder des caractéristiques de tuile qui sont similaires à celles que l’on avait
Utilisé pour pouvoir créer notre corpus d’entraînement en effet pour que le réseau de neuron gardent des performances qui soient les plus optimales possibles il faut éviter de changer ces caractéristiques pour pas que le réseau de neuron soit perdu par des des images qui sont assez différentes de celles qu’il a vu durant
Son entraînement alors plus particulièrement ici ce qui est vraiment important de comprendre c’est que c’est plutôt la taille territoriale des pixels donc ce qu’on pour appeler la ground sampling distance donc la taille apparente réelle des pixels sur le territoire qui a une importance en effet aujourd’hui on utilise beaucoup ce qu’on
Appelle des réseaux convolutionnels les réseaux convolutionnels ont la l’avantage de pouvoir accepter n’importe quelle taille d’image en entrée et du coup bah on peut être tout à fait tenté de doubler la taille des images par rapport à celle qu’on avait considéré durant le C d’entraînement et là on peut
S’en sortir en effet si on double la taille des tuiles territoriales on peut aussi doubler la RA résolution et donc on va garder cette ground sampling distance donc la taille des pixels identique à celle que le réseau neurone avait vu durant son apprentissage et là normalement on devrait conserver des
Performances qui sont bonnes donc ici on va quand même essayer de faire attention à garder des caractéristiques de Tuil qui vont entré qui sont le plus similaires possible que celles qu’on a considéré durant la phase d’entraînement donc ici on voit qu’une solution il a une fois qu’elle est déployée conserve
Quand même un certain nombre de contraintes d’utilisation qui sont assez similaires que celles qu’on a rencontré durant la constitution du corpus et la phase entraînement donc c’est pas un outil tout à fait immédiat il y a quand même un certain nombre d’efforts d’utilisation à mettre en heure pour
Pouvoir utiliser l’IA comme un outil au quotidien alors comme on l’a vu aussi précédemment donc on a utilisé un réseau de neurone qui est producteur de masque et on a vu aussi que pour faire une des prédictions sur une zone il va falloir la découper de la même manière que l’on
Avait découpé notre zone de travail pour l’entraînement et donc ce résone de r il va travailler sur ces tuile et donc il va nous fournir des prédictions donc des masques de détection pour chacune de ces tuiles individuelles donc la nature euh donc il va falloir d’une part traduire
Ces masques en des géométries donc là on a une certaine liberté d’interprétation est-ce qu’on veut réduire euh les géométries en des simples points est-ce qu’on veut des emprises territoriales évidemment ce qu’on aime bien au ginformation c’est d’avoir des emprises territoriales d’avoir des espèces de protocadastre qui nous donne une couche
Géométrique de l’élément qui nous intéresse donc aujourd’hui ces processus qui servent à traduire le masque en géométrie sont assez bien maîtrisés euh euh c’est quelque chose qui ne pose relativement pas de problème mais il faut quand même comprendre d’ où viennent ces géométries donc on va les
Déduire des masques donc il y a un certain nombre de géométries qui vont se retrouver découpé à cause de cette découpe de la zone de prédiction pour pouvoir la soumettre au réseau de neuron donc c’est quelque chose qu’il faut avoir en tête c’est-à-dire que un certain nombre d’éléments territoriauxx
Vont se retrouver à Chaval entre deux tuiles de prédiction du coup on aura deux masques séparés qui vont conduire à sa détection il va falloir faire un petit effort de réunion de ces différentes géométries coupées qui sont coupées par l’effet euh euh du tuilage qu’on a a dû utiliser pour pouvoir
Soumettre la zone de prédiction au réseau neuron donc on voit aussi que finalement le réseau neuron c’est une partie d’une solution y donc effectivement c’est la partie de détection mais on comprend aussi qu’il y a quand même un certain nombre de processus annexes qui doivent être à l’œuvre non seulement pour la découpe
Des images pour les faire entrer dans le réseau dans le réseau de neuron mais aussi un certain nombre d’efforts en sortie de réseau de neuron pour pouvoir traiter les prédictions et les transformer en une couche géographiquement intéressante qu’on peut utiliser dans un contexte de gination alors à partir de là on
Pourrait imaginez que on est bon on a déployé un outil après l’avoir entraîné et que du coup voilà on a un outil qui est censé fonctionner avoir de bonnes performances dans la réalité c’est un tout petit peu plus compliqué que ça on effet un réson de de quelque chose qui
Est assez vivant donc il va falloir mettre en place une stratégie de suivi de ce réseau neurone en effet euh une fois qu’on a déployé un réseau neurone donc il va nous fournir un certain nombre de prédition de prédiction mais là on est hors du corpus c’est-à-dire
Qu’on a plus aucune indication sur la pertinence de ces prédictions donc on est à l’aveugle et ici euh il est justement important par rapport à ce problème de mettre une stratégie de suivi en place parce que justement on a cet aveuglement on ne sait pas effectivement si le réson
Continue d’avoir les performances que l’on a obtenu durant la phase d’entraînement donc en effet on peut avoir des performances qui peuvent se dégrader une fois qu’on a déployé un outil Ia donc il y a plusieurs raisons qui peuvent expliquer cette dégradation donc un exemple assez assez classique
C’est que le corpus qu’on a utilisé s’avère un tout petit peu faible donc il n’avait pas la richesse nécessaire il n’a pas a réussi à expliquer correctement le problème au réseau de neurone et du coup ben le réseau de neurone a bien performé durant la phase d’apprentissage mais une fois en
Opération il a des lacune justement parce qu’il n’a pas vu suffisamment de richesse une autre chose c’est l’utilisation de nouvelles images qui peutvent avoir des caractéristiques un petit peu différentes des sensors de des des des des des capteurs un petit peu différents qui peuvent avoir une influence délétaire sur les performances
D’un réion neuron on a aussi typiquement des variations saisonnières avec les images qui peuvent avoir un impact dégradant sur les performances d’un réseau de neurone et donc il va falloir suivre mettre une stratégie en place pour pouvoir suivre les performances de cet outil déployé donc ce que l’en faire
Ici au plus simple généralement ce qu’ l’on met en place c’est euh lorsqu l’on traite une zone de prédiction on a ce découpage en huile qui s’effectue estce que l’on va mettre en place ben c’est tout simplement une sélection aléatoire d’un certain nombre de tuiles de prédiction que l’on va ensuite soumettre
À l’expertise métier donc l’expertise métier va analyser le contenu de cette huile analyser les prédictions qui ont été faites par le réseau de neurone donc faire un travail essentiellement d’annotation de ces tuiles et on va pouvoir de cette de cette manière-là vérifier effectivement que les performances du réseau neuron se
Conservent bien effectivement qui garde bien les performances que l’on avait durant la phase d’entraînement alors que doit-on faire si on constate une baisse de performance d’un réseau de neurone donc tout d’abord ce qu’il faut faire c’est identifier pourquoi on est confronté à une baisse de performance en effet il y a plusieurs
Cas de Figur qui peuvent survenir un des grands cas de figures qui peut survenir c’est le réseau de neurone ne voit pas un certain nombre d’objets qui aurait dû détecter ce qu’on appelle ici euh euh une un problème de faux négatif c’est-à-dire que on voit sur les images
L’objet qui nous intéresse mais le réseau de neurone ne les détecte pas donc il ne les voit pas alors qu’il aurait dû marquer leur présence donc ici ce qu’on va faire pour palier à ce genre de problème c’est qu’on va renforcer notre corpus avec des exemples de ces
Objets euh qui auraiit dû être détectés qui ne l’ont pas été donc on va adjoindre cette huile avec des annotations pour essayer de faire comprendre au réseau de neuron ben que ces objets nous intéresse et qui doit effectivement les faire apparaître en sortie donc dans les masassques qui
Produit un autre grand problème auquel on est confronté avec liya c’est ce qu’on appelle les problèmes des faux positifs c’est-à-dire un réseau de neuron qui aura tendance à trop détecter c’est-à-dire qu’il va bien nous détecter les objets qui nous intéresse mais il va aussi beaucoup détecter d’éléments qui
Nous intéressent pas donc ça c’est un petit peu embêtant parce que ça réduit l’utilité des côes géographiques que l’on peut obtenir parce que justement elles sont un petit peu polluées par des éléments annexes et là aussi on va mettre en place une stratégie similaire c’est-à-dire qu’on va renforcer notre
Corpus où là on va lui soumettre ses tuiles qui posent problème où on va cette fois-ci sans annotation où on va expliquer au raisau zone neuron voilà que ces objets ce sont des objets qui nous intéressent pas donc il faut lui faire comprendre que c’est des éléments
Qui ne qui ne doivent pas détecter et qui ne doivent pas apparaître dans les masques qu’il produit dans les prédictions qu’il produit donc on voit aussi clairement que même en opération le corpus qui a servi à entraîner notre solution il reste au centre de cette solution donc c’est vraiment toujours à
Travers le corpus non seulement qu’on explique un problème à la réson n mais aussi qu’on pase à ses déficites à ses déficiences ou à une dégradation des performances que l’on peut constater une fois le réseau de neurone euh en opération aussi quelque chose d’intéressant c’est qu’on voit que ben
Voilà finalement un réseau de neurone n’est pas une solution que l’on abandonne c’est quelque chose qui doit être suivi donc un réseau de neurone un cycle de vie et ce qui est aussi assez important ce qu’on peut déduire de ces considérations et qu’il faut aussi à mon
Avis garder bien en tête c’est que finalement l’IA une solution il a la mise en œuvre de l’IA c’est d’abord une solution à moyen et long terme plutôt qu’une recette miracle à court terme donc en effet c’est quelque chose qui doit être suivi dans le temps et qui
Doit être euh corrigé euh si nécessaire donc on arrive à la conclusion de cette première partie théorique de ce webinaire donc ici euh je vous propose simplement effectivement on avit regardé donc euh toutes ces étapes nécessaires à la mise en œuvre de Lia donc on a vraiment regardé le détail
Le détail technique de ces différentes étapes donc on a aussi compris de façon importante quel était le coût lié à ces différentes étapes et les enjeux aussi qui sont reliés à ces différentes étapes on a aussi compris quelque chose d’important c’est que une solution y un cycle de vie donc c’est pas quelque
Chose que l’on entraîne et qui va marcher merveilleusement bien donc il faut suivre euh une solution i à travers le temps donc ici ce qu’ a motivé un petit peu cet aspect théorique de ce webinaire c’est que aujourd’hui il y a un certain nombre d’outils du GIS qui
Commenc à proposer les solutions il a on peut citer par exemple qjis et Argis mais ces solutions ont tendance à cacher toute cette complexité donc toutes ces étapes au travers desquelles on est allé sont souvent un petit peu cachés escamoté par ces solutions ce qui est une bonne chose parce qu’effectivement
Ce sont des opérations pénibles qui ne sont pas forcément nécessaires mais par contre quand on ignore l’existence de ces différentes étapes on peut être amené à mal utiliser ou à mal comprendre ces outils de la et c’est pour ça qu’on a essayé de détailler un petit peu tous
Ces aspects techniques pour vous donner un petit un petit peu des clés de compréhension et de pouvoir aborder ces nouveaux outils d’une façon la plus sereine que possible donc voilà j’espère avoir vous don réussi à vous donner un certain nombre de clés de compréhension par rapport à cette mise en œuvre de Lia
Aux différentes étapes qui la constitue et j’espère aussi que bah ces euh ces différents éléments pourront aussi vous guider et vous aider dans vos futur utilisations de Lia donc je vous remercie pour votre attention je repasse la parole à Fabrice pour la suite de notre webinaire merci Nils pour cette
Première partie théorique eu avant de passer la parole à G juste cette image qui est que nous avons sous les yeux que comment elle a été générée je vois des je vois des références en bas de l’image mais tu pourrais nous en donner quelques quelques informations supplémentaires oui alors effectivement c’est une image
Un petit peu particulière qui a été obtenu grâce à l’outil d’Ali 3 qui est un outil d’intelligence artificielle qui permet de générer des images qui est typiquement accessible via les outils d’OP ai donc ici ce que j’ai fait c’est que bah j’ai simplement expliqué à chat
GPT que j’étais en train de préparer un webinaire que je lu expliquer le thème du webinaire ce que j’allais expliquer dans ce webinaire et je lu simplement indiqué que voilà il me fallait une jolie slide pour conclure ce webinaire donc je lui ai demandé de me produire
Cette image et c’est ce qui m’a produit je l’ai trouvé jolie donc je l’ai conservé c’est la la première image qui t’a qui t’as c’est la première image qui’ ou d’accord ok on tu pourrais l’améliorer si je comprends bien tu pourrais lui repartir avec le robot conversationnel et lui et lui demander
Des ajustements c’est ça absolument super merci merci bien eu avant de passer la parole à gwenel juste vous rappeler de de d’utiliser si vous le souhaitez la partie QR d’échange questions-réponsse afin que je puisse que je puisse prendre les les éléments pour pour pour modérer tout à l’HE alors
Notre échange collectif genael je te laisse je te passe la main je te laisse partager ton ton écran et puis de de nous de nous présenter cette cette deuxième partie sur plus pratique sur un cas concret merci à vous et bon bonne suite de MobiLire merci Fabrice donc normalement
Maintenant vous voyez mon écran avec la slide de titre pour la présentation de la du cas de détermination du revêtement des routes à l’aide d’un outil de Deep learning donc c’est un projet que le stdl a mené et qui porte sur le produit Suisse TLM 3D donc je sais pas si vous
Êtes familiè familier avec ce produit mais dans le Suisse TLM 3D on a toutes les routes de Suisse représentées comme des lignes ici vous voyez un exemple dans la région d’interlacen dans le petit rond rouge j’ai sélectionné trois routes différentes et ça a ouvert leurs attributs sur la droite donc chacune a
Un type qui donne la largeur approximative de la route comme chemin de 1 m ou route de 3 m et ils ont un type de revêtement naturel ou dur ce qu’il faut savoir sur ce produit su TLM 3D c’est qu’il est entièrement produit et mise à jour à la main par des
Opérateurs à chaque nouvelle acquisition d’image ou à chaque fois qu’une erreur est signalée donc c’est beaucoup de travail et de temps investi et en plus la l’interprétation des attributs de ces routes peuvent dépendre des opérateurs c’est pour ce quoi l’Office fédéral de la topographie a approché le
Stdl pour faire un prototype et tester est-il possible de déterminer automatiquement le type de revêtement des routes donc il s’agirait de travailler sur ces trois classes que nous on a traduit l’allemand par deux classes pardon que nous on a traduit l’allemand par artificiel et naturel et ils nous ont demandé de commencer les
Tests sur la le type de route route de 3 m le but de ce projet ce serait donc d’accélérer la mise à jour du produit Suiss TNM 3D et d’avoir une interprétation unique sur tout le territoire qui ne dépendrait donc plus vraiment des opérateurs donc ces routes les routes
Concernées par ce problème de revêtement c’est essentiellement les petites routes c’est-à-dire les routes de 3 m et les chemins de 1 et 2 m les routes de 3 m celles sur lesquelles on nous a demandé de nous focaliser euh le R artificiel c’est essentiellement du goudron et les revêtements naturels c’est
Essentiellement du gravier en fait ça rend le problème assez compliqué parce que le gravier et le goudron sur des images à 10 cm de résolution ça se ressemble beaucoup cependant ça devrait être possible de résoudre ce problème puisque les opérateurs y arrivent ensuite sur les chemins des 1
Et 2 m sur lequel le projet n pas apportter dans un premier temps un revêtement artificiel on c’est toujours généralement du goudron mais un revêtement naturel on a plus de diversité puisque ça peut être du gravier de la terre batue de l’herbe ou autre donc la question c’est comment
Différencier un revêtement naturel d’un revêtement artificiel comme je l’ai dit dans ce produit Suisse TLM 3D on a toutes les routes de Suisse ce qui veut dire qu’en fait on connaît déjà la localisation des routes c’est pas un problème de détection c’est uniquement un problème de classification et ces
Problèmes de classifation appcation ils peuvent généralement être résolu en utilisant uniquement du machine learning c’est donc ce qu’on a testé d’abord de faire du machine learning au lieu de appliquer une intelligence artificielle et de faire dans ce machine learning une classification supervisée donc dans cette première procédure c’est
Le geodata scientist qui va chercher est-ce qu’il y a des caractéristiques discriminantes des manières d’interpréter la valeur des pixels qui mettrai en en évidence les différences entre les classes et du moment qu’il estime que il a trouvé des valeurs qui pourraient fonctionner il va donner ses valeurs donc cette table d’attribut pour
Chaque route à l’algorithme et qui lui va classifier mettre des seuils essayer de séparer les différentes classes l’avantage de cette méthode c’est queon a besoin d’une moins grande puissance de calcul et on comprend bien mieux l’algorithme puisqu’on a nous-même cherché des caractéristiques discriminantes à l’avance le désavantage c’est qu’on passe des tables d’attributs
Donc il n’y a pas de valorisation de l’image et du contexte et le temps nécessaire pour la recherche des caractéristiques et entre et entre autres investi par l’humain on a tester cette procédure et ça n’a pas marché probablement à cause de la grande ressemblance entre les
Routes de goudron et de gravier et donc comme la détection des routes est une classe très bien maîtrisée par l’intelligence artificielle on a décidé d’app d’appliquer l’intelligence artificielle et le Deep learning dans ce cas-là la détection enfin la détermination de caractéristiques discriminantees est entièrement faite par l’algorithme qui reçoit l’image en
Entier et qui va lui-même chercher comment différencier les route les avantages c’est qu’on a une meilleure valorisation de l’information puisqu’on passe toute l’image et qu’elle est entre guillemets vue en entier et l’algorithme a une capacité à apprendre et à reproduire les désavantages c’est que ça nécessite une bien plus grande puissance
De calcul et on reproche à ces algorithmes d’être une boîte noire donc d’une fois que on a décidé sur cette méthode pour appliquer cette méthode de Deep learning il y a une première phase de préparation des données ensuite on est passé à l’apprentissage profond c’est-à-dire à l’entraînement du modèle et à l’usage de
Ce modèle pour faire des prédictions ensuite du moment qu’on a ces prédictions on n’est pas obligé de les utiliser tel qu parfois on peut appliquer des filtres dessus pour essayer de gagner un pu en précision et d’une fois qu’on a nos résultats finaux on va toujours calculer une métrique
Pour essayer de déterminer quelle est la qualité de nos résultats donc tout d’abord pour les données on n pas travaillé sur toute la Suisse bien sûr on a déterminé une aire d’intérêt pour faire nos tests euh cette aire de TER elle était dans la région de l’emental donc dans la Suisse centrale
Et elle était constituée de quatre carreaux de la carte nationale euh ces carreaux ont été choisis par nos bénéficiaires parce qu’ils présentent une large variété de topographies donc on devrait avoir toutes les situations possibles en Suisse et pour pouvoir les apprendre et parce queon avait les données contrôlées qu’on appelle vérité
De terrain et les images pour l’année 2018 donc tout d’abord pour les images nos bénéficiaires nous ont demandé d’utiliser le produit Suiss image RS donc c’est un produit avec quatre bandes de rouge vert bleu proche infrarouge une résolution de 10 cm elles sont les
Images sont codées en 16 bits et il y a beaucoup de recouvrement ça peut paraître surprenant qu’on ait décidé de utiliser ce produit avec tout ce recouvrement alors que la Suisse possède bien sûr déjà une version tuilée des images d’ailleurs c’est ce que vous voyez ici en arrière-plan c’est la version déjà
Traité et Tulé des images mais nos bénéficiaires souhaitaent qu’on n’utilise pas cette version déjà bien tuilé parce qu’en fait elle a été modifiée afin que les forêts soient bien vertes et les lacs bien bleus et qu’elles soit en fait jolie à regarder mais en faisant ça on a perdu en qualité
D’information ils nous ont donc demandé de partir de l’information plus brut ce qui est bien parce qu’il y a plus d’information le problème c’est qu’avec l’encodage en 16 bit et tout ce recouvrement on avait 1,5 taoctate donné et un volume aussi élevé c’est très difficile à traiter et ensuite les gèent
Pas bien le recouvrement donc on a décidé dans un dans une première étape du projet de passer de ce tuilage un peu chaotique à une grille sans recouvrement pour se faire on a normalisé nos données on les a réencodé en 8 bit en se disant que la facilité de traitement compensait
La l’image enfin l’information qu’on perdait et on les a sauvé en cloud optimiz ge ce ferat ça nous a permis d’utiliser l’ l’outil open source ttailer c’est un outil de tuilage x YZ à la volée ça veut dire qu’après sur notre grille on pouveaz appeler chaque tuile
Par leur Identifiant X Y Z simplement avec l’algorithme maintenant qu’on a nos images prêtes on est passé au traitement des routes donc comme vous avez pu le voir sur la première sur la première slide les routes dans le TLM ce sont des lignes or l’algorithme pour ces label il a besoin d’emprise territoriale
C’est-à-dire de polygone heureusement grâce au type de route qui donne sa largeur approximative c’est-à-dire sa largeur à plus ou moins de mètres on a pu transformer ses routes en polygone suffisamment précis ensuite on a fait un choix sur chaque tuile et il y a beaucoup de
Routes enfin il y a souvent beaucoup de routes sur une tuile et donc soit on demandait à l’algorithme d’apprendre à distinguer les routes de 3 m artificielles et les routes de 3 m natureles soit on lui demande de distinguer juste les routes artificielles et naturel sans essayer en
Plus de lui apprendre le type de la route c’est le choix qu’on a fait on s’est dit c’est sûrement plus simple à l’algorithme s’il voit toutes les routes de la tuile labelliser et qu’il cherche simplement à apprendre si elles sont artificiel ou naturel donc à l’origine pour nos lignes on a
6485 routes artificielles et 289 routes naturelles une fois qu’on a transformé en polygone toutes les routes visibles sur chaque tuile contenant une route de 3 m on a 5597 routes artificielles et 1239 routes naturelles donc ce qu’on constate c’est surtout au niveau des lignes mais toujours aussi au niveau des
Polygones on a un énorme déséquilibre c’est un problème en quoi c’est un problème et ben que si un algorithme disait en fait les routes sont tous artificiels il aurait raison 5 fois sur 6 or ce qu’on veut c’est un algorithme qui apprend à reconnaître les routes pas un algorithme qui apprend que
La plupart sont artificiel donc si je dis artificiel j’aurais probablement raison pour éviter ce cas de figure on a plusieurs possibilités on peut modifier le corpus donc le jeu de données d’origine en supprimant des routes artificielles ou en dupliquant des routes naturelles la première solution elle est applicable mais il faut toujours être
Prudent parce que il faut que l’algorithme puisse apprendre chaque qu figure qu’il verra dans le futur et donc lorsqu’on supprime des rotes il faut faire attention à ne pas supprimer entièrement des cas de figure la deuxième solution elle est applicable mais elle n’est pas très
Bonne parce qu’en fait on ne crée pas de nouvell information on duplique juste l’information qu’on a la deuxième possibilité c’est de modifier la fonction de cou donc cette fonction qui va gérer l’entraînement et qui va l’aider à chercher le bon minimum on pourrait mettre des poids dans cette fonction coup afin qu’elle privilégie
Les routes naturelles cependant suivant l’algorithme que vous utilisez la fonction de coup est en fait difficilement accessible et difficilement modifiable et le trisème sa choix c’est de choisir une maîtrique adaptée donc quand on va évaluer la qualité de notre modèle on va mettre une importance particulière de nouveau grâce
À un poids souvent sur les routes naturelles c’est le choix qu’on a fait ici donc maintenant que nos données sont prêtes et queon a choisi notre méthode on va choisir notre algorithme de DEP learning euh au stdl on a un détecteur d’objets comme on l’appelle qui est basé
Sur des déteectron 2 et qui est disponible sur notre GitHub détecteur d’objet en fait c’est un peu un abus langage parce qu’il fait c’est pas de la détection d’objet où on reçoit la la boîte englobante de l’objet c’est de la segmentation d’instance comme on voit
Sur l’image à droite où on va avoir les les pixels appartenant à l’objet précisément donc ce il est ce détecteur d’objet qui fait de la segmentation d’instance il est basé sur déteectron 2 et le SDL a adapter détectron 2 aux données géographiques c’est quoi détectron 2 c’est une librairie Python
Qui fournit des algorithme de détection et de segmentation prête à l’emploi et c’est développé par MTA donc l’avantage c’est que au lieu de tout développer on a déjà tout qui est prémâché et on doit simplement l’adapter à notre problème c’est aussi une librerie qui est très bien documentée parce qu’elle est très
Largement utilisée les inconvénients de ce gen de méthode de ces librairies prépréparées c’est que elles ne sont pas entièrement adaptables on peut pas on peut parfois pas mettre les mains vraiment dedans pour les modifier et c’est par exemple pour ça qu’on n pas pu modifier la fonction de
Coup aussi détectron 2 n’est plus vraiment à l’état de l’art même s continue de donner des excellents résultats et continue d’être très largement utilisé donc maintenant que j’ai tout prêt pour me lancer il faut que je fasse mes datasets d’entraînement de validation et de test comme Nils les a
Expliqué comme dans mon cas j’ai beaucoup de données je me suis dit que c’était probablement pas nécessaire de utiliser toute la zone pour l’entraînement ça aurait fait un jeu de données très lourd donc l’entraînement aurait été très long et les bénéfices auraient probablement été faible j’ai donc décidé d’utiliser les deux carreaux
Du milieu comme zone d’ENT et les deux carreaux extérieurs comme une seconde zone de test pour que le je puisse constater les performances du modèle sur une zone entièrement nouvelle donc sur mes deux carreaux du milieu la zone d’entraînement j’ai séparé les tuiles dans les trois jeux de donné habituel
L’entraînement la validation et le test et dans notre cas on a pris la répartition 7 15 15 mes données sont prêtes et réparties dans les jeux dans les datasets dans les jeux de données donc je passe à l’entraînement pour l’entraînement détectron 2 met des modèles préentraînés à disposition donc des modèles qui ont
Déjà vu des millions d’images et qui ont déjà qui sont déjà un peu adaptés on va réentraîner ce modèle on va faire ce qu’on appelle du transfer learning pour l’adapter précisément à notre problème et à nos données donc avec ce modèle pré-entraîné et nos données on va faire un premier set de
Prédictions ces prédictions on va les comparer avec la ver é de terrain donc avec les données justes ça va euh il va y avoir une différence entre les deux c’est le coût d’entraînement sur le jeu de données d’entraînement et le coût de validation sur le jeu de données de validation sur
La base de ce coût d’entraînement l’algorithme va adapter les poids du modèle et faire des nouvelles prédictions on va faire plusieurs itérations dans cette boucle en essayant d’être toujours plus précis et lorsqu’on atteint le nombre d’itération total on sauve un modèle final et le coût d’entraînement et le coût de validation
Se sauv dans des graves donc on va généralement toujours sauver un modèle final mais en fait ce modèle final c’est pas le bon modèle pourquoi bah parce que on peut avoir ce problème de surentraînement du modèle du fait qu’il est appris par cœur les solutions donc appris par cœur les
Labels de du jeu de données d’entraînement pour éviter de tomber dans ce piège et ben on a le graphe du coup validation et sur la base de ce graphe on va pouvoir choisir le meilleur modèle qui est un modèle transitoire qu’on aura saber pendant l’entraînement souvent quand on parle de
L’IA on a l’impression que l’IA elle peut un peu fonctionner toute seule on entraîne et puis c’est bon mais c’est pas forcément le cas en fait il a est quand même géré par des paramètres hyper paramètres et il faut quand même que le Data scientist règle ses paramètres
Par exemple ici vous avez trois entraînements et pour chaque entraînement vous avez en haut le coup de le coût d’entraînement et en bas le coût de validation en fonction des itérations de l’algorithme donc sur le premier entraînement on voit que le coup d’entraînement déjà il varie beaucoup il
Sautille beaucoup et en plus bah il stagne on n pas vraiment l’impression qu’il s’améliore le cou de validation juste en dessous il est décroissant mais il atteint pas ce minimum qui indiquerait le bon modèle ensuite pour le deuxième entraînement où j’ai mis changer le paramètre du nombre
D’image par batch au début on a une meilleure décroissance sur le coût d’entraînement mais au final ça stagne toujours un peu et pour le cûp de validation on attteend un minimum mais il remonte toujours pas et du coup lors du 3è entraînement j’ai changé un paramètre qui s’appelle
Le base learning rate qui détermine le rythme auquel l’algorithme apprend je lui ai demandé d’apprendre plus vite et là on a une une décroissance bien correcte sur le coût d’entraînement et le coût de validation atteint un minimum et remonte ce qui indique que l’algorithme a fini d’apprendre et qu’il
A commencer à appr prendre par cœur les labels donc là je peux me dire ah ça c’est le c’est le bon entraînement et je peux choisir le bon modèle c’est-à-dire celui qui est au minimum du coût de validation à environ 7000 itérations donc c’est pas fait maintenant j’ai mon
Modèle et je vais pouvoir passer à appliquer ce modèle sur les datasets pour faire mes prédictions donc ici en haut vous avez un exemple de prédiction et normalement vous voyez ma souris donc ces prédictions comme la montré Nils elles délimit les routes elles sont parfois un peu tremblante
Parce qu’elles ont été fait pixel par pixel c’est la vectorisation des masques et ici on voit la délimitation des tuiles les prédictions sont coupées au bord des tuiles parce qu’on a les a fait tuile par tuile en vert on a les routes qui sont bien détectées donc au bon
Endroit avec un bon revêtement en orange on a les routes qui ont été détectées au bon endroit mais avec le mauvais revêtement en rose par exemple en haut à droite on a les routes qui ont été détectées là où il n’y avait pas de laappel donc nos données disent que là
Ce ne sont pas des routes et en violet foncé on a les routes qui manquent donc nous on avait un label mais l’algorithme n’a pas détecté de route à cet endroit donc déjà le résultat là il est très bien en apparence mais c’est un peu dommage que par exemple les routes qui
Ont été manquées elles auraient sûrement pas été manquées si elles avaient été ailleurs sur la tuile et c’est aussi dommage qu’on nit pas les géométries exactes alors qu’au fond on les connaît pour toute la Suisse c’est pour ça qu’on a décidé d’appliquer un une étape supplémentaire et on a
Agréger nos prédictions aux géométries originale des routes de 3 m donc c’est le résultat qu’on voit ici en bas et cette méthode nous a permis d’améliorer les résultats en supprimant par exemple les routes roses cell qui étaient des faux positifs des routes là où il n’y avait pas de laappelle de
Route et ça n N a prmis de limiter l’impact des faux négatifs des routes manquées par l’algorithme par exemple ici en haut où seulle la moitié de la route avait été détecté à l’origine en agrégeant ça sur la géométrie d’origine on a toute la route avec le bon
Revêtement donc ça ce sera notre nos prédictions finales et maintenant qu’on les connaît on peut calculer leur qualité alors calculer leur qualité c’est une bonne chose mais ce qu’on cherche c’est s’améliorer et pour s’améliorer il faut commencer par définir une baseline la baseline souvent en classification ça peut être le
Résultat de l’opérateur paresseux l’opérateur paresseux généralement il va classifier vos objets au hasard sauf que ici ça a pas vraiment de sens de classifier les objets au hasard étant donné que on sait que la large majorité des routes sont artificielles donc on se dit que la baseline la plus censé ce
Serait que toutes les routes soient classifiées comme artificielles si toutes les routes étaient classif comme artificiel on aurait une précision globale de 97 % donc autant dire que c’est déjà très très bon et que c’est très très difficile à améliorer c’est pour ça qu’on a décidé de pas utiliser cette valeur comme
Métrique on a décidé de la de subdiviser cette valeur on a gardé la précision la précision c’est sur toutes les routes qu’on a cherché à détecter lesquels ont été détectés avec le bon revêtement et on a décidé de aussi prendre en compte le rappel c’est-à-dire sur non la précision c’est
Sur toutes les prédictions que j’ai fait lesquelles sont des les des bonnes routes avec les bonnes bons revêtements et le rappel c’est sur toutes les routes que je chercher à détecter lesquels ont bien été détectés avec le bon revêtement et si j’applique ce Précis cette précision et ce rappel aux routes
Artificielles et naturelles benah en classifiant tout dans artificiel je vois que les routes artificielles ont effectivement une précision de 97 % et un excellent rappel elles ont toutes été bien retrouvé mais bah les routes naturell il n’y a aucune prédiction pour les routes naturelles et aucune n’a été
Retrouvée en tant que route naturelle donc on a des valeurs de zéro et donc c’est ce tableau qu’on va chercher à améliorer en particulier bah les valeurs pour les routes naturelles ces valeurs je les ai calculé pour tous mes dat 7 donc entraînement validation test et le deuxème test la zone
D’inférence ici vous avez les les valeurs pour la validation le test et la zone d’enférence on voit qu’en validation les valeurs sont pas mal on est à 0,98 0,94 pour les routes artificielles et on est à 0,69 064 pour les routes naturelles donc sur toutes les routes prédit comme naturell 69 %
Étaient effectivement des routes naturelles et sur toutes les routes naturelles que j’ai cherché à trouver j’en ai retrouvé 64 % comme des routes naturelles mais ce qu’on voit ici aussi c’est qu’après ces valeurs vont décroître quand on regarde le jeu de données de test ell vont encore décroître quand on regarde la zone
D’inférence jusqu’à atteindre 10 % de précision et 34 % de rappel pour les roues naturelles donc c’est vraiment pas très haut en final sur toutes les prédictions de routes naturelles seul 10 % étaai effectivement des routes naturelles et sur toutes les routes naturelles que j’ai cherché à retrouver seul 34 % ont
Été retrouvés en tant que route naturelle c’est franchement pas très haut mais on a présenté ses résultat à nos bénéficiaires ah oui pourquoi on a cette décroissance sachant que j’ai regardé la courbe de validation donc j’ai pris un modèle qui n’était pas sur entraîné j’ai testé sur la première zone de test et
Bon ça a décru mais pas si fort que ça alors pourquoi est-ce qu’on est aussi mauvais dans la zone d’inférence le but dans la zone d’inférence c’était de tester sur une zone entièrement nouvelle à une location un peu différente donc peut-être que les les topologies sont juste trop
Différentes et que du coup le modèle n’arrive plus à reconnaître les les routes une une autre possibilité c’est que malgré toute ma prudence mes paramètres soient pas tout à fait adaptés et j’ai quand même de l’overfitting donc du sur entraînement et la dernière possibilité c’est que on a une absence de critères
Discriminant entre les routes artificielles et les routes naturel l’algorithme a pas réussi à savoir et sur le test il a eu un peu de chance mais en zone d’inférence moins et du coup on a des métriques qui sont très mauvaises ENF franchement pas terrible du coup on a présenté ce résultat à nos
Bénéficiaires et ce qu’on constate c’est du coup la performance très inégale entre les jeux de données en zone d’inférence on a une précision finale de 91 % une précision globale mais malgré tout ça les bénéficiaires s’estimaient satisfait pourquoi pas parce que l’algorithme remplirait les critères de donner des résultats meilleurs que notre baselign
Sur toute la Suisse et que ils ont ils auraient une interprétation uniforme contrairement à un opérateur donc ils ont décidé qu’on pouvait continuer l’application et les prochaines étapes c’était de tester sur les chemins de 1 et 2 m et d’étendre ensuite les résultats à tout à tout le compon de
Berne donc ce travail sur les chemins des 1 et de M il a déjà été conclu les quand on regarde les chemins de 1 et 2 m si on prend les lignes du TLM de su TLM 3D on a 6599 lignes artificielles et 12505 lignes naturelles et une fois transformé en
Polygone on a 7709 routes artificielles et 4907 routes naturelles on a une grande perte de routes naturell parce qu’en fait la plupart d’entre elles sont en forêt mais l’excellente nouvelle avec tout ça c’est que le déséquilibre est nettement moindre et donc les difficultés aussi donc j’ai refait toute la procédure pour
Ces chemins et j’ai calculé les métriques et ici on a à nouveau les métriques pour la validation le test et la zone d’inférence mais cette fois sur les chemins et ce qu’on constate c’est que les la la perte de qualité dans la zone d’inférence est nettement moindre
Qu’avant on a des plutôt bons résultats pour la zone d’inférence avec aucune valeur qui descend sous 0,69 ça c’est une excellente nouvelle et ça veut dire aussi que ce n’est pas notre procédure qui était fausse mais qu’il y avait bien soit un surentraînement soit un une absence de critères discriminant
Sur les routes de 3 m donc avec ces résultats nos bénéficiaires sont encore satisfaits et le travail continue on travaille actuellement à extension surt le canton de Bern c’est tout pour moi merci de votre attention merci Ganael pour pour cette présentation je vous remercie pour votre attention euh on va pouir échanger
Entre nous sur les différentes questions qui ont été euh qui ont été posés si vous pouvez évidemment toujours poser les questions dans l’onglet qrr pendant que pendant qu’on échange sur les premiers éléments alors euh une première question question qui a été euh qui a qui avait été posé lors du premier
Premier webinaire euh bonjour on prend souvent l’exemple de la reconnaissance d’objets sur les photos aériennes y a-t-il d’autres usages de l’intelligence de l’intelligence artificielle qui ressortent dans l’information géographique par exemple serait-il possible de mettre en place des analyses de qualité des données vectorielles exostivité cohérence précision fraîcheur conformité unicité sensibilité je crois
Nils on avait on avait déjà répondu je crois à cette à cette première question qui avait été posée en juin dernier est-ce que tu pourrais apporter rappeler rappeler la réponse que nous avions apporté ou si tu effectivement c’est c’est une question qui revient beaucoup alors il faut quand même
Admettre que l’IA c’est avéré redoutable sur l’analyse d’image donc c’est quelque chose qui en géoforation faisait beaucoup de défauts avant aujourd’hui on a avec lia les outils qui sont très performants pour faire des choses qui é tout à fait inenvisageable avant et c’est vrai qu’and j’ai information on parle beaucoup d’analyse d’image parce
Que voilà ça c’est c’est ce qui est parti le plus vite c’est ce qui a été immédiatement le plus utile effectivement aujourd’hui on a un peu l’impression que tout ce qu’on fait AC li en géformation c’est d’analyser des mages alors c’est pas le cas évidemment pas euh l’intelligence artificielle est
Par exemple utilisé sur les nuages de points donc la classification la détection d’éléments dans les nuages de point ça c’est un autre exemple qui reste quand même assez proche de l’analyse d’image mais aussi aujourd’hui tout les champs qui vont s’ouvrir qui sont difficiles à prédire évidemment parce que c’est des choses qui vont
Évoluer se mettre en place avec le temps il y a par exemple l’utilisation de modèle de régression c’est-à-dire que quand on a par exemple une couche avec des attributs couche vectorielle avec des attributs on peut tout à fait essayer de vérifier la cohérence de vérifier la consistance d’interpoler des
Valeurs qui pourraient manquer des choses comme ça donc ça c’est des choses qui vont apparaître c’est très certainement des applications qui vont devenir importantes même en G information et il y a une autre chose qui va certainement prendre énormément d’importance également qui est aussi très difficile à prédire c’est euh
L’avèement des LLM donc des langage de modèle donc c’est chat GPT et compagnie ces élémentsl vont très probablement aussi avoir des implications extrêmement intéressantes au géant information un exemple tout bête qu’on peut donner ici c’est la recherche de données la conception de portail géographique c’est-à-dire euh typiquement à l’adresse
Des citoyens un citoyen qui cherche une donnée qui peut-être un petit peu complexe pourrait effectivement formuler sa question sa de demande sous la forme d’une question comme si sadressait un opérateur ou un expert de gérination et du coup ce sera à la charge de ce genre
De réseau de neuron enfin d’outil il y a d’aller chercher les bonnes données d’aller les compacter les les compulser et d’en fournir une réponse à l’utilisateur pour pouvoir le guider donc on pourrait imaginer des des portails géographiques qui permettraient à des gens peu formés ou pas formés à l’ingé information d’accéder à des
Données d’une grande complexité il y a aussi un certain nombre de choses qu’on peut imaginer dans le terme de du traitement donc dans la recherche des données et cetera donc ça aussi c’est quelque chose qui va probablement beaucoup évoluer encore une fois c’est difficile de savoir dans quelle mesure
Ça va évoluer dans quelle direction on va aller mais clairement on a c’est déjà ces modèles de régression qui vont prendre de l’importance qui vont s’appliquer aux tables attributaires donc aux bases de données aux séries de chiffres aux séries de d’informations et on a ces outils de type chat GPT qui
Vont certainement aussi prendre une grande importance euh par rapport à ces aspects d’IA utilisant lesin information après il y aura certainement d’autres applications qu’on ignore aujourd’hui euh qui effectivement ben sont pas c’est pas évident à à prédire merci Gonel tu veux rajouter quelque chose euh non la réponse de niss
Me paraît assez complète c’est effectivement les projets pour lesquels on est approché par les administrations Suisse dans le stdl c’est effectivement pour l’instant essentiellement des projet de détection d’objets soit sur des images soit dans le nuage de point et on commence effectivement aussi à réfléchir au à l’application euh pouvoir
Poser une question en langage humain et avoir une réponse en données géographique par inia d’accord merci alors deuxème question euh l’intelligence artificielle peut-elle être utilisée pour classifier l’ensemble des classes d’occupation du sol qui veut répondre à cette question alors oui évidemment ça c’est une des très grandes applications de Lia c’est
Cette cette classification complète donc ici on appelle ça de la segmentation sémantique donc on peut euh c’est abondamment utiliser euh intelligence artificielle sur l’image aérienne on va vraiment entraîner un réseau de neuron à reconnaître différentes catégories sur euh sur le territoire c’est notamment ce qui a été fait par l’ignn récemment donc
L’ignn a lancé cette initiative cosossa euh qu’s ont calculé une couverture du sol assez impressionnante ce qui vont si j’ai bien compris euh rapidement déployer sur l’ensemble du territoire français qui inclut aussi les territoires d’utramer donc ça c’est typiquement une application très intéressante très performance de la alors il y a des
Petites lacunes il y a des choses ma fois quand un élément un revêtement de route un type de sol qui est caché par un arbre qui peut être caché par de des éléments territoriaux B lia ne fera pas de miracle les manquera donc il y aura des imprécision évidemment mais c’est
Une application une des premières applications qui a été qui a été envisagé pour la la LIA appliqué à la donnée géographique donc à géographique c’est vraiment de calculer ses cartes d’usage du sol ça c’est effectivement ça va devenir une grosse application d’A ce sera des cartes du sol qui vont être
Calculées chaque année sur la base d’image aérienne avec des des catégories qui vont sans doute devenir de plus en plus finesc gel euh la réponse de ni M paraît complète ok euh question suivante quel est l’apport principal de l’intelligence artificielle par rapport aux méthodes classiques de traitement
D’image alors si je commence je te laisserai compéter effectivement ça c’est à chaque fois que quelque chose de nouveau apparaît on a toujours cette question qui survient en se disant bah finalement on le faisait déjà avant ça existait déjà avant et cetera c’est vrai qu’effectivement on faisait déjà de l’analyse d’image certaines analyses
Même parfois assez poussées ce qui arrive aujourd’hui c’est pour ça qu’on a conclu notre précédent webinaire un petit peu sur cette notion là c’est qu’il faut pas voir lié comme une révolution mais comme une évolution donc un renforcement des techniques Act actuelle li a ce qu’elle apporte de
Façon très claire c’est une souplesse dans les possibilités d’analyse de l’image c’est-à-dire que l’image avant l’ on savait l’analyser mais de certaine manière on savait en déduire certains types de résultats on éétait pas capable d’aller chercher autant de richesse qu’on arrive à aller chercher en utilisant de l’a donc l’a n’est pas une
Révolution c’est vraiment un aboutissement de la il faut le voir plutôt comme un aboutissement de l’analyse d’image où on a un outil qui devient tout d’un coup extraordinairement performant extrêmement intelligent c’est-à-dire qui va réussir parfois dans des cas très subtiles des objets assez particuliers où on pourrait nous-même se dire que
C’est impossible à détecter lia pourrait effectivement aller chercher cette information donc ça c’est le premier avantage de Len c’est de renforcer ces techniques qu’ l’on utilisait déjà par ailleurs mais de les rendre beaucoup plus efficace et d’ouvrir le champ des possibles à des éléments qui étaient par le passé inaccessibles ce que ouvre
Aussi il a c’est vraiment tous ces aspects qui sont liés au modèle de langage donc là aussi il y aura certainement dans l’analyse d’image des choses très intéressantes qui vont se passer euh open ai a déjà présenté un certain nombre de choses très dernièrement qui sont extrêmement intéressant je vous donne un
Exemple un petit peu un petit peu un petit peu nul mais qui est très parlant on peut soumettre à chat GPT une vidéo d’un match de football et chat GPT vous génère le commentaire en hurlant quand il y a un goal donc il comprend qu’effectivement il faut hurler quand il
Y a un goal donc ça ça vous donne un petit peu une idée d’où on en est en terme de langage de modèle de langage qui sont coupés à de l’analyse d’image donc là aussi il va y avoir des choses qui vont se passer et c’est-à-dire que dans l’analyse d’image ce qui pourra
Être intéressant à faire dans l’avenir c’est de coupler ça avec des requêtes complexes et du coup de pouvoir faire des des requêtes complexes sans avoir à devoir se coltiner toutes ces apprentissages toutes ces ces mises en forme de données on pourra peut-être aussi demander des analyses d’images à
La volée c’est-à-dire un expert métier un citoyen n’importe qui pourrait aller sur une interface dire bon bah moi j’ai besoin de tel analyse sur tel type d’image et il l’écrit en langage naturel donc il formule une question comme s’il s’adressait à quelqu’un et du coup l’intelligence artificielle derrière va
Se charger d’aller chercher les les données de produire l’analyse d’analyser les données jusqu’à produire les résultats qui sont nécessaires pour la pour la personne je sais pas si tu veux ajou ah mais elle est partie perdu gen perdu gen essayer de se reconnecter ouais on a perdu buelle va se reconnecter euh merci
Nils euh quels sont question suivante euh quelles sont les règles bonnees pratique pour définir la bonne taille du corpus ou du dataset au-delà de la capacité de traitement de la machine alors ça c’est une question excellente parce qu’il n’y a pas de réponse à cette question c’est extrêmement difficile de
Savoir jusqu’où il faut aller aujourd’hui en terme de constitution de corpus on y va quand même encore à taton c’est pas une opération facile ce qu’on va faire la stratégie qu’on va faire en général c’est qu’on va exagérer c’est-à-dire qu’on va considérer un nombre de Tuil exag gérer pour être sûr
Qu’on en aille le bon nombre aujourd’hui comme je l’ai cité dans le dans la partie théorique l’optimisation du nombre de de tuiles a quelque chose qui est un encore un domaine de recherche donc c’est quelque chose qui n’est pas du tout arrêté donc on n pas on a pas du
Tout de recette miracle donc on va vraiment ce qu’on fait vraiment usuellement c’est ce que j’ai décrit pendant le webinaire c’est qu’on va essayer de se laisser guider par notre intuition tant en terme de résolution tant en terme de taille de tuile donc ce découpage de la zone de travail et on va
Essayer de regarder que l’on obtient avec cette première approche par intuition et si on n’est pas trop faux on va essayer de regarder autour de ces paramètres donc faire des entraînements un petit peu dans tous les sens de façon systématique en faisant varier tous les paramètres de découpage et pour essayer
De regarder dans quelle mesure on arrive à avoir les meilleures performances on pourrait aussi faire ce jeu-là en allant chercher dans le corpus un sous-échantillonnage des tuile que l’on a défin et faire un entraînement avec et regarder si les performances sont bonnes et on pourrait essayer de faire tout
Toutes les combinaisons possibles de sous-échantillonnage du corpus et regarder le score comment il évolue et de cette manière-là on pourrait effectivement trouver le corpus absolument parfait qui réalise les meilleures performances avec le moins de pile possible mais l’analyse combinatoire fait que si vous voulez euh sortir toutes ces combinaisons possible
Vous en aurez des milliards et des milliards et des milliards et des milliards il faudra faire des milliards et des milliards et des milliards d’entraînement du coup c’est quelque chose qui n’est pas réaliste donc aujourd’hui c’est un petit peu la procédure elle est pas encore arrêtée je
Pense que les outils nous aideront de plus en plus à constituer ces corpus c’est une base d’intuition et ensuite on va essayer d’optimiser autour de cette intuition pour essayer de trouver les paramètres qui sont les plus les plus efficaces je sais pas si tu peux peut-être essayer de compléter aussi
W est-ce que tu as entendu la question oui j’ai entendu la question désolé c’est la deuxième fois que teams crache ce matin alors que d’habitude ce problème pas de souci t’inquiète pas mais oui en travaillant avec des experts métiers c’est toujours la première question qu’on a mais il faut la
Belliser quelle quantité parce que c’est un très au travail et la question c’est la réponse c’est toujours on ne sait pas on peut toujours estimer la stabilité du enfin la qualité mais aussi la stabilité du résultat à postériori pour savoir est-ce qu’on a suffisamment ou pas mais c’est très difficile voir impossible à
Priori de savoir de combien on va avoir besoin du coup ce qu’on dit toujours à nos partenaires c’est laabéiser autant que possible assurez-vous d’avoir toutes les typologies tous les types possibles ensuite faites autant que possible et on verra d’accord eu Gwenael est-ce que tu peux nous en dire plus sur le base
Learning rate sur quoi concrètement joue-t-il donc quand on prend un modèle pré-entraîné euh alors quand Nils vous a montrer ce ce réseau de neuron donc qui était large au début qui se resserait et qui se qui se réélargist après l’encodeur et le décodeur en fait sur ces nœuds il y a
Des poids et ces poids vont déterminer la classe de sortie des objets des pixels le bas learning rate il va sur la base de la fonction de coup adapter ses poids donc plus il est élevé plus ses poids vont s’adapter vite donc si on va trop lentement si le
Bas lening était trop bas bah on va stagner c’est ce qui ce que j’ai montré dans mes exemples je stagnais à l’inverse sil est trop rapide c’est comme si on cherchait à atteindre un point et qu’on pouvait que aller vers l’avant si on fait des pas trop petits
On va jamais y arriver et si on fait des pasas trop grands bah on va arriver plus loin sans pouvoir forcément revenir en arrière d’où l’importance de vraiment trouver le bon leing rat quand j’entraîne mon modèle d’accord merci mer euh question suivante je sais que l’intelligence artificielle peut s’appliquer à l’analyse des changements
Pouvez-vous nous expliquer les principes de base par rapport à la détection d’objets alors c’est pas pas quelque chose dans laquel je suis spécialisé he je sais pas si tu en as fait un petit peu de ton côté Ganael mais l’idée c’est euh c’est qu’on va rester dans cette
Notion de de production de masque euh sauf que là on sera dans une situation un petit peu plus particulière c’est que il y a pas une image qui va entrer dans le réseau de neurone mais deux et du coup de ces deux images il va falloir
Exp extraire un masque qui va marquer la présence de changement alors ce qui est intéressant et encourageant en tout cas d’après ce que j’ai pu lire dans la littérature scientifique c’est que justement liya est capable d’aller chercher des changements qui nous intéresse c’est-à-dire quand on compare deux images aériennes souvent la
Majorité des changements seront dominés par des changements de colorimétrie des changements de teintes des changements de qualité d’image des changements de variation saisonniè saisonnière et ça ça nous intéresse pas c’est pas pas ça qu’on entend par changement quand on entend changement c’est un travau une maison qui a disparu une maison qui a
Été construite une route qui a été réaménagée et cetera et du coup d’après les les premiers résultats qu’on a en util de l’IA pour détecter ces changements on a des résultats très encourageants effectivement l’IA est capable de discerner les deux éléments changement variation usuel entre différentes images et changements
Véritables qui sont réellement sur le territoire VO là le rison neuron est effectivement capable de produire un masque donc il va produire un masque en disant bah voilà les pixels blancs sur ce masque ce sont selon moi la zone sur laquelle je pense qu’il y a eu un changement effectif sur
Le territoire et charge à nous bah de faire ces ces ces ces éléments de postraitement donc traduire ces ces éléments de de masque en des géométries qu’on va ensuite pouvoir transformer en des géométries de changement euh utilisable je sais pas si tu vas ajouter quelque chose par rapport à ça
Gel non non ça me paraît complet alors merci le cas d’usage question suivante le cas d’usage de la détection des routes est intéressant serait-il possible de transposer simplement ce cas d’usage sur d’autres territoires alors le risque de le transposer TelQuel c’est toujours cette histoire de typologie est-ce que la
Typologie reste la même si c’est pas le cas il faut le réentraîner après même si on a le même si on doit le réentraîner le stdl a tous ses algorithmes sur gthub et pour une personne qui a des connaissances au moins de base en en nia elle pourrait
Depuis notre kitthub et la documentation qu’on a produite reproduire ce cas euh en plus de des connaissances de base en nia il vous faut une machine capable de le faire euh pas n’importe quel ordinateur peut faire de l’ la point le nerf de la guerre c’est généralement qu’il faut un GPU
Et c’est ce GPU qui va permettre de faire toute la enfin d’appliquer toute la puissance de calcul nécessaire à li mais c’est ça tombe bien puisqueil y avait la question suivante était était justement concernant le hardware CPU RAM GPU quelles sont les caractéristiques importantes et qu’utilisez-vous par
Exemple euh donc nous comme on utilise detteectron 2 il est basé sur un système qui s’appelle une architecture CUDA et donc il faut un GPU adapté à CUDA après comme CUDA a été développé par NVIDIA euh je pense tous les GPU NVIDIA actuels prévu pour Delia sont capables de gérer
CUDA donc par exemple avant on avait des machines fixes et on avait un GPU NVIDIA 3090 et actuellement comme les machines fixes ça ça a quand même des contraints notamment pour des gens qui travaillent pas toujours au même endroit ou ce genre de chose on on travaille sur des machines virtuelles chez un
Ébergeur qui lui a des GPU T4 Nvidia T4 ou L4 et ça fonctionne tout aussi bien en ligne il suffit d’avoir une bonne connexion si on peut pas se permettre d’avoir un gros PC chez soi d’accord tu veux tu veux apporter d’autres précisions par rapport à ce que
Nous utilisons chit par exemple oui alors même plus généralement effectivement ce qu’a dit gwenel est tout à fait juste c’est le GPU c’est le ner de la guerre ça il y a absolument pas de de discussion là-dessus le GPU va beaucoup plus vite donc il est beaucoup plus efficace dans les traitements
Parallèles qui sont massifs en ya donc ça c’est quelque chose de très important euh une chose quand même à signaler c’est que de Lia tourne sur CPU vous pouvez faire tourner ça sur un CPU misérable c’est tout à fait possible ça va vous coûter très cher en temps c’est
Plus le l’outil de calcul que vous avez utiliser si c’est un CPU qui est relativement peu véloce ça va vous prendre énormément de temps mais c’est quelque chose qui peut être utilisé aussi en terme de mémoire ce qu’il faut bien garder à l’esprit pourquoi est-ce qu’on a besoin d’une certaine mémoire
Quand on entraîne un réseau de neurone donc vous vous souvenez quand on a cette minimisation de la fonction de cû donc on va soumettre tout le corpus au réseau de neurone et on va calculer l’erreur globale qu’il commet sur l’ensemble du corpus dans la réalité c’est faux c’est
Pas ça qu’on fait c’est totalement impossible de faire rentrer un corpus tout entier dans un réseau de neuron d’un seul tenant donc ce que l’on fait en a quand on entraîne un réseau de neurone c’est qu’on va découper notre corpus en petites unités donc on va prendre par exemple des ce qu’on appelle
Des batch donc c’est des groupements d’exemple donc on prend par exemple quatre images avec leurs annotations qu’on va soumettre au réseau de neurone et c’est sur la base uniquement de ces quatre images qu’on va faire l’ajustement des poids donc ça paraît un petit contreintuitif parce qu’on se dirait pour converger vers la solution
Idéale il faudrait tout regarder en même temps en Y a c’est pas ce qu’on fait on se restreint des tout petits morceaux du corpus et on avance pas à pas le long de la descente de cette fonction de coup et ça bon mathématiquement on a des preuves
De convergence donc on est rassuré par rapport au fait que ça fonctionne donc le GPU c’est là-dessus qui va influer c’est sur notre capacité à considérer des batchs qui sont suffisamment gros c’est-à-dire qu’il y a des problèmes qui fonctionnent bien quand on montre une
Image à la fois ou deux images à la fois certains problèmes vont nécessiter de devoir montrer 4 8 16 images à la fois et du coup ces images sont lourdes il va falloir les faire monter vers le GPU donc il faut qu’il soit hébergé dans la mémoire du de l’ordinateur ell doivent
Être transféré dans la mémoire du GPU pour pour que le GPU ait accès à ces images puisse les traiter puisse se faire le pas d’optimisation et ensuite passer au batch suivant donc c’est beaucoup là-dessus qu’on va jouer sur la la la mémoire vive c’est sur cette capacité de pouvoir donner plus ou moins
D’exemples pour faire ces pas d’entraînement qui va être prépondérant pour choisir un petit peu la quantité de mémoire dont on va avoir besoin euh merci pour ces pour cette réponse allez on prend encore deux dernières question et puis avant avant d’arrêter le webinaire est-ce qu’il y il y a question
Est-ce qu’il y a des contraintes recommandations à prendre en compte pour détecter des objets qui sont en mouvement euh alors sur une image il y a pas de mouvement donc théoriquement sur une image il y a pas de raison de traiter les objets qui effectivement une situ bouger puisqu’ils sont figés sur l’image
Donc il y a pas tellement de raison de s’inquiéter de cela euh on peut traiter ça sur une vidéo oui alors une vidéo mais une vidéo est faite de d’imageix donc on ne peut pas effectivement aujourd’hui effectivement li lia est capable de traiter des vidéos donc d’analyser effectivement des
Éléments qui sont vraiment purement dynamiques la plupart du temps cependant on va quand même garder cette vision image par image donc on va analyser l’image son contenu on va analyser l’image suivante son contenu et on va en dériver le changement de ces deux analyses d’image aujourd’hui il commencec à yoir des intelligences
Artificielles qui sont capables vraiment d’aller chercher le mouvement plus viscéral si on peut le dire comme ça vraiment directement de de la vidéo mais aujourd’hui pour traiter du mouvement on peut le plus souvent s’en sortir en traitant la vidéo comme une succession d’image et donc faire de l’analyse de la
Détection d’objets de façon usuelle faud quand même faire attention à une chose c’est de le flux cinétique euh si on a un flou cinétique important c’est-à-dire par exemple si les voitures vont vite euh et du coup quand on les photographie quand on les fige quand on extrait une
Trame d’une vidéo on peut avoir un flux cinétique qui va étaler la voiture et on pourrait avoir une baisse de sa visibilité de ses caractéristiques et qui pourrait avoir un impact négatif sur la détection d’objet et donc sur l’analyse de ces de ces de ces éléments en mouvement mais normalement la plupart
Du temps on peut s’en sortir par ce ce B là c’est on continue de voir la vidéo comme une succession d’image et on interprète ensuite les résultats qu’on obti sur chaque image et j’rais peut-être C les les différentes architectures elles ont un différent temps d’entraînement mais elles ont aussi un différent temps
Qu’elles mettent pour faire des prédictions et du coup en règle générale dans les objets géographiques qui ne bougent pas c’est pas important si on met 1 heure 2h 3h à faire nos prédictions mais peut-être si vous faites de l’analyse de vidéo selon les applications ça peut être important de
Choisir un réseau qui est rapide lors des prédictions d’accord très bien merci allez dernière question avant de nous quit l’utilisation de l’IA nécessite-elle un accompagnement pour les premiers projets et si oui sous quelle forme al oui la réponse est oui très clairement oui vous aurez besoin d’un accompagnement l est un peu
Déroutante c’est pas c’est pas une méthodologie qui va vous produire un résultat qui sera soit juste soit faux il vous produira toujours des résultats il fauda touours un qui peut les interpréter euh et c’est surtout que liya nous confronte à à nos faiblesses en tant qu’être humain notamment quand il s’agit de par
Exemple cette partie d’annotation c’est ce qu’on avait vu au précédent webinaire qu’on a rappelé aujourd’hui quand on s’attaque au bâtiment par exemple on se dit bah les bâtiments c’est clair je sais ce que c’est qu’un bâtiment il y a aucune difficulté c’est c’est un concept absolument clair il y a aucun aucun
Débat là-dessus et quand on commence à faire des anotation tout d’un coup on comprend qu’en fait on comprend pas les bâtiments on a pas compris le concept de bâtiment parce qu’on sait pas si on doit anoter machin ou pas si ça c’est un bâtiment çaen est pas un est-ce que
L’expert métier va considérer que c’est un bâtiment ou pas et cetera donc oui déjà rien pour ces étapes là pour un petit peu affronter cette ces aspects un petit peu déroutant de l’utilisation de liar c’est mieux d’avoir un accompagnement un accompagnement aujourd’hui si vous êtes une administration des experts métiers ils
Vont essentiellement se se matérialiser sous la forme déjà d’un accompagnement de la démarchea donc formation du corpus comment le former avec quel type de données quelles annotations est-ce que effectivement le problème auquel vous vous attaquez est a priori résolvable avec de Lia ou si au contraire il faut
Va mieux abandonner faire un petit peu autrement et on va aussi vous accompagner en terme d’outil c’est-à-dire quels outils il faut utiliser comment on les utilise comment on les déplacee sur une machine comment on fait un entraînement comment on lit les résultats d’entraînement donc t ces dans toutes ces premières démarches il a
Vous allez être un petit peu inondé par tous ces concepts à la fois de constitution de corpus d’optimisation des paramètres des hyperpamètres du réseau de neurone le choix du réseau de neurone l’interprétation des sorties du réseau de neurone la correction de ses performances l’interprétation de ses performances et sur toutes ces étapes à
Mon avis il vaut mieux être en tout cas accompagné par au moins un Data scientiste qui pourra au moins vous guider vous expliquer à quoi se correspondent ces différentes étapes pourquoi elles sont importantes et pourquoi elles sont pas ouis pourquoi elles sont importants très bien merci alors eu
Merci Nils merci Gwenael pour pour ce pour ce ce webinaire euh avant de avant de conclure juste pour vous rappeler que que arc CIT reste à votre à votre disposition à votre service pour vous accompagner sur sur l’ensemble des axes de de l’intelligence artificielle pour le pour le pour l’information géographique donc trois
Axes que sont l’appui à la stratégie de goia autour de la donnée géographique un axe de service de solution autour de la goia et puis évidemment des formations en en goia autour des différents outils que vous pourriez utiliser utiliser tous les jours je voulais je voudrais remercier
Encore une fois le le stdl et puis et Genel d’avoir de nous avoir accompagné dans ce second volet de de de webinaire merci à vous d’avoir participé à ce second webinaire nous restons évidemment à votre écoute pour vous accompagner dans le cadre de votre stratégie goia et
Puis je vous invite à à nous retrouver sur les différentes pages arité des réseaux sociaux que ce soit LinkedIn ouou x euh et puis portail portailarccit.com et puis formationcjev.com si vous souhaitez que nous vous accompagnons dans le renforcement de vos de vos capacités merci encore une fois de votre écoute et
Puis je vous souhaite une très belle journée à toutes et à tous à bientôt au revoir au revoir au revoir [Musique]