WEBVTT
Kind: captions
Language: fr

00:00:01.260 --> 00:00:04.340
Merci beaucoup pour l’invitation. J’aimerais
commencer par dire qu'il s'agissait d'un travail

00:00:04.340 --> 00:00:07.960
d'équipe et que nous disposions d'une excellente
équipe.

00:00:07.960 --> 00:00:16.699
Des crises comme la pandémie émergent et
nous éprouvons un besoin urgent de données.

00:00:16.699 --> 00:00:23.430
Parfois les données dont nous avons besoin
sont sur la biodiversité. Dans ce cas, nous

00:00:23.430 --> 00:00:26.800
aimerions avoir plus de connaissances sur
les chauve-souris. Dans d’autres cas, comme

00:00:26.800 --> 00:00:32.739
les marées noires, il peut s'agir de l'ensemble
du biote d'une région particulière pour

00:00:32.739 --> 00:00:39.160
lequel nous avons besoin de données. Avant
notre travail, nous n’avions pas d’ensemble

00:00:39.160 --> 00:00:47.905
de protocoles de réponse en cas de crise
pour améliorer rapidement les données relatives

00:00:47.905 --> 00:00:52.980
à une source importante d'informations sur
la biodiversité : à savoir les 3 à 4 milliards

00:00:52.980 --> 00:00:54.792
de spécimens de la biodiversité dans le
monde.

00:00:54.792 --> 00:00:59.730
Comme nous le voyons pendant la pandémie
actuelle, il peut s’agir d’un petit sous-ensemble

00:00:59.730 --> 00:01:05.490
de spécimens qui deviennent critiques pour
la réponse à la crise. Les spécimens sont

00:01:05.490 --> 00:01:11.660
associés à des informations qui documentent
ce qui a été collecté, où cela a été

00:01:11.660 --> 00:01:14.509
collecté, qui l'a collecté, et d'autres
informations. Il existe également des capsules

00:01:14.509 --> 00:01:16.490
temporelles d'informations potentielles, car
les données génomiques peuvent souvent être

00:01:16.490 --> 00:01:20.771
dérivées du spécimen ou de ses agents pathogènes.
Il ne s'agit que de quelques spécimens de

00:01:20.771 --> 00:01:26.640
l'espèce de chauve-souris en fer à cheval
chez laquelle le parent le plus proche du

00:01:26.640 --> 00:01:31.259
SRAS-CoV-2 a été découvert. Il s'agit de
Rhinolophus affinis.

00:01:31.259 --> 00:01:37.770
Nous avons ciblé un ensemble de trois familles
très proches, qui inclut la famille de la

00:01:37.770 --> 00:01:43.330
Rhinolophus affinis pour l'amélioration des
données sur les spécimens.

00:01:43.330 --> 00:01:45.444
Il s'agit des cartographies des spécimens
de chauve-souris fer à cheval/Rhinolophe

00:01:45.444 --> 00:01:48.100
dans les deux principaux agrégateurs de données
sur les spécimens. Je veux mettre en avant

00:01:48.100 --> 00:01:52.579
que les données collectées et agrégées
sont précieuses dans leur état actuel. Cependant,

00:01:52.579 --> 00:01:55.640
les données présentent certaines qualités
qui peuvent être améliorées par l'examen

00:01:55.640 --> 00:01:59.610
des données dans leur ensemble et les données
ont été créées sur deux décennies ou

00:01:59.610 --> 00:02:03.930
plus, ce qui signifie que les données n'ont
pas toutes bénéficié de notre compréhension

00:02:03.930 --> 00:02:07.670
actuelle des bonnes pratiques et de la disponibilité
de logiciels permettant d'améliorer certaines

00:02:07.670 --> 00:02:09.330
étapes.
Nous nous sommes concentrés sur l'amélioration

00:02:09.330 --> 00:02:12.286
des données de ces manières et je vais les
passer en revue avec vous en caractères gras.

00:02:12.286 --> 00:02:14.640
Si vous prêtez attention au changement de
titre de la diapositive, vous pourrez suivre

00:02:14.640 --> 00:02:17.940
notre progression relativement rapide dans
ces activités.

00:02:17.940 --> 00:02:23.590
Les données sur les spécimens provenant
des deux principaux agrégateurs se sont chevauchées,

00:02:23.590 --> 00:02:29.769
mais elles ne sont pas identiques. La déduplication
de leurs enregistrements a permis d'obtenir

00:02:29.769 --> 00:02:33.569
environ 90 000 enregistrements dans le champ
d'application.

00:02:33.569 --> 00:02:40.730
Les archives sont conservées par 118 institutions
dans le monde entier. Les 10 premières de

00:02:40.730 --> 00:02:43.650
ces institutions se partagent 63 % des enregistrements.
Nous ne pouvions attribuer ou évaluer les

00:02:43.650 --> 00:02:48.550
coordonnées des collections - les emplacements
des collections - que lorsque ces emplacements

00:02:48.550 --> 00:02:55.360
étaient décrits dans les données partagées.
Et environ deux tiers des enregistrements

00:02:55.360 --> 00:03:01.120
contenaient ces informations. Parmi ceux-ci,
environ deux tiers sont arrivés avec des

00:03:01.120 --> 00:03:07.840
coordonnées pré-assignées et un tiers n'en
avait pas. Nous avons pu évaluer ou attribuer

00:03:07.840 --> 00:03:13.159
des coordonnées dans 95 % des cas possibles
et nous avons modifié des coordonnées préexistantes

00:03:13.159 --> 00:03:16.170
dans la moitié des cas. Le déplacement médian
d'une coordonnée préexistante était de

00:03:16.170 --> 00:03:22.260
six kilomètres.
Il est important de noter que les champs de

00:03:22.260 --> 00:03:29.239
métadonnées pertinents sont passés de pratiquement
vides à pratiquement complets grâce à l'ajout

00:03:29.239 --> 00:03:33.570
d'informations utiles telles que le protocole
de géoréférencement et les ressources de

00:03:33.570 --> 00:03:37.300
géoréférencement.
Dans ce résumé, au niveau des pays, vous

00:03:37.300 --> 00:03:43.840
pouvez voir où le plus grand nombre de spécimens
a été collecté par la taille du diagramme

00:03:43.840 --> 00:03:51.200
circulaire et le nombre relatif de nouvelles
coordonnées ajoutées aux spécimens de ces

00:03:51.200 --> 00:03:54.680
pays.
Voici les coordonnées des lieux de collecte

00:03:54.680 --> 00:04:00.140
pour chacune de nos familles focales.
Nous avons comparé nos coordonnées avec

00:04:00.140 --> 00:04:05.150
d’anciennes cartes de la répartition des
espèces quand elles étaient disponibles

00:04:05.150 --> 00:04:14.549
à l’Union Internationale pour la Conservation
de la Nature (UICN). Voici un exemple de circonscription

00:04:14.549 --> 00:04:29.630
de l'aire de répartition en rouge pour une
espèce, il s’agit une nouvelle fois de

00:04:29.630 --> 00:04:33.730
Rhinolophus affinis, et nos coordonnées pour
cette espèce en vert. Nous avons découvert

00:04:33.730 --> 00:04:36.800
que les spécimens géoréférencés suggèrent
une extension de l’aire de répartition

00:04:36.800 --> 00:04:42.300
pour 153 des 169 espèces de chauves-souris
pour lesquelles nous disposons de ce genre

00:04:42.300 --> 00:04:47.470
de cartes. C’est une expansion significative
de notre compréhension des endroits où trouver

00:04:47.470 --> 00:04:53.100
les chauves-souris. Voici une capture d'écran
d'un explorateur de données sur les chauves-souris

00:04:53.100 --> 00:04:59.230
fer à cheval basé sur internet, destiné
aux évaluateurs de cartes de l'UICN et à

00:04:59.230 --> 00:05:07.880
d'autres parties prenantes, qui permet de
consulter les coordonnées des localités

00:05:07.880 --> 00:05:12.600
par rapport aux cartes actuelles de l'UICN,
avec des liens vers les enregistrements complets

00:05:12.600 --> 00:05:16.220
dans notre système.
Les enregistrements sont associés avec 2930

00:05:16.220 --> 00:05:27.470
valeurs distinctes qui référencent les personnes
qui ont collecté ou identifié les spécimens.

00:05:27.470 --> 00:05:34.121
Nous avons été capable d’assigner 803
identifiants uniques à un sous-ensemble de

00:05:34.121 --> 00:05:38.021
ces valeurs. Ces identifiants uniques, ou
ORCID IDs quand la personne est vivante, et

00:05:38.021 --> 00:05:46.850
Wikidata IDs quand la personne est décédée.
437 valeurs additionnelles représentant 359

00:05:46.850 --> 00:05:52.860
personnes ont été assignées raisonnablement
à des personnes vivantes mais qui n’ont

00:05:52.860 --> 00:05:56.419
pas encore un ORCID ID.
Pour cela, nous avons embauché 34 personnes

00:05:56.419 --> 00:06:04.259
qui sont principalement des experts des chauves-souris
venant de 13 pays. Ces experts et nos curateurs

00:06:04.259 --> 00:06:08.930
de données ont découvert qu’ils pouvaient
associer à peu près la moitié des enregistrements

00:06:08.930 --> 00:06:13.330
à un identifiant unique pour les collecteurs
de spécimen et environ deux tiers les identificateurs

00:06:13.330 --> 00:06:24.100
de spécimen.
La valeur de ce travail pour une réponse

00:06:24.100 --> 00:06:29.039
de crise peut ne pas paraître évidente,
mais cela pourrait être l’une des choses

00:06:29.039 --> 00:06:30.234
les plus importantes que nous ayons faites.
Nous avons identifié 117 personnes avec des

00:06:30.234 --> 00:06:34.840
ORCID IDs avec de l’expérience dans la
collecte de chauves-souris. Vous pourriez

00:06:34.840 --> 00:06:39.290
objecter qu’il est facile de trouver les
experts de chauve-souris - il suffit de se

00:06:39.290 --> 00:06:43.200
rapprocher de leur organisation ou de faire
une recherche bibliographique. En réalité,

00:06:43.200 --> 00:06:49.330
les collecteurs de chauve-souris et ceux que
vous pourriez trouver avec ces deux méthodes

00:06:49.330 --> 00:06:55.610
ne s'intersectent que partiellement. Les collecteurs
de chauve-souris se répartissent en fait

00:06:55.610 --> 00:07:00.680
parmi une grande variété de professions
incluant certaines qui ne sont pas reliées

00:07:00.680 --> 00:07:06.190
à la biologie. Voici quelques descriptions
de collecteurs avec une expérience précieuse

00:07:06.190 --> 00:07:10.870
qui font du travail de terrain parfois dans
des régions reculées. Rappelez-vous, nous

00:07:10.870 --> 00:07:15.540
avons aussi identifié 359 collecteurs de
chauves-souris vivants qui n’ont pas de

00:07:15.540 --> 00:07:20.520
ORCID ID. L'ensemble constitue un rolodex
de contacts potentiels pour ceux d'entre vous

00:07:20.520 --> 00:07:27.349
qui doivent retourner sur le terrain pour
relocaliser des populations de chauves-souris.

00:07:27.349 --> 00:07:32.139
Avant l'amélioration des données, 5,5 % des
enregistrements contenaient des informations

00:07:32.139 --> 00:07:37.220
sur les séquences associées. Nous avons
identifié environ 1 100 spécimens supplémentaires

00:07:37.220 --> 00:07:39.910
auxquels nous pouvions associer les nouvelles
séquences que nous avons trouvées.

00:07:39.910 --> 00:07:43.610
Notre version des données, et nos protocoles,
sont partagés sur Zenodo. Nous avons donc

00:07:43.610 --> 00:07:51.639
pavé un chemin que d’autres peuvent suivre
pour améliorer la qualité des données rapidement

00:07:51.639 --> 00:07:54.710
pendant la prochaine crise. Nous nous attendons
à partager notre version finale complète

00:07:54.710 --> 00:07:57.330
très bientôt. Néanmoins, j’aimerais noter
que notre version actuelle est très proche

00:07:57.330 --> 00:08:05.840
de la version finale. Nous sommes proches
de soumettre un manuscrit sur ce travail et

00:08:05.840 --> 00:08:13.169
nous attendons à mettre largement à disposition
l’explorateur de données pour les chauves-souris

00:08:13.169 --> 00:08:17.000
fer à cheval pour ceux qui en ont besoin.
L’UE a récemment annoncé un nouveau financement

00:08:17.000 --> 00:08:21.510
pour la création d'enregistrements, environ
20000 spécimens de chauves-souris, et nous

00:08:21.510 --> 00:08:26.780
nous attendons à ce que les fondations que
nous avons jeté accélèrent ce travail.

00:08:26.780 --> 00:08:32.870
J’aimerais remercier toutes les personnes
qui ont contribué par leur temps et leur

00:08:32.870 --> 00:08:40.860
expertise, pour la désambiguïsation et présents
dans le premier paragraphe, mais qui n’ont

00:08:40.860 --> 00:08:50.019
pas été assignés d’ORCID ID à cet endroit
par manque de place. Et merci à la NSF pour

00:08:50.019 --> 00:08:53.080
le soutien.

