1. Phase 1A : Initialisation

1.1. Objectifs

Tue, 13 Feb 2001 23:35:40 +0100

Frédéric legens

Décrire ce projet, n'est pas quelque chose de facile surtout sans faire référence à la technologie à employer. Cependant je vais essayer de le faire.

Prenons comme exemple ISFF. Benoît Bock aurait pu se contenter de mettre à jour le fichier texte fait par Kerguelen, cependant il a choisit de structurer l'information dans une base de donnée. Cette structuration a pour avantage de simplifier le travail à faire, et de rendre facilement utilisable l'information, ce qui n'était pas le cas dans le fichier texte.

C'est justement se que l'on souhaite faire dans le projet eFlore, pour les fonctionnalités dont aurons besoin notamment les projets flore de France et pour les listes départementales.

Ces deux projet ont un point commun. Ils consistent à associer de l' information à des taxons.

Pour les listes départementales, l'information est la présence ou l' absence d'un taxon dans un département..
Pour une clef de détermination, c'est un enchaînement de questions partant d'un taxon donné aboutissant aux taxons hiérarchiquement inférieurs au taxon donné.

Une bonne structuration des ces informations permettra lorsqu'une correction est apportée à un taxon, de répercuter automatiquement cette modification aux listes départementales et aux clefs. Cependant il existe des avantages bien plus importants :

se concentrer sur une bonne structuration permet par exemple de remarquer que la différence entre une liste départementale, régionale, et entre une cartographie réside certainement dans le maillage qui à première vue est respectivement un département, une région, des carrés d'une certaine superficie. Rendre la structuration identique permettra alors de faire facilement des opérations d'unions, exclusions, etc..
avoir une structuration homogène d'informations de nature différentes. Par exemple lorsque l'on aura dans le système un dérivé de l'ISSFF pour les taxons, des clefs nationales associées à ces taxons, ainsi que des listes départementales, il sera alors possible d'obtenir facilement une déclinaison régionale des clefs par élagage automatique (suppression des questions aboutissant aux taxons absents du département), etc.

Ce projet, outre l'établissement de ces structures d'informations, aura également pour but de mettre en place les outils informatiques permettant l' exploitation de ces structures.

Il débouchera sur la création d'une base de données, hébergée sur le site de tela-botanica pour stocker ces informations. Ces informations seront accessibles soit par un navigateur sous la forme de page HTML (sur Mac ou sur PC), soit par des applications clientes (utilisant comme intermédiaire avec la base de donnée des documents XML) pour les données complexes (voir pour exemple mon prototype d'éditeur de clefs). Les fichiers HTML et XML seront générés par PHP.

Voila j'espère que c'est compréhensible et j'attend vos questions. Dans les jours à venir nous établirons un plan d'actions.

1.2. eflore et flore

"Frederic legens"

Sat, 2 Jun 2001 22:12:30 +0200

Bonjour Daniel,

C'est vraiment étrange, la plupart des botanistes se plaignent car il y a de moins en moins de chercheurs dans ce domaine, de moins en moins de temps consacré à cette discipline en université , de moins en moins d'étudiants, de moins en moins de jeunes amateurs. Mais d'un autre coté, ils ne souhaite pas dépoussiérer l'image de la botanique, je parle de celle du vieux bonhomme errant parmi des piles de planches d'herbiers, avec ces plantes fanées aux couleurs délavées. Attention je n'ai rien contre les herbiers et je sais que cette image est fausse, mais c'est quand même l'image que s'en fait le grand public, c'est dommage car ce n'est vraiment pas porteur.

Tela-botanica a pu déjà il me semble redynamiser un certain nombre de botanistes. A l'intérieur de Tela-botanica j'espère bien que le projet eFlore puisse rendre dynamique la notion de flores. En effet quel est le problème principale d'une flore : c'est qu'elle est figée. En effet : · les changements nomenclaturaux, les erreurs sont rarement corrigées, · les flores nationales ne sont que rarement déclinées au niveau de la région, au niveau du département. · elles ne sont pas mises en lignes, sur CD-ROM, en base de données, utilisables sur un PDA.

Daniel tu vas me dire que je n'ai pas répondu à ta question : « le projet eflore peut-il concrètement aider à la réalisation d'UNE flore ?"

Si lorsque l'on parle d'UNE flore on considère que l'on va avoir une flore papier dont les erreurs ne seront jamais corrigées dans les rééditions, que les changements nomenclaturaux ne seront jamais répercutés, je pense que le projet eFlore n'apportera que peu de chose : un suivi facile de l'avancement, une consultation immédiate des parties déjà faites, un travail collectif plus facile à condition que les auteurs ne soient pas technophobes.

Par contre si l'on souhaite que les changements nomemclaturaux soient immédiatement pris en compte, que l'on souhaite pouvoir disposer de cette flore sur papier, sur son ordinateur, sur internet, sur PDA alors oui le projet eFlore apportera concrètement de l'aide car sa force est de reposer sur la technologie XML. XML permet à la fois de structurer l'information et également de la rendre relativement facilement malléable donc déclinable et personnalisable sous différentes formes. Ce n'est pas un hasard que XML puisse permettre cela car il résulte de la simplification du le langage SGML qui est couramment utilisé pour la rédaction de document très complexes : comme le mode d'emploie d'un mirage, d'une centrale nucléaire. Je ne suis pas un expert sur les logiciels de publications, mais de plus en plus peuvent utiliser ce format par exemple FrameMaker. Cela peut donc faciliter la mise en page donc la publication.

Il sera également facile d'en obtenir une déclinaison partielle de la flore, pour sa région, pour son département, pour un edition particulière.

Bref le projet eFlore permettra surtout d'obtenir SA flore personnelle. Cela me semble très important, cela pourrait permettre aussi bien à une association linnéenne ou de protection de la nature, ou à une entité territoriale, à une société faisant des études d'impacts, à un instituteur, de disposer de la flore convenant à ses besoins (en formation, en communication, en information).

Voilà pour la partie exploitation des données, maintenant il existe la partie concernant l'écriture des données. Pour cette partie les avantages me semblent moins importants, ils permettront principalement de pouvoir amalgamer des clefs, des descriptions, des dessins, de photos d'auteurs différents en temps réels et sans demander un grand travail de synthèse.

Voilà pour ma réponse j'ai pas l'impression d'avoir apporté d'éléments nouveaux. L'utilisation XML me semble quelque chose de très important maintenant ce n'est pas une solution miracle qui résoudrait tous les problèmes : une mauvaise clef de détermination sera toujours une mauvaise clef une fois structurée en XML.

Par contre je peux te proposer deux éléments concrets pour illustrer mes propos : Un livre électronique au format MicrosoftReader contenant une partie de la flore de Coste (monocotylédones (sans les poacées)) avec les clefs les descriptions et les illustrations le tout relié par hypertexte. Ce livre est lisible sur les derniers PocketPC ou sur tout PC équipé du logiciel MicorsoftReader. Un document pdf contenant la même partie de la flore de Coste mais sans les illustrations.

Ces deux fichiers ont été obtenus par les étapes suivantes : Base de données >> XML >>transformation en HTML par XSL >> Fichier Microfost Reader. Base de données >> XML >> transformation en LATEX par XSL >> Fichier PDF

On fera de même avec le projet eFlore.

J'ai pas d'autre arguments à l'esprit, mais si tu peux me décrire les profils des personnes à convaincre, je pourrais peut-être compléter cette réponse.

Cordialement.

Daniel MATHIEU

Sun, 12 Aug 2001 20:45:06 +0200

Bonjour,

Je rejoins l'argumentaire de Frédéric en complétant les points suivants :

Des logiciels existent, et pour faire des choses multiples. Au niveau de Tela, ce que nous souhaitons, c'est développer ou utiliser des produits existants, mais dans le cadre de projets bien définis. Parmi ces projets citons :

la préparation et l'accompagnement du développement de flores (Flore méditerranéenne, flore de France)
la publication de l'ISFF
la mise à disposition de données en ligne fiables et validées : chorologie, iconographie, diagnoses...
la production d'un cédérom intégrant ces données et permettant de faire des relevés de terrain et d'échanger des données.

Il faut faut pour cela une structure pérenne (l'Association Tela Botanica) et "professionnelle" (les permanents de Tela Botanica), capable de structurer et d'organiser des projets et de coordonner le travail des uns et des autres. Le piège à éviter est celui de la dispersion, très facile avec Internet ou chacun peut "faire son truc dans son coin" et le montrer à tous, mais sans soucis d'intégration avec le travail des autres.

Il faut aussi cultiver les collaborations, et lorsqu'une idée ou un produit nouveau et intéressant émerge, ne pas hésiter à collaborer avec les initiateurs.

Le projet eflore entre dans cette stratégie de maîtrise d'outils au service de projets plus globaux et en collaboration avec ce qui existe de mieux.

C'est de tous ces points que nous discuterons aux journées du 29 et 30, septembre prochains à Montpellier.

1.3. Outils

Sun, 11 Feb 2001 21:19:20 +0100

Frédéric legens

Je vous rappelle que le projet comporte principalement les parties suivantes :

La partie fonctionnelle,
La partie technique qui se décompose elle même en :
- XML pour l'échange de données
- PHP pour la création des fichiers XML, et l'intégration de l'information dans la base de données.
- mySQL pour la base de données.
- La réalisation d'applications clientes pour la manipulation du XML.

Pour les personnes qui ne sont pas familières au XML vous pouvez trouver une introduction à l'emplacement suivant http://www.citeweb.net/apetitje/xml/ ou bien http://www.chez.com/xml/initiation/index.htm .

De même pour PHP et mySQL a l'emplacement suivant : http://www.phpinfo.net/

1.4. Découpage

Wed, 21 Feb 2001 23:05:11 +0100

Frédéric legens

Comme je l'ai écrit dans un de mes précédents mails le projet consiste essentiellement à définir la structure des informations que l'on va associer à des taxons. Je propose donc qu'on commence à travailler sur la partie qui concerne le stockage des taxons et la structure à adopter en fonction de l' utilisation que l'on pense en faire, cette partie étant réellement la pierre angulaire du système. Pour cette partie nous avons la grande chance de ne pas partir de zéro grâce à l'ISFF (merci benoît) autant du point de vue du contenu que du contenant. Cependant on ne peut pas utiliser directement ISFF, en effet sa structure est bien adaptée à un index synonymique, mais pas forcément à nos besoins. Je pense notamment au fait qu'elle n'abrite il me semble que des taxons égaux ou inférieurs à l'espèce, de plus il n'y a pas réellement de notion de classification, notion qui me semble essentielle pour notre projet. Je vous propose donc dans un premier temps de lire le descriptif technique du travail de conversion qu'a rédiger Benoît Bock afin de se rendre compte de la structure de l'ISFF ainsi que des informations qui s'y trouvent. Vous pouvez trouver ce document à l'emplacement suivant : www.tela-botanica.net/projets/bdnff/bilan-bdnff.pdf Dans un second temps nous essayerons de définir les fonctionnalités que l'on souhaite avoir pour la manipulations de ces taxons (Phase 1B) Puis nous définirons la structure à adopter pour stocker les informations nécessaires à ces fonctionnalités ainsi que les premières fiches XML destinées à véhiculer l'information en dehors de la base de données. (Phase 1C)

Sun, 25 Feb 2001 12:09:42 +0100

Frédéric legens

Merci pour vos exemples de données à mettre en place dans eFlore, ils vont me permettre de présenter le phasage du projet.

Le premier groupe de données concerne en quelque sorte l'identité du taxon :

Nom scientifique (cf ISSF et travaux de BB)
Noms français
Noms étrangers
Synonymes.
Taxons hiérarchiquement supérieurs au taxon.

C'est le but de la phase 1, de définir les structures et les fiches XML associées à ces données.

Le deuxième groupe concerne la description d'un taxon. On se limitera certainement à définir le format d'une fiche XML permettant de structurer la description faite en français du taxon. Ce sera l'objet d'une phase spécifique.

Le troisième groupe concerne les clefs de détermination. On procédera certainement de la même façon que pour la description d'un taxon. Ce sera l' objet d'une phase spécifique.

Le quatrième groupe concerne les caractéristiques d'un taxon. Ces caractéristiques seront exprimées de façon à pourvoir facilement faire des requêtes dessus. Ce sera l'objet d'une phase spécifique.

Exemple de données :

Origine géographique
Aire de répartition
Forme végétale (Phanérophyte, etc.)
Type végétal (arbre, arbuste, arbrisseau, etc.) les valeurs dépendent de la forme végétale
pérennité (sempervirente, vivace, annuelle, etc.)
besoin en lumière (5 niveaux)
besoin en eau (7 niveaux)
besoin en azote (5 niveaux)
préférences calcaire/acidité (6 niveaux)
granulométrie du substrat (6 niveaux)
Statut de protection (nationale, régionale avec liste des régions, départementale
Statut de présence en France
Synanthropie ou Xénophytie: Planté, Échappé de jardin, Éphémère, Adventice, Subspontané, Naturalisé

1.5. ISFF/BDNFF

Thu, 01 Mar 2001 15:56:48 +0100

Benoit BOCK

subsp. = sous-espèce

= sous-espèce mais ce rang est non explicitement mentionné dans la descripion d'origine n-subsp.= nothosubsp. = sous-espèce hybride idem pour var. proles= rang taxonomique entre sous-espèce et variété plus usité aujourd'hui fa. = forme cv. et convar.: 2 types de cultivars (revoir discussion sur le sujet sur tela) BB

Fri, 02 Mar 2001 11:58:17 +0100

Benoit BOCK

Definition basionyme :

C'est le premier nom donné à une plante. Généralement, les autres noms données ensuite conservent l'épithète spécifique mais par nécessairement au même rang.

1.6. Attributs

Mon, 26 Feb 2001 16:56:52 EST

APIMEDIA

D'une manière générale, il semble très difficile d'intégrer la dimension géographique dans une base de données botanique, sauf à rendre la taille de la base démesurée.

Pourtant ces données sont intéressantes : stades phénologiques en fonction des lieux, statut à différents endroits, croisement des répartitions de différents taxons, indication de présence à différentes échelles, etc.

Quelqu'un a-t-il des idées sur la gestion de ces données géographiques ? Y-a-t-il un spécialiste SIG (systèmes d'informations géographiques) dans le groupe ?

Sat, 03 Mar 2001 22:25:39 +0100

Benoit BOCK

Toujours afin de rendre échangeables les données entre les différentes bases, il me semble nécessaire de se mettre d'accord sur le contenu des rubriques.

Pour la répartition des taxons, rubrique que j'ai appelée CHOROLOGIE, on peut ainsi utiliser :

Artico Alpin
Atlantique
Atlantique méridional
Atlantique occidental
Atlantique oriental
Atlantique septentrional
Atlantique tempéré
Boréal
Boréo Altantique
Circum Boréal
Cosmopolite
Cultivé
Endémique alpin
Endémique corse
Endémique pyrénéo-cantabrique
Endémique français
Micro Endémique
Eurasiatique
Eurasiatique méridional
Eurasiatique occidental
Eurasiatique oriental
Eurasiatique septentrional
Eurasiatique tempéré
Européen
Européen central
Européen méridional
Européen occidental
Européen oriental
Européen septentrional
Européen tempéré
Holarctique
Holarctique méridional
Holarctique septentrional
Holarctique tempéré
Introduit
Introduit (?)
Introduit (Afrique Centrale)
Introduit (Afrique de l'Est)
Introduit (Afrique de l'Ouest)
Introduit (Afrique du Nord)
Introduit (Afrique du Sud)
Introduit (Afrique)
Introduit (Amérique du Nord occidentale)
Introduit (Amérique du Nord orientale)
Introduit (Amérique du Nord septentrionale)
Introduit (Amérique du Nord)
Introduit (Amérique du Sud)
Introduit (Amérique tropicale)
Introduit (Amérique)
Introduit (Antartique)
Introduit (Antilles)
Introduit (Asie centrale)
Introduit (Asie méridionale)
Introduit (Asie occidentale)
Introduit (Asie orientale)
Introduit (Asie septentrionale)
Introduit (Asie)
Introduit (Australie)
Introduit (Balkans)
Introduit (Brésil)
Introduit (Canaries)
Introduit (Caucase)
Introduit (Chine)
Introduit (Himalaya)
Introduit (Japon)
Introduit (Maghreb)
Introduit (Mexique)
Introduit (Tibet)
Méditerranéen
Méditerranéen Atlantique
Méditerranéen méridional
Méditerranéen occidental
Méditerranéen oriental
Méditerranéen septentrional
Méditerranéen tempéré
Naturalisé
Orophyte
Sub Atlantique
Sub Méditerranéen liste à compléter

Pour les pays de répartition, les codes utilisés par Flora Europaea semblent satisfaisants:

Ga, Co, Hs, It, ...

Ils peuvent couplés comme je l'ai fait dans l'ISFF à partir des information sde Kerguelen par A (adventice) N (Naturalisé) D(Disparu) E(à Exclure) I(Présence Incertaine) pour donner GaA ou GaN ou GaI ou GaE, ...

Il est ensuite facile de lancer une requête informatique pour obtenir toutes les plantes de France (Ga) en excluant par exemple les Adventices (- GaA)...

Sun, 4 Mar 2001 09:44:32 +0100

"Roger Cruon"

Aucune classification chorologique n'est satisfaisante, mais celle de Pignatti (Flora d'Italia, 1982) est intéressante. Elle privilégie évidemment les origines méditerranéennes, mais rien n'empêche de la compléter pour d'autres régions. La liste de Benoît mélange deux aspects: la répartition "naturelle" du taxon, et le fait qu'il soit introduit en France. Il n'est pas facile de séparer complètement ces deux aspects, à cause des naturalisations anciennes, qui font que certains taxons sont cosmopolites ou subcosmopolites (voir ci-après 94 et 95). Mais il vaut mieux avoir un code séparé pour la xénophytie (voir mon message du 24/02). Voici la liste de Pignatti, un peu modifiée:

11 Endémique
12 Subendémique
2 Sténoméditerranéen: côtes méditerranéennes, dans l'aire de l'olivier
- 21 Sténomédit. s.l.: de Gibraltar à la mer
- 22 Sténomédit. septentrional: Côtes méridionales de l'Europe, de l'Espagne à la Grèce
- 23 Sténomédit. oriental: bassin méditerranéen oriental, des Balkans à la Turquie et à l'Egypte
- 24 Sténomédit. méridional: côtes septentrionales de l'Afrique, du Maroc à l'Egypte
- 25 Sténomédit. occidental: bassin méditerranéen occidental, de la Ligurie à l'Espagne et à l'Algérie
- 26 Sténomédit. nord-occidental: de la Ligurie à l'Espagne
- 27 Sténomédit. sud-occidental: du Maroc à la Tunisie et à la Sicile
- 28 Sténomédit. nord-oriental: des Balkans à la Turquie
3 Euryméditerranéen: bassin méditerranéen, dans l'aire de la vigne
- 31 Eurymédit. s.l.: de Gibraltar à la mer Noire
- 32 Eurymédit. septentrional: sud de l'Europe, de l'Espagne à la Grèce
- 33 Eurymédit. oriental: Méditerranée orientale, des Balkans à la Turquie et à l'Egypte
- 34 Eurymédit. méridional: nord de l'Afrique, du Maroc à l'Egypte
- 35 Eurymédit. occidental: Méditerranée occidentale, de la Ligurie à
- l'Espagne et à l'Algérie
- 36 Eurymédit. nord-occidental: de la Ligurie à l'Espagne
- 37 Eurymédit. sud-occidental: du Maroc à la Tunisie et à la Sicile
- 38 Eurymédit. nord-oriental: des Balkans à la Turquie
41 Méditerranéo-montagnard s.l.: montagnes du bassin méditerranéen
5 Eurasiatique: continent eurasien
- 51 Paléotempéré: Eurasiatique s.l., pouvant déborder sur l'Afrique du Nord
- 52 Eurasiatique s.s.: de l'Europe au Japon
- 53 Sud-européen - sud-sibérien: zones chaudes d'Europe et secteurs arides de la Sibérie méridionale
- 54 Européo-caucasien: Europe et Caucase
- 55 Européen: Europe
- 56 Centreuropéen: Europe tempérée, de la France à l'Ukraine
- 57 Nord-européen: Europe septentrionale
- 58 Sud-est européen: région carpatico-danubienne
- 59 Sud-européen: Europe méridionale
6 Atlantique: côtes atlantiques de l'Europe
- 61 Ouest-européen: Europe occidentale, de la Scandinavie à la péninsule Ibérique
- 62 Subatlantique: zones à climat subocéanique
- 63 Sténoméditerranéo-atlantique: côtes atlantiques et méditerrranéennes
- 64 Amphi-atlantique: côtes de l'Europe et de l'Amérique du Nord
- 65 Euryméditerranéo-atlantique: côtes atlantiques et méditerrranéennes
- s.l.
7 Orophyte sud-européen: montagnes de l'Europe méridionale
- 71 Orophyte sud-européen s.l.: de la péninsule Ibérique au Balkans, et
- éventuellement le Caucase et l'Anatolie
- 72 Orophyte sud-est-européen: aire centrée sur les Balkans (manquant aux Pyrénées)
- 73 Orophyte sud-ouest-européen: péninsule Ibérique, massifs centraux (rare ou manquant aux Balkans)
- 74 Endémique alpin: chaîne des Alpes, quelquefois débordant au nord et à l'ouest
- 75 Orophyte européen: montagnes d'Europe, parfois centré sur les chaînes méridionales
- 76 Orophyte centreuropéen: Alpes, Jura, Carpates et même chaînes plus
- méridionales
8 Boréal: zones boréales
- 81 Circumboréal: zones froides ou tempérées-froides d'Europe, d'Asie et d'Amérique du Nord
- 82 Eurosibérien: zones froides ou tempérées-froides d'Eurasie
- 83 Circumarctico-alpin: zones arctiques d'Eurasie et d'Amérique du Nord, et hautes montagnes
- 84 Arctico-alpin eurasiatique: zones arctiques d'Eurasie et hautes
- montagnes de ce continent
- 85 Arctico-alpin européen: Europe arctique, Alpes et autres montagnes
- sud-européennes
- 86 Arctico-alpin euro-américain: Scandinavie, Amérique du Nord et hautes montagnes des zones tempérées
9 Répartition vaste
- 91 Pantropical: zones tropicales d'Eurasie, d'Afrique et d'Amérique
- 92 Saharo-sindien: zones désertiques, de l'Afrique septentrionale à l'Inde
- 93 Méditerranéo-touranien: zones désertiques et subdésertiques, du bassin méditerranéen à l'Asie centrale
- 94 Subcosmopolite: la plupart des continents et des zones climatiques
- 95 Cosmopolite: tous les continents et les zones climatiques
- 96 Paléotropical: zones tropicales d'Afrique et d'Asie
- 97 Subtropical: zones tropicales et tempérées-chaudes

Il faudrait peut-être la compléter pour les espèces américaines.

P5 Wed, 7 Mar 2001 21:53:09 +0100 P5 Jean-François Léger

On peut éventuellement compléter la liste de Benoît en s'aidant de celle que j'utilise, +/- inspirée de Pignatti:

présumé disparu 0
microendémique 1
endémique d'un ou deux départements Présent dans seulement un ou deux départements 2
endémique de quelques départements Présent dans seulement 3 à 5 départements 3
endémique corse De Corse 4
endémique cyrno-sarde De Corse et de Sardaigne 5
endémique des Alpes occidentales 6
endémique Alpes SW & Apennins Endémique des Alpes du sud-ouest et des Apennins 7
endémique liguro-provençal 8
endémique français 9
Sténoméditérranéen: sténoméditerranéen De Gibraltar à la Mer Noire 20
sténoméditerranéen septentrional
- De l'Espagne à la Grèce 21
- sténoméditerranéen nord-oriental 22
- sténoméditerranéen oriental Des Balkans à la Turquie et à l'Egypte 23
- sténoméditerranéen méridional Des côtes d'Afrique du Nord 24
- sténoméditerranéen sudoccidental Du Maroc à la Tunisie et à la Sardaigne, voire la Corse 25
- sténoméditerranéen occidental De la Ligurie à l'Espagne et à l'Algérie 26
- sténoméditerranéen nordoccidental De la Ligurie à l'Espagne 27
- sténoméditerranéen franco-ibérique Des côtes méditerranéennes françaises et ibériques 28
- sténoméditerranéen occidental - atlantique De la Ligurie à l'Espagne, à l'Algérie et à la Bretagne 29
Euryméditerranéen: euryméditerranéen
- De Gibraltar à la Mer Noire 30
- euryméditerranéen septentrional De l'Espagne à la Grèce 31
- euryméditerranéen-pontique Des terres proches de la Méditerranée et de la Mer Noire 32
- euryméditerranéen-caucasien Des terres proches de la Méditerranée et du Caucase 33
- euryméditerranéen occidental De la Ligurie à l'Espagne et à l'Algérie 36
- euryméditerranéen nordoccidental De la Ligurie à l'Espagne 37
- euryméditerranéen franco-ibérique Des zones ± médit. de France et de la péninsule ibérique 38
- euryméditerranéen occidental - atlantique De la Ligurie à l'Espagne, à l'Algérie et à la Bretagne 39
Méditerranéo-montagnard:
- méditerranéo-montagnard De Gibraltar à la Mer Noire 40
- méditerranéo-montagnard septentrional De l'Espagne à la Grèce 41
- méditerranéo-montagnard oriental 43
- méditerranéo-montagnard sudoccidental Du Maroc à la Tunisie et à la Sardaigne, voire la Corse 45
- méditerranéo-montagnard occidental De la Ligurie à l'Espagne et à l'Algérie 46
- méditerranéo-montagnard nordoccidental De la Ligurie à l'Espagne 47
- méditerranéo-montagnard franco-ibérique Des montagnes méditerranéennes françaises et ibériques 48
Eurasiatique:
- eurasiatique De l'Europe au Japon 50
- européo-subpontique 51
- européo-caucasien 52
- européen-ouestasiatique 53
- centroeuropéen-pontique d'Europe centrale et des rives de la Mer Noire 54
- centroeuropéen-sudsibérien 55
- centroeuropéen-ouestasiatique 56
- sudeuropéen-pontique d'Europe du sud et des rives de la Mer Noire 57
- sudeuropéo-sudsibérien Des zones chaudes d'Europe et arides de Sibérie (steppique) 58
- sudeuropéen-centroasiatique 59
- sudeuropéen-sudasiatique 60
Orophyte eurasiatique:
- orophyte eurasiatique Des hautes montagnes d'Europe et d'Asie 70
- orophyte alpino-asiatique 71
- orophyte sudeurop.-ouestasiat. 72
- orophyte européen-ouestasiat. 73
- orophyte européo-caucasien 74
- orophyte centroasiatique-méditerranéen 75
- orophyte euryméditerranéen Des hautes montagnes méditerranéennes et sudeuropéennes 76
Européen:
- européen 80
- sudesteuropéen 81
- sudeuropéen 82
- sudouesteuropéen 83
- nordeuropéen 84
- centroeuropéen De la France à l'Ukraine 85
- centro- et esteuropéen 86
- centro- et sudeuropéen 87
- centro- et ouesteuropéen 88
- centro- et nordeuropéen 89
Orophyte européen:
- orophyte européen 100
- orophyte sudeuropéen De la péninsule ibérique aux Balkans, voire au Caucase 101
- orophyte sudesteuropéen 102
- orophyte sudouesteuropéen 103
- orophyte centroeuropéen Des Alpes, du Jura et des Carpathes 104
- orophyte centro- et sudeuropéen 105
- orophyte franco-espagnol 106
- orophyte (endémique) pyrénéen De la Chaîne des Pyrénées 107
- orophyte (endémique) alpin De toutes les Alpes et de leur piémont 108
- orophyte alpino-carpathique De toutes les Alpes et des Carpathes 109
Atlantique
- euatlantique Des régions à climat typiquement atlantique 110
- euatlant. franco-ibérique Des région côtières de la France et de la Péninsule Ibérique 111
- ouesteuropéen (euatlant. s.l.) De la Scandinavie à la péninsule ibérique 112
- nordouesteuropéen De la Scandinavie au NW de la France et aux Iles Britanniques 113
- subatlantique Des zones à climat (sub)océanique d'Europe de l'ouest 114
- atlantique franco-ibérique Idem, avec pénétration à l'intérieur des terres 115
- sténoméditerranéo-atlantique Des côtes atlantiques et méditerranéennes 120
- euryméditerranéo-atlantique Idem, avec pénétration à l'intérieur des terres 121
- submédit.-subatlantique 122
- amphi-atlantique Des zones atlantiques d'Amérique du Nord et d'Europe 129
Boréal:
- circumboréal Des zones (tempérées-)froides de l'hémisphère nord 130
- eurosibérien Des zones (tempérées-)froides d'Eurasie 131
- arcticoalpin euro-américain Des hautes latitudes et altitudes d'Europe et d'Am. Du Nord 133
- arcticoalpin européen Des hautes latitudes et altitudes d'Europe 134
- arcticoalpin eurasiatique Des hautes latitudes et altitudes d'Eurasie 135
- circum-arcticoalpin Des hautes latitudes et altitudes de l'hémisphère nord 136
- orophyte euro-américain Des hautes montagnes d'Europe et d'Amérique du Nord 138
- orophyte circumboréal Des hautes montagnes de l'hémisphère nord 139
Taxon à ample distribution:
- européo-nordafricain d'Europe et d'Afrique du Nord 200
- européen-boréoaméricain d'Europe et d'Amérique du Nord 201
- méditerranéo-touranien Des zones (sub-)désertiques du Bassin Médit. et de l'Asie centrale. 202
- paléotempéré De toute l'Eurasie et débordant sur l'Afrique du Nord 203
- paléosubtropical 204
- paléotropical 205
- holarctique 210
- subtropical Des zones tropicales et tempérées chaudes 212
- pantropical 213
- subcosmopolite tempéré Présent dans la plupart des régions tempérées du monde 214
- orophyte subcosmopolite Présent dans la plupart des chaînes de montagnes du monde 215
- subcosmopolite Présent dans la plupart des régions du monde 216
- cosmopolite Présent quasiment dans le monde entier 219
Taxon introduit:
- cultivé 220
- naturalisé 221
- cultivé et naturalisé 222
- adventice 223
- cultivé et adventice 224
Non déterminé:
- répartition à préciser 250
- présent avec les parents Répartition d'un hybride stérile 252
- présent surtout avec les parents Répartition d'un hybride peu fertile 253
- présent avec les parents, cultivé Répartition d'un hybride stérile, parfois cultivé 254

1.7. Delta

Sat, 24 Feb 2001 15:30:37 +0100

Jean-François Léger

Que pensez-vous de Delta Access? BDD Delta au standard Access. http://www.bgbm.fu-berlin.de/projects/DeltaAccess/

"Denis ZIEGLER"

Friday, February 23, 2001 10:46 PM

Puisque nous en sommes à la phase de reflexion préliminaire, je me permets d'intervenir pour indiquer qu'il existe un format de fichier utilisé au niveau international, spécialement adapté à la description taxonomique, en vue du traitement informatique. Il s'agit du format DELTA (DEscription Language for TAxonomy) recommandé comme standard pour les échanges de données taxonomiques. Son utilisation dépasse le cadre de la botanique ; il a d'ailleurs été développé par le département d'entomologie du CSIRO à Canberra en Australie. Le format DELTA comprend essentiellement deux fichiers : un fichier CHARS décrivant les caractères et leurs modalités, et un fichier ITEMS décrivant les taxons c'est à dire indiquant les modalités des caractères pour chaque taxon.

A titre d'illustration (simplifiée), voici un extrait de ces fichiers pour un jeu de données sur le genre Viola :

SHOW Genre Viola - Liste des caractères
SHOW Denis ZIEGLER - Novembre 1998
CHARACTER LIST
1. fleurs <position des pétales>/ 1. de type violette <2 pétales dressés et 3 vers le bas>/ 2. de type pensée <4 pétales dressés et 1 vers le bas>/
2. pétales <couleur>/ 1. violet/ 2. bleu/ 3. bleu pâle, lilas/ 4. blanc/ 5. jaune/ 6. bi ou tricolore/
3. fleurs <odorantes ou inodores>/ 1. odorantes/ 2. inodores/
4. taille des fleurs/ mm/
SHOW Genre Viola - Liste des taxons
SHOW Denis ZIEGLER - Novembre 1998

ITEM DESCRIPTIONS

Viola hirta <L.>/ 1,1 2,1/2 3,2 4,12-18 7,2 8,2 9,1 11,1 12,2 13,2 16,2 17,2 18,2 19,1 20,2 21,2 22,1 25,2 26,1 27,3 28,1 29,1 30,2 31,8-20 32,2
Viola palustris <L.>/ 1,1 2,3 3,2 4,12-15 6,1 7,2 9,1 11,2 12,1 13,2 16,1 17,2 18,1 19,1 20,2 21,2 22,3 25,1 26,1 27,3 28,1 29,1 30,1 31,3-10 32,2
Viola odorata <L.>/ 1,1 2,1 3,1 4,15-20 7,2 8,1 9,1 11,1 12,2 13,2 16,2 17,1 18,2 19,1 20,2 21,2 22,2 25,1 26,2 27,3 28,1 29,1 30,2 31,5-15 32,2

Un certain nombre de logiciels permettent d'exploiter ces fichiers, en vue de générer des clés de détermination, de réaliser des identifications interactives, etc... Le logiciel Intkey par exemple, développé par la même équipe, est très performant pour l'identification (y compris avec utilisation d'illustrations). Malheureusement, il s'agit d'un logiciel propriétaire et compilé sous Windows. Dans la même catégorie, le logiciel Navikey assure sensiblement les mêmes fonctionnalités sous forme d'une applet Java. C'est un logiciel libre. Personnellement, je collabore au projet FreeDelta, qui a pour but de créer des logiciels libres basés sur le format DELTA (une API en C++ est en cours d'écriture permettant d'analyser les fichiers Delta, utilisable par exemple par un programme d'identification).

Je ne sais pas si ce type de standard est utilisable dans le cadre de notre projet. Je pense qu'il n'est pas adapté à la réalisation de bases de données regroupant un grand nombre de taxons pour extraction, consultation, etc... Par contre, il permet de stocker toutes les informations nécessaires pour la description, l'identification, la réalisation de clés pour un genre donné par exemple.

Pour plus d'informations se reporter aux liens suivants :

Delta : http://biodiversity.uno.edu/delta/
FreeDelta : http://www.geocities.com/RainForest/Vines/8695/FreeDELTA/
Logiciels concernant la taxonomie (site très complet) : http://www.geocities.com/RainForest/Vines/8695/

Wed, 28 Feb 2001 00:35:06 +0100

"Denis ZIEGLER"

Parmi les valeurs "spéciales" que peut prendre un caractère vis-à-vis d'un taxon, on peut distinguer :

inconnu (pas d'info disponible à ce sujet)
impropre ou non applicable (ex : couleur des fleurs pour un gymnosperme)
variable (peut prendre une valeur quelconque pour ce caractère)
nul ou inexistant (ex : absence de stipules, glabre pour le caractère pilosité) Ces "pseudo-valeurs" sont codées dans le système Delta, on peut faire de même. Pour alléger la base de données (si l'on utilise une table de caractères séparée), on peut considérer que la première, voire les deux premières sont représentées par l'absence d'enregistrement du couplet taxon x caractère dans la table de relation. Les deux autres seront codées avec une valeur particulière.

Tue, 27 Feb 2001 06:07:25 +0100

Frédéric legens

Nous avons déjà abordé le sujet de DELTA sur la liste Flore-de-France. Ces outils n'ont pas suscité un enthousiasme délirant, c'est le moins que l'on puisse dire (comme le reste d'ailleurs) ! remarque :il me semble que tous les intervenants sont abonnés à tb-eFlore. Pour ma part je trouve ce système intéressant. Je ne vais pas résumer la discussion qu'on a eu mais seulement citer la conclusion donnée par daniel :

« Pour les clefs, il me semble difficile d'avoir une génération automatique pertinente. C'est "à la main" que s'élabore une bonne clé. »

Je pense que cette remarque est également valable pour la description des taxons.

Personnellement, il me semble très important que les clefs ainsi que les descriptions soient stockées en français (structurer en XML) dans la base, cela offre beaucoup plus de souplesse. Il me semble donc pas approprié de vouloir réaliser en php ce que font les différents outils du système DELTA. D'autant plus que je partage l'avis de Mr Ziegler sur le fait que les outils delta semblent plus adapté au travail sur un petit nombre de taxons que sur un grand nombre.

Cependant pour alimenter les clefs et les descriptions, il peut coexister différentes façon de faire :

l'écriture traditionnel à la main, via nos futurs éditeurs,
ou utiliser un programme DELTA de façon totalement indépendante, puis de recopier les résultats dans l'un des éditeurs que l'on aura réalisé pour obtenir un résultat respectant la structure XML que l'on aura défini.

On peut même envisager, s'il est possible de modifier le programme DELTA, que celui-ci demande directement via http au serveur eFlore, les identifiants uniques des taxons, et que celui-ci réalise directement l' export au format XML. Et si l'on veut avoir une intégration encore plus forte, que celui-ci demande également la liste des différentes catégories de caractères, ainsi que les caractères associés aux différents taxons. Pour ce dernier type d'échange il a eu une proposition de format XML DELTA que vous pouvez trouver à l'adresse suivante: http://www.bath.ac.uk/~ccslrd/delta/index.html. La formalisation des différentes catégories de caractères y semble très bien formalisé. Il me semble qu'il faudra s'en inspirer, et éventuellement adopter ce codage. (Mais il est également possible de renvoyer directement les informations dans le format DELTA).

1.8. Eflore et le Mac !

Wed, 28 Feb 2001 07:37:21 +0100

Frédéric legens

L'idée n'est bien entendu pas d'exclure les possesseurs de Mac, mais en effet cela pause un problème car un certain nombre d'outils informatiques que nous allons utiliser n'existent pas actuellement sur Mac OS.

Au niveau de la base de données et des outils permettant de générer des documents XML et de lire ces mêmes documents, nous avons opté pour les outils dont dispose Tela-botanica pour son site internet, ce qui semble logique. De plus ces outils ont l'avantage d'être couramment utilisés sur internet, et sont gratuits ou sont des sharewares (je pense notamment à mySQL sur windows), et sont librement distribuable (ce qui est très appréciable). A noter qu'il peuvent également fonctionner sur MAC à condition d'utiliser comme système d'exploitation LINUX (je sais cela n'est pas vraiment une solution), de plus il y a de grandes chances qu'ils soient adaptés à Mac OS X.

Dans le projet eFlore nous allons utiliser ces outils mais toute personne courageuse peut les remplacer par un autre outil, notamment pour la base de données qui peut être remplacer par oracle ou access par exemple. (PHP est capable de travailler directement avec ces bases de données). Il est également possible d'utiliser FileMaker pro qui peut remplacer à la fois mySQL et PHP, puisqu'il peut faire office de serveur internet. En effet le point majeur de ce projet est de définir des fichiers d'échanges de données en XML, ces fichiers étant des fichiers textes il est relativement facile de les analyser dans le but d'importer les informations dans sa propre base de données. Obtenir du serveur de telabotanica ces fichiers XML est facile puisque l'on passe par le protocole standard d'internet : http. Par exemple pour obtenir le squelette vierge d'une clef de détermination pour le genre Papaver dans mon prototype d'éditeur de clef, je demande url suivante http://flegens.free.fr/GetNewKey.php3?nom=Papaver (Il est possible de tester cela dans n'importe quel navigateur) .L'envoie de données se fait de façon analogue. De plus pour faciliter ces échanges d'informations la majorité des bases de données commerciales comportent dans leur nouvelles versions des outils facilitant l'analyse de fichiers XML (il me semble que c 'est notamment le cas FileMaker pro version 5).

Pour les applications clientes spécifiques à tela-botanica que l'on va être susceptible de développer, il existe plusieurs solutions : 1) développer une version spécifique au MAC, si l'on trouve quelqu'un qui peut le faire. 2) développer les applications en java ce qui permet à ces application de tourner à la fois sur mac, pc, linux . Mais il faut avoir un programmeur java. De plus java est lent sur des machines peu puissantes et est délicat à installer et l'installable est très gros (avec la jvm),donc difficilement chargeable d' internet. On risque donc d'exclure plus de personnes que le nombre de possesseurs de Mac ainsi dépannés. 3) Utiliser un logiciel de base de données façon FileMakerPro et intégrer les outils de manipulations à la base. Par exemple l'éditeur de clefs de benoît (qui en définitive est très proche de mon prototype), du moment qu' il comporte une fonction d'exportation en XML (qui n'est pas plus compliqué à développer que la fonction d'export en HTML).

Bref il y a plein de possibilités, j'espère donc que l'on pourra au moins en développer une pour les possesseurs de Mac.

Cordialement.

2. Phase 1B : Services

2.1. Liste

Mon, 5 Mar 2001 07:41:50 +0100

"Frederic legens"

Vous retrouverez ci-dessous une première descriptions des fonctionnalités en lecture que je souhaiterais avoir pour la partie1. N'hésitez surtout pas à ajouter les fonctionnalités qui vous semblent manquer.

1)récupérer le nom valide d'un taxon, et ses identifiants respectifs.

2)récupérer les synonymes d'un taxon et leurs identifiants respectifs.

3)récupérer l'enchaînement des noms valides des taxons hiérarchiquement supérieurs, ainsi que leurs identifiants respectifs.

4)récupérer l'ensemble des noms valides des taxons hiérarchiquement inférieurs (d'une façon directe), ainsi que leurs identifiants respectifs.

5)récupérer les noms communs en différentes langues d'un taxon.

6)récupérer les identifiants d'un taxon dans d'autres systèmes de codage que celui utilisé dans eFlore et inversement.

Toutes ces informations devront être accessibles soit en donnant un nom latin, soit en donnant l'identifiant d'un taxon.

"Frederic legens"

Sat, 2 Jun 2001 22:11:56 +0200

Bonjour,

Je viens de placer sur http://eflore.tela-botanica.org, deux nouveaux fichiers décrivant la base de données que j'ai installés sur le site grâce à Jean-Charles (avec les données que m'a envoyé Benoît). Nous allons donc pouvoir dès la semaine prochaine passer au vif du sujet : la structuration XML. Pour cela je pense que nous allons discuter du premier service XML que nous allons mettre en place.

Un service XML peut se définir de la façon suivante : c'est le fait de faire une demande d'information au serveur via http (comme vous le faites avec la barre d'adresse de votre navigateur internet) et de recevoir l' information demandée. L'information renvoyée par le serveur devra respecter un format XML que nous allons donc devoir définir.

Je vous propose de commencer par le service XML qui nous permettra de recevoir une classification taxonomique.

Cordialement.

3. Phase 1C : Structure

3.1. Proposition

Mon, 5 Mar 2001 07:41:50 +0100

"Frederic legens"

Voici une proposition informelle de structures pour l'ensemble des fiches nécessaires à la réalisation de la phase1. J'y reprend principalement les rubriques présentes à la page 8 du document de Benoît.

Fiche d'identité d'un taxon :

N° Taxonomique N° nomenclatural Rang taxonomique (Embranchement, classe . espèces .) Nom du Taxon (noté en toutes lettres donne le nom complet du taxon jusqu'à l'espèce.) Auteur du taxon Type de sous-espèce Sous-espèce Auteur de la sous-espèce Type de l'inra2 Infra2 Auteur de l'infra2 Type de l'infra3 Infra3 Auteur de l'infra3 Année Source bilbliob Source biblio à exclure Info sur la combinaison Type de synonymie Doute nom valide Hybride Auteur principal In Statut

Fiche des noms communs d'un taxon :

N° Taxonomique Code de la langue Nom commun Note

La rubrique code CIFF sera disponible par des fiches de transcodages.

La rubrique Nombres chromosomiques sera à intégrer à la notion de caractères.

Les rubriques suivantes n'ont pas été conservées mais seront d'une certaine façon disponible par la notion de classification :

Famille Genre Flores

La fiche de classification des taxons permettra de relier un taxon donné avec le taxon de niveau hiérarchiquement supérieur ( par exemple une espèce avec le genre, un genre avec la famille) . Cette fiche comportera les champs suivants :

N° taxonomique du taxon de rang supérieur. N° taxonomique du taxon de rang inférieur.

Dans la pratique on rajoutera un troisième champ, qui sera la concaténation de tous les N° taxonomique reliant le taxon de rang inférieur avec le taxon de plus haut rang. Ce champ n'apporte aucune information supplémentaire mais est utile pour optimiser certains traitements.

Cette structure permet de gérer une classification unique, cela suppose donc que l'on se mette d'accord sur la classification à utiliser, de plus celle-ci devra couvrir l'ensemble des taxons.

Une autre façon de voir les choses est de considérer que l'on peut avoir besoin de faire coexister plusieurs classifications. Par exemple la classifications d'Engler, de Cronquist, de Thorne ou de Dahlgren pour les angiospermes. Mais également la classification utilisé par Coste , Fournier ou Bonnier dans leurs flores respectives. Dans ce cas on aurait plutôt la structure suivante :

N° de classification N° taxonomique du taxon de rang supérieur N° nomenclatural du taxon de rang supérieur N° taxonomique du taxon de rang inférieur N° nomenclatural du taxon de rang inférieur

Ce cas me semble nettement plus intéressant, de plus on n'a pas besoin que chaque classification couvre l'ensemble des taxons (on peut donc avoir par exemple une classification qui se limite aux bryophytes. Il est également à noter que la notion de nom valide n'a plus la même utilité, puisque le nom est valide à l'intérieur d'une classification donnée. Il serait quand même possible de trouver le nom valide dans une classification moderne, du nom employé dans une classification ancienne.

Que pensez-vous sur cette notion de classifications multiples ? (sachant que l'on peut de toute façon débuter avec une seule classification).

Cordialement.

Sat, 10 Mar 2001 11:26:25 +0100

"Frederic legens"

Le but n'étant pas de phagocyter le projet isff, toutes les fiches d' identités correspondant à des taxons inférieurs ou égaux à l'espèce, seront créés par l'importation des données correspondantes présentes dans l'isff. Nous utiliserons donc les mêmes numéros nomenclaturaux et taxonomiques. (Ces opérations d'export import se feront de façon régulière (à définir) pour suivre les évolutions de l'isff).

Par contre pour les fiches concernant des taxons supérieurs à l'espèce, cela n'est pas actuellement possible puisque ces fiches n'existent pas dans l' isff.

Je ne me trompe pas Benoît ? Est-ce une prochaine étape de l'isff ?

Si c'est le cas nous procéderons de la même façon que pour les taxons égaux ou inférieurs à l'espèce.

Dans le cas contraire il va falloir prévoir une façon de faire, dans ce cas on définira deux plages de numéros nomenclaturaux et taxonomiques non utilisables par l'isff pour numéroter nos nouveaux taxons.

Note : Je vais faire un petit prototype pour illustrer mes différentes propositions, benoît tu m'avais proposer de me fournir l'ensemble des noms valides de l'isff, ne pourrais tu pas plutôt m'envoyer un export de tous les taxons (valides ou non valides ) appartenant aux deux familles suivantes Polyganacées et Oxalidacées. Cela permettrait d'avoir de meilleurs exemples. Pour le format je te propose d'exporter tous les champs (séparés par un point virgule ou un autre caractère non utilisé par ailleurs) dans un fichier texte, je ferai le tri dans l'export, c'est le plus simple.

Cordialement

"Benoit BOCK"

Friday, March 09, 2001 10:44 PM

Comment feras tu pour rechercher tous les noms d'un même genre sachant qu'il y a des homonymies de genre appartenant à des familles différentes?

Voir "petite" liste ci-dessous:

Famille Genre Auteur_du_Genre - Année = Genre "valide" correspondant
Polygonacées Acetosella (Meisner) Fourr. - 1869 = Rumex L. 1753
Oxalidacées Acetosella O. Kuntze - 1891 = Oxalis L. 1753
Posidoniacées Alga Boehmer in Ludwig - 1760 = Posidonia C. König 1805
Zosteracées Alga Hill in Scott - 1753 = Zostera L. 1753
Caryophyllacées Anthyllis Adanson - 1763 = Polycarpon Loefl. ex L. 1759
Fabacées Anthyllis L. - 1753
Zannichelliacées Aponogeton Hill - 1756 = Zannichellia L. 1753
Aponogetonacées Aponogeton L. fil. - 1782
Saxifragacées Astilbe D. Don - 1825
Rosacées Astilbe Trevisan - 1855 = Aruncus L. 1758
Amaryllidacées Belladonna (Endl.) Harvey - 1838 = Amaryllis L. 1753
Solanacées Belladonna Hill in Scott - 1753 = Atropa L. 1753
Amaranthacées Blitum Hill in Scott - 1753 = Amaranthus L. 1753
Chenopodiacées Blitum L. - 1753
Brassicacées Bohadschia Crantz - 1762 = Peltaria Jacq. 1762
Astéracées Bohadschia F.W. Schmidt - 1795 = Leontodon L. 1753
Lamiacées Botrys Fourr. - 1869 = Teucrium L. 1753
Chenopodiacées Botrys Nieuwland - 1914 = Chenopodium L. 1753
Iridacées Bulbocodium Gronovius - 1755 = Romulea Maratti 1772
Colchicacées Bulbocodium L. - 1753
Solanacées Busbequia C.F.P. Martius - 1829 = Salpichroa Miers in Hooker 1845
Hyacinthacées Busbequia Salisb. - 1866 = Bellevalia Lapeyr. 1808
Posidoniacées Caulinia DC. in Lam. & DC. - 1805 = Posidonia C. König 1805
Hydrocharitacées Caulinia Willd. - 1798 = Najas L. 1753
Ebenacées Cavanillea Desr in Lam. - 1789 = Diospyros L. 1753
Malvacées Cavanillea Medik. - 1787 = Anoda Cav. 1785
Cupressacées Cedrus Hill in Scott - 1753 = Juniperus L. 1753
Pinacées Cedrus Trew - 1757
Colchicacées Celsia Boehmer in Ludwig - 1759 = Bulbocodium L. 1753
Hyacinthacées Celsia Heister ex Fabricius - 1759 = Ornithogalum L. 1753
Scrophulariacées Celsia L. - 1753 = Verbascum L. 1753
Caryophyllacées Centunculus Adanson - 1763 = Cerastium L. 1753
Primulacées Centunculus L. - 1753
Astéracées Ceratocephalus Cass. in Cuvier - 1817 = Bidens L. 1753
Renonculacées Ceratocephalus Pers. - 1805
Astéracées Caltha Hill in Scott - 1753 = Calendula L. 1753
Renonculacées Caltha L. - 1753
Hemerocallidacées Cameraria Boehmer in Ludwig - 1759 = Hemerocallis L. 1753
Portulacacées Cameraria Fabricius - 1759 = Montia L. 1753
Lythracées Chabraea Adanson - 1763 = Lythrum L. 1753
Apiacées Chabraea Rafin. - 1840 = Holandrea Reduron, Charpin & Pimenov 1997
Plantaginacées Coronopus Hill in Scott - 1753 = Plantago L. 1753
Brassicacées Coronopus Zinn - 1757
Molluginacées Corrigiola L. - 1753
Illecebracées Corrigiola O. Kuntze - 1891 = Illecebrum L. 1753
Poacées Costia Willk. - 1858 = Agropyron Gaertner 1770
Iridacées Costia Willk. - 1860
Gentianacées Cruciata Gilib. - 1782 = Gentiana L. 1753
Rubiacées Cruciata Hill in Scott - 1753
Theligonacées Cynocrambe Gagnebin - 1755 = Theligonum L. 1753
Euphorbiacées Cynocrambe Hill - 1756 = Mercurialis L. 1753
Apiacées Danaa All. - 1785 = Selinum L. 1762
Astéracées Danaa Colla - 1835 = Senecio L. 1753
Apiacées Diapensia Hill - 1756 = Sanicula L. 1753
Diapensiacées Diapensia L. - 1753
Astéracées Dracunculus Ledeb. - 1846 = Artemisia L. 1753
Scrophulariacées Elatine Hill - 1756 = Kickxia Dumort. 1829
Elatinacées Elatine L. - 1753
Commelinacées Ephemerum Hill in Scott - 1753 = Tradescantia L. 1753
Primulacées Ephemerum Reichenb. - 1831 = Lysimachia L. 1753
Rosacées Eupatorium Bubani - 1899 = Agrimonia L. 1753
Astéracées Eupatorium L. - 1753
Rosacées Geum L. - 1753
Saxifragacées Geum Miller - 1754 = Saxifraga L. 1753
Primulacées Glaux L. - 1753
Hyacinthacées Helonias Adanson - 1763 = Scilla L. 1753
Melanthiacées Helonias L. - 1753
Cyperacées Heuffelia Opiz - 1845 = Carex L. 1753
Poacées Heuffelia Schur - 1866 = Helictotrichon Besser in Roemer & Schultes 1827
Liliacées Hornungia Bernh. - 1840 = Gagea Salisb. 1806
Brassicacées Hornungia Reichenb. - 1837
Fagacées Ilex Hill in Scott - 1753 = Quercus L. 1753
Aquifoliacées Ilex L. - 1753
Illecebracées Illecebrum L. - 1753
Amaranthacées Illecebrum Sprengel - 1817 = Alternanthera Forsskål 1775
Astéracées Jacea Hill in Scott - 1753 = Centaurea L. 1753
Violacées Jacea Opiz in Berchtold & Opiz - 1839 = Viola L. 1753
Brassicacées Kernera Medik. - 1792
Scrophulariacées Kernera Schrank - 1786 = Tozzia L. 1753
Posidoniacées Kernera Willd. - 1806 = Posidonia C. König 1805
Lamiacées Ladanum O. Kuntze - 1891 = Galeopsis L. 1753
Cistacées Ladanum Rafin. - 1838 = Cistus L. 1753
Plantaginacées Lagopus (Gren. & Godron) Fourr. - 1869 = Plantago L. 1753
Fabacées Lagopus Bernh. - 1800 = Trifolium L. 1753
Brassicacées Lepia Desv. - 1815 = Lepidium L. 1753
Astéracées Lepia Hill - 1759 = Zinnia L. 1759
Astéracées Lepiactis Rafin. Rafin. - 1837 = Solidago L. 1753
Lentibulariacées Lepiactis Rafin. - 1838 = Utricularia L. 1753
Cistacées Libanotis Rafin. - 1838
Astéracées Ligularia Cass. - 1816
Saxifragacées Ligularia H.A. Duval - 1869 = Saxifraga L. 1753
Anthericacées Liliago C. Presl - 1845 = Anthericum L. 1753
Amaryllidacées Liliago Heister - 1755 = Amaryllis L. 1753
Astéracées Linosyris Cass. in Cuvier - 1825 = Aster L. 1753
Santalacées Linosyris Ludwig - 1757 = Thesium L. 1753
Fabacées Listera Adanson - 1763 = Genista L. 1753
Orchidacées Listera R. Br. in Aiton fil. - 1813
Orchidacées Lonchitis Bubani - 1902 = Serapias L. 1753
Blechnacées Lonchitis aspera Hill ex Farwell - 1931 = Blechnum L. 1753
Melanthiacées Melanthium L. - 1753
Renonculacées Melanthium Medik. - 1789 = Nigella L. 1753
Astéracées Meridiana Hill - 1768 = Gazania Gaertner 1791
Portulacacées Meridiana L. fil. - 1781 = Portulaca L. 1753
Caryophyllacées Moenchia Ehrh. - 1788
Brassicacées Moenchia Roth - 1788 = Camelina Crantz 1762
Poacées Moenchia Wenderoth ex Steudel - 1841 = Paspalum L. 1759
Gesneriacées Myconia Lapeyr. - 1813 = Ramonda Lam. 1793
Astéracées Myconia Schultz Bip. In Webb & Berth - 1844 = Coleostephus Cass. in Cuvier 1826
Caryophyllacées Myosotis Hill in Scott - 1753 = Cerastium L. 1753
Boraginacées Myosotis L. - 1753
Tamaricacées Myrica Bubani - 1899 = Myricaria Desv. 1824
Myricacées Myrica L. - 1753
Scrophulariacées Odontites Ludwig - 1757
Apiacées Odontites Sprengel - 1813 = Bupleurum L. 1753
Grossulariacées Oxyacantha Chevallier - 1827 = Ribes L. 1753
Rosacées Oxyacantha Medik. - 1789 = Crataegus L. 1753
Illecebracées Paronychia Hill in Scott - 1753
Brassicacées Paronychia Hill - 1756 = Erophila DC. 1821
Solanacées Pentagonia Heister ex Fabricius - 1763
Campanulacées Pentagonia Vest ex Steudel - 1841 = Legousia Durande 1782
Poacées Phoenix Haller - 1768 = Chrysopogon Trin. 1820
Arecacées Phoenix L. - 1753
Pteridacées Phyllitis Rafin. - 1819 = Pteris L. 1753
Fabacées Phyllodoce Link - 1831 = Acacia Hill in Scott 1753
Ericacées Phyllodoce Salisb. - 1806
Astéracées Pilosella Hill - 1756
Brassicacées Pilosella Kostel. - 1844 = Arabidopsis Heynh. in Holl & Heynh. 1842
Rosacées Pimpinella Hill in Scott - 1753 = Sanguisorba L. 1753
Apiacées Pimpinella L. - 1753
Aristolochiacées Pistolochia (Rafin.) Rafin. - 1838 = Aristolochia L. 1753
Papaveracées Pistolochia Bernh. - 1800 = Corydalis DC. in Lam. & DC. 1805
Plantaginacées Plantaginella Fourr. - 1869 = Plantago L. 1753
Scrophulariacées Plantaginella Hill - 1758 = Limosella L. 1753
Amaryllidacées Polyanthemum Bubani - 1902 = Leucojum L. 1753
Plumbaginacées Polyanthemum Medik. - 1791 = Armeria Willd. 1809
Woodsiacées Pterilis Rafin. - 1814 = Matteuccia Todaro 1866
Pteridacées Pterilis Rafin. - 1830 = Pteris L. 1753
Pteridacées Pteris L. - 1753
Dryopteridacées Pteris Scop. - 1760 = Dryopteris Adanson 1763
Hymenophyllacées Pyxidaria Gleditsch - 1764 = Trichomanes L. 1753
Scrophulariacées Pyxidaria O. Kuntze - 1891 = Lindernia All. 1766
Astéracées Robertia A. Richard ex DC. in Lam. & DC. - 1815 = Hypochaeris L. 1753
Renonculacées Robertia Mérat - 1812 = Eranthis Salisb. 1807
Papaveracées Roemeria Medik. - 1792
Amaranthacées Roemeria Moench - 1794 = Amaranthus L. 1753
Poacées Rothia Borckh. - 1792 = Mibora Adanson 1763
Astéracées Rothia Schreber - 1791 = Andryala L. 1753
Astéracées Schmidtia Moench - 1802 = Tolpis Adanson 1763
Ericacées Schollera Roth - 1788 = Vaccinium L. 1753
Pontederiacées Schollera Schreber - 1791 = Heteranthera Ruiz & Pavon 1798
Boraginacées Scorpiurus Haller - 1768 = Myosotis L. 1753
Fabacées Scorpiurus L. - 1753
Chenopodiacées Selago Adanson - 1763 = Polycnemum L. 1753
Capparacées Sinapistrum Hill in Scott - 1753 = Cleome L. 1753
Hyacinthacées Stellaster Heister ex Fabricius - 1763 = Scilla L. 1753
Liliacées Stellaster Heister ex O. Kuntze - 1891 = Gagea Salisb. 1806
Astéracées Stoechas Gueldenstaedt - 1787 = Helichrysum Hill in Scott 1753
Lamiacées Stoechas Hill in Scott - 1753 = Lavandula L. 1753
Blechnacées Struthiopteris Scop. - 1754 = Blechnum L. 1753
Woodsiacées Struthiopteris Willd. - 1809 = Matteuccia Todaro 1866
Poacées Sturmia Hoppe in Sturm - 1799 = Mibora Adanson 1763
Orchidacées Sturmia Reichenb. - 1826 = Liparis L.C.M. Richard 1817
Plantaginacées Subularia Boehmer in Ludwig - 1760 = Littorella Bergius 1768
Brassicacées Subularia L. - 1753
Gentianacées Swertia L. - 1753
Astéracées Swertia Ludwig - 1760 = Tolpis Adanson 1763
Hydrangeacées Syringa Hill in Scott - 1753 = Philadelphus L. 1753
Oleacées Syringa L. - 1753
Astéracées Tetralix Hill - 1757 = Cirsium Hill in Scott 1753
Ericacées Tetralix Zinn - 1757 = Erica L. 1753
Pteridacées Thelypteris Adanson - 1763 = Pteris L. 1753
Woodsiacées Thelypteris Schmidel - 1763
Apiacées Thorea Briq. - 1902 = Caropsis (Rouy & E.G. Camus) Rauschert 1982
Poacées Thorea Rouy - 1913 = Pseudarrhenatherum Rouy 1922
Aspleniacées Trichomanes Hill in Scott - 1753 = Asplenium L. 1753
Hymenophyllacées Trichomanes L. - 1753
Juncaginacées Tristemon Rafin. - 1819 = Triglochin L. 1753
Juncacées Tristemon Rafin. - 1838 = Juncus L. 1753
Scrophulariacées Trixago Steven - 1823
Poacées Verinea Merino - 1899 = Melica L. 1753
Asphodelacées Verinea Pomel - 1860 = Asphodelus L. 1753
Chenopodiacées Willemetia Maerklin - 1801 = Bassia All. 1766
Astéracées Willemetia Necker - 1777/1778

Sat, 10 Mar 2001 11:26:50 +0100

Frederic legens

Merci benoît, pour ta lecture détaillée de mes propositions.

Je n'avais pas pensé au cas des homonymies de genres, mais cela ne semble pas être un problème. Par exemple dans la table des synonymes, on aura les lignes suivantes:

N° taxonomique - N° nomenclaturale - Nom -Année -validité 1000 - 6845 - Polygonacées -valide 1052 - 3278 - Oxalidacées - valide 2301 - 345 - Acetosella (Meisner) Fourr. - 1869 -non valide 2304 - 998 - Acetosella O. Kuntze - 1891 - non valide 2301 - 300 - Rumex L. 1753 - valide 2304 - 350 - Oxalis L. 1753 -valide Si l'on fait une recherche de synonymes avec le N° taxonomique, ou le numéro nomenclaurale, il n'y a aucun problème. Par contre si l'on fait une recherche avec le nom, deux cas se présenterons: 1) Le nom n'existe qu'une fois dans la table (ex : Rumex ou Oxalis) : dans ce cas la réponse ne contiendra que les synonymes ayant respectivement les N° taxonomiques 2301 et 2304. 2) Le nom existe plusieurs fois dans la table (ex : Acetosella) : dans ce cas la réponse contiendra tous les synonymes existants , mais groupés par N° taxonomiques (structuration avec XML). Bien entendu cela dépend du type de fiches que l'on souhaite avoir pour réponse , c'est possible pour une fiche de synonymes, mais difficilement envisageable pour les clefs ou les fiches de descriptions : nous définirons donc un comportement pour ce cas pour tous les types de fiches.

En continuant sur cet exemple et en s'intéressant à la notion de classification.

Dans le cas ou l'on adopterait une classification unique :

On aurait les liens suivants dans la table classification:

N° taxonomique du taxon de rang supérieur - N° taxonomique du taxon de rang inférieur. 1052 - 2304 1000 - 2301

Certes pour ces numéros taxonomiques, on peut éventuellement avoir des synonymes ayant des rangs différents, mais le vrai rang du taxon , si j'ai bien compris ton système dans l'isff est le rang du nom valide, donc il n'y a pas de problèmes puisque on aura toujours un nom valide par n° taxonomique.

Dans le cas ou l'on adopterai le système de classification multiple :

On aurait une classification moderne (classification n°1) composée par les lignes suivantes: N° de classification -N° taxonomique du taxon de rang supérieur - N° nomenclatural du taxon de rang supérieur - N° taxonomique du taxon de rang inférieur. - N° nomenclatural du taxon de rang inférieur 1-1052 -3278- 2304 -350 1-1000 -6845- 2301 -300

On pourrait également avoir en plus une classification n°2 où le genre Acetosella serait associé aux Polygonacées :

2-1052 -3278- 2304 -350 2-1000 -6845- 2301 -345

Et inversement une classification n°3 où le genre Acetosella serait associé aux Oxalidacées :

3-1052 -3278- 2304 -998 3-1000 -6845- 2301 -300

Evidemment cette notion de classification multiple devra être utilisée de façon modérée, le but n'étant pas d'embrouiller les choses, mais de pouvoir faire éventuellement coexister plusieurs systèmes soit dans le but de faire des évolutions, soit dans un souci de faire apparaître des classifications ayant une importance historique ou pratique (classification utilisée par Bonnier, Coste, Fournier ...).

Personnellement je pense que cette notion de classification multiple est la meilleur, même si dans un premier temps nous en réaliserons qu'une.

"Roger Cruon"

Saturday, March 10, 2001 9:29 AM

La discussion actuelle (sur [tb-eflore]) met en lumière la principale difficulté d'un index synonymique, qui est que les règles de la nomenclature ne s'appliquent qu'après que toutes les décisions taxonomiques aient été prises; le nom valide d'un taxon dépend des conceptions systématiques relatives à son rang taxonomique et plus généralement à sa place dans la classification.

Mais, pour y voir clair, il faut distinguer d'une part le niveau du genre et de ses subdivisions, d'autre part les niveaux supra-génériques.

Je commence par ces derniers. Prenons l'exemple du genre Smilax, classé par Fournier dans les Liliacées. Les classifications récentes (disons depuis 30 ans) éclatent les Liliacées s.l. en plusieurs familles; Kerguélen a suivi cette tendance et placé Smilax dans les Smilacacées. Ceci ne change rien au nom du genre et des espèces qui en font partie, par exemple Smilax aspera. Ce que propose Frédéric, c'est de supprimer l'indication de la famille dans l'index proprement dit, et de faire un fichier séparé pour traduire la classification, ici Smilax -> Smilacaceae. L'avantage est qu'on peut ne pas se limiter à une seule conception systématique, et indiquer aussi Smilax -> Liliaceae, à condition de préciser de quelle classification il s'agit (par exemple Engler-Melchior).

Même à ce niveau, les choses ne sont pas toujours si simples. Par exemple, l'article 18.5 du Code de nomenclature valide les noms traditionnels (non formés à partir d'un nom de genre) de 8 familles, parmi lesquelles figure Leguminosae. Mais il indique aussi entre parenthèses un autre nom (ici Fabaceae) dont l'usage est également autorisé, ce qui est une entorse à la règle selon laquelle, à conception systématique donnée, un taxon ne peut avoir qu'un seul nom valide. En outre, l'article 19.7 indique que, si les Papilionaceae sont incluses dans la famille Leguminosae ou Fabaceae en tant que sous-famille (ce qui est une décision taxonomique, sur laquelle le Code ne peut pas prendre parti), le nom Papilionoideae peut être utilisé comme alternative à Faboideae.

Au niveau du genre et en dessous, la situation est différente puisque les décisions taxonomiques influent sur le nom. Par exemple, l'ISFF utilisait Chamaecytisus hirsutus, alors que les travaux récents ne reconnaissent pas ce genre, inclus maintenant dans Cytisus (voir messages sur [isff] 18-23/11/2000). Ceci est une décision taxonomique, mais elle a une conséquence directe sur le nom. La synonymie qui figure dans l'index suffit à savoir que, pour quelqu'un qui considère comme justifiée la séparation du genre Chamaecytisus, le nom Chamaecytisus hirsutus est correct, alors que dans le cas contraire c'est Cytisus hirsutus qui est correct.

En conclusion, je pense que l'idée de Frédéric d'un fichier de classification est à retenir seulement pour les niveaux supérieurs au genre.

"Frederic legens"

Thu, 19 Apr 2001 07:50:05 +0200

Bonjour Benoît,

Peux-tu me confirmer les choses suivantes concernant les fichiers que tu m'as envoyés?

Lorsqu'il existe un doute sur la validité du nom (champ doute nom valide renseigné), le champ N° taxonomique est-il toujours vide ?

Lorsqu'un enregistrement comporte des renseignements au niveau de l'infra 2 ou l'infra 3, j'ai constaté que les données de la sous-espèce ne sont pas toujours renseignées! Est-ce normal ? J'ai l'impression que cela signifie simplement qu'il n'y a pas de sous-espèce autre que la sous-espèce type (qui n'est donc pas exprimée). C'est bien cela.

Cordialement.

Benoit BOCK

Thu, 19 Apr 2001 10:00:01 +0200

> Lorsqu'il existe un doute sur la validité du nom (champ doute nom valide
> renseigné), le champ  N° taxonomique est-il toujours vide ? NON.

exemple: Acer fauriei H.Lév. & Vaniot [1906, Bull. Soc. Bot. Fr., 53 : 590] (t) = Acer negundo L. subsp. negundo ? (Aceraceae) {162}

Acer faurei possède le même numéro taxonomique que Acer negundo subsp. negundo. Le champ doute nom valide comprend la valeur "1" qui est retranscrite en "?".

Par contre lorsqu'un nom est "sans correspondance" noté "= ?" par Kerguelen. Le numéro "doute nom valide" est "2" retranscrite en "sans correspondance"

Peut-être veux tu la liste complète des valeurs de la rubrique "doute nom valide" et leur signification?

> Lorsqu'un enregistrement comporte des renseignements au niveau de l'infra 2
> ou l'infra 3, j'ai constaté que les données de la sous-espèce ne sont pas
> toujours renseignées! Est-ce normal ? J'ai l'impression que cela signifie
> simplement qu'il n'y a pas de sous-espèce autre que la sous-espèce type (qui
> n'est donc pas exprimée). C'est bien cela.

Effectivement, c'est un problème qui m'a beaucoup préoccupé. Logiquement, lorsque l'on trouve "Genre a var. b" on devrait écrire en fait : "Genre a subsp. a var. b". Cependant, lorsqu'il n'y a aucune sous-espèce mais simplement 2 ou 3 variétés, il est plus commode de ne pas rallonger la mention du nom.

Mais dans beaucoup de cas Kerguelen a répertorié un grand nombre de variétés sans mention de la sous-espèce. J'ai homogénéisé ces citations pour les noms retenus mais pas pour les innombrables variétés synonymes. Ce qui donne par exemple:

>Brassica napus L. [1753, Sp. Pl. : 666] (Brassicaceae) {10308}

Brassica napus L. var. esculenta DC. [1821, Syst. Nat., 2 : 592] (t) = Brassica napus L. subsp. rapifera Metzg. (Brassicaceae) {10313}

Brassica napus L. var. napobrassica (L.) Rchb. [18371838, Icon. Fl. Germ., 2

21] (t) = Brassica napus L. subsp. rapifera Metzg. (Brassicaceae) {10314}

Brassica napus L. subsp. napobrassica (L.) O.Schwarz [1949, Mitt. Thüring. Bot. Ges., N. F., 1 (1) : 102] (t) = Brassica napus L. subsp. rapifera Metzg. (Brassicaceae) {10309}

>Brassica napus L. subsp. napus [, ] (Brassicaceae) {10310}
>Brassica napus L. subsp. oleifera (DC.) Metzg. [1833, Syst. Beschr. Kult.
>Kohlarten : 46] (t) = Brassica napus L. subsp. napus (Brassicaceae) {10311}
>Brassica napus L. subsp. rapifera Metzg. [1833, Syst. Beschr. Kult.
> Kohlarten : 46] (Brassicaceae) {10312}

"Frederic legens"

Fri, 20 Apr 2001 09:52:26 +0200

C'est en effet un problème. Je ne pense pas que dans la notion de classification liant un taxon de niveau hiérarchiquement supérieur avec des taxons de niveaux inférieurs il soit souhaitable d'avoir des taxons de niveaux différents. De plus si on lie a une espèce une sous-espèce, de facto les variétés devraient en toute logique changées également de taxon supérieur (pour être associées à la nouvelle sous-espèce ou à la sous-espèce type), ce qui est un gros inconvénient. Je pense donc que dans un premier temps pour le projet eFlore, il serait souhaitable de se limiter aux sous-espèces, pour les taxons de niveaux inférieurs. Qu'en pensez-vous ?

"Benoit BOCK"

Wednesday, June 27, 2001 7:08 PM

Est-ce qu'il faut intÈgrer la bibliographie dans la balise <NOMTAXON> comme semble l'indiquer tous les mails de benoÓt faisant rÈfÈrence ý la bdnff.

oui. L'idéal serait: année / source biblio / tome et pages dans ma base j'ai seulement découpé le champ en 2: année / source, tome et page Les sources biblio ne sont pas homogénéisées mais elles sont indispensables pour les chercheurs. C'est probablement le point le plus important de l'index de Kerguelen (au départ de celui là). Il faut absolument le conserver mais peut être définir deux options d'affichage comme je l'ai fait. Une pour les amateurs (botanistes de terrain) masquant l'information et une pour les "professionnels", ceux qui s'intéressent à la nomenclature et qui ont besoin de connaître les références précises concernant les noms.

4. Phase 1B - Services - Approfondissement

4.1. Maquette

"Frederic legens"

Mon, 25 Jun 2001 22:36:34 +0200

Bonjour,

Voici enfin les deux premiers services xml que nous allons mettre en place concernant le dictionnaire taxonomique d'eFlore.

Comme ce sont les deux premiers services j'ai developpe une maquette pour que tous le monde puisse voir a quoi cela peut ressembler. Par la suite il me semble preferable de commencer par definir le format XML, cela sera plus economique en temps et permettra de distribuer la partie programmation.

Pour chaque service XML on pourra se poser les questions suivantes : est-ce que toutes les informations necessaires a l'usage que l'on souhaite en faire sont bien presentes ? est-ce qu'il n'y a pas des informations inutiles (disponibles par d'autres services) ? est-ce que la syntaxe et la semantique XML est correcte, comprehensible= , et facile d'usage ? est-ce que tous les parametres des services ont bien etes definis ?

Il faudra egalement verifier que la syntaxe XML entre les differents services est bien homogene.

J'ai redige deux documentations pour les deux services XML. Vous pouvez les trouver sur eflore.tela-botanica.org.

Je me pose deja les questions generales suivantes : Quel langue choisir pour le nom des services, des balises et des attributs ? Est-ce que ce type de documentation vous semble clair.

Au niveau du format XML, je me pose la question suivante :

Est-ce qu'il faut integrer la bibliographie dans la balise <NOMTAXON> comme semble l'indiquer tous les mails de benoit faisant reference a la base dnff.

Cordialement.

4.2. Objectifs

"Frederic legens"

Tue, 4 Sep 2001 23:05:44 +0200

Bonjour,

C'est la rentrée, je vous propose donc de reprendre nos activités.

Nous avons à terminer les services XML du dictionnaire taxonomique, et comme convenu mettre en place un développement collaboratif via CVS.

Pour la suite du dictionnaire taxonomique, il me semble qu'il manque les services XML de consultations suivants:

1) Un service permettant de recevoir une liste alphabétique de noms de taxons.

2) Un service permettant de recevoir la liste de synonymes et de noms communs d'un taxon dans une classification donnée.

J'ai déjà réalisé quelque chose pour le premier que je vous soumettrai prochainement.

Quelqu'un veut-il se charger de proposer un format pour le second, en s'inspirant de ce qui a déjà été fait pour les premiers services? (On en fera l'implémentation une fois CVS mis en place).

Ensuite nous aborderons les services XML du dictionnaire taxonomique en écriture.

Cordialement.

"Frederic legens"

Mon, 17 Sep 2001 07:43:55 +0200

Bonjour

J'ai placé sur le serveur le nouveau service XML donnelistetaxon. Vous avez comme d'habitude la documentation, et la possibilité de le tester.

De plus j'ai comme convenu ajouté les balises BIBLIOGRAPHIE et BIBLIO_A_EXCLURE pour toutes les balises NOM_TAXON des différents services, ainsi qu'un attribut « version » à chaque fiche.

Cordialement.

4.3. Commentaires

jean-christophe bottraud

Mon, 08 Oct 2001 07:56:28 -0000

1.Remarques générales

Ce serait bien d'avoir une section "Objectifs du service" (ou données restituées : description des classifications disponibles, extraits d'une classification, données bibliographiques ...). Cela permettrait de mieux voir les objectifs de la formalisation des documents XML et des DTDs présentés.

Les attributs 'numclass' et 'numtaxo', si j'ai bien compris, jouent le rôle d'identifant pour les éléments correspondants. Dans ce cas ne devraient-ils pas être de type ID plutôt que CDATA ? Ils pourraient ainsi être référencés par d'autres objets par l'intermédiaire d'un attribut de type IDREF, avec une garantie de cohérence ou, ce qui est plus intéressant, être retrouvés à l'aide de services standard lors de l'utilisation d'une feuille de style XSLT.

Remarques :

un document doit contenir la déclaration de tous les ID qu'ils référencent (si le parseur XML utilisé est validant, ce qui est une option).
un ID est nécessairement alphanumérique, ce qui est facilement contournable en mettant un préfixe (par exemple cumclass='2' deviendrait numclass='C2').

D'autre part, l'attribution d'un identifiant numérique de cette façon est arbitraire. Deux bases n'auront vraisemblablement pas le même numéro pour le même taxon, ce qui peut rendre difficile les comparaisons. Il me semble qu'il serait préférable de carrément utilisé le nom scientifique du taxon (latin en général, donc que des caractères ASCII et pas de problème en XML) comme base de l'identifiant. Si le nom scientifique (normalisé je suppose) n'est pas utilisé directement, un algorithme permettant de passer de ce nom à l'identifiant devrait être publié. Mais je ne suis pas sûr que ce soit la meilleure solution.

Enfin la signification des attributs numnom et rangtaxo n'est pas claire.

2.donneclassification.php

remarque : il y a une erreur (typo) dans le DTD - #REDUIRED doit être remplacé par #REQUIRED dans la ligne <!ATTLIST CLASSIFICATION numclass CDATA #REDUIRED >

Je ne suis pas sûr de comprendre l'objectif de la DTD. Est-ce de définir des classifications indépendantes, avec les données suivante :

FICHE_CLASSIFICATIONS correspond à la définition d'un ensemble de classification (mais à quoi sert l'attribut numclass ?).

CLASSIFICATION définit une classification avec

DESCRIPTION, une description brève (ce serait bien d'avoir une URL pointant sur la référence d'une description complète, éventuellement correspondant à un organisme de référence - comme cela se pratique pour XML par exemple).
PREMIER_TAXON, la référence du taxon à la racine de la classification.

Si c'est le cas, je pense que l'exemple est peut-être mal choisi. Il est certainement posible de trouver un Taxon englobant Polygonacées et Oxalydacées, et les deux classifications sont en fait des parties de la classification ayant ce taxon ancêtre commun comme PREMIER_TAXON.

3.donneclassificationtaxons.php

Je crois que le nom LISTE_CLASSIFICATION_FILLES est mal choisi parce qu'il donne à penser que les éléments contenus sont des CLASSIFICATION, alors qu'il s'agit en fait de CLASSIFICATION_TAXON. Une meilleure appelaation, plus facile à réutiliser,serait peut-être LISTE_TAXONS.

D'autre part, je pense qu'il est possible de simplifier les deux DTDs correspondants aux services donneclassification.php et donneclassificationtaxons.php et de les fusionner, à partir des remarques suivantes:

il n'y a pas vraiment de différences entre PREMIER_TAXON et CLASSIFICATION_TAXON. On purrait juste définir un élément TAXON
LISTE_CLASSIFICATIONS_FILLES est facultatif.

On pourrait donc utiliser les DTD suivantes (avec le remplacement de nom proposé ci-dessus) :

Fichier common.dtd : <?xml version="1.0" encoding="UTF-8"?>

<!ELEMENT CLASSIFICATION (DESCRIPTION, TAXON)> <!ATTLIST CLASSIFICATION numclass CDATA #REDUIRED >

<!ELEMENT DESCRIPTION (#PCDATA)>

<!ELEMENT TAXON (NOM_TAXON, LISTE_TAXONS?)> <!ATTLIST TAXON numtaxo CDATA #REQUIRED >

<!ELEMENT NOM_TAXON (NOM+)> <!ATTLIST NOM_TAXON numnom CDATA #REQUIRED rangtaxo CDATA #REQUIRED >

<!ELEMENT NOM (#PCDATA)> <!ATTLIST NOM auteur CDATA #IMPLIED >

<!ELEMENT LISTE_TAXONS (TAXON+)>

Puis la DTD suivnte pour donneclassification.php :

<?xml version="1.0" encoding="UTF-8"?> <!ENTITY % COMMON SYSTEM "common.dtd"> %COMMON;

<!ELEMENT FICHE_CLASSIFICATIONS (CLASSIFICATION+)> <!ATTLIST FICHE_CLASSIFICATIONS numclass CDATA #IMPLIED>

Et enfin la DTD suivante pour donneclassificationtaxons.php :

<?xml version="1.0" encoding="UTF-8"?> <!ENTITY % COMMON SYSTEM "common.dtd"> %COMMON;

<!ELEMENT FICHE_CLASSIFICATION_TAXONS (CLASSIFICATION, TAXON)> <!ATTLIST FICHE_CLASSIFICATION_TAXONS numclass CDATA #REQUIRED numtaxo CDATA #IMPLIED profondeur CDATA #IMPLIED rangtaxo CDATA #IMPLIED >

Ces deux DTDs sont compatibles avec les exemples de donneclassification.php et de donneclassficationtaxons.php:

<?xml version="1.0" encoding="ISO-8859-1" standalone="no"?> <FICHE_CLASSIFICATIONS> <CLASSIFICATION numclass="1"> <DESCRIPTION>Classification des Polygonacées basée sur la bdnff. </DESCRIPTION> <TAXON> <NOM_TAXON numnom="200000" rangtaxo="40"> <NOM>Polygonaceae</NOM> </NOM_TAXON> </TAXON> </CLASSIFICATION> <CLASSIFICATION numclass="2"> <DESCRIPTION>Classification des Oxalydacées basée sur la bdnff. </DESCRIPTION> <TAXON> <NOM_TAXON numnom="200001" rangtaxo="40"> <NOM>Oxalidaceae</NOM> </NOM_TAXON> </TAXON> </CLASSIFICATION> </FICHE_CLASSIFICATIONS>

Autre exemple : <?xml version="1.0" encoding="ISO-8859-1" standalone="no"?> <FICHE_CLASSIFICATION_TAXONS numclass="2" numtaxo="100025" rangtaxo="110"> <CLASSIFICATION numclass="2"> <DESCRIPTION>2è me classification</DESCRIPTION> <TAXON numtaxo="200001"> <NOM_TAXON numnom="200001" rangtaxo="40"> <NOM>Oxalidaceae</NOM> </NOM_TAXON> </TAXON> </CLASSIFICATION> <TAXON numtaxo="100025" > <NOM_TAXON numnom="100025" rangtaxo="60"> <NOM >Oxalis</NOM></NOM_TAXON> <LISTE_TAXONS> <TAXON numtaxo="4007" > <NOM_TAXON numnom="47095" rangtaxo="100"> <NOM auteur="L.">Oxalis acetosella</NOM> </NOM_TAXON> </TAXON> <TAXON numtaxo="4008" > <NOM_TAXON numnom="47102" rangtaxo="100"> <NOM auteur="Savigny">Oxalis articulata</NOM> </NOM_TAXON> </TAXON> <TAXON numtaxo="13136" > <NOM_TAXON numnom="47110" rangtaxo="100"> <NOM auteur="Lindl.">Oxalis bowiei</NOM> </NOM_TAXON> </TAXON> </LISTE_TAXONS> </CLASSIFICATION_TAXON> </FICHE_CLASSIFICATION_TAXONS>

4.donnelistetaxons.php Ma première remarque concerne les paramètres de la procédure

l'utilisation de valeurs minimales et maximales pour définir des intervalles sur les noms semblent indiquer l'existence d'une relation d'ordre, ce qui n'est généralement pas le cas dans les chaînes alphabétiques correspondants aux noms. Il serait peut-être plus justifié d'utiliser des préfixes ou des radicaux (ce qui est le cas de l'exemple : nommin=Oxalis et nommax=Oxalis => cela revient à sélectionner tous les noms commençant par Oxalis). On diviserait par deux le nombre de paramètres et le critère de sélection serait peut-être plus clair.

Ma deuxième remarque concerne la liste d'attributs de NOM_TAXON : BIBLIOGRAPHIE et BIBLIO_A_EXCLURE sont des éléments facultatifs. Comme dans la discussion du paragrpahe 3, on pourrait les mettre dans une DTD commune, ce qui peremttrait de réutiliser pour LISTE_TAXONS la définition donnée ci-dessus, sans modification. Il n'y aurait alors qu'un seul élément nouveau de défini pour cette procédure.

Voilà.

Si vous avez des questions ou des commentaires sur ces quelques remarques, n'hésitez pas à me contacter, ou a répondre par la liste !

flegens

Wed, 10 Oct 2001 07:39:06 -0000

Merci pour ces commentaires très constructifs, je n'ai pas de réponses pour tous les points. De toute manière il faut que l'on prenne tous ensemble les décisions sur ces différents points.

> Voici quelques réflexions sur les formats XML proposés pour eFlore
> sur le site eflore.tela-botanica.org.
>
> Aucun des points soulevés ci-dessous ne correspond à un problème
> majeur et en fait, suivant les objectifs recherchés, il est même
> possible que je sois le plus souvent "à côté de la plaque" à cause
> peut être d'un manque de vision claire sur les objectifs du projet
> (quelles sont les données que doit collecter le projet Flore de
> France, comment seront-elles organisées et quels sont les moyens
> prévus pour pouvoir retrouver ces données, etc.).
>
> Mon principal souci avec la présentation actuelle est qu'elle est
> très orientée service, c'est à dire description de données renvoyées
> en réponse à une demande (ce sont donc plutôt des descriptions de
> messages, au sens SOAP), alors que le modèle sous-jacent des
> informations stockées n'est pas décrit explicitement. On risque
> ainsi d'introduire des incohérences dans la description des
> différentes entités.

En effet il faudrait peut-être séparer la notion de service, et la description des entités et du modèle sous-jacent, mais comment présenter cela simplement ? Il me semblait plus facile de présenter cela via les services, car à chaque fois on s'occupe d'une petite partie, de plus c'est la seule qui est facilement matérialisable.

> 1.Remarques générales
>
> Ce serait bien d'avoir une section "Objectifs du service" (ou
> données restituées : description des classifications disponibles,
> extraits d'une classification, données bibliographiques ...). Cela
> permettrait de mieux voir les objectifs de la formalisation des
> documents XML et des DTDs présentés.

Ok, on rajoutera une rubrique Objectifs du service: pour détailler la mini présentation que j'ai placée dans l'introduction.

> Les attributs 'numclass' et 'numtaxo', si j'ai bien compris, jouent
> le rôle d'identifant pour les éléments correspondants.
> Dans ce cas ne devraient-ils pas être de type ID plutôt que
> CDATA ?
> Ils pourraient ainsi être référencés par d'autres objets
> par l'intermédiaire d'un attribut de type IDREF, avec une garantie de
> cohérence ou, ce qui est plus intéressant, être retrouvés à l'aide de
> services standard lors de l'utilisation d'une feuille de style XSLT.
>
> Remarques :
> - un document doit contenir la déclaration de tous les ID qu'ils
> référencent (si le parseur XML utilisé est validant, ce qui
> est une option).
> - un ID est nécessairement alphanumérique, ce qui est
> facilement contournable en mettant un préfixe (par exemple
> cumclass='2' deviendrait numclass='C2').

je ne connaissais pas l'intérêt de ce type, donc en effet il serait mieux de les utiliser. Par contre cela risque de poser de sérieux problèmes techniques. Par exemple l'attribut numtaxo est très souvent employé. Il est donc possible d'avoir deux fois la même valeur dans un même document ce qui n'est pas possible. En plus je ne souhaite pas m'écarter des identifiants de la BDNFF (qui sont des entiers). Bref il y a du pour et du contre sur ce point. Dans les documents actuels l'utilisation d'une référence me semble inutile, par contre elle est peut-être souhaitable dans une clef de détermination par exemple?

> D'autre part, l'attribution d'un identifiant numérique de cette
> façon est arbitraire. Deux bases n'auront vraisemblablement pas le
> même numéro pour le même taxon, ce qui peut rendre difficile les
> comparaisons. Il me semble qu'il serait préférable de
> carrément utilisé le nom scientifique du taxon (latin en général, donc
> que des caractères ASCII et pas de problème en XML) comme base de
> l'identifiant. Si le nom scientifique (normalisé je suppose) n'est
> pas utilisé directement, un algorithme permettant de passer de ce
> nom à l'identifiant devrait être publié.
> Mais je ne suis pas sûr que ce soit la meilleure solution.

On en a discuter dans le groupe de discussion IFFF. L'identifiant doit obligatoirement être autre chose que le nom car il est soumis à des changements (orthographe, nom d'auteur …), il faut donc conserver=

notre code numérique. Au niveau de la base j'ai prévu une table permettant d'avoir les correspondances entre deux systèmes d'identifiants (je ne sais pas encore où et comment on l'intégrera au niveau de nos servicesXML). Remarque : Il faut savoir que dans la plupart des grands référentiels taxonomiques chaque taxon est identifié par un code et non pas par son nom.

> Enfin la signification des attributs numnom et rangtaxo n'est pas
> claire.

En effet elle n'est décrite nulle part dans le document. Il faudrait les rajouter, cependant je ne sais pas trop où les faire apparaître.

> 2.donneclassification.php
>
> remarque : il y a une erreur (typo) dans le DTD - #REDUIRED doit
> être remplacé par #REQUIRED dans la ligne
> <!ATTLIST CLASSIFICATION numclass CDATA #REDUIRED >
>
> Je ne suis pas sûr de comprendre l'objectif de la DTD. Est-ce de
> définir des classifications indépendantes, avec les données suivante :
>
> FICHE_CLASSIFICATIONS correspond à la définition d'un ensemble
> de classification (mais à quoi sert l'attribut numclass ?).

numclass est l'identifiant d'une classification, il permet dans la liste d'identifier chaque classification et au niveau du service de ne ramener les données que sur une seule classification.

>
> CLASSIFICATION définit une classification avec
> - DESCRIPTION, une description brève (ce serait bien d'avoir une
> URL pointant sur la référence d'une description complète,
> éventuellement correspondant à un organisme de référence - comme cela
> se pratique pour XML par exemple).
> - PREMIER_TAXON, la référence du taxon à la racine de la
> classification.

C'est à envisager cependant le but à ce niveau est d'être relativement indépendant, ne peut on pas considérer que l'on puisse mettre sous forme de teste une URL si nécessaire dans la description.

> Si c'est le cas, je pense que l'exemple est peut-être mal choisi.
> Il est certainement posible de trouver un Taxon englobant
> Polygonacées et Oxalydacées, et les deux classifications sont en fait
> des parties de la classification ayant ce taxon ancêtre commun comme
> PREMIER_TAXON.

Oui l'exemple n'est pas le meilleur, j'ai été au plus rapide. Le mieux serait par exemple d'avoir une classification moderne et celle employée par coste ou bonnier. Cependant l'exemple actuel peux être d'un usage réel, on peut penser que pour la réalisation d'une flore la classification servira de plan, dans ce cas on peut avoir une classification pour les orchidées employée pour une monographie sur ces mêmes orchidées et une classification générale pour une flore de France.

>
> 3.donneclassificationtaxons.php
>
> Je crois que le nom LISTE_CLASSIFICATION_FILLES est mal choisi parce
> qu'il donne à penser que les éléments contenus sont des
> CLASSIFICATION, alors qu'il s'agit en fait de CLASSIFICATION_TAXON.
> Une meilleure appelaation, plus facile à réutiliser,serait peut- être
> LISTE_TAXONS.

En effet le nom est mal choisi, cependant la balise LISTE_TAXONS est déjà utilisée dans le service donnelistetaxons et a une autre signification. Il faut donc trouver un autre nom.

> D'autre part, je pense qu'il est possible de simplifier les deux DTDs
> correspondants aux services donneclassification.php et
> donneclassificationtaxons.php et de les fusionner, à partir des
> remarques suivantes:
> - il n'y a pas vraiment de différences entre PREMIER_TAXON et
> CLASSIFICATION_TAXON. On purrait juste définir un élément TAXON
> - LISTE_CLASSIFICATIONS_FILLES est facultatif.
>
> On pourrait donc utiliser les DTD suivantes (avec le remplacement de
> nom proposé ci-dessus) :
>
> Fichier common.dtd :
> --------------------
> <?xml version="1.0" encoding="UTF-8"?>
>
> <!ELEMENT CLASSIFICATION (DESCRIPTION, TAXON)>
> <!ATTLIST CLASSIFICATION numclass CDATA #REDUIRED >
>
> <!ELEMENT DESCRIPTION (#PCDATA)>
>
> <!ELEMENT TAXON (NOM_TAXON, LISTE_TAXONS?)>
> <!ATTLIST TAXON numtaxo CDATA #REQUIRED >
>
> <!ELEMENT NOM_TAXON (NOM+)>
> <!ATTLIST NOM_TAXON
>       numnom CDATA #REQUIRED
>       rangtaxo CDATA #REQUIRED >
>
> <!ELEMENT NOM (#PCDATA)>
> <!ATTLIST NOM auteur CDATA #IMPLIED >
>
> <!ELEMENT LISTE_TAXONS (TAXON+)>
>
> Puis la DTD suivnte pour donneclassification.php :
>
> <?xml version="1.0" encoding="UTF-8"?>
> <!ENTITY % COMMON SYSTEM "common.dtd">
> %COMMON;
>
> <!ELEMENT FICHE_CLASSIFICATIONS (CLASSIFICATION+)>
> <!ATTLIST FICHE_CLASSIFICATIONS numclass CDATA #IMPLIED>
>

Techniquement c'est possible mais je me suis fixé une règle pour les balises optionnelles (avec un point d'interrogation dans la DTD). Que la balise soit optionnelles dans seulement les deux cas suivants:

l'information n'existe pas dans la base de donnée (exemple : la bibliographie).
L'information n'a pas été demandée de façon explicite par l'utilisateur via un paramètre dans l'interrogation d'un service (exemple demander une classification jusqu'au niveau des espèces).

Dans ce cas la balise LISTE_TAXONS est optionnelle et ne respecte pas cette règle, cela me semble vraiment dommage car cela n'apporte que des imprécisions. En lisant la DTD et la documentation du service on n'est plus capable de prévoir la structure du résultat. C'est donc quelque chose à éviter. D'une manière générale il me semble qu'il faut éviter toute simplification de DTD susceptible d'engendrer des ambiguïtés.

> Et enfin la DTD suivante pour donneclassificationtaxons.php :
>
> <?xml version="1.0" encoding="UTF-8"?>
> <!ENTITY % COMMON SYSTEM "common.dtd">
> %COMMON;
>
> <!ELEMENT FICHE_CLASSIFICATION_TAXONS (CLASSIFICATION, TAXON)>
> <!ATTLIST FICHE_CLASSIFICATION_TAXONS
>       numclass CDATA #REQUIRED
>       numtaxo CDATA #IMPLIED
>       profondeur CDATA #IMPLIED
>       rangtaxo CDATA #IMPLIED >

Techniquement c'est en effet possible, mais cependant cela signifie qu'il n'est plus possible d'avoir en même temps connaissance du premier taxon d'une classification et d'une partie seulement de cette classification. Cela me semble dommage car c'est un peu ambigu. Je préfère donc sur ce point la solution existante. D'autant plus qu'une classification peut être grande et qu'il est souhaitable de pouvoir y accéder par parties.

>
> Ces deux DTDs sont compatibles avec les exemples de
> donneclassification.php et de donneclassficationtaxons.php:
>
> <?xml version="1.0" encoding="ISO-8859-1" standalone="no"?>
> <FICHE_CLASSIFICATIONS>
>      <CLASSIFICATION numclass="1">
>           <DESCRIPTION>Classification des Polygonacées basée
> sur la bdnff.
>           </DESCRIPTION>
>           <TAXON>
>                <NOM_TAXON numnom="200000" rangtaxo="40">
>                   <NOM>Polygonaceae</NOM>
>                </NOM_TAXON>
>           </TAXON>
>      </CLASSIFICATION>
>      <CLASSIFICATION numclass="2">
>           <DESCRIPTION>Classification des Oxalydacées basée sur
> la bdnff.
>           </DESCRIPTION>
>           <TAXON>
>                <NOM_TAXON numnom="200001" rangtaxo="40">
>                  <NOM>Oxalidaceae</NOM>
>                </NOM_TAXON>
>           </TAXON>
>      </CLASSIFICATION>
> </FICHE_CLASSIFICATIONS>
>
> Autre exemple :
> <?xml version="1.0" encoding="ISO-8859-1" standalone="no"?>
> <FICHE_CLASSIFICATION_TAXONS numclass="2" numtaxo="100025"
> rangtaxo="110">
>    <CLASSIFICATION numclass="2">
>       <DESCRIPTION>2è me classification</DESCRIPTION>
>       <TAXON numtaxo="200001">
>          <NOM_TAXON numnom="200001" rangtaxo="40">
>              <NOM>Oxalidaceae</NOM>
>          </NOM_TAXON>
>       </TAXON>
>    </CLASSIFICATION>
>    <TAXON numtaxo="100025" >
>       <NOM_TAXON numnom="100025" rangtaxo="60">
>         <NOM >Oxalis</NOM></NOM_TAXON>
>         <LISTE_TAXONS>
>            <TAXON numtaxo="4007" >
>               <NOM_TAXON numnom="47095" rangtaxo="100">
>                   <NOM auteur="L.">Oxalis acetosella</NOM>
>               </NOM_TAXON>
>            </TAXON>
>            <TAXON numtaxo="4008" >
>               <NOM_TAXON numnom="47102" rangtaxo="100">
>                 <NOM auteur="Savigny">Oxalis articulata</NOM>
>               </NOM_TAXON>
>            </TAXON>
>            <TAXON numtaxo="13136" >
>               <NOM_TAXON numnom="47110" rangtaxo="100">
>                 <NOM auteur="Lindl.">Oxalis bowiei</NOM>
>               </NOM_TAXON>
>            </TAXON>
>         </LISTE_TAXONS>
>    </CLASSIFICATION_TAXON>
> </FICHE_CLASSIFICATION_TAXONS>

Oui il est bien sur possible d'inclure des DTD dans une DTD. Je ne l'ai pas fait pour simplifier la lecture, de plus cela ne facilite pas le développement d'applications utilisant ces mêmes DTD (en effet le chargement et le stockage sont plus difficile à concevoir avec des DTD incluses, surtout pour travailler en mode déconnecté). Cependant en relisant la documentation des services je me suis aperçu que j'ai oublié de corriger la balise NOM_TAXON pour rajouter les balise BILIOGRAPHIE et BIBLIO_A_EXCLURE, car bien entendu le modèle sous- jacent doit être consistant, c'est à dire chaque DTD doit être compatible avec l'ensemble des éléments des autres DTD du projet eFlore.

Remarque : de façon général on essayera d'éviter le nom TAXON comme nom de balise, car c'est trop général. En fonction du sujet abordé on est susceptible d'associer n'importe quel information à une balise TAXON, puisque tout le système consiste en définitive à associer des informations à des taxons.

> 4.donnelistetaxons.php
> Ma première remarque concerne les paramètres de la procédure
> :
> l'utilisation de valeurs minimales et maximales pour définir des
> intervalles sur les noms semblent indiquer l'existence d'une relation
> d'ordre, ce qui n'est généralement pas le cas dans les
> chaînes alphabétiques correspondants aux noms.

Si l'ordre alphabétique.

> Il serait peut-être plus justifié d'utiliser des préfixes ou
> des radicaux (ce qui est le cas de l'exemple : nommin=Oxalis et
> nommax=Oxalis => cela revient à sélectionner tous les noms
> commençant par Oxalis). On diviserait par deux le nombre de
> paramètres et le critère de sélection serait peut-être plus clair.

Ce n'est pas la même façon d'utiliser la liste. Le radical a d'ailleurs été demandé pour la mise en ligne de l'ISFF. Je pense que c'est complémentaire. Il faut mieux avoir le choix avec les paramètres même si certaines personnes n'utiliserons qu'un seul type d'interrogation que de se retrouver bêtement limité. De plus l'interrogation se fera rarement directement mais via une interface qui peut simplifier la saisie par exemple pour une interrogation par un préfix, l'interface s'occupera de générer les paramètres suivants : : nommin=Oxalis et nommax=Oxaliszzzzz.

> Ma deuxième remarque concerne la liste d'attributs de NOM_TAXON :
> BIBLIOGRAPHIE et BIBLIO_A_EXCLURE sont des éléments facultatifs.
> Comme dans la discussion du paragrpahe 3, on pourrait les mettre dans
> une DTD commune, ce qui peremttrait de réutiliser pour LISTE_TAXONS
> la définition donnée ci-dessus, sans modification. Il n'y aurait
> alors qu'un seul élément nouveau de défini pour cette procédure.

Oui il faut que l'on tranche cette question des DTD incluses ou pas, et comment le présenter dans un document.

> Voilà.
>
> Si vous avez des questions ou des commentaires sur ces quelques
> remarques, n'hésitez pas à me contacter, ou a répondre par
> la liste !
>
> Jean-Christophe

Conclusion :

Cette intervention est très intéressante. Dans la démarche que j'ai adoptée pour l'écriture de ces formats de documents j'ai raisonné déjà en fonction du service mais en prenant en permanence en compte la consistance du modèle sous-jacent, sans jamais faire apparaître ce modèle dans les propositions de services. Il serait peut-être en effet souhaitable de le faire également apparaître. La description des services se limiterait dans ce cas à ne documenter que l'interface d'interrogation et l'encapsulation XML (balise FICHE_…) de la partie du modèle sous-jacent abordée. Par contre j'ai plus de difficultés pour percevoir la façon de documenter le modèle sous- jacent, dans le sens ou la réalisation d'une DTD est bien indispensable mais en aucune façon suffisante pour définir celui-ci. Jean-Chrisophe as tu une idée la dessus ? Pourrais-tu nous proposer quelques chose la dessus en prenant comme tu l'as déjà fait nos trois premiers documents XML comme base de travail? Existe t-il des exemples consultables sur le web pour ce problème ?

Pour ce qui est des identifiants, je ne sais pas trop comment faire, c'est à la fois utile et complexe à mettre en place. Dans les documents actuels je ne vois pas bien l'intérêt de mettre cela en place, dans le sens ou l'information à identifier n'est présente qu'une fois et directement placé au bon endroit. Cependant il est très clair que pour de futurs services, il sera utile de les avoir comme par exemple une clef de détermination ou les caractéristiques d'un taxon (voir le format XDELTA). La difficulté réside sur 2 point l'identifiant doit commencer par une lettre et doit être unique. Le fait que l'attribut doit commencer par une lettre fait qu'il faut modifier la base de données en conséquence et que l'on s'écarte de la BDNFF. Surtout l'unicité de l'identifiant est vraiment problématique, peut-être devrait-on dissocier l’identifiant du document XML de celui=

utilisé dans la base de données, il serait donc en plus et pas à la place.

Amicalement frédéric.

"Jean-Christophe Bottraud"

Tue, 16 Oct 2001 20:00:54 +0200

Bonjour,

En continuant à réfléchir, après les commentaires de Frédéric, voici quelques commentaires ou suggestions complémentaires (j'ai repris uniquement les extraits nécessaires du message de Frédéric et de mon premier message, pour la discussion complète, voir Yahoo)...

> En plus je ne souhaite pas m'écarter des identifiants de la BDNFF
> (qui sont des entiers).

Ce n'est pas vraiment un problème dans la mesure où un entier peut être transformé en chaîne alphanumérique simplement en le préfixant par un caractère alphabétique, qui peut être toujours le même (ex X1055 ou BDNFF1055).

> Bref il y a du pour et du contre sur ce point. Dans les documents
> actuels l'utilisation d'une référence me semble inutile, par contre
> elle est peut-être souhaitable dans une clef de détermination par
> exemple?

Pour moi l'intérêt du couple ID/IDREF réside surtout dans la garantie de cohérence : un IDREF ne peut pas référencer un ID qui n'existe pas (donc une référence à un taxon parent est garantie de bien faire référence à un taxon qui existe). Avec l'inconvénient que cette cohérence est au niveau document !

> Remarque : Il faut savoir que dans la plupart des grands référentiels
> taxonomiques chaque taxon est identifié par un code et non pas par
> son nom.

Est-ce qu'un de ces grands référentiels pourrait nous servir de référence ? (on utiliserait le même identifiant pour le même taxon, si cela a un sens)

> > Je crois que le nom LISTE_CLASSIFICATION_FILLES est mal choisi
>>....> > Une meilleure appellation, plus facile à réutiliser,serait peut-
> être LISTE_TAXONS.
>
>
> En effet le nom est mal choisi, cependant la balise LISTE_TAXONS est
> déjà utilisée dans le service donnelistetaxons et a une autre
> signification. Il faut donc trouver un autre nom.

Je crois que c'est un des problèmes de l'approche choisie : en décrivant toutes les variantes possibles pour un élément (une liste de taxons en l'occurrence), on épuise vite les noms significatifs. Pour moi c'est l'indicateur d'un problème dans l'approche choisie. (mais voir plus loin, pour une approche alternative ou complémentaire ...)

> >
> Techniquement c'est possible mais je me suis fixé une règle pour les
> balises optionnelles (avec un point d'interrogation dans la DTD). Que
> la balise soit optionnelles dans seulement les deux cas suivants:
>
> - l'information n'existe pas dans la base de donnée (exemple : la
> bibliographie).
> - L'information n'a pas été demandée de façon explicite par
> l'utilisateur via un paramètre dans l'interrogation d'un service
> (exemple demander une classification jusqu'au niveau des espèces).

Un problème que je vois à ces deux règles (mais c'est peut être mon problème à moi tout seul), c'est qu'elles concernent deux choses différentes : les données dans la base d'une part, les données de l'autre (mais cf. plus loin ...)

> Dans ce cas la balise LISTE_TAXONS est optionnelle et ne respecte pas
> cette règle, cela me semble vraiment dommage car cela n'apporte que
> des imprécisions. En lisant la DTD et la documentation du service on
> n'est plus capable de prévoir la structure du résultat. C'est donc
> quelque chose à éviter. D'une manière générale il me semble qu'il
> faut éviter toute simplification de DTD susceptible d'engendrer des
> ambiguïtés.

Strictement parlant, il n'y a pas d'ambiguïté : le service ne s'engage pas à fournir la donnée Bon d'accord, il ne s'engage pas non plus à ne jamais la fournir, ce qui peut conduire un utilisateur à penser qu'il lui faut prévoir le cas où cette donnée est fournie ...

> > Et enfin la DTD suivante pour donneclassificationtaxons.php :
> >
> > <?xml version="1.0" encoding="UTF-8"?>
> > <!ENTITY % COMMON SYSTEM "common.dtd">
> > %COMMON;
> >
> > <!ELEMENT FICHE_CLASSIFICATION_TAXONS (CLASSIFICATION, TAXON)>
> > <!ATTLIST FICHE_CLASSIFICATION_TAXONS
> > numclass CDATA #REQUIRED
> > numtaxo CDATA #IMPLIED
> > profondeur CDATA #IMPLIED
> > rangtaxo CDATA #IMPLIED >
>
> Techniquement c'est en effet possible, mais cependant cela signifie
> qu'il n'est plus possible d'avoir en même temps connaissance du
> premier taxon d'une classification et d'une partie seulement de cette
> classification. Cela me semble dommage car c'est un peu ambigu. Je
> préfère donc sur ce point la solution existante. D'autant plus qu'une
> classification peut être grande et qu'il est souhaitable de pouvoir y
> accéder par parties.

Je ne suis pas sûr que ce soit un problème parce que ce n'est pas la taille de la classification qui est en cause mais sa profondeur (la façon de faire présentée oblige à fournir tous les ascendants). Or quelle est la profondeur de la classification ? Même s'il y a 20 niveaux (ce que je ne crois pas être le cas), le surcoût n'est pas exagéré, et d'autre part il évite toute ambiguïté sur le positionnement d'un taxon (dont, à strictement parlé - encore une fois ;-) , l'identifiant est formé par la concaténation de son identifiant et de celui de tous les taxons ascendants).

> Oui il est bien sur possible d'inclure des DTD dans une DTD. Je ne
> l'ai pas fait pour simplifier la lecture, de plus cela ne facilite
> pas le développement d'applications utilisant ces mêmes DTD (en effet
> le chargement et le stockage sont plus difficile à concevoir avec des
> DTD incluses, surtout pour travailler en mode déconnecté). Cependant
> en relisant la documentation des services je me suis aperçu que j'ai
> oublié de corriger la balise NOM_TAXON pour rajouter les balise
> BILIOGRAPHIE et BIBLIO_A_EXCLURE, car bien entendu le modèle sous-
> jacent doit être consistant, c'est à dire chaque DTD doit être
> compatible avec l'ensemble des éléments des autres DTD du projet
> eFlore

la formalisation des données (ou des documents qui les contienent) d'une part,
la formalisation des vues sur ces données, fournies par les services, d'autre part. Et je crois que si le système prend de l'ampleur, la seule façon d'obtenir un système cohérent sera de ne définir chaque description d'élément qu'une fois, quelque soit son concept d'utilisation, et d'appeler cette description chaque fois que nécessaire (c'est d'ailleurs le problème qui semble s'être produit avec NOM_TAXON et BIBLIOGRAPHIE ?). Je ne crois pas que la gestion des fichiers à inclure soit très difficile, puisqu'on peut créer un fichier contenant toutes les définitions disponibles (qui servira donc d'index) et inclure systématiquement ce fichier. Si les références de fichier sont toutes relatives, le développement d'application ne doit pas s'en trouver trop compliquer ?

Par contre, le problème de l'organisation de l'information en documents ne va pas être simple :-(

>
>
> Remarque : de façon général on essayera d'éviter le nom TAXON comme
> nom de balise, car c'est trop général. En fonction du sujet abordé on
> est susceptible d'associer n'importe quel information à une balise
> TAXON, puisque tout le système consiste en définitive à associer des
> informations à des taxons.

Je ne sais pas. Il me semble que TAXON devrait être utilisé une fois (mais une seule, je suis d'accord) ne serait-ce que pour avoir un point d'ancrage pour lier toutes les informations susceptibles d'être associées à un taxon. On peut ensuite bien sûr dériver tous les noms nécessaires.

>
> > 4.donnelistetaxons.php
> > Ma première remarque concerne les paramètres de la procédure
> > :
> > l'utilisation de valeurs minimales et maximales pour définir des
> > intervalles sur les noms semblent indiquer l'existence d'une
> relation
> > d'ordre, ce qui n'est généralement pas le cas dans les
> > chaînes alphabétiques correspondants aux noms.
>
> Si l'ordre alphabétique.

A-t-il un sens dans la classification ? ou s'agit-il juste d'un moyen de limiter le nombre de taxons obtenus (et dans ce cas, autant spécifier directement une quantité max.) ?

> Il faut mieux avoir le choix avec les
> paramètres même si certaines personnes n'utiliserons qu'un seul type
> d'interrogation que de se retrouver bêtement limité.

Ca, c'est bien vrai ....

> > Ma deuxième remarque concerne la liste d'attributs de NOM_TAXON :
> > BIBLIOGRAPHIE et BIBLIO_A_EXCLURE sont des éléments facultatifs.
> > Comme dans la discussion du paragrpahe 3, on pourrait les mettre
> dans
> > une DTD commune, ce qui peremttrait de réutiliser pour LISTE_TAXONS
> > la définition donnée ci-dessus, sans modification. Il n'y aurait
> > alors qu'un seul élément nouveau de défini pour cette procédure.
>
>

Conclusion (où on se trouve enfin au "plus loin" annoncé!) :

>
>  Dans la démarche que j'ai
> adoptée pour l'écriture de ces formats de documents j'ai raisonné
> déjà en fonction du service mais en prenant en permanence en compte
> la consistance du modèle sous-jacent, sans jamais faire apparaître ce
> modèle dans les propositions de services. Il serait peut-être en
> effet souhaitable de le faire également apparaître. La description
> des services se limiterait dans ce cas à ne documenter que
> l'interface d'interrogation et l'encapsulation XML (balise FICHE_&#8230;)
> de la partie du modèle sous-jacent abordée. Par contre j'ai plus de
> difficultés pour percevoir la façon de documenter le modèle sous-
> jacent, dans le sens ou la réalisation d'une DTD est bien
> indispensable mais en aucune façon suffisante pour définir celui-ci.
> Jean-Chrisophe as tu une idée la dessus ?
> Pourrais-tu nous proposer quelques chose la dessus en prenant comme
> tu l'as déjà fait nos trois premiers documents XML comme base de
> travail?
> Existe t-il des exemples consultables sur le web pour ce problème ?

Ma première réaction est de dire que notre problème correspond en fait à celui qu'adresse les spécifications SOAP. En gros, SOAP (cf. http://www.w3.org/TR/SOAP/). correspond à un standard pour décrire les services fournit par un serveur, en précisant les messages disponibles, le contenu des messages, les erreurs possibles, etc. Le standard utilise XML. Un message SOAP est composé de plusieurs parties : un en-tête, donnant des informations sur le message (sa nature en particulier), le corps de message (qui peut être un message d'erreur), et une fin de message. Le message ne fait pas référence à une DTD, ce qui laisse pas mal de souplesse, et il me semble que la description permet de décrire les informations disponibles. Ce serait peut être une solution qui nous permettrait de réserver les DTDs à la description des documents et les descriptions SOAP aux services.

Je vais essayer de creuser un peu.

> Pour ce qui est des identifiants, je ne sais pas trop comment faire,
> c'est à la fois utile et complexe à mettre en place. Dans les
> documents actuels je ne vois pas bien l'intérêt de mettre cela en
> place, dans le sens ou l'information à identifier n'est présente
> qu'une fois et directement placé au bon endroit. Cependant il est
> très clair que pour de futurs services, il sera utile de les avoir
> comme par exemple une clef de détermination ou les caractéristiques
> d'un taxon (voir le format XDELTA). La difficulté réside sur 2 point
> l'identifiant doit commencer par une lettre et doit être unique.  Le
> fait que l'attribut doit commencer par une lettre fait qu'il faut
> modifier la base de données en conséquence et que l'on s'écarte de la
> BDNFF. Surtout l'unicité de l'identifiant est vraiment problématique,
> peut-être devrait-on dissocier l'identifiant du document XML de celui
> utilisé dans la base de données, il serait donc en plus et pas à la
> place.

Le problème de la cohérence avec la BDNFF ne me semble pas en être un si on prend une règle du type (par exemple): identifiant XML = X + identifiant BDNFF soit : si la BDNFF utilise 1055, les documents XML utiliseront X1055 (ou BDNFF1055, ou autre chose ...).

Voilà. Encore une fois, n'hésitez pas à réagir !

Cordialement,

Jean-Christophe

5. Gestion du projet

5.1. Eflorephp

"Frederic legens"

Wed, 16 May 2001 07:28:19 +0200

Bonjour,

L'environnement informatique nommé eflorephp, fonctionnant sous windows est enfin terminé.

Il consiste en la livraison d'un installable contenant :

Le serveur internet apache.
La base de donnée mySQL
Le programme PHP.

Cet installable est téléchargeable à partir de l'url suivant : http://eflore.tela-botanica.org.

Il vous permettra pour l'instant de prendre part au développement si vous le souhaitez.

Le "site" http://eflore.tela-botanica.org, nous permettra de stocker les fichiers téléchargeables et de documenter les différents aspects du projet.

Et encore merci à Jean-charles pour son aide.

5.2. CVS

David Delon

Sat, 13 Oct 2001 11:30:57 +0200

Bonjour, Le projet eflore est donc crée sur sourceforge.net.

Pour le moment la page d'accueil renvoi sur http://eflore.tela-botanica.org, vous pouvez y accéder par http://eflore.sourceforge.net .

Les personnes désirant intervenir sur le projet pour apporter de la documentation, des développements, des traductions ... doivent s'inscrire sur http://sourceforge.net en suivant le lien : "Nouvel Utilisateur via SSL". Ensuite elles devront me communiquer leur identifiant sourceforge (login) pour que je les autorise en mise à jour sur CVS.

La récupération du projet pourra se faire de également de façon anonyme à partir de eflore.sourceforge.net.

L'utilisation de CVS se fait à partir de Windows (Wincvs), Mac (MacCVS) et Linux. Par contre, comme la communication est sécurisé (cryptée) elle peut être délicate à mettre en place. Je donnerai bientôt toute les indications nécessaire pour le faire, vous pouvez récupérer dès maintenant les utilitaires suivants :

CVS :

http://www.cvsgui.org/download.html :

récupérer :

Windows WinCvs 1.2 *STABLE* / Client + Local / Binaries

Mac MacCvs 3.1 *STABLE* / Client Only / Binaries (Classic MacOS 8/9)

SSH (accès sécurisé)

Windows : sfsetup.zip

http://sfsetup.sourceforge.net/#sfsetup

Mac : MacSSH - MacOS Secure Shell

http://www.macssh.com/

Synthese

Table of Contents