Rendre Légifrance compatible avec Zotero : compte-rendu d’expérience

Envisagée depuis plusieurs mois, la mise en compatibilité de Légifrance, le site web officiel de la diffusion du droit, avec l’outil de gestion de bibliographique Zotero apparaissait comme un défi personnel sur le plan documentaire et informatique.

En effet, une première lecture du code source laissait présager que la mission était impossible :

  • pas d’exposition de métadonnées sous un format comme le Dublin Core,
  • peu de balises « parlantes » <div> ou <span> suffisamment documentées pour identifier et mapper les informations utiles.

De même, le site web étant constitué d’un grand nombre de bases de données (http://www.legifrance.gouv.fr/Bases-de-donnees/Rechercher), le temps de codage en JavaScript serait vraisemblablement assez long.

Quelle est la méthode utilisée ?

Etant donné qu’il était impossible d’utiliser le framework de développement, il a fallu tout coder « à l’ancienne » en déterminant une technique de récupération des métadonnées.

Ainsi, pour récupérer la plus grande partie des informations, je me suis servi des éléments d’identification de la décision de justice ou du texte de loi. Elles sont situées dans toutes les bases de données entre les balises <h2> </h2>.

cass

J’ai remarqué également que chaque élément récupérable (nom du tribunal, date, numéro) est séparé par un tiret ou par une virgule.

Il suffit ensuite de récupérer chaque élément issu de Légifrance pour l’intégrer dans Zotero. Exemple avec la Cour de cassation :

h = title.match(/(Cour de cassation), (.*), (.*), (s*[0-9-. ]+), (.*)/)
if (h) {
var nature = h[1];
var formation = h[2];
var date = h[3];
var numero = h[4];
var publication = h[5];
newItem.court = ‘Cour de cassation’;
newItem.tags = nature;
newItem.extra = formation;
newItem.date = date;
newItem.docketNumber = numero;
newItem.reporter = publication;
}

Il a fallu également utiliser, pour la numérotation ou pour les dates, des expressions régulières.

Fonctionnalités

A l’heure actuelle, la détection par Zotero fonctionne sur :

  • la jurisprudence judiciaire,
  • la jurisprudence administrative,
  • la jurisprudence constitutionnel,
  • les lois, les décrets et les codes,
  • les décisions de la CNIL.

jp

legi

Pour la jurisprudence, le pictogramme « balance » s’affiche, tandis que pour les textes législatifs et la CNIL, le pictogramme « tribunal » est proposé.

detectionloi detectionjp

La détection des occurrences multiples ne fonctionne que pour la jurisprudence. A ce moment, le pictogramme « répertoire » est affiché.

multiple

Au niveau des métadonnées, il est pour l’instant possible de récupérer :

  • le nom de la juridiction (pour la jurisprudence),
  • la date,
  • le numéro,
  • l’URL,
  • le nom de la décision (pour le Conseil constitutionnel).

meta

Pour la jurisprudence, le fac-similé au format RTF est automatiquement téléchargé. Il est également indiqué, mais Zotero le réalise automatique, la date de première récupération du document et de sa mise à jour.

Limites à la récupération des métadonnées

Les autres bases de données ou certaines textes législatifs ne sont pas pour l’instant intégrés. Il est apparu que certaines données posaient quelques difficultés de récupération. J’ai préféré, pour cette première version, proposer un script opérationnel avec le moins de bugs possibles.

Proposition de feuille de route

Les points suivants sont à améliorer :

  • suppression dans l’URL des éléments de session,
  • détection de tous les types de textes dans la législation,
  • détection des occurences multiples pour la législation.

Parmi les évolutions possibles de l’outil, il peut être prévu:

  • l’intégration des plans de classements dans les mots-clés de Zotero (comme Juricaf),
  • l’intégration dans Zotero dans les liens connexes des textes cités par les lois ou les jurisprudences.

Le projet qui devrait suivre est la conception d’un style bibliographique compatible avec Légifrance, Juricaf, BoFip-Impôts et d’autres bases de données juridiques. Une fois réalisé, Zotero sera d’une aide très précieuse pour les étudiants, doctorants et universitaires en sciences juridiques.

Contribuer à l’amélioration du code

Si vous connaissez JavaScript, le code est disponible sur Github : https://github.com/zotero/translators/blob/master/Legifrance.js. Toute bonne volonté est invitée à modifier ma contribution initiale.
Si vous détectez des bugs ou des fonctionnalités potentielles, les commentaires sont ouverts.

Publié dans Légifrance, Zotero | Tagué , , , , , , , | 6 commentaires

Test de la bibliothèque virtuelle de l’AFNOR

En tant que membre de l’ADBS, l’association des professionnels de l’information et de la documentation, j’ai reçu une publicité agréable, à savoir la possibilité de tester la bibliothèque virtuelle documents et normes de l’AFNOR, l’association française de normalisation. Et même, si je suis intéressé, je dispose de 35% de réduction sur l’abonnement.

AFNOR

Comme la normalisation me passionne (eh oui, c’est possible !), je suis aller tester la base de données. A propos, tout le monde peut l’essayer, pendant cinq jours, à cette adresse : http://www.bivi.fonctions-documentaires.afnor.org/essai-gratuit. Après un questionnaire un peu trop détaillé sur l’utilisateur, on arrive enfin à la page d’accueil.

Bonne surprise, moi qui pensait avoir une interface austère, on prend connaissance des actualités (article du mois), à la partie éditoriale (articles d’auteurs), à un accès par mots-clés (présentés en nuages de tags), ainsi que les dernières normes publiées.

Les articles d’auteurs sont lisibles, avec l’affichage du plan en haut à gauche. On peut ajouter une note personnelle, créer un panier, envoyer à un ami ou imprimer. L’article est catégorisé et inscrit dans une thématique. C’est plutôt réussi.

S’agissant des normes et des textes réglementaires, impossible de tester, il faut « étendre le périmètre de votre abonnement pour accéder aux normes ». C’est bien dommage, c’est quand le coeur de la base de données. Grosse frustration !

Je me console en regardant les livres blancs qui sont fort intéressants, mais peu nombreux (33 publiés), ainsi que les outils qui sont en fait un répertoire de modèles.

Sur ces modèles, celui du cahier des charges est décevant. A vrai dire, je suis prévenu : il n’y a que le minimum. Les autres documents sont un peu légers pour un usage professionnel. Cela mériterait à être amélioré.

S’agissant de la recherche avancée, étant donné que l’on ne peut pas rechercher dans les normes, on peut sélectionner les articles par auteur, mot-clé ou thématique. Le minimum en réalité.

Conclusion

J’espérais beaucoup de la consultation de la base de données et voir comment sont gérés les normes et les aspects réglementaires. Hormis cet aspect pourtant essentiel, je suis agréablement surpris par la qualité des articles et des livres blancs. La consultation de la bibliothèque est utile pour ces aspects.

Publié dans Tests | Tagué , , , | 2 commentaires

Test de Hélinia : la base de données de mélanges juridiques

Dans un billet précédent, Emmanuel Barthe, documentaliste juridique auteur de Précisement.org a réalisé un test de la base de données « Pages de doctrine », consacré aux « mélanges », ces ouvrages juridiques qui comprennent des articles de doctrine de très grande qualité.

Une autre base de données existe également sur ce même secteur : Hélinia.

La base de données, qui dispose un tutoriel pour aider à son utilisation, propose une seule interface de recherche qui combine recherche par termes et la possibilité d’affiner par auteurs ou mots-clés.

Test de la base de données

Dans les points positifs, on notera l’exhaustivité de la base de données, à défaut d’avoir une page relatant les collections indexées. L’affichage des résultats et la gestion de panier est ergonomique et la fonction permettant d’interroger le SUDOC pour la bibliothèque universitaire qui détient l’ouvrage est très utile.

Sur les points de vigilance, on notera que certaines fonctionnalités simples comme de l’auto-complétion pour les auteurs et les mots-clés serait fort utile. On regrettera également l’impossibilité de filtrer à la fois par auteur et par mot-clé. Pour l’instant, c’est l’un ou l’autre cas.

Conclusion

L’outil est attachant par son côté un peu rudimentaire, mais il réalise plutôt bien ce qu’on lui demande : une recherche sur un fonds d’articles de doctrine souvent peu exploités.

S’il on souhaite connaître toutes les fonctionnalités, le Jurisguide a réalisé une excellente description de ce produit documentaire.

Publié dans Tests | Tagué , | 2 commentaires

Les entrepôts OAI-PMH en sciences juridiques

L’OAI (comme Open Archives Initiative) est un projet qui vise à développer et promouvoir l’interopérabilité entre les bases de données.

Open archives

Ce mouvement s’inscrit dans un contexte plus large, à savoir l’accès aux données des institutions publiques et principalement celles des universités et des bibliothèques.

Rapide définition de l’OAI et des entrepôts de données

Silots with grains of a farm

L’OAI ainsi sur des entrepôts de données interopérables.
Matériellement, ces entrepôts ou silots sont de très importantes bases de données qui peuvent contenir :

  • des notices bibliographiques,
  • des documents universitaires avec leurs métadonnées (mémoires, thèses),
  • des articles de périodiques,
  • tout autre donnée comme  par exemple, un annuaire de liens.

Pour éviter que l’entrepôt deviennent un garage où rien n’est accessible, la norme utilisée s’appelle OAI-PMH qui signifie Protocol for Metadata Harvesting (protocole pour la collecte de métadonnées).

Cette norme, fort bien documentée est décrite clairement par la BNF qui précise ses objectifs :

  • « accroître la visibilité des collections numériques sur Internet »,
  • « reconstituer virtuellement des corpus à partir de ressources accessibles sur différents sites »,
  • « alimenter des portails thématiques. »

Il est précisé également que la norme fait intervenir deux acteurs :

  • le producteur de la base de données qui va exposées ses métadonnées (au minimum sous un format Dublin Core),
  • l’utilisateur final qui va « moissonner » ses bases de données.

Comment être compatible avec OAI-PMH ?

Ce producteur doit respecter la norme OAI-PMH et adapter sa base de données en conséquence. Ce travail est plutôt coûteux. Il peut malgré tout s’aider d’outils qui sont naturellement dotés de cette fonction, comme par exemple :

  • le gestionnaire de bibliothèque (SIGB) PMB : ils promettent même une installation en dix minutes,
  • le gestionnaire de bibliothèque numérique Omeka ,
  • l’outil de création de portails documentaires universitaires ORI-OAI ,
  • l’outil de création de revues en ligne Open Journal System,
  • l’outil de diffusion de la jurisprudence OIA4Courts.

Les avantages liés à OAI-PMH pour le producteur de données

Les potentialités sont très importantes. Citons quelques unes :

Les avantages liés à OAI-PMH pour le documentaliste

L’intérêt majeur pour le documentaliste est de pouvoir, au moyen de connecteurs, ajouter dans son propre système de de gestion de bibliothèque des documents distants situés dans des bases de données. Il peut ainsi récupérer les notices, voire le document complet très facilement.

Un logiciel comme PMB réalise très bien cette opération (voir le tutoriel), appelée « moissonnage » de données.

Moissonneuse Massey-Ferguson 830-S

Une fois la ressource identifiée, il faut repérer la déclaration OAI de la base. Elle est toujours, dans le lien, sous cette forme :  http://URL/oai.php?verb=Identify. Ensuite, il faut choisir une partie de la base de données, comme une revue. C’est la sélection d’un « set ».

Quelles bases de données en sciences juridiques sont accessibles ?

Voici une liste d’entrepôts OAI qui contiennent des ressources en sciences juridiques :

Revues

CAIRN : http://oai.cairn.info/oai.php?verb=Identify
Revues.org : http://oai.revues.org/
Persée : http://oai.persee.fr/c/ext/prescript/oai

Notices bibliographiques

Bibliothèque nationale de France : http://oai.bnf.fr/oai2/OAIHandler

Universités (thèses et mémoires)

Bibliothèque Cujas : http://cujas-num.univ-paris1.fr/oai
Université Paris II : possible, mais lien non communiqué
Université du Mans : http://ori.univ-lemans.fr/ori-oai-repository/OAIHandler
Archives en ligne HAL : http://hal.archives-ouvertes.fr/oai/oai.php
Portail national des thèses : http://staroai.theses.fr/OAIHandler?verb=Identify
Université de Strasbourg : http://theses.unistra.fr/ori-oai-repository/OAIHandler
Universités de Lorraine : http://ori-repository.univ-lorraine.fr/OAIHandler
Université Paris-Dauphine : http://basepub.dauphine.fr/oai/request?verb=Identify

Cette liste est loin d’être exhaustive, merci d’ajouter dans les commentaires vos découvertes !

Publié dans OAI-PMH | Tagué , , , , , , , , , , , , | 4 commentaires

Créer un fil RSS avec Yahoo Pipes

https://i2.wp.com/l.yimg.com/a/i/us/pps/pipeslogo_whitebg.gif

Yahoo Pipes est un outil bien utile, graphique et efficace qui vous permet notamment de manipuler des fils RSS.

Un module supplémentaire a été créé le 24 avril 2012 permettant d’utiliser les fonctionnalités XPATH : http://pipes.yqlblog.net/2012/04/24/new-module-xpath-fetch-page/

XPATH (tutoriel publié à l’adresse http://www.w3schools.com/xpath/default.asp) est utilisé pour décrire les éléments HTMLou CSS d’une page web au moyen d’un langage apparenté au XML.Il peut être utilisé pour créer des fils RSS, alors que le site web n’en propose pas.

Étude de cas : le Journal officiel

L’idée est de créer à partir de la page du journal officiel du jour (http://www.legifrance.gouv.fr/affichJO.do), un fil RSS. Légifrance n’en propose malheureusement pas.

Étape 1 : Je détecte pour chaque lien le chemin XPATH.

J’utilise pour cela l’extension Firebug pour Mozilla Firefox pour faire apparaître le code source :

yahoopipes1

Étape 2 : je copie le chemin du XPATH

yahoopipes2

Étape 3 : je colle le chemin dans Yahoo Pipes

Les fonctions utilisées sont :

  • XPath Fetch Page (onglet Sources)
  • Create Rss (onglet Operators)

yahoopipes3

Résultat obtenu

A l’adresse http://pipes.yahoo.com/adreagui/jorf, vous pouvez accéder au fil au format :

A vous de jouer ?

Pas besoin de tout réécrire, vous pouvez cloner ce code pour l’adapter à tous vos projets. Un autre exemple est proposé : le fil Rss de la bibliothèque des rapports publics : http://pipes.yahoo.com/adreagui/rapports_publics.

Merci à Serge Courrier (https://twitter.com/secou) pour sa relecture pertinente.

Publié dans RSS | Tagué , , , , | 16 commentaires

L’identifiant ECLI sur les décisions du Conseil constitutionnel

Depuis le 20 novembre 2012, suite à l’annonce faite par le biais d’un message issu de son compte Twitter, le Conseil constitutionnel publie sur son site internet tout en bas de chaque décision le numéro ECLI correspondant. Ils sont également publiés sur Légifrance depuis le 21 février 2013.

Pour la description de cette norme et de son organisation, on se réfèrera à un billet précédent concernant le Conseil d’Etat et la Cour de cassation.

Quelles sont les particularités pour le Conseil constitutionnel ?

Les deux premiers éléments ne varient pas : l’identifiant commence par ECLI:FR.

Le troisième (l’abréviation) commence par « CC« .

Le quatrième élément est constitué de l’année du prononcé de la décision (exemple 2012).

Le cinquième et dernier élément est constitué de deux parties, séparées chacun par un point :

  • le numéro de la décision,
  • le type de décision.

Dans le cas où le numéro de décision est en deux parties, comme par exemple pour la décision QPC n°2012-281, le tiret est remplacé par un point. Le cinquième élément sera ainsi 2012.281.QPC.

Le type de la décision peut avoir pour valeur :

  • QPC : Question prioritaire de constitutionnalité
  • DC : Contrôle de constitutionnalité des lois ordinaires, lois organiques, des traités, des règlements des Assemblées
  • LP : Contrôle de constitutionnalité des lois du pays de Nouvelle-Calédonie
  • L : Déclassements de textes législatifs au rang réglementaire
  • FNR : Fins de non-recevoir
  • LOM : Répartitions des compétences entre l’État et certaines collectivités d’outre-mer
  • AN : Élections à l’Assemblée nationale
  • SEN : Élections au Sénat
  • PDR : Élection présidentielle
  • REF : Référendums
  • ELEC : Divers élections: observations
  • D : Déchéance de parlementaires
  • I : Incompatibilité des parlementaires
  • AR16 : Article 16 de la Constitution (pouvoirs exceptionnels du Président de la République)
  • NOM : Nomination des membres
  • ORGA : Décision d’organisation du Conseil constitutionnel
  • AUTR : Autres décisions

Cette liste est issue de la nomenclature publiée sur le site Internet du Conseil constitutionnel.

Publié dans Normologie | Tagué , | Laisser un commentaire

Lancement du diplôme inter-universitaire « Droit et informatique »

Objectifs et spécificités :

Ce Diplôme Inter-Universitaire couvre le champ des interactions existant entre le droit et l’informatique. Prenant en compte tant la demande des professionnels en matière d’informatique juridique que la portée épistémologique prometteuse de ce passionnant champ d’étude , les Universités Paris Sud et Paris 1 ont décidé de créer conjointement le Diplôme Inter-Universitaire « Droit et informatique » (DEI).

Ce DIU entend former des personnes se destinant au Knowledge Management, ou à la maîtrise d’ouvrage déléguée de projets d’informatique juridique. On y acquiert des compétences pour animer des projets de création ou de modification de sites internet, de bases de données ou de process juridiques électroniques.

L’équipe enseignant est dirigée par M. Dondero, professeur à l’Université Paris 1, directeur du Cavej et de M. Relmy, maître de conférence à l’université Paris-Sud, elle réunit les professeurs Dupichot et Herberger, ainsi que de nombreux professionnels de l’informatique juridique française dont MM. et Mmes Adréani, Barthe, Cottin, Gasnault, Lame, Saint Aubin, et Silber. Elle vous propose des cours portant sur l’évolution du droit sous l’impact de l’informatique, la confrontation des systèmes de droit sur la toile mondiale, les statuts juridiques de la donnée (publique et/ou personnelle) dans les traitements de l’information, la légistique, la normologie juridique, la e-justice et la e-procédure et, d’une manière plus générale, tous les techniques qui permettent aux juristes et aux informaticiens de mieux maîtriser les interactions existant entre leur monde. Il est nécessaire, pour suivre cette formation, de posséder de bonnes connaissances en droit et en informatique et surtout de s’intéresser de près à l’évolution de leurs combinaisons.

Attention : ce diplôme n’est pas une formation à distance, mais pour l’essentiel en « présentiel ». Une grande partie des cours auront lieu, à partir du 7 janvier jusqu’à la fin de mois de juin, les mardi, mercredi et jeudi soir, de 17h à 19h, soit dans Paris Intramuros soit à la faculté de Sceaux.  Le nombre d’heures enseignées est égal à 142h. Ce diplôme peut être suivi dans le cadre d’un DIF.

Modalités d’inscription :

Pour toutes demandes de renseignements complémentaires et pour demander le dossier d’inscription, vous devez adresser un mail à inscription@diudei.fr – Les dossiers  d’inscription dûment remplis devront être envoyées à Mme Rey ( christine.rey@u-psud.fr  – 01 40 91 18 21 ), Faculté Jean Monnet, Service de la Formation continue , «Candidature au DIU DEI», Bureau A5, 54 boulevard Desgranges, 92330 Sceaux cedex avant le 20 novembre 2012. La sélection des dossiers retenus sera annoncée à la fin du mois de novembre.

Pour plus d’information, consultez le blogue de la formation : http://www.diudei.fr/

Publié dans Brêves | Tagué , , , , | 1 commentaire