Nederlands

Table des matières

Que sont les processus FRBR et dedup ?

FRBR et dedup sont deux mécanismes qui rassemblent des notices Alma distinctes dans Limo afin que les utilisateurs trouvent des notices qui "vont ensemble" en tant que groupe dans la liste des résultats de recherche. Les deux processus fonctionnent sur un principe de base différent.

Le processus FRBR (ou FRBRisation) part du modèle FRBR ou Functional Requirements for Bibliographic records. Dans le cadre de ce modèle, le processus FRBR vise à regrouper les notices similaires : en termes FRBR, il s'agit donc de rassembler les différentes manifestations et expressions d'une même œuvre. En termes catalographiques plus "classiques", on pourrait dire que FRBR est destiné à rassembler les différentes éditions d'un texte donné et à les présenter à l'utilisateur comme un tout ordonné.

Le processus de déduplication (ou dédup) garantit que les notices equivalentes sont fusionnées. Il ne s'agit pas de notices décrivant des éditions différentes mais de notices décrivant la même édition. Différents scénarios font que plusieurs notices pour la même édition sont présentes dans Limo :

  • parce que dans Alma, 2 notices distinctes sont créées pour la version physique (P) et électronique (D/E) d'une même édition.
  • parce que les notices de différentes sources (Alma, Lirias) se chevauchent dans Limo et que la même édition est donc décrite dans deux ou plusieurs fichiers sources.
  • parce que (accidentellement ou non) la même édition a reçu plusieurs notices bibliographiques dans Alma.

Les processus FRBR et dédup ne fonctionnent pas sur toutes les notices affichées dans Limo :

  • FRBR & dedup fonctionnent sur les notices affichées dans Limo depuis Alma (sauf pour certains groupes, cf. infra).
  • FRBR & dedup fonctionnent également sur les fiches chargées directement dans Limo (par exemple les fiches Lirias).
  • FRBR & dedup fonctionnent également entre les deux groupes précédents (les notices locaux) : les notices Alma et Lirias sont donc également fusionnées entre elles selon les principes de FRBR et de dedup.
  • les notices du Central Discovery Index (CDI) sont fusionnées entre elles selon le principe de la déduplication, mais pas selon le principe FRBR.
  • il n'y a également ni FRBR ni dédup entre les notices locales et les notices du CDI.

Comment FRBR et déduplication sont-ils visibles dans Limo ?

FRBR regroupe les notices similaires dans un groupe FRBR. Ceux-ci sont clairement identifiés dans la liste des résultats de recherche par l'icône spécifique, l'indication Plusieurs versions au lieu d'un type de document spécifique et l'indication [x] versions trouvées. Voir toutes les versions sous le titre.

Image Placeholder

Lorsqu'un utilisateur clique sur un groupe FRBR dans une liste de résultats de recherche, la liste des éditions individuelles de ce groupe s'affiche alors. Par défaut, cette liste est triée par ordre alphabétique (bien que le titre soit normalement le même), puis par ordre chronologique décroissant, l'édition la plus récente se trouvant donc en tête.

Image Placeholder

Les notices groupées par le mécanisme de déduplication sont (intentionnellement) moins reconnaissables dans la liste des résultats de recherche. Comme les autres notices, elles apparaissent comme un seul résultat de recherche. Cependant, tous les inventaires des notices (notices de fonds, portfolios et/ou représentations) sont fusionnés et montrés ensemble. Une notice faisant référence à la fois aux copies physiques disponibles et à l'accès électronique sera donc presque toujours un groupe de déduplication de 2 notices ou plus groupées par dédup.

Image Placeholder

Avec dédup, il n'y a pas de fusion au niveau de la notice bibliographique. Limo "choisit" une des notices du groupe dedup comme notice préférée selon les principes suivants :

  • si vous avez saisi dans votre requête un terme de recherche qui n'apparaît que dans 1 des notices, cette notice est affichée comme notice préférée. Ainsi, vous voyez toujours la notice qui est le plus pertinente pour vous.
  • s'il n'y a pas de différence à ce niveau, Limo donne la priorité à la version physique.

Important : les notices d'un groupe de déduplication sont consultables avec tous les termes de recherche de toutes les notices. Les facettes montrent également les termes des différentes notices.

Il existe également une méthode dans Limo pour vérifier avec certitude si un résultat de recherche montre un groupe de déduplication ou non :

  • cliquez sur le résultat de la recherche pour que la notice soit affichée en détail dans Limo.
  • ajoutez &ShowPnx=true dans la barre d'adresse de votre navigateur à la fin de l'url.
  • vous verrez alors la notice PNX (les données 'pures' de la notice Limo).
  • dans la section control, recherchez l'étiquette isDedup. Si elle indique true, vous avez affaire à un groupe de déduplication.
Image Placeholder

Comment Limo détermine-t-il quelles notices appartiennent à des groupes FRBR ou de déduplication ?

Les deux mécanismes fonctionnent de manière similaire : les éléments de métadonnées individuels des notices sources dans Alma, Lirias, CDI, etc. (clés partielles ou partial keys) sont combinés en clés complètes (complete keys) selon des règles fixes. Ainsi, chaque notice obtient un ensemble de clés complètes qui peut ensuite être comparé aux ensembles d'autres notices. Dès qu'une des clés complètes de deux ou plusieurs notices correspond exactement, on parle d'une correspondance et les notices sont rassemblées dans un groupe FRBR ou de déduplication.

Pour le mécanisme FRBR, la construction des clés est assez simple :

  • si la notice contient une zone 100, 110 ou 111, cette zone est combinée avec le titre complet (245) pour former une clé FRBR de cette notice. Le nom de l'auteur et le titre sont simplifiés afin que, par exemple, la ponctuation n'affecte pas le formatage de la clé FRBR.
  • si la notice ne contient pas de zone 100, 110 ou 111, des clés FRBR sont créées pour toutes les combinaisons de zones 700, 710 et 711 dans la notice avec le titre complet (245). Ainsi, une notice sans zone 100, 110 ou 111 mais avec 2 zones 700 et 1 zone 710 recevra au moins 3 clés FRBR.

Pour la déduplication, la construction des clés est beaucoup plus complexe. En effet, outre les noms d'auteurs et les titres, de nombreux autres éléments de métadonnées sont inclus dans les clés de déduplication : identifiants de la zone 035, ISBN, ISSN, date de publication, éditeur. Un exemple : la clé de déduplication la plus complète fait la combinaison suivante :

  • le titre complet de la zone 245
  • l'année de publication (à partir de 008 ou si elle n'est pas complète à partir de 260 $$c ou si elle n'est pas présente à partir de 264 $$c)
  • l'éditeur (260 $$$b > 264 $$$b)
  • la pagination (300 $$$a)
  • l'auteur principal (de 100 ou 110) (si présent)

Il en résulte par exemple pour la notice 9992150769201471, après simplification du texte, la clé complète suivante : relations internationales~2014~larcier~463 p.~drain michel.

Les clés complètes dédup sont également compilées de manière différente pour les publications monographiques et sérielles (revues et articles). Ainsi, plusieurs clés complètes de déduplication sont généralement préparées pour chaque notice, et à nouveau, lorsque deux (ou plus) notices partagent une de ces clés complètes de déduplication, ces notices sont rassemblées en un seul groupe de déduplication.

Un aperçu complet de toutes les clés partielles et de la manière dont elles sont assemblées en clés complètes est disponible sur la page Web suivante : Understanding the Dedup and FRBR Processes (Primo VE).

Comment pouvez-vous avoir une idée de ce que FRBR/dedup fera avec "votre" notice ?

FRBR et la déduplication ne sont pas des "boîtes magiques". Ils traitent les données des notices (Alma) selon des principes logiques et les comparent avec d'autres notices. Il est également possible d'obtenir une vue d'ensemble dans Alma déjà sur :

  • l'ensemble des clés complètes créées pour une notice donnée.
  • la comparaison des ensembles d'une notice avec ceux d'autres notices.

Ainsi, vous pouvez trouver des réponses aux questions de savoir si "votre" notice est dans un groupe FRBR ou dédup, quels autres notices appartiennent à ce groupe et sur la base de quelles données elles ont été rassemblées/fusionnées.

L'outil que nous utilisons pour cela est l'Utilitaire de test Dedup et FRBR. Vous l'ouvrez comme suit :

  • en bas à gauche de l'écran d'Alma, cliquez sur Configuration.
  • cliquez ensuite sur Découverte dans la barre de menu de gauche.
  • dans la liste des fonctions sous Autre, cliquez sur Utilitaire de test Dedup et FRBR.

Cet outil occupe maintenant la quasi-totalité de l'écran d'Alma. En haut, vous pouvez voir que l'outil est divisé en deux onglets pour les deux façons différentes dont vous pouvez l'utiliser.

Image Placeholder

Rechercher des notices correspondantes

Ici, vous pouvez entrer le MMS ID d'une notice et voir ensuite si la notice appartient à un groupe FRBR ou à un groupe de déduplication :

  • collez le MMS ID dans la case située derrière Identifiant de la notice. Il peut s'agir du MMS ID de la notice dans la zone Réseau (se terminant par 1471) ou du MMS ID de la notice dans votre zone Institution.
  • choisissez si vous voulez rechercher les notices correspondantes selon les règles FRBR ou les principes de déduplication.
  • cliquez sur le bouton Rechercher des notices correspondantes.
  • l'outil affiche d'abord l'ensemble des clés complètes compilées pour la notice. La colonne Description, qui indique la composition de chaque clé (quels éléments de métadonnées sont inclus dans chaque clé), et la colonne Clé textuelle, qui indique ensuite la composition correcte de cette clé pour la notice recherchée, sont particulièrement intéressantes.
  • s'il existe d'autres notices qui correspondent à celle que vous recherchez, elles sont listées en bas de la page. Un bouton ... est visible derrière chaque notice. Cliquez dessus pour obtenir soit une liste des clés partagées par les deux notices (Consulter les clés mutuelles), soit le jeu de clés complet de la notice en question (Voir les clés).
Image Placeholder

Comparer des notices

Cette partie de l'outil vous permet de contraster 2 notices et de comparer les jeux de clés avec précision.

  • collez dans les 2 cases les MMS ID des 2 notices que vous souhaitez comparer. Encore une fois, les MMS ID NZ et IZ peuvent être utilisés et même mélangés.
  • cliquez sur Comparer des notices.
  • les jeux de clés des deux notices sont mis côte à côte. Les coches vertes et les croix rouges indiquent les clés complètes qui correspondent et celles qui ne correspondent pas.
Image Placeholder

Remarque : pour les nouvelles notices, vous ne pouvez utiliser cet outil qu'après que la notice ait été sauvegardée pour la première fois. Ce n'est qu'à ce moment-là que la notice est indexée dans Alma et que les éléments de métadonnées indexés sont utilisés pour construire le jeu de clés FRBR et dédup et le comparer aux jeux de clés déjà présents. Il n'est donc pas possible d'essayer, dès la création d'une notice, de savoir si celle-ci correspondra ou non à la base de données.

Comment ajuster le fonctionnement de FRBR et de la déduplication ?

Au niveau de la configuration, il existe deux façons de modifier le fonctionnement des mécanismes FRBR et de déduplication.

Premièrement, nous pouvons modifier la façon dont les jeux de clés sont construits : les clés complètes existantes peuvent être (dés)activées et il est également possible de construire de nouvelles clés complètes sur la base des clés partielles et de les ajouter au jeu de clés. La configuration prête à l'emploi de PrimoVE utilisée dans Limo a été adaptée autant que possible pour reproduire les processus FRBR et de déduplication tels qu'ils existaient dans Limo classic (basé sur Primo). Cependant, il existe encore quelques différences comme, par exemple, l'utilisation de la zone 035 comme élément clé du mécanisme de déduplication. Cet élément n'était pas utilisé dans Limo classic.

D'autres ajustements à cette configuration sont encore possibles mais doivent être considérés avec beaucoup de précaution :

  • une modification visant à obtenir un certain effet (par exemple, que certains types de notices soient dédoublés ou non) a souvent des effets secondaires indésirables sur d'autres notices.
  • une modification de la configuration n'a pas d'effet immédiat dans Limo : pour cela, les notices concernées doivent être réindexées et cela ne peut se faire que manuellement notice par notice (voir ci-dessous) ou sur requête à Ex Libris.

Deuxièmement, il est possible de définir des règles qui désactivent le mécanisme de déduplication et/ou de FRBR pour certains groupes de notices. Actuellement, ce système est utilisé de deux manières :

  • pour les notices décrivant des imprimés anciens, des manuscrits, des cartes et du matériel graphique (images), les mécanismes FRBR et de déduplication sont tous deux supprimés. Ainsi, ces notices apparaîtront toujours séparément sur une liste de résultats de recherche Limo.
  • lorsqu'un catalographe ajoute la zone 900 $$a NO DEDUP dans la notice bibliographique, le mécanisme de déduplication n'agit pas sur la notice. Le mécanisme FRBR fonctionne et la notice peut donc apparaître dans un groupe FRBR sur la liste des résultats de recherche [note : ce mécanisme ne fonctionne pas actuellement en raison de difficultés techniques. Une solution est recherchée avec Ex Libris].

Comment pouvez-vous manipuler l'impact de la déduplication et/ou de FRBR sur une notice spécifique ?

Vous remarquez parfois dans Limo que deux ou plusieurs notices sont rassemblées (ou non) par le mécanisme FRBR ou de dédup et vous vous posez des questions à ce sujet. L'utilitaire de test FRBR et Dédup vous aide à trouver des réponses et des solutions. Il est toujours préférable de travailler en trois étapes :

Analyse

Avec l'utilitaire de test, vous pouvez découvrir pourquoi deux ou plusieurs notices correspondent (ou non) et déterminer la cause : y a-t-il des erreurs ou des omissions dans les notices, le mécanisme FRBR/dédup fonctionne-t-il comme prévu/souhaité ? Tout d'abord, collectez les ID SGM des notices que vous voulez comparer (conseil : copiez-les dans le Bloc-notes, par exemple). Utilisez ensuite l'utilitaire de test pour comparer ces notices côte à côte. La fonction Comparer des notices est particulièrement utile ici. Lorsque, contre toute attente, deux notices ne correspondent pas, vous pouvez bien sûr rechercher les différences entre les jeux de clés. Lorsque deux notices correspondent de manière inattendue, vous regardez principalement les clés complètes qui correspondent (coche verte).

Sur la base de cette comparaison, vous devez juger si le regroupement par FRBR et déduplication est justifié ou non.

Le (non-)regroupement par FRBR et dédup est justifié lorsque :

  • toutes les notices bibliographiques concernées sont entièrement saisies. Accordez une attention particulière aux zones 008, 035, 020, 022, 245, 264, 300, 1XX et 7XX. Après tout, ce sont les zones utilisées par FRBR et dédup pour construire les jeux de clés.
  • les notices bibliographiques dans Alma ont été saisies correctement selon les règles. Elles ne contiennent aucune erreur (de frappe) et toutes les règles ont été appliquées. L'identification et la saisie correctes de tout auteur principal dans la zone 100/110 sont par exemple très importantes. Pour les noms d'auteurs en général (100/110/700/710), l'entrée par la sélection d'une notice d'autorité est d'une grande aide pour assurer une entrée cohérente (et donc le fonctionnement correct de FRBR/dédup).

Lorsque FRBR et dédup construisent des jeux de clés sur la base de données correctes qui fournissent ensuite des correspondances ou non, le fonctionnement de FRBR et de dédup est également considéré comme correct.

Inversement, l'intervention de FRBR et de déduplication est considérée comme non correcte lorsqu'elle est basée sur des notices incomplètes ou contenant des erreurs. On pense notamment aux documents qui contiennent si peu d'informations bibliographiques qu'il est quasi-impossible de constituer des notices bibliographiques suffisamment riches (pensons à la littérature grise avec des titres génériques, des noms d'auteurs manquants, le lieu de publication, l'année et l'éditeur...).

Dans ce dernier cas, il faut donc voir si l'on peut corriger le fonctionnement des FRBR et/ou de la déduplication en faisant des ajustements sur les notices bibliographiques.

Corriger et compléter les notices ou bloquer la déduplication

La plupart des cas de (non)-fonctionnement injustifié du FRBR et de la déduplication peuvent être résolus en mettant à jour les notices bibliographiques :

  • vérifier soigneusement la notice et corriger les erreurs.
  • ajouter les données bibliographiques manquantes si possible.
  • surtout pour les notices anciennes, il est souvent nécessaire de "mettre la notice en conformité" avec la réglementation actuelle. Cela concerne notamment la distinction d'un auteur principal dans le tag 100/110 et l'adaptation des noms d'auteurs à la forme principale de la notice d'autorité (c'est-à-dire la recherche des tags 100/110/700/710 via F3 dans le fichier d'autorité).

Attention : il n'est pas question de mettre la charrue avant les bœufs et de faire des ajustements qui vont à l'encontre de la réglementation dans le but de faire fonctionner FRBR/dédup comme nous le souhaitons/attendons. Chaque notice sera réalisée individuellement selon les règles établies. Un exemple : une ancienne édition de Consciences De leeuw van Vlaenderen ne se retrouvera pas dans un groupe FRBR avec une édition récente dont l'orthographe du titre De leeuw van Vlaanderen est légèrement différente. Mais les deux notices sont toutes deux correctement établies (le titre a été repris des deux éditions selon le principe de base take what you see) et nous considérons donc que le non-regroupement par FRBR est correct.



Dans des cas (très) exceptionnels, un catalographe peut décider de bloquer le mécanisme de déduplication pour une notice spécifique en saisissant le tag 900 $$a NO DEDUP dans cette notice. Cela sera alors principalement nécessaire dans les notices bibliographiques mentionnées ci-dessus pour les documents dont les données bibliographiques sont très limitées/génériques. De telles notices sont parfois incluses par erreur dans un groupe FRBR ou dédup. Pour que les collègues comprennent bien votre décision, ajoutez également une brève "justification" dans 900 $$b expliquant pourquoi la clé NO DEDUP était nécessaire.

Recalculer le groupement FRBR/dedup pour une notice

L'amélioration et l'ajout d'une ou plusieures notices ou même l'ajout d'une zone 900 $$a NO DEDUP n'est pas en soi suffisant pour obtenir également l'effet escompté dans Limo. En effet, les groupes FRBR et dédup sont très " persistants " et il est donc nécessaire de lancer manuellement le recalcul de ces groupes pour les notices modifiées. Pour cela aussi, nous avons besoin de l'utilitaire de test FRBR and Dedup:

  • veillez à avoir à portée de main le MMS ID d'au moins une des notices modifiées et ouvrez l'utilitaire de test.
  • collez le MMS ID sur l'onglet Rechercher des notices correspondantes dans la case appropriée et cliquez sur le bouton Recalculer groupes FRBR et de déduplication.
  • après une courte attente, le message indiquant que le travail a commencé apparaît.
  • un peu plus tard, lorsque vous refaites un test dans l'outil, vous verrez que le jeu de clés de la notice a été modifié et que la liste des notices correspondantes a également été modifiée. Si tout se passe correctement, vous verrez maintenant là (ou pas) les notices avec lesquelles la notice éditée doit (ou ne doit pas) correspondre.
  • il se peut que vous deviez attendre un peu plus longtemps pour la modification dans Limo, mais après un certain temps, cela se synchronisera également avec les résultats de l'utilitaire de test.

Résumé : conseils pour les catalographes

Pour conclure, voici quelques conseils que les catalographes peuvent utiliser pour s'assurer, lors de la mise au point de (nouvelles) notices bibliopraphiques, que FRBR et la déduplication fonctionneront correctement. La plupart d'entre eux sont explicites :

  • commencez par élaborer une notice aussi complètement que possible avant de la sauvegarder (Save) une première fois. De cette façon, l'indexation et la répartition en groupes FRBR et dédup se feront également sur la base de la notice complète. La fonction de sauvegarde automatique d'Alma assure que même le travail préliminaire n'est pas perdu.
  • il faut appliquer correctement les règles qui déterminent si un auteur principal peut être saisi en 100 ou en 110 et, dans le cas de plusieurs "candidats", comment décider qui doit être cet auteur. Après tout, la présence d'une vedette principale (une zone 1XX) pèse lourd dans les clés FRBR et de déduplication. Plus d'informations : Personnes et collectivités en 100/110 ou 700/710 ?
  • saisir les noms d'auteurs dans les zones 1XX et 7XX sous contrôle d'autorité. De cette manière, on s'assure que la même forme de nom (la forme principale de la notice d'autorité) est toujours saisie dans les notices bibliographiques. Cela aussi est bien sûr essentiel pour le bon fonctionnement de la déduplication et de FRBR. Faites-le non seulement pour les notices que vous créez sur la base d'un modèle, mais certainement aussi pour les notices que vous incluez dans Alma en important une notice d'un catalogue externe.
  • Dupliquer la notice est extrêmement utile, mais nécessite une attention particulière dans ce contexte : n'oubliez jamais d'enlever les zones 035 de la notice copiée. Autre point où les choses se gâtent parfois : n'oubliez pas d'ajuster la date de publication, non seulement dans le tag 264 $$c mais aussi dans le tag 008. Après tout, c'est cette valeur qui est principalement utilisée par dedup dans la construction des clés.
  • Particulièrement pour les bibliothèques qui travaillent avec ce qu'on appelle des notices PRECAT pour les acquisitions : des notices bibliographiques provisoires qui sont créées pour pouvoir commander une nouvelle publication via Alma. Ces notices PRECAT sont souvent incomplètes et il est donc possible que la répartition en groupes FRBR/dedup lors de la sauvegarde de cette notice préliminaire ne soit pas tout à fait correcte. Ces notices sont ensuite perfectionnées après la livraison de la nouvelle acquisition mais ces modifications de la notice Alma ne déclenchent donc pas automatiquement un nouveau calcul du classement FRBR et dédup. Il est donc recommandé de déclencher manuellement un Recalcul après la livraison : il suffit de copier le NZ MMS ID de la zone 001 et, en quelques clics, de lancer l'utilitaire de test, de coller le MMS ID et de cliquer sur le bouton Recalculer les groupes FRBR et de déduplucation.

Colophon

Dernière modification: 28.02.2023