A "refNum" file describes the technical and descriptive metadata associated with a digitized document.
Un fichier refNum décrit les métadonnées techniques et descriptives associées à un document numérisé.
Un fichier refNum décrit les données descriptives et techniques associées à un document numérisé. La production de ce document s'incrit dans le cadre des marchés de numérisation passés entre la BnF et un prestataire de services.
L'élément "document" contient trois types de données :
- "bibliographie" pour les données descriptives;
- "production" pour les données techniques de production;
- "structure" pour l'organisation des données produites.
Cet élément comprend l'attribut "identifiant" qui est un identifiant unique affecté par la BnF à chaque document numérisé.
L'élément "bibliographie" contient des données issues du catalogage bibliographique. Elles sont fournies par la BnF.
L'élément "dateNumérisation" contient la dernière date de numérisation du document. Dans le cas d'ajout ou de correction, il doit être mis à jour.
L'élément "nombreVueObjet" contient le nombre total de pages ou d'objets d'un lot. Il correspond au nombre d'éléments "vueObjet".
L'élément "nombreImages" contient le nombre exact d'images numérisées. Il correspond au nombre d'éléments "image".
L'élément "identifiantSupport" contient un identifiant unique affecté par le producteur. Certains documents ne peuvent être enregistré sur un seul support. Dans ce cas, l'attribut "ordre" permet de déterminer l'enchainement des supports.
Cet élément décrit les objets associés au document. Un objet associé est un fichier (par exemple résultat OCR : ALTO ou saisie de table des matières TDM) lié au document principal sans lequel il ne peut être pertinent.
Cet élément permet de décrire l'historique des traitements qui ont touché le document numérique.
Cet élément permet d'identifier l'agent auteur de l'opération: atelier interne ou prestataire.
Cet élément permet d'identifier l'agent qui a permis/autoriser l'opération , généralement il s'agit d'un agent interne BnF.
Cet élément permet de décrire le contenu des opérations. La granularité de description la plus fine est requise.
Cet élément décrit les objets proposés en entrée de l'opération décrite. La date indiquée est la date de début de l'opération.
Cet élément décrit l'opération elle-même.
Cet élément décrit le résultat obtenu après exécution de l'opération sur les objets présentés en entrée. La date indiquée est la date de fin de l'opération.
L'élément "commentaire" contient des indications fournies par les différents intervenants de la chaîne de production. Chaque "commentaire" doit être daté afin de permettre de conserver l'historique. L'élément "commentaire" doit être associé à l'élément auquel il se réfère. Les valeurs de l'attribut "type" sont définies de la manière suivante :
- INSTNUM pour les commentaires qui concernent les instructions particulières de traitement.
- REJPREST pour les commentaires qui concernent les motivations d'un rejet avant numérisation par le producteur.
- PRODUCT pour les commentaires qui concernent des indications liées à la production du document
- CONTROL pour les commentaires sur les motivations de rejet effectué par le contrôle qualité BnF.
- USAGER pour les commentaires à destination de l'usager du document.
L'élément "vueObjet" est généralement défini par la structure physique de l'original à numériser.
L'attribut "ordre" permet d'identifier l'enchainement des vueObjets.
L'attribut "numeroPage" contient le numero de la page quand il existe. Ce numero peut être une foliotation.
L'attribut "typePagination" contient N pour les vueObjet non paginées, A pour les chiffres arabes, R pour les chiffres romains, F pour la foliotation ou X pour les autres cas.
L'attribut "typePage" contient N pour les VueObjets sans type particulier, P pour les vueObjets contenant les pages de titre, T pour les vueObjets contenant la table des matières, I pour les vueObjets contenant un index, L pour les vueObjets contenant un logo, E pour les vueObjets contenant la première page à afficher, A pour les publicités et catalogues d'éditeurs, R pour les index et tables des matières sans renvoi vers des numéros de page, D pour les dessins ou illustrations, C pour tous les éléments de couverture et de couvrure, Y pour les pages d’index déqualifiées, Z pour les pages de table des matières déqualifiées.
Permet de signaler la présence d'extraits de document numérique. Pour un document audiovisuel, il s'agira d'un extrait de quelques secondes par plage audio; pour un document texte, il s'agira d'un extrait du résultat d'océrisation
Conteneur pour les commentaires et différents formats de paramétres descriptifs des opérations.
Groupe de texte ou d'image ou audio ou vidéo
Cet élément décrit les données et les références des fichiers résultat de transcription d'un texte en mode texte structuré.
Il s'agit d'un fichier au format XML, HTML ou XHTML.
L'attribut nomTexte contient le nom du fichier texte structuré. Il est unique pour le document.
L'attribut typeFichier contient le type de fichier (format XML, HTML ou XHTML).
L'attribut supportOrigine contient le type de support qui a été numérisé.
L'attribut traitement contient des informations sur le type de traitement effectué : AUTO pour automatique (OCR par exemple) , MANU pour manuelle (videocodage par exemple) ou COMPLEXE pour caractériser les traitements nécessitant des lignes de prix autres.
L'élément image contient les données de l'image numérisée.
L'attribut nomImage contient le nom du fichier image numérisée. Il est unique pour le document.
L'attribut typeFichier contient le type de fichier (JPEG, JP2 ou TIFF).
L'attribut supportOrigin contient le type de support qui a été numérisé.
L'attribut traitement contient des informations sur le type de traitement effectué : AUTO pour automatique, MANU pour manuelle ou COMPLEXE pour caractériser les traitements nécessitant des lignes de prix autres.
L'attribut cadrage contient des informations sur le champ effectif de numérisation.
L'élément" legende" contient la légende de l'image. Il n'est généralement utilisé que dans la cadre des lots d'images.
L'élément audio contient les données de son numérisé.
L'attribut nomAudio contient le nom du fichier son numérisé. Il est unique pour le document.
L'attribut typeFichier contient le type de fichier (MP3 ou WAV).
L'attribut traitement contient des informations sur le type de traitement effectué : AUTO pour automatique, MANU pour manuelle, ou COMPLEXE pour caractériser les traitements nécessitant des lignes de prix autres.
L'élément video contient les données de vidéo numérisée.
L'attribut nomVideo contient le nom du fichier vidéo numérisé. Il est unique pour le document.
L'attribut typeFichier contient le type de fichier (MP4).
L'attribut traitement contient des informations sur le type de traitement effectué : AUTO pour automatique, MANU pour manuelle,
ou COMPLEXE pour caractériser les traitements nécessitant des lignes de prix autres.
Ancienne valeur laissée pour compatibilité, utiliser de préférence "PV DT NEG".
Fichier vidéo numérisée
L'élément "genre" contient :
- "MULTIMEDIA" pour les documents multimédias (sonores, images, ...)
- "MONOGRAPHIE" pour les imprimés qui ne sont pas des périodiques. Il inclut les monographie en plusieurs volumes
- "PERIODIQUE"
- "LOT" pour les lots d'images qui ne sont ni des monographies ni des périodiques.
L'élément "titre" contient le titre du document, éventuellement constitué de plusieurs niveaux : titre, sous-titre, etc. séparés par des point-virgules.
L'élément "auteur" contient un ou plusieurs auteurs séparés par des point-virgules.
L'élément "description" contient un descriptif succint du lot ou de la collection.
L' élément "editeur" n'est généralement pas utilisé dans le cas des lots.
L'élément "dateEdition" n'est généralement pas utilisé dans le cas des lots.
L'élément "type" contient le niveau de découpage tel que volume, tome ou fascicule.
L'élement "valeur" indique la séquence.
L'élément "nombrePages" a une valeur issue du catalogage bibliographique. Il prend généralement la valeur "sans objet" dans le cas des lots.
L'élément référence contient des éléments d'identification bibliographique, par exemple identification pérenne de la notice bibliographique. Le typage permet d'envisager plusieurs références de divers types :
* CADRECLASSEMENTDEWEY définit un regroupement thématique sur 3 chiffres basé sur la cote DEWEY.
* CODEBARREPROVENANCE définit l'objet utilisé pour produire le document numérique et le découpage de cet objet.
* COTEORIGINAL définit la cote de l'original.
* NOTICEBIBLIOGRAPHIQUE définit l'identifiant ARK de la notice bibliographique correspondant au document numérique.
* CODEBARREBNF définit = à rédiger.
* IDDOCUMENT définit l= à rédiger
* COTEOBJETREPRODUIT définit l= à rédiger
* SOURCE permet de définir l'exemplaire qui a permis la numérisation, en particulier l'établissement