Outils pour utilisateurs

Outils du site


Panneau latéral

dev:divers

margin/temoin

  • <l>, <lb> : rend ou ed =“margin”
  • <pb> : end ou ed =“temoin”

metadata

- pour abstract, nous avons son positionnement dans le teiHeader, mais ou est exactement (xpath) cet élément dans le texte pour le capturer ?
Chloé : D'une part il n'y a pas d'argument dans tous nos textes. On essaye mais pour les anciens bouquins il en manque. D'autre part, quand il y en a un il devrait être (!) ici : /TEI/text[1]/front[1]/argument[1], c'est à dire dans une balise <argument> juste après la fermeture </titlePage>
Est-ce que ça te va ?

- dans les metadonnées pour zotero j'ai :

  1. collection : /TEI/teiHeader[1]/fileDesc[1]/sourceDesc[1]/biblFull[1]/seriesStmt[1]/title[1]
  2. N° dans la collection : /TEI/teiHeader[1]/fileDesc[1]/sourceDesc[1]/biblFull[1]/seriesStmt[1]/title[2]/@type

- Volume - Nb de volume

  1. Édition : pour l'instant cette donnée n'est pas intégrée dans le header, je dois voir cela.

Volume et nbe de volumes sont propres aux revues. Nous nous ne proposons pour l'instant que des livres.

- dublin core

  1. Subject ?

Quel est l'équivalent précis, dans le teiHearder ?
Chloé : nulle part. C'est indispensable ?

Le nombre de pages ? : pour l'instant cette donnée n'est pas intégrée dans le header mais ça devrait être là : /TEI/teiHeader[1]/fileDesc[1]/sourceDesc[1]/biblFull[1]/extent[1]/measure[1]

pour inscrire dans le namespace : http://bibotools.googlecode.com/svn/bibo-ontology/trunk/doc/index.html ou/et Dublin Core

A priori mon header type c'est ça : http://wikinum.droz.org/index.php?page=teiheader&redirect=no

MARC-XML

MARC-XML est implanté à l'adresse : page/marcxml ( http://calvin.archicol.fr/page/marcxml)

Le fichier créé est donc relatif au portail

Il faut valider le fichier MARC-XML pour vérifier que les attributs “tag” et “code” sont les bons Et ajouter le lien openurl !!

epub [update 01-31-2015]

Pour réaliser l'epub il y a plusieurs conditions. D'abord il est nécessaire que les fichiers importés dans Zord soient sans erreurs au test “tei_all” car la création du epub plante (surtout pour les erreurs d'ID !). Les images doivent être préalablement importées et toutes présentes.

Pour la fabrication des epub il y a une réflexion à approfondir sur différents points :

1) La couverture : La non présence de couverture ne fait pas planter la création du epub. Pourtant comme aucune page html ni lien dans l'opf n'est fait pour la couverture, l'insertion à posteriori de la celle-ci va être pénible. La mise en place de couvertures automatiques devient nécessaire même si celles-ci ne sont que temporaires.
Chloé : Les couv des ePUB sont toutes prêtes : leur nomenclature est ISBN_cov.jpg. Il faut un “entrepôt” où les déposer.

2) Les métadonnées sont particulièrement bien prises en compte par l'outil “teitoepub” il reste cependant quelques soucis comme par exemple les droits (on retrouve dans les tests une licence “Creative Commons” au lieu de “© Droz”), et bien sur l'absence de l'isbn epub !

L'implantation dans Zord est terminé. Des adaptations, couverture, css, métadonnées, un peu d'XSLT sont nécessaire pour une sortie parfaite.

Chloé : Qu'est-ce que je dois faire ? Je peux te fournir les couv. Les métadonnées je vais tout vérifier. LA licence il faut systématiquement mettre un “Copyright 2014 by Librairie Droz S.A.” quant à l'ISBN ePUB je peux te fournir l'équivalence ISBNpapier/ISBNePUB. Je me demande si le mieux ne serait pas d'intégrer systématiquement cette donnée au Header ? Tu en penses quoi ?

La construction des epubs est réalisé en “background”, car la création par lot peut prendre beaucoup de temps.

Un log est réalisé (log/epubs_[date du jour].log) lors de la création des epubs pour vérifier que chaque epub à bien été réalisé et voir les raisons en cas d'échec. Ensuite un epubCheck est réalisé quand le epub à bien été créé. Les fichiers, l'epub et le check sont placés dans le dossiers “epub” :

  1. [ISBN].epub
  2. [ISBN]_check.txt

openUrl (resolver)

En reprenant la structuration que l'on trouve dans crossRef : http://help.crossref.org/using_the_open_url_resolver

On devrait avoir une URL de ce type : http://www.droz.org/openurl?id=XXXXX

Voici les différentes questions :

  1. on envoie quoi ?
    1. Le plus pertinent me semble les métadonnées sous une forme html + RDF:bibo pour zotero ou autre
    2. qu'il y aie dans ces métadonnées un lien vers le portail quand l'oeuvre est publié sur un des portails (accès à la ressource)
    3. Si il y a une information de type “page” associée alors faire une redirection automatique vers la source (citation !)
  2. La création de citations/signet sur les portails, devraient donc avoir cette structure :
    1. Forme OpenUrl :
      1. http://www.droz.org/openurl?id=9782600013086&page=18 (le système devant pouvoir faire la conversion)
    2. Redirection vers :
  3. quel type d'id ? ISBN, ISSN, DOI, ARK ? ARK étant fait pour des institutions, DOI centralisé et cher, l'ISBN est je pense largement suffisant. Cette ID n'ayant de sens que pour la citabililité, et la pérénité le DOI est efficace pour ça, mais une URL de type OpenURL c'est pas mal non plus, non ?
  4. le resolver doit être global pour Droz donc il doit être externe aux portails bien qu'intégrable dans Zord comme web service. Je préconise quand même d'en faire un système de web service complètement autonome !

TODO: Plusieurs URL lien à ajouter dans Marc-XML !!

Typo (petite)

Pour la balise <hi> j'ai trouvé de 9 valeurs différentes pour l'attribut “rend” alors que la documentation n'en compte que 4. J'ai placé à coté de chaque valeur une définition CSS, un élément HTML ou un point d'interrogation.

  1. sup → <sup>
  2. b → <b>
  3. sc → font-variant: small-caps;
  4. sub → <sub>
  5. n → ?
  6. small → font-size:0.8em;
  7. i → <i>
  8. underline → text-decoration: underline;
  9. big → font-size:1.2em;

C'est quoi “n” ? Vue par exemple dans 9782600000215 je l'ai trouvé 2066 fois dans le corpus calvin.

Chloé : Je t'avoue que je n'en sais rien et que j'ai un peu de mal à les identifier dns les textes. Tu peux me donner quelques exemples pour que je te réponde ?

9782600000215 :

<hi rend=“n”>legitis ;</hi> (2 fois dans la note 38, page 20, facs 9782600000215_p0080.pdf)

9782600000253 :

<hi rend=“n”>a se</hi> et le <hi rend=“n”>per se</hi> (page 74, facs 9782600300253_p0094.pdf)

<hi rend=“n”>Loci communes</hi> (page 109, facs 9782600300253_p0129.pdf)

"Bugs"

  • Quand je clique sur un appel de note j'arrive à la note en question mais le haut de la note est caché par la barre de navigation statique, corrigé
  • idem quand je reviens au texte depuis la note, corrigé
  • j'aime définitivement mieux une table des matières repliée en parties et chapitres, définitivement pas une bonne idée, toc replié + élément dans la toc replié, comme tu le dis cela va être laborieux
  • baisser le corps des notes de 1 ou 2 points (même si c'est un peu un “résidu” du papier,, corrigé
  • supprimer espacement entre les paragraphe. un <p> n'a pas de margin top ou bottom. Seuls les autres éléments de texte en ont. corrigé
  • j'ai un doute quant à la dimension max de <l>. On risque d'avoir des retours à la ligne fréquents comme ici : http://calvin.archicol.fr/9782600009232/front-2#Zsec_38 , p.31. Est-ce qu'il n'y a pas moyen de gérer la question des gloses autrement ? Il y en a peu quand même des gloses (quoique beaucoup dans les TLF à venir !),
  • moi, perso, je ne vois pas du tout un rapport 1/3 entre les indentations de <p> et des autres, <lg>, <quote> : j'aurais plutôt 3, 1/3 !! Et dans Chromium c'est bizarrement géré, Heu j'ai 15px et 45px, qu'on a vu ensemble ?? il faut que je voie
  • j'aimerais vraiment beaucoup des flèches “chapitre suivant” “Chapitre précédent” (sans texte, juste un infobulle), peut-être dans la barre fixe de navigation, à gauche et à droite du fil d'ariane ??!, Je me rends compet à l'usage que la tabmat repliée rend le passage à un chapitre suivant un peu laborieux.
  • il faudrait que quand je déploie la tabmat le chapitre où je suis soit hilighté, parce que franchement, comme en général mes tabmats sont très longues je ne sais pas du tout où je suis !
  • est-ce qu'on peut mettre en place le lien vers la page pdf/tif sur le <pb>, ce qui imposerait que je dépose les sources sur le serveur,
  • http://calvin.archicol.fr/9782600011693/body-1-1#Zsec_8 : <pb ed=“temoin” n=“”> renvoie à une page de manuscrit témoin. Le problème c'est que selon que ces <pb> sont dans un titre ou un autre élément ils prennent la forme de cet élément. Chez Algone ils étaient envoyés dans la marge comme tous les <pb> avec pour résultat que les uns s'empilent sur les autres. Est-ce qu'on les envoie en marge de gauche ? Avec une marque type | qui se met à la place dans le texte, comme sur le papier ? Ou sans marque dans le texte puisque l'on a accès au PDF pour le détail ?
  • Registres du consistoire de Genève : comment Algone a-t-il distingué les textes traités en <p> mais qui auraient dû être traités en ??? comme “La Claude, veufve de feu André, d’Hatena” http://e-librairie.droz.org/calvin/9782600011693/body-1-1#body-1-1-1 pour les distinguer des simples <p>. Quand les marges top et bottom des <p> seront à 0 on ne distinguera plus rien ! Ils ont mis des <br class=“lb”/> avant et après !! Quel taf !!! Non, c'est bon, en fait il y a des <lb> dans le XML, posés par Ligaran.
  • la css sur les tables ne passe pas, par exemple ici : http://calvin.archicol.fr/9782600002967/front-2#Zsec_66 Pourquoi ? Voir aussi dans les 3 bibliographies corrigé.
  • Attention CSS éditions témoin, un peu trop proches des n° de ligne : voir ici : http://calvin.archicol.fr/9782600003681/body-1-2#Zsec_190
  • Il manque les “dates” dans le tableau nouveautés. corrigé
  • il faudrait que les nouveautés soient classées par ordre alphabétique auteur. Les sans auteur en haut.
  • il faudrait que j'ai les accès pour déposer les images. par FTP sur le serveur Droz
  • Je n'ai pas compris où sortent les ePUB ??!! par FTP sur le serveur Droz
  • faire en sorte, que quand on se connecte on revient ensuite à la page où on était. Par exemple si je voulais aller sur un livre je me connecte et je reviens sur ce livre.
  • Comment les titres sont-ils triés par défaut dans le tableau de la page “recherche” ? On dirait que ce n'est pas la même chose que sur la page d'accueil. Oui ce n'est pas la même chose c'est la frieze qui génère le tableau uniquement par date il n'y a pas ici de catégorie, j'avoue ne pas savoir quoi faire
  • quid de la recherche transversale sur plusieurs portails ?? Non ce n'est pas implanté il faut le mettre en place ?
  • j'ai besoin d'une nouvelle catégorie dans le Calvin : operaomnia. Merci ! OK c'est fait il me faudrait un libélé pour l'instant c'est “operaomnia”
  • question des données pour la citation : ok. Faire simplement la mise à jour.
  • Problème dans la recherche : si je fais “De là vient l’horreur” je trouve 1 résultat mais quand je tente d'aller le consulter sur la page j'ai tous les “de” les “là” les…
  • les <pb ed=“temoin” n=“[1541 p. 3 ; 1551 s. §. 4.]”/> ne s'affichent pas en marge dans les Calvini Opera.
  • il faut absolument une gestion des imports par portail. Actuellement si je fais “sélectionner tout” pour supprimer tous les Calvin je sélectionne en fait les fichiers de tous les portails. Et puis il n'y a aucun ordre précis de classement des sources, est-ce qu'on pourrait envisager de les classer par date de publication Droz par exemple ?
  • mettre un retrait beaucoup plus important pour les “retours de vers”, avec le crochet en SVG. Dautre part ce crochet s'affiche mal dans FireFox et Chromium, il est coupé à moitié ici et là par exemple : http://thr.archicol.fr/9782600012126/body-9#Zsec_18 http://thr.archicol.fr/9782600012126/body-8#Zsec_16
  • Attention à la css des vers, cela génère trop de retours avec crochets ! Voir ici : http://thr.archicol.fr/9782600012126/body-9#Zsec_18 Faire un div plus large ?
  • mettre à jour les portail THR et TLF avec les ajouts du Calvin (page Accueil, css…).
  • La phrase à mettre à la place de “Ajouter les parties index et bibliographie” est “Inclure les index, bibliographies et glossaires”
  • Quelque chose ajoute une espace à la fin des appels de note dans le texte. Du coup on a une espace et ensuite un point ou une virgule qui du coup se retrouve parfois en bout de ligne suivante. Est-ce qu'on peut supprimer cette espace ?
  • tu verras ici un livre comprenant le facsimlé d'un livre ancien : http://thr.archicol.fr/9782600001717/body-5#Zsec_10 est-ce qu'il y aurait moyen d'intégrer pour ça ta liseuse ? Ce qui serait élégant c'est qu'elle s'ouvre dans une popup qui prend toute la hauteur de l'écran avec des flèches droite/gauche et peut-être la liste des images disponibles. J'ai le même genre de besoin ici ; http://thr.archicol.fr/9782600030618/back-5#Zsec_26 c'est pas un facsimilé mais un grand nombre d'illustrations à la suite, genre “cahier d'illustrations”.
  • insérer un bouton “Citer”, “Coquille” et un switch “Droz/Flux”
  • j'ai ajouté comme attribut aux dates de création “from” et “to”, à traiter comme notAfter et notBefore. exemple ici : http://thr.archicol.fr/9782600031554
  • Est-ce que tu peux exclure par défaut tous les <div type=“toc”> de la recherche ? stp.
  • Prendre en compte les attributs rows (rowspan) et cols (colspan) dans <table>
  • Dans Zord-dev les <div type Part> ne se déroulent pas dans le menu de gauche : exemple : http://zord_dev.droz.org/9782600317627/
  • et ici les sections ne s'affichent pas sous les titres de chapitre dans le menu de gauche : http://zord_dev.droz.org/9782600305587
  • création utilisateur IP. Demande un mot de passe !!
  • http://calvin.droz.org/9782600019842/body-2-1#letter_1891 doublonnement des lettres ! C'est aussi le cas ici : http://textes-litteraires-francais.droz.org/9782600024655/body-1-1#Zsec_8 Je croyais qu'on avait déjà corrigé ça ?
  • Quand on est pas en admin les tableaux ne passent pas, le texte s'affiche tout à la ligne !! voir ici : http://calvin.droz.org/9782600000130/body-6#Zsec_18 et là http://humanisme-renaissance.droz.org/9782600012065/body-2#Zsec_4 (page 43, 44 et suivantes)
  • en mode user les liens des index vers les pages, en gros toutes les références, ne passent plus: voir ici : http://humanisme-renaissance.droz.org/9782600012324/back-4#Zsec_22
  • dans les tableaux de titres en page d'accueil, quand il y a uniquement un nom, sans Prénom (genre Fénelon, Voltaire, Lafayette, Marguerite de Navarre) on a une virgule après ce Nom. Il faudrait qu'il n'y en ait pas.
  • bouton “connexion” a disparu !!

Rechercher dans ce livre

Prenons le http://humanisme-renaissance.droz.org/9782600030618/
Je fais une recherche dans ce livre avec Isagoge
La page de résultats me dit :
“Vous faites une recherche dans le livre : undefined”
À la place de Undefined on devrait avoir la référence biblio telle que dans le style Harvard.
La page me dit “Aucun résultat” parce que par défaut j'arrive sur l'onglet Humanisme alors que ce livre se trouve dans l'onglet “Réforme et Réformation”.
Dans cet onglet j'ai bien comme résultat : 64 occurrences.
Quand on fait une “recherche dans ce livre” on ne devrait plus avoir les onglets dans la page de résultat, ou arriver d'emblée sur l'onglet du livre et les occurrences trouvées…

Voilà. Merci. Bises.

Nettoyage du code

Les listes : en particulier Index et Biblio : on atoujours la forme <iten><p>…</p></item>. L'idéal serait de retirer ces <p> qui créent des retours à la ligne.

CSS

CSS type Dictionnaire

Voir ici : http://humanisme-renaissance.droz.org/9782600005074/body-1#Zsec_10

<entry>
  <dictScrap><orth><hi rend="b">ABAQUE</hi></orth>
  <sense>ATTRIBUT DE L’ARITHMÉTIQUE, un des sept arts libéraux.</sense>
  <etym>
     <label><emph>ART.</emph></label>
Sur le frontispice de la <emph>Margarita philosophica</emph> de Reisch, Strasbourg, 1504 (Marle, II, fig. 268). Sur une plaquette allemande de 1554 au Musée de Nuremberg (Marle, II, fig. 269).
  </etym>
  </dictScrap>
</entry>

Dans les entrées suivantes on a <sens n=”“>

Titres courants

Images dans le flux du texte, inline

http://wikiportails.droz.org/doku.php?id=tlf#navigation_tlf

Attention dans les calvin on retrouve l'élément <textClass> et cela rentre en conflit avec la categorie indiqué dans <seriesStmt> ! C'est soit l'un soit l'autre et il faut que le <textClass> soit bien rédigé ce qui n'est pas le cas dans les calvin !!

Autre point important, il faut une catégorie générale (un peu comme genre pour les tlf) qui soit unique, car elle correspond au différents onglets ! Donc il y a un problème avec les calvin car avec la catégorie “thr” on a à la fois des titres dans “sources” et “études” !

Détail sur le code à finaliser et figer

livres références

- 9782600009232, 9782600031660, 9782600002967

Actions

  • création epub (qualité TEI, css+xslt… + cron ) ~5
    • création de 3 titre OK
    • page à ajouter 2
  • onglets de genre calvin « Opera quae supersunt omnia » mise en stand-by (class calvin fnc sortBooks + lib/view/public/calvin/start_books.php rédiger 2 fichiers ) OK
  • recherche ensemble des filtres et présentation en onglet 0
    • passage source / nosource même si il y a une date OK
    • exlusion index/biblio… à tester corriger 1
  • exclure <div type=“toc”> de la recherche OK
  • vis-à-vis sur titre 1
  • test sur les différents mode de recherche ~* Or AND etc 1
  • bulles d'aides
    • Aide à la recherche (lien gris sous la loupe) OK
  • validation schéma Marc-XML avec lien openURL OK Valider avec exemple
    • ajouter la barre de menu sur la page MarcXML OK
  • test navigateur uniquement admin OK déterminer les navigateurs+test
  • css responsive (main + tei) 800×600 bascule 1135px OK
  • css print OK
  • pages présentation, abonnement, contact et aide OK manque traduction
    • email pas en texte OK

Onglets et catégories

3 onglets :

  • SOURCES
    • bezecorr
    • calvinomnia
    • calvinopuscules
    • regconseil
    • regconsistoire
    • regpasteurs
    • tlf
  • ÉTUDES
    • thr
    • varia
    • calvin
  • BIBLIOGRAPHIES
    • bibcalvin
  • calviniopera_19

Temps estimé 28h ; Release 1 le 24 JUIN 2015

Catégories TLF

Petite réflexion indispensable pour la navigation dans les TLF (et potentiellement dans tous les portails à terme)

Nous avons deux types de données dans le <header> pour les classer ou définir des facettes de tri :

1- /TEI/teiHeader[1]/fileDesc[1]/seriesStmt[1]

Où l'on indique jusqu'ici la catégorie, type <seriesStmt xml:id=“theatre”> <title/> </seriesStmt>

2- /TEI/teiHeader[1]/profileDesc[1]/textClass[1]

Où l'on met les mots-clefs BISAC, CLIL et Cie.

Il y a deux questions :

  • quelles données prendre pour le classement en onglets sur la page d'accueil et dans la recherche ?
  • quelles données utiliser en aval pour les facettes de tri ?

Je propose que l'on continue à indiquer la catégorie disons “primaire” dans /TEI/teiHeader[1]/fileDesc[1]/seriesStmt[1]
c'est-à-dire pour les TLF :

  • theatre
  • poesieMaria: peut-être que “vers” serait mieux dans la mesure où dans cette catégorie il y aurait également des romans en vers, que l'on ne considère pas tout à fait comme de la poésie?
  • prose
  • correspondance

ensuite on a parmi les autres données un heureux mélange qu'il faudrait trier en différentes facettes :

  • Courant Littéraire
  • Période
  • Thème

À nous, Maria et moi, de les classer, à partie de notre liste complète BISAC+CLIL, et de donner à David quels codes correspondent à quelle facette.

dev/divers.txt · Dernière modification: 2019/02/15 13:38 (modification externe)