Questions, conseils

Bonjour,

tout d’abord:
-je viens d’adhérer à cette liste
-je suis mathématicien retraité (auparavant: à l’Institut Camille
Jordan, Lyon): j’ai donc une certaine habitude de LaTeX.

A Lyon, nous avons l’Académie des Sciences, Arts et Belles-Lettres:

dont j’ai réalisé le site web (django).

Cette académie de province édite chaque année des Mémoires qui publient
entre autres les résumés des conférences qui y sont données. Ces
mémoires étaient fabriqués chaque année par une académicienne qui se
considère comme atteinte par la limite d’age. Elle utilisait Indesign.

Je récupère ça et il est hors de question que j’utilise Indesign pas
plus que l’un quelconque de ses clones libres.

Donc: LaTeX.

Le workflow, comme on dit, tel que j’ai commencé à l’implanter:

-1) les conférenciers envoient des .docx ou des .odt: ça, on n’y peut rien.
-2) pandoc, avec un template un peu sophistiqué transforme ces fichiers
en .tex
-3) Je modifie les fichiers LaTeX à l’aide d’un script python (plein
d’expressions régulières)
-4) J’assemble le tout.

Questions: qu’en pensez-vous ? ce genre de chose a peut être été fait
par d’autres, autrement ?

Questions et remarques subsidiaires:

  • format obligatoire : B5.
  • texte en 9pt obligatoire: j’utilise
    \usepackage[fontsize=9]{fontsize}
    est-ce raisonnable ?
  • je pense utiliser la classe smfbook; Une autre suggestion ?

Un exemple de Mémoire tel qu’il est réalisé avec Indesign:

https://academie-sbla-lyon.fr/media/Documents/MEMOIRE/texte/Mémoires_16_2016_Texte_complet.pdf

voir par exemple la page 203 et les suivantes.

Désolé d’être long…

Merci d’avance
Thierry Dumont

Bonjour, je crois que vous avez fait tous les bons choix.
Et que nombre de personnes ici seraient gourmandes de vos scripts.
Notamment le passage docx vers .tex, qui est toujours une plaie.
Pour ma part, j’arrive à forcer les littéraires qui publient de gros
livres structurés à basculer sur LaTeX.

Bien cordialement
Eric

Bonjour,

Pour éviter l’étape 3, il serait possible de modifier la conversion de
Pandoc vers LaTeX en utilisant un « custom writer »
(Pandoc - Creating Custom Pandoc Writers in Lua). Ce serait plus robuste que
d’utiliser des expressions régulières, d’abord à cause des difficultés
inhérentes auxdites expressions, ensuite et surtout parce que l’export
de Pandoc vers LaTeX est modifié de temps en temps (j’ai par exemple dû
faire face pendant ma thèse à une transition de Polyglossia vers Babel
qui a affecté mes réglages personnalisés liées aux langues).

Bien à vous,

Bastien Dumont

Bonjour Thierry et bienvenue sur cette liste,

Questions et remarques subsidiaires:

  • format obligatoire : B5.
  • texte en 9pt obligatoire: j’utilise
    \usepackage[fontsize=9]{fontsize}
    est-ce raisonnable ?
  • je pense utiliser la classe smfbook; Une autre suggestion ?

Je réagis juste sur le choix de smfbook : cette classe est ancienne,
plus vraiment maintenue (dernière mise-à-jour en 2021…) et surtout
probablement incompatible avec le « tagging » des PDF (elle n’est même pas
mentionnée dans la liste de référence
https://latex3.github.io/tagging-project/).

Pour des documents pérennes comme ceux que tu envisages de produire, il
me semble que la compatibilité « tagging » s’impose et dans ce cas il n’y
pour le moment pas beaucoup de choix en matière de classes compatibles
(voir https://latex3.github.io/tagging-project/tagging-status/#classes),
en gros il reste book.cls (même amsbook, memoir, scrbook, ne le sont
pas…). En plus, l’équipe LaTeX3 conseille vivement la compilation en
lualatex plutôt que pdflatex (xelatex est définitivement hors jeu).

J’ai toujours pensé que les classes standard, book, report, article,
étaient rigides et mal conçues mais il faut savoir que ce n’est plus le
cas : l’équipe LaTeX3 les a complètement revues pour les adapter aux
nouveaux « templates » développés pour le « tagging ». J’attends la sortie
imminente du format Latex-2026-06-01 pour mettre sur CTAN une version de
babel-french compatible avec ces nouveaux « templates ».

Je suggère donc book.cls + amsmath.sty (ou mathtools.sty) plutôt que
smfbook.cls et lualatex plutôt que pdflatex.

Bien cordialement,

Daniel Flipo

Bonjour, Thierry,

Bienvenue sur cette liste, et merci pour ce partage d’expérience.

J’utilise une méthode similaire à la vôtre, mais avec Writer2LaTeX et
LibreOffice plutôt que Pandoc, et un script Bash plutôt que Python, avec
la classe Memoir.

Aux dernières nouvelles, Pandoc ne gère toujours pas l’export des
renvois internes (cross-references) lors de la conversion ODT/DOCX en
LaTeX, mais il est possible que les dernières versions le fassent enfin
(utilisant la version Debian, je l’ignore). Pour ma part, en tout cas,
je recours à Writer2LaTeX en ligne de commande, qui le fait très bien.
Cependant, cela suppose une copie ODT/DOCX propre, idéalement sans mise
en forme manuelle au profit des styles de caractère et de paragraphe —
faute de quoi les résultats peuvent être désagréablement surprenants. En
pratique, vu le manque de rigueur des auteurs, un travail de préparation
de copie et de stylage est toujours indispensable.
Je trouve sinon que la personnalisation des gabarits pour l’export est
très simple avec Writer2LaTeX (du banal XML).

Dans le mémoire que vous nous soumettez, je relève en tout cas divers
problèmes d’orthotypo — apostrophe dactylo en première de couverture,
capitalisation souvent hétérodoxe —, et surtout de composition
typographique : veuves et orphelines traitées à la truelle, pas de tenue
du registre après les titres, exposants bricolés plutôt que
l’utilisation de lettres et chiffres supérieurs… Page 207, on a un
« de » en bleu — le genre de surprise que j’évoquais lors de l’export en
LaTeX de copies pas très propres. Les séquences composées en capitales
ne sont pas interlettrées. Il manque des espaces insécables
obligatoires, avec comme résultat par exemple un titre de civilité
esseulé en fin de ligne, ou une date maladroitement tronçonnée. Idem
pour les traits d’union insécables attendus : dans la mesure du
possible, on évite de couper un intervalle de dates, par exemple. Il y a
aussi beaucoup de lignes à voleur (dernière ligne d’alinéa très courte)
et de fins de ligne désagréables (du style « . Le », « . Il »). On ne
peut pas toujours empêcher de tels défauts sans sacrifier le gris
typographique, mais ici la justification est très longue (autour de
90 signes par ligne), si bien que l’on devrait pouvoir les éviter
presque toujours — très simple à faire avec des regex (avant comme après
l’export, encore que la présence de commandes LaTeX puisse faire échouer
les regex).

J’imagine que je parle un peu chinois…

À toutes fins utiles, je précise que ma société de services d’édition Du
cœur à l’ouvrage propose un service de relecture et de stylage de
documents, en plus de mise en page. C’est moi-même qui assure la mise en
page : cependant, ma spécialité sont les romans, les essais et le
théâtre ; je ne suis pas très à l’aise avec les documents comprenant
figures, tableaux et bibliographies. Mais je pourrais au moins vous
apporter quelques conseils et recommandations, voire partager mes
fichiers de configuration (Writer2LaTeX, lua-typo) et scripts si vous
êtes intéressé.

Cordialement,

Thomas Savary

Bonjour,

Je rebondis en essayant de ne pas dériver des intérêts de l’auteur du
message initial.

Thomas Savary writes:

Aux dernières nouvelles, Pandoc ne gère toujours pas l’export des
renvois internes (cross-references) lors de la conversion ODT/DOCX en
LaTeX, mais il est possible que les dernières versions le fassent enfin
(utilisant la version Debian, je l’ignore).

En effet, et il est extrêmement improbable qu’il le fasse jamais, étant
donné que cela ne ferait sens que pour les formats paginés. Pandoc a
uniquement le concept de liens. Il faut bien lire le manuel pour
comprendre quel est le modèle de document utilisé par Pandoc et, par
conséquent, ce dont il ne tient pas compte.

Pour ma part, en tout cas, je recours à Writer2LaTeX en ligne de
commande, qui le fait très bien. Cependant, cela suppose une copie
ODT/DOCX propre, idéalement sans mise en forme manuelle au profit des
styles de caractère et de paragraphe — faute de quoi les résultats
peuvent être désagréablement surprenants. En pratique, vu le manque de
rigueur des auteurs, un travail de préparation de copie et de stylage
est toujours indispensable. Je trouve sinon que la personnalisation
des gabarits pour l’export est très simple avec Writer2LaTeX (du banal
XML).

Merci pour ce retour !

Dans le mémoire que vous nous soumettez, je relève en tout cas divers
problèmes d’orthotypo […] exposants bricolés plutôt que l’utilisation
de lettres et chiffres supérieurs…

Est-ce que vous pourriez développer sur ce point ? J’ai fait quelques
recherches dernièrement sur cette histoire de caractères exposants
Unicode et en suis arrivé à la conclusion inverse : que ces caractères
sont prévus pour des usages et des sémantiques bien précis
(principalement pour la phonétique) et que les utiliser pour des
expression comme « 2ᵉ étage » est un détournement de leur vocation
initiale, justifiable surtout dans du texte brut1. De plus, ils ne
sont pas toujours très gracieux, surtout quand on les met à la suite
comme dans « 1ᵉʳ », et les fontes ne les ont pas toujours tous : tout
dépend des domaines auxquels elles sont destinées.

En vous souhaitant une bonne journée,

Bastien Dumont

Le 26/05/2026 à 07:33, Thomas Savary a écrit :

Bonjour, Thierry,

Bienvenue sur cette liste, et merci pour ce partage d’expérience.

J’utilise une méthode similaire à la vôtre, mais avec Writer2LaTeX et
LibreOffice plutôt que Pandoc, et un script Bash plutôt que Python, avec
la classe Memoir.

Aux dernières nouvelles, Pandoc ne gère toujours pas l’export des
renvois internes (cross-references) lors de la conversion ODT/DOCX en
LaTeX, mais il est possible que les dernières versions le fassent enfin
(utilisant la version Debian, je l’ignore).
Bonjour,
Merci pour tous vos conseils.
Je suis en Debian TESTING et j’ai:
$ pandoc -v
pandoc 3.9.0.2

Pour ma part, en tout cas,

je recours à Writer2LaTeX en ligne de commande, qui le fait très bien.
Cependant, cela suppose une copie ODT/DOCX propre, idéalement sans mise
en forme manuelle au profit des styles de caractère et de paragraphe —
faute de quoi les résultats peuvent être désagréablement surprenants. En
pratique, vu le manque de rigueur des auteurs, un travail de préparation
de copie et de stylage est toujours indispensable.
Je trouve sinon que la personnalisation des gabarits pour l’export est
très simple avec Writer2LaTeX (du banal XML).
Le problème est bien là « cela suppose une copie ODT/DOCX propre » et
ça… c’est du domaine du rève. Je vais essayer Writer2LaTeX.

Actuellement, les problèmes que je rencontre sont déjà de deux sortes:

  1. les illustrations quand il y en a demandent une intervention au
    niveau du LaTeX engendré, intervention plus ou moins lourde
  2. des problèmes de typos dans les DOCX/ODT. Un exemple (on a pas mal
    d’historiens): dix huitième codé XVIII° , XVIIIème, XVIIIe etc. Là mes
    scripts python font leur travail, mais c’est fou ce qu’il y a comme
    erreurs comme ça/

Dans le mémoire que vous nous soumettez, je relève en tout cas divers
problèmes d’orthotypo — apostrophe dactylo en première de couverture,
capitalisation souvent hétérodoxe —, et surtout de composition
typographique : veuves et orphelines traitées à la truelle, pas de tenue
du registre après les titres, exposants bricolés plutôt que
l’utilisation de lettres et chiffres supérieurs… Page 207, on a un
« de » en bleu — le genre de surprise que j’évoquais lors de l’export en
LaTeX de copies pas très propres. Les séquences composées en capitales
ne sont pas interlettrées. Il manque des espaces insécables
obligatoires, avec comme résultat par exemple un titre de civilité
esseulé en fin de ligne, ou une date maladroitement tronçonnée. Idem
pour les traits d’union insécables attendus : dans la mesure du
possible, on évite de couper un intervalle de dates, par exemple. Il y a
aussi beaucoup de lignes à voleur (dernière ligne d’alinéa très courte)
et de fins de ligne désagréables (du style « . Le », « . Il »). On ne
peut pas toujours empêcher de tels défauts sans sacrifier le gris
typographique, mais ici la justification est très longue (autour de
90 signes par ligne), si bien que l’on devrait pouvoir les éviter
presque toujours — très simple à faire avec des regex (avant comme après
l’export, encore que la présence de commandes LaTeX puisse faire échouer
les regex).

Mhh, oui. Je n’avais pas repéré tout ça, même si je trouve l’ensemble
plutôt laid à commencer par la couverture. Et puis times comme police,
je n’aime pas.

J’imagine que je parle un peu chinois…

Pas grave, je parle chinois :slight_smile:

Merci beaucoup et peut-être bien à suivre.
t.d.

Bonjour,

Mercredi 27, serai-je le dernier à poster sur la liste ? :slight_smile:

Si Pandoc en effet devait ne jamais gérer l’export des renvois internes,
c’est une raison de lui préférer Writer2LaTeX, au moins pour les textes
susceptibles d’en contenir (et souvent beaucoup). Une autre raison est
la facilité avec laquelle on peut associer des commandes ou des
environnements personnels à des styles courants ou personnalisés de
LibreOffice Writer, grâce à une configuration en XML.

Au sujet des lettres et chiffres supérieurs, vous avez à la fois raison
et tort. Il est exact que la table Unicode comprend un ensemble de
caractères représentés par des glyphes correspondant aux lettres
supérieures, notamment, en effet, dans le cadre de l’alphabet phonétique
international. Si ainsi l’on souhaite composer l’abréviation de
« numéro » dans un courriel ou un formulaire Web, on n’a pas d’autre
choix que de détourner de son usage le caractère U+1D52 MODIFIER LETTER
SMALL O afin d’obtenir « nᵒ ». Dans un logiciel de PAO, il en va tout
autrement. Le caractère utilisé est bien « o » — pour ne pas offenser
sainte Unicode —, mais sa représentation graphique sera le glyphe du
« o » supérieur : vous l’aurez compris, la distinction entre caractère
et glyphe, en typographie numérique, est comparable à celle entre nombre
entier naturel inférieur à 10 et chiffre.

Pour obtenir ce résultat en LaTeX, il faut utiliser l’extension
realscripts. Si vous utilisez babel-french, il convient de l’appeler
avant babel. Il faut encore, bien sûr, que la police utilisée comprenne
les glyphes nécessaires — si tel n’était pas le cas, lettres ou chiffres
supérieurs pourront continuer d’être bricolés comme le fait hélas LaTeX
par défaut, à l’instar des traitements de texte mal maîtrisés, avec pour
résultat des signes trop maigres et pas toujours bien positionnés. Même
Writer permet d’utiliser les glyphes supérieurs, lorsqu’ils sont
disponibles, en recourant aux fonctions OpenType (+sups), il me
semblerait déshonorant de ne pas les afficher en LaTeX — mais aussi avec
InDesign, comme je le vois très souvent dans les livres publiés en France.

Ainsi, avec realscripts et babel-french, « M\up{gr} » ou « M\up{e}
composera correctement les abréviations de « Monseigneur » ou
« Maître ». Avec Writer2LaTeX, à partir d’un document correctement
stylé, on peut obtenir directement ce résultat en convertissant le
fichier ODT.

Cordialement,

Thomas Savary

Il faudrait bien que je me renseigne sur ces histoires de tagging et d’accessible pdf (ou alors tu nous fait un cours…), mais dans la mesure où ce qui est demandé c’est finalement une maquette adaptée à une revue précise, je conseillerais quant à moi l’élaboration d’une classe dédiée aussi simple que possible et chargeant book.cls à travers la commande \LoadClass{book}.

J’en profite pour dire, puisqu’il me semble que personne ne l’a évoqué, que décider que l’on sera en 9 points sans avoir choisi la fonte me semble une mauvaise idée (il suffit de comparer un Times, un Adobe Garamond et un Palatino en 9 points pour comprendre). De même je ne vois pas l’intérêt du package fontsize dans ce contexte.

Bonjour Michel, le correcteur orthographique automatique a transformé fontsize en fontaine dans votre message. Je pense que la plupart d’entre nous aura fait la correction de lui-même, mais je précise pour éviter d’avoir à chercher un mystérieux package fontaine sur le CTAN :wink:. Je ne sais pas si le forum dispose d’un temps limite pour éditer un message, et s’il n’est pas trop tard, peut-être la correction peut-elle être faite ? Il m’est arrivé le même problème récemment avec une IA, où j’évoquais la commande \boxed qui a été transformée en \boxer mais l’IA a compris selon le contexte.

1 « J'aime »

@quark67 Merci pour ta vigilance : correction apportée.

2 « J'aime »

Je ne sais pas si le forum dispose d’un temps limite pour éditer un
message, et s’il n’est pas trop tard, peut-être la correction
peut-elle être faite ?

Il n’y a pas de temps limite pour éditer un message, seulement un délai
de dix minutes (de mémoire) entre la publication du message sur le forum
et l’envoi du courriel correspondant qui permet de prendre en compte les
corrections immédiates avant l’expédition.

1 « J'aime »