L’IA a fait de grands progrès en matière de traduction. Alors, je sais, ce n’est pas bien, mais ne pourrions-nous pas nous en servir pour traduire certains livres ou manuels importants ? Voilà qui permettrait de rendre nos logiciels plus accessibles au public francophone.
Je pense en particulier pour l’instant :
au livre TeX by Topic de Victor Eijkhout (licence GFDL) ;
au manuel de la classe memoir (projet déjà évoqué sur la liste voilà deux ou trois ans) ;
à A Few Notes on Book Design de Peter Wilson (pas libre, a priori, copyright détenu par l’auteur, qui serait dès lors à contacter).
Le premier et peut-être le troisième pourraient même faire l’objet d’une publication papier par l’association, éventuellement en impression à la demande pour des raisons budgétaires.
Le cas des manuels est plus délicat, puisqu’ils sont susceptibles d’évoluer.
Bien sûr, relecture et interventions humaines seraient nécessaires. En particulier, il faudrait veiller à l’homogénéité de la traduction de termes techniques (relatifs à TeX comme à la typographie).
Je ne dispose pas moi-même de beaucoup de temps à y consacrer, mais je me propose au moins de jouer le rôle de conseiller technique pour la typographie (en particulier pour les passages qui nécessiteraient une adaptation aux usages français, dans le cas du manuel de memoir et du texte de Wilson), de correcteur pour l’ensemble, et bien sûr de metteur en page.
Nous avons déjà discuté de ce sujet en interne, à l’initiative de Denis Bitouzé, lors d’une réunion du CA. Si je me souviens bien, le fait que l’association attribue un petit budget à un tel projet ne choquait personne.
J’ai ensuite fait des tests dans mon coin avec diverses IA et j’ai été déçu par le résultat. Seul le service deepl me semblait fournir un travail correct, mais il n’accepte pas de fichiers .tex. Je dois dire que j’en suis resté là.
Je salue ton initiative. À moins que notre grand mamamouchi de la trésorerie s’y oppose, je crois que l’association pourrait tout à fait :
financer l’abonnement à un service de traduction en ligne ;
coordonner le travail des bénévoles.
Et ton expertise serait évidemment précieuse. C’est un beau projet.
À ta liste je rajoute le manuel de TikZ, qu’il serait utile de finir de traduire, vu le succès de ce logiciel.
Pour le format de travail utilisé et servi aux IA, il me semble préférable d’utiliser le markdown, voire le format ODT, bien plus pratique en préparation de copie — même si je sais que travailler dans LibreOffice n’est pas une option très populaire ici.
Il n’empêche qu’un traitement de texte est fait pour cela :
bon interfaçage avec un logiciel de correction comme Antidote ;
aide au formatage et détection des répétitions avec l’extension Grammalecte ;
confort dans la gestion des notes, des commentaires, des modifications, des renvois internes ;
intepréteur regex de LibreOffice assez puissant (avec même des tests de position prenant en compte des chaînes de longueur variable).
Pandoc permet la conversion LaTeX-Markdown, LaTeX-ODT, mais il faut faire attention à certaines commandes non reconnues. En particulier, il n’est pas encore en mesure d’interpréter les macros définies avec \NewDocumentCommand.
De ce que je comprends, mais je ne suis pas spécialiste de ce domaine — du tout —, la modification et la distribution sont autorisées. Il faudrait juste faire en sorte qu’il soit clair que ce n’est pas le document officiel (c’est simplement un traduction non officielle de celui-ci), et mettre un lien permettant de retrouver le document d’origine et citer l’auteur d’origine. Là, je ne parle pas du tout en langage de spécialiste. C’est ce que je comprends de https://ctan.org/license/lppl1.3 et ce ce qu’explique une IA interrogée là dessus.
Donc a priori il n’y aurait aucune difficulté à faire cette traduction, sur le plan des licences. Bien évidement, un avis plus assuré sera souhaitable.
Avec l’âge, j’ai appris à composer avec mes inclinations kantiennes — « Le kantisme a les mains pures, mais il n’a pas de mains », écrivait Péguy. Je sais que l’IA a déjà fait des ravages au sein de la profession des traducteurs et des correcteurs, et j’en suis désolé (étant d’ailleurs moi-même partiellement concerné). Alors, donc, pourquoi ?
Parce que nous n’avons probablement pas les moyens de financer des traductions de cette ampleur (au moins 8 000 EUR pour le manuel de memoir, par exemple).
Parce que nous ne comptons pas, parmi nous, de vrais traducteurs, je crois.
Parce que, si nous décidons de traduire nous-mêmes malgré tout (ce qui a été commencé pour le manuel de TikZ, si j’ai bien compris, et peut-être aussi pour celui de memoir), l’IA apportera une aide précieuse.
Je me suis amusé à quelques essais de traduction : le verdict est sans appel. Dans les 3/4 des cas, très bien, même si personnellement je n’eusse pas toujours traduit de cette façon, pour ce qui reste, c’est soit du charabia imbitable, soit l’on arrive à entraver quand même mais avec beaucoup de bonne volonté. Je pense que la version payante devrait être plus efficace, reste à savoir ce qu’il faudra faire manuellement, qui va le faire. Nous serons bien obligés de trouver un pingouin, vu le prix du programme…
Autre chose, mais tant qu’à y être : vous avez parlé de la traduction du manuel de « TikZ » : est-ce que les choses ont vraiment beaucoup changé depuis la traduction qui est parue dans un des "Cahiers GUTenberg "? Bien à vous,
Je ne réponds que sur la doc de TikZ : dans sa version actuelle (3.1.11a) elle fait 1323 pages A4. Les Cahiers n’en ont publié que la traduction de deux fragments.
Je n’ai pas d’opinion complètement arrêtée sur la traduction utilisant l’IA. Seulement une certaine prévention contre l’IA en général due à la débauche énergétique nécessitée par son utilisation débridée.
Je n’ai réagi que parce que justement, lorsque tu as dit toi-même (t’étais pas obligé) que ce n’était pas bien, il m’a semblé que tu te sortais un peu les mains kantiennes des poches.
S’il y a un groupe motivé pour faire cela, c’est à considérer !
Sur TeX by Topic, je pense qu’il y aurait mieux à traduire. Ce n’est pas
un ouvrage d’initiation à TeX et comme référence, à mon avis, on trouve
mieux, en tout cas plus clair et détaillé. Il est vastement diffusé
parce qu’il est en anglais et libre. Je me demande s’il ne vaudrait pas
mieux traduire le TeXbook naruby de
Petr Olšák.
Pour l’utilisation de ODT, ça suppose de convertir les fichiers source.
Si vous comptez sur Pandoc, il faudra implémenter votre propre reader
et votre propre writer, car Pandoc ne comprendra pas toutes les macros
utilisées dans les sources et ne produira pas un fichier contenant des
références internes à la page (il ne sait faire que des liens hypertexte).
Et quand je dis votre propre writer, il en faudrait en réalité deux,
un vers ODT et l’autre vers le format TeX souhaité, où il faudrait
bidouiller dans les deux cas pour supporter les fonctionnalités que
Pandoc ignore parce qu’elles sont spécifiques à un petit sous-ensemble
de formats. Il vaudrait mieux travailler directement sur les fichiers
TeX à mon avis, mais ça risque de poser problème aux traducteurs
automatiques.
Je vous prie de m’excuser si tout cela n’a pas l’air bien positif, mais
il faut bien poser les problèmes techniques pour pouvoir les résoudre !
J’avais en effet proposé lors d’un CA que, et en s’aidant d’outils tels que Deepl, on traduise complètement ou partiellement les numéros du TUGboat.
Je suis très réticent à l’égard de l’intelligence artificielle (je préfère la naturelle) mais, s’il y a un cas où son usage me paraît raisonné, c’est en effet celui de la traduction : on n’a en effet pas tous les compétences ni le temps d’effectuer de telles traductions nous-mêmes, alors que de nombreux documents dans de nombreuses langues différentes sont d’inestimables mines de connaissances et d’informations.
(Un autre usage raisonné m’a été soufflé par un ami qui s’en sert pour fabriquer des messages de commits : comme un humain, l’IA examine les différences apportées aux fichiers à commiter mais le fait beaucoup plus rapidement et avec une bluffante capacité de synthèse, épargnant à l’humain une tâche potentiellement très fastidieuse et chronophage qu’il bâcle souvent en se contentant d’un « WIP » ou « Update » .)
Le problème de Deepl est que, à ce que j’ai constaté, il faut lui fournir de nombreuses informations de textes à ne pas traduire (afin d’éviter des choses du genre \begin → \début). En revanche, un collègue m’avait dit avoir été très impressionné par la traduction de sources TeX par ChatGPT et j’ai testé le traducteur de Google qui s’en sort très bien : tous deux ignorent les balises TeX. Je ne sais pas ce que donnent les autres IA (je les fuis comme la peste !)