Word en PDF ? Dans ce tutoriel nous montrons comment convertir Word en PDF à travers une réponse détaillée à chacune des questions :
Les fichiers PDF sont difficiles à modifier ou à traduire. Pour pouvoir éditer ou traduire un PDF, vous devez le convertir dans un format modifiable. Cette conversion peut être plus ou moins difficile (voire impossible) selon le type de PDF.
Savoir distinguer les différents types de PDF en un coup d’œil est essentiel pour appliquer le bon processus de conversion et utiliser le bon outil.
PDF est l’abréviation de Portable Document Format, un format de fichier développé par Adobe en 1993 qui permet de représenter des documents indépendamment du matériel et des logiciels utilisés pour les générer ou les visualiser.
En fin de compte, un PDF a le même aspect quel que soit l’ordinateur ou l’appareil utilisé. Cette fonctionnalité a fait de ce format l’une des méthodes préférées de partage de documents. Pour beaucoup de gens, créer un PDF d’un document est devenu l’équivalent de “faire une photocopie numérique” de celui-ci, avec tous les avantages que cela comporte en termes de praticité, mais sans compter les inconvénients qui surviennent lorsqu’il est nécessaire de modifier ou traduire le PDF lui-même.
Un PDF peut contenir différents types d’éléments. Certains éléments n’appartiennent pas au texte visible : ce sont les soi-disant “propriétés”, c’est-à-dire :
Les autres éléments, en revanche, constituent le document proprement dit et sont généralement :
Lorsque vous recevez un fichier PDF vous devez avant tout vérifier la nature de son contenu, pour comprendre s’il est :
Si vous souhaitez modifier ou traduire un PDF, il est important de vérifier si le texte du document apparaît sous forme de texte, c’est-à-dire s’il peut être sélectionné. Ouvrez simplement le document avec Adobe Reader (ou tout autre visualiseur PDF) et cliquez sur l’icône de sélection de texte dans la barre d’outils, ou effectuez un zoom avant sur le document.
Si, à un moment donné, le texte apparaît flou ou dentelé, cela signifie que nous sommes confrontés à un scan. Par contre, si en augmentant le zoom le texte ne perd pas en résolution, cela signifie que le PDF a été généré par une application.
Comme mentionné dans la section précédente, il existe également le cas “hybride”, dans lequel le document est une numérisation, mais il existe une couche avec du texte sélectionnable. Dans ces cas, pour extraire le texte, il suffit de le sélectionner, mais il est conseillé de vérifier attentivement l’orthographe et l’exactitude du texte, car le système de reconnaissance de caractères qui extrait le texte d’une image (OCR) a une certaine marge d’erreur .
Si nous avons vérifié que le PDF est un “vrai” PDF généré par une application, pour savoir quelle application l’a généré, appuyez simplement sur consulter les propriétés du document (généralement avec CTRL + D, ou Fichier | Propriétés du document) et lisez le contenu sur l’onglet Description.
Sous Application (Application ou similaire) doit apparaître le nom du programme utilisé pour créer le PDF.
A ce stade, l’idéal serait de demander au client de nous envoyer le fichier éditable en précisant que vous êtes sûr de son existence (en venant juste de le lire dans les propriétés du document lui-même). Avoir le fichier source qui a généré le PDF est le seul moyen de travailler confortablement sur le document, avec la certitude de pouvoir générer un autre PDF identique à l’original une fois la traduction ou la modification terminée.
Habituellement, une façon de convaincre le client ou la personne qui nous a fourni le PDF est de demander un supplément pour couvrir les coûts du processus de conversion. Évidemment, ce type de négociation dépend de la relation établie avec le client et de notre pouvoir de négociation.
En vérité, il arrive aussi, notamment dans le cas des organisations multinationales, que le fichier éditable/source ne soit pas vraiment disponible pour celui qui envoie le PDF. Souvent les prestations de PAO (pagination) sont réalisées au siège et les agences ne reçoivent que les PDF finaux à imprimer sur place. Tout besoin de manipuler ou de traduire le PDF peut être apparu plus tard et, par conséquent, remonter à la source originale du document peut être quelque peu laborieux, voire impossible.
Sous Application (Application ou similaire) doit apparaître le nom du programme utilisé pour créer le PDF.
A ce stade, l’idéal serait de demander au client de nous envoyer le fichier éditable en précisant que vous êtes sûr de son existence (en venant juste de le lire dans les propriétés du document lui-même). Avoir le fichier source qui a généré le PDF est le seul moyen de travailler confortablement sur le document, avec la certitude de pouvoir générer un autre PDF identique à l’original une fois la traduction ou la modification terminée.
Habituellement, une façon de convaincre le client ou la personne qui nous a fourni le PDF est de demander un supplément pour couvrir les coûts du processus de conversion. Évidemment, ce type de négociation dépend de la relation établie avec le client et de notre pouvoir de négociation.
En vérité, il arrive aussi, notamment dans le cas des organisations multinationales, que le fichier éditable/source ne soit pas vraiment disponible pour celui qui envoie le PDF. Souvent les prestations de PAO (pagination) sont réalisées au siège et les agences ne reçoivent que les PDF finaux à imprimer sur place. Tout besoin de manipuler ou de traduire le PDF peut être apparu plus tard et, par conséquent, remonter à la source originale du document peut être quelque peu laborieux, voire impossible.
Si, malgré tous vos efforts, vous ne disposez pas du fichier d’origine, il existe différentes options pour exporter le texte d’un PDF.
Il est bon de souligner désormais qu’aucune option n’aboutira à un fichier parfaitement identique à l’original, surtout s’il contient des images (bitmaps) et un certain formatage, ou des polices spéciales.
La méthode choisie, et donc le degré de précision, dépend également de l’objectif de l’extraction de texte. Les cas les plus courants sont deux :
avoir le texte disponible uniquement pour pouvoir effectuer un comptage de mots ou pour copier (puis coller) le texte ;
créer un fichier éditable aussi proche que possible de l’original, à traduire ou à modifier ultérieurement.
Si vous avez seulement besoin de compter le texte d’un PDF, par exemple pour pouvoir estimer le coût d’une traduction, il n’est même pas nécessaire de recourir à l’extraction. Si le texte du PDF est encodé sous forme de texte (comme nous l’avons vu précédemment), l’un des outils suivants peut être utilisé :
($) PractiCount et facture practiline
($) AnyCount
Si le fichier à compter ne pèse pas plus de 1 Mo, il n’est pas nécessaire d’installer un programme. Divers outils en ligne permettent de compter le nombre de mots contenus dans un PDF. Nous en citons un, gratuitement :
Dans ce cas, selon le type de document original, il peut être nécessaire d’appliquer une ou plusieurs macros pour fixer le format. Par exemple, cette macro Word restaure les retours chariot corrects (le lien est vers une copie du site archivé sur www.archive.org, car www.terminologymatters.com n’est plus en ligne). Une autre macro très efficace, dans ce cas pour OpenOffice et LibreOffice, est PerfectEpub, une version améliorée de MyTXTcleaner.
Évidemment, cette option peut également être choisie si le texte à analyser ou à traduire n’est qu’une partie de l’ensemble du document.
L’extraction du texte d’un PDF est également utile dans les cas où une traduction rapide du texte est requise et que l’on ne peut ou ne veut pas utiliser les services d’un traducteur humain. Le texte extrait avec les méthodes décrites dans cet article peut être collé dans un traducteur automatique. Bien sûr, si vous souhaitez une traduction de qualité, notre conseil est de toujours vous fier à des traducteurs professionnels spécialisés.
Pour conserver le format d’un PDF à éditer ou à traduire nous avons deux possibilités :
utilisez l’un des nombreux programmes qui convertissent PDF en Word
utiliser directement un programme de reconnaissance optique de caractères, un OCR tel que FineReader, OmniPage, ReadIris, etc.
Nous déconseillons les programmes qui garantissent une conversion directe sans intervention de l’utilisateur. Ces programmes créent généralement des documents Word qui ne conservent le format PDF d’origine qu’en apparence, mais y parviennent grâce à une mise en forme très compliquée pleine de cadres de texte, de plages de sections, de colonnes, de styles et d’interlignes.
Dès que vous travaillez sur le document, par exemple en supprimant une phrase ou en l’ouvrant avec un outil de TAO (programme de traduction assistée), le format se décompose et la plupart du temps il est humainement impossible de travailler avec.
Nous vous recommandons donc d’effectuer la conversion avec un programme OCR. Celle qui nous a donné les meilleurs résultats est Abbyy FineReader. La meilleure stratégie consiste à modifier manuellement les paramètres par défaut, c’est-à-dire à indiquer au programme comment répartir les différents éléments sur la page.
Si non seulement le format doit être conservé, mais que vous devez reconstruire complètement le fichier (toujours si le fichier à l’origine du PDF n’existe plus), il y a deux possibilités :
soit vous travaillez dans un programme de PAO (InDesign, Scribus, Inkscape, QuarkXPress, etc.) en utilisant le PDF original comme modèle, soit
vous pouvez utiliser Infix PDF Editor, un éditeur PDF distribué par Iceni.
Iceni PDF Editor (disponible sous forme d’abonnement ou d’achat unique) contient une fonction utile (TransPDF) qui exporte le texte d’un PDF au format XLIFF, l’un des standards de l’industrie de la traduction. Ce fichier XLIFF peut être traduit avec n’importe quel outil de TAO. Le fichier traduit doit ensuite être réimporté dans le PDF d’origine, toujours à l’aide d’Infix. Sur le site Web d’Infix, une vidéo claire explique la procédure complète.
Si, par contre, vous devez travailler dans un programme de mise en page, utilisez le PDF original comme modèle d’arrière-plan. Nous vous conseillons de lire l’article suivant pour plus de détails : « Traduction et PAO d’un fichier PDF ».
Ceux qui ne souhaitent pas investir dans l’achat d’un programme de reconnaissance de caractères (OCR), car ils ne l’utiliseraient qu’occasionnellement, peuvent recourir à l’un des nombreux convertisseurs en ligne, comme Zamzar.com, dont les résultats pourraient toutefois pâtir de la mêmes défauts que les convertisseurs de bureau souffrent.
Si le PDF a été généré avec Microsoft Word, une autre option qui donne généralement d’excellents résultats consiste à convertir le PDF en Microsoft Word lui-même. D’une manière ou d’une autre, Word “reconnaît” que le PDF a été généré avec le même programme et le convertit avec une extrême précision.
Un autre programme doté de puissantes fonctionnalités d’édition de PDF est Inkscape, l’éditeur de graphiques vectoriels gratuit et open source (une alternative à Adobe Illustrator). Inkscape ouvre les PDF et permet de les manipuler. Cependant, une certaine familiarité avec le programme est requise, dont la richesse des options et des configurations peut être difficile à submerger.
soit vous travaillez dans un programme de PAO (InDesign, Scribus, Inkscape, QuarkXPress, etc.) en utilisant le PDF original comme modèle, soit
vous pouvez utiliser Infix PDF Editor, un éditeur PDF distribué par Iceni.
Iceni PDF Editor (disponible sous forme d’abonnement ou d’achat unique) contient une fonction utile (TransPDF) qui exporte le texte d’un PDF au format XLIFF, l’un des standards de l’industrie de la traduction. Ce fichier XLIFF peut être traduit avec n’importe quel outil de TAO. Le fichier traduit doit ensuite être réimporté dans le PDF d’origine, toujours à l’aide d’Infix. Sur le site Web d’Infix, une vidéo claire explique la procédure complète.
Si, par contre, vous devez travailler dans un programme de mise en page, utilisez le PDF original comme modèle d’arrière-plan. Nous vous conseillons de lire l’article suivant pour plus de détails : « Traduction et PAO d’un fichier PDF ».
Ceux qui ne souhaitent pas investir dans l’achat d’un programme de reconnaissance de caractères (OCR), car ils ne l’utiliseraient qu’occasionnellement, peuvent recourir à l’un des nombreux convertisseurs en ligne, comme Zamzar.com, dont les résultats pourraient toutefois pâtir de la mêmes défauts que les convertisseurs de bureau souffrent.
Si le PDF a été généré avec Microsoft Word, une autre option qui donne généralement d’excellents résultats consiste à convertir le PDF en Microsoft Word lui-même. D’une manière ou d’une autre, Word “reconnaît” que le PDF a été généré avec le même programme et le convertit avec une extrême précision.
Un autre programme doté de puissantes fonctionnalités d’édition de PDF est Inkscape, l’éditeur de graphiques vectoriels gratuit et open source (une alternative à Adobe Illustrator). Inkscape ouvre les PDF et permet de les manipuler. Cependant, une certaine familiarité avec le programme est requise, dont la richesse des options et des configurations peut être difficile à submerger.
Une complication supplémentaire est représentée par tous les niveaux de sécurité possédés par le PDF à manipuler. En effet, dans un PDF il est possible de définir 2 niveaux de sécurité à l’aide d’un “mot de passe utilisateur” et d’un “mot de passe propriétaire”. Le premier empêche l’ouverture du document lui-même, tandis que le second restreint une ou plusieurs opérations, telles que l’impression, la copie du texte, toute modification, l’ajout de notes, etc.
Par conséquent, si l’auteur du PDF a choisi de restreindre les opérations à l’aide d’un mot de passe, il sera impossible d’utiliser les différentes méthodes décrites ci-dessus. Il est nécessaire de contacter la personne qui nous a fourni le PDF et de demander que le mot de passe soit envoyé. Si ce n’est pas possible, il est bon de savoir qu’il existe de nombreux outils capables de déchiffrer rapidement les “mots de passe propriétaires”. Il suffit de rechercher Google pour “PDF crack” (vous pouvez même trouver des outils en ligne, tels que Unlock-PDF). La chose est beaucoup plus compliquée dans le cas de “mots de passe utilisateur” qui empêchent l’ouverture du PDF ; dans ce cas, les programmes ont recours à des méthodes de “force brute” qui peuvent prendre des heures, voire des jours, pour déchiffrer la clé.
Voici une série d’exercices conçus pour perfectionner vos compétences Excel. Les corrigés sont inclus pour…
Excel offre plusieurs méthodes pour calculer une moyenne tout en tenant compte des filtres ou…
Excel propose plusieurs fonctions pour insérer ou manipuler la date actuelle. Voici les principales méthodes…
Lorsque des nombres sont stockés sous forme de texte dans Excel, ils ne peuvent pas…
Extraire uniquement les chiffres d'une cellule contenant du texte et des nombres mélangés est une…
Pour supprimer plusieurs caractères spécifiques (par exemple, des symboles, chiffres ou lettres indésirables) dans des…
This website uses cookies.
View Comments
Ulajopaqe Ovabiq yqf.grjt.lecoursgratuit.com.kye.ay http://slkjfdf.net/