Regrouper des textes de divers formats

05/05-2006 à 08:23Bonjour,

Je voudrais regrouper dans un même traitement de texte des extraits de divers formats. Par exemple des extraits d'e-mail, des textes Word lus grâce à Word viewer, des textes scannés et lu via un OCR, des extraits du bloc notes et de Word Pad.
Pour compliquer j'utilise Word Pro 97 de Lotus (c'est du temps où je travaillais...) et je voudrais pouvoir apporter des corrections.
Est ce possible ou vais je devoir tout retaper [8(]


05/05-2006 à 14:58Bonjour,
Tu as interet a convertir l'integralite de tes documents dans un format "classique" (.txt ou .doc ...) sans mise en forme. Une fois tous tes documents convertis dans le meme format, tu n'as plus qu'a appliquer ta propre mise en forme.

Regrouper des textes de divers formats
05/05-2006 à 15:17le copier-coller peut également etre une bone arme pour toi.


----------
ancienement "Vincnet", pcpguser, sundae888


05/05-2006 à 17:23si tu veux garder des formats différents dans un même document, tu dois créer des sections indépendantes pour chaque format au sein de ce même document.

Ceci permet à ton traitement de texte de les gérer indépendamment les uns des autres

05/05-2006 à 17:48Merci de vos réponses... mais d'autres questions

J'ai essayé le copié-collé de courriel, mais ni Word Pro, ni Word pad ne veulent en entendre parler [8(]
En pratique comment transformer tous mes document en txt ou doc. Ensuite il faudrait tout retransférer dans mon traitement de texte, mais en voudra t-il..Bon j'exagère un peu, j'ai qu'à faire des essais.
Avoir plusieurs formats dans un même document, je crains de m'emmeler les pinceaux..

Regrouper des textes de divers formats
05/05-2006 à 21:44j'ai résolu ce problème avec open ofice qui est gratuit en plus . Je renome les fichiers en .doc et open office les ouvre ; il suffit de refaire une mise en page sommaire et je retrouve le courrier d'origine .


----------
MERCI LES AMIS


06/05-2006 à 01:40

J'ai essayé le copié-collé de courriel,


aucune raison que cela ne marche pas... le copier-coller (ou les raccourcis ctrl-c ctrl-v ou la sélection à la souris + clic droit et "copier") fonctionne avec TOUS les logiciels à partir du moment où tu affiches bien du texte (et pas une image).
Dans le cas du courrier électronique, selon le courielleur que tu utilises, il faut parfois D'ABORD ouvrir le mail (en cliquant dessus dans la liste de la boîte aux lettres où il est rangé), car en effet, la fenêtre de visualisation est (parfois) inactive : on peut faire défiler le texte mais sans pouvoir intervenir dessus.

Sinon, d'une manière générale, lorsque tu travailles sur du texte, quel qu'il soit, et que tu n'as pas besoin de formatage, travaille en mode texte pur (texte brut, texte seul, texte sans enrichissement, format texte, selon les logiciels ou les systèmes d'exploitation, la dénomination diffère).
Bref, texte sauvegardé avec l'extension .txt

Si tu as besoin d'un formatage (gras, ital, police proportionnelle, justification, découpage en paragraphes, retraits, etc.), privilégie le format RTF (rich text file) qui est le seul format UNIVERSEL,
c'est-à-dire utilisable par TOUS les traitements de texte du monde (en lecture et en écriture), aussi bien sous windows (toutes versions) que Mac, Linux, Unix, BSD, OS/2, voire Palm ou Epoc.

Se méfier comme la peste du format "doc" qui recouvre quantité de formats hétéroclites (depuis les fichiers texte pur sous dos en ascii jusqu'aux formats word (win ou Mac) en ANSI, hélas même pas compatibles entre eux d'une version à l'autre de word ou works pour Windows (et encore moins avec open Office, Word Perfect StarOffice, word pour Mac ou Macwrite...).

Je le sais, ayant été saoulé par ce problème pendant des années quand je bossais pour la presse (j'étais sous windows, la plupart des journaux sous mac, quand on me forçait à utiliser un format doc word, seul word 2.0 windows était compatible avec tous les autres word (jusqu'à word 6 à l'époque, pour win et mac).

Notons que Microsoft est sans doute le seul éditeur de logiciel capable de sortir des programmes dont les fichiers ne sont même pas compatibles d'une version à l'autre (essayer d'ouvrir un document word 6 avec word 97 ou word 2000, et vice-versa et je ne parle pas des passerelles trouées et branlantes entre word (produit M$) et Works (produit M$) ou Write (produit M$) et Worpad (produit M$).
Pour ces deux derniers, c'est encore plus cocasse, puisque wordpad, dans certaines versions de windows s'appelle "write.exe" (comme le bon vieux write 3.1 sous 16 bits), crée également des fichiers avec l'extension "wri", mais qui sont moyennement compatibles avec les mêmes créés avec la version antérieure (et qui plus est, avec des possibilités en moins : pas de justification, pas de pagination longue, etc.)

Bref, pour être tranquille, préférer Open Office, ou encore mieux (à mon avis) pour le traitement de texte, Atlantis, et systématiquement enregistrer au format RTF...
En plus, les fichiers RTF créés avec Atlantis sont optimisés : pour les mêmes enrichissements et le même formatage qu'un document word DOC, ils sont deux à trois fois plus petits. Ils réussissent même l'exploit d'être plus légers (de 10 à 15 pour cent) que des documents write 3.1 (pourtant réputé pour sa compacité...).

Enfin, dernier point pour privilégier les formats RTF (ou write pour un simple document de travail, à convertir éventuellement ensuite en rtf) : malgré leurs enrichissements, en cas de plantage, il est toujours assez facile de retrouver les données brutes (le texte, donc) à partir des fichiers bak ou tmp, voire même à partir des fichier .chk créés à partir de clusters perdus et récupérés après un checkdisk ou scandisk.
C'est très loin d'être le cas avec des documents DOC créés avec word...

06/05-2006 à 08:41salut johannis
Je t'avoue que je n'ai jamais de problème avec open office et les fichiers .doc . Mais des problèmes pourraient peut-etre apparaitre si j'utilisais un autre traitement de texte pour lire et modifier mes fichiers . doc , mais là je n'ai jamais essayé et n'ai pas besoin de le faire .


----------
MERCI LES AMIS


Regrouper des textes de divers formats
07/05-2006 à 09:38Merci Johannis pour ce cours dont j'avais bien besoin.

J'ai réessayé de coller un mel issu de OE sur WordPad (MS) et Word Pro (Lotus) le 2 TT dont je dispose, cela marche en utilisant "Collage Spécial" au lieu de "Collage". Je note le conseil d'enregistrer en RTF
Au fait quel est le format d'un mel ? il va falloir que j'essaie aussi ceux qui sont en HTML

Je ne doute pas qu'open office soit un bon produit, mais j'ai du mal à changer mes habitudes et reste avec Win 98SE, et les produits de Lotus Suite 97 (1.2.3, WordPro, Approach, Organiser) qui me conviennent. S'il faut reconvertir tout ce que j'ai, ou adopter Windows Xp au risque de ne plus pouvoir utiliser ces vieux logiciel [:(]

07/05-2006 à 14:16

aucun problème avec open office et les fichiers .doc


si tu m'as bien lu, j'indique qu'Open Office (ou Atlantis) sont préférables à Word.
Si tu m'as bien lu également, tu auras noté que "fichier doc" ne veut rien dire en soi puisque (et c'est bien là tout le malheur), des dizaines de formats de textes (moyennement voire pas du tout compatibles entre eux) utilisent cette extension (*). Tant qu'on reste avec le même tdt et la même version de celui-ci, on n'a pas de problème. Ceux-ci surgissent lors des passerelles entre versions différentes, OS différents (dos, win 16 bits ou 32 bits, Mac, etc.) et dont portage ou transfert d'un ordi à l'autre.

(*) preuve en est, le choix ouvert lorsqu'on clique sur "enregistrer sous" :
n'importe quel tdt normalement constitué offre nombre de possibilités. Or, parmi celles-ci, il y a souvent quantité de versions de word (word 2, 4, 6, 97, 2000, word Dos, word Windows, etc.) mutuellement incompatibles entre elles et pourtant toutes affublées de l'extension DOC...

Avec le rtf, je le répète, il n'y a qu'une seule version (plus ou moins compacte selon l'algorithme utilisé, c'est pourquoi je préfère Atlantis, à mon expérience personnelle le plus performant en la matière) mais toutes sont intercompatibles en lecture et en écriture...




Au fait quel est le format d'un mel ?


Il n'y en a que deux : texte brut ou html.
La différence se fait au niveau du mode d'encodage (7 ou 8 bits, ISO, Quoted-printable, UUEncode etc.) au moment de l'envoi, avec intégration ou non de l'habillage et des pièces jointes, etc.
Cela ne joue pas pour le copier-coller.
Ne pas confondre avec le format d'archivage des boîtes aux lettres contenant lesdits méls : celles-ci étant compressées, le format diffère d'un courielleur à l'autre (OE, The Bat, Foxmail, Incredimail, etc.)

Je ne doute pas qu'open office soit un bon produit, mais j'ai du mal à changer mes habitudes et reste avec Win 98SE, et les produits de Lotus Suite 97 (1.2.3, WordPro, Approach, Organiser) qui me conviennent. S'il faut reconvertir tout ce que j'ai, ou adopter Windows Xp au risque de ne plus pouvoir utiliser ces vieux logiciel



Rassure-toi : OpenOffice, tout comme Atlantis, offre une interface tout à fait comparable à celle des "grands" du tdt (Word et word Perfect, WordPro). En général, on peut même configurer celle-ci (voire modifier les raccourcis spécifiques) pour singer entièrement l'interface que l'on connaît.
Dans le cas d'Atlantis, l'avantage est que le logiciel (bien que très complet) est extrêmement léger, aussi bien en occupation disque que mémoire et ressources, et surtout dispose d'une interface très claire (à la limite, on peut n'afficher que la fenêtre texte seule sans aucun bouton... encore plus zen qu'avec write 3x, c'est dire !

Enfin, pour la conversion avec windows XP, n'aie aucune crainte : j'ai fait l'expérience. Côté textes (au moins), winXP ne pose aucun problème : on peut faire tourner dessus n'importe quel tdt 32 ou 16 bits même ancien (write 3x, Atlantis, Works 97, olitext, Amipro, Wordstar... !).

Et de même que sous win98, j'ai réinstallé les anciens tdt dont j'avais l'habitude sous win3x ou dos lorsque c'était nécessaire, lorsque je travaille sur un ordi avec winXP, je fais de même : j'utilise mon fidèle et robuste write 3x (qui me sert sans interruption depuis 1994 et avec lequel j'ai dû pondre une bonne soixantaine de livres, soit plusieurs dizaines de milliers de pages), voire mon olitext dos qui lui, date de... 1984 dans sa version initiale sous CP/M (même pas DOS)... !
On pourra difficilement me taxer d'être un amateur de l'écriture (c'est mon métier depuis plus de 40 ans), or, je n'ai JAMAIS utilisé word ou autres usines à gaz... (j'ai pourtant eu abondamment l'occasion de les tester, sans jamais être convaincu, même pour pondre des manuscrits de 1800 feuillets truffés de notes et de renvois). Et depuis que j'ai découvert Atlantis il y a quelques années, j'ai totalement désinstallé ma version de word qui ne me servait jusque là qu'à "lire" certains documents (doc, justement) illisibles avec write ou works.
Et je n'ai plus jamais eu aucun problème de décodage lors de l'envoi de mes textes aux éditeurs, rédacteurs, imprimeurs et autres compositeurs, que ce soit de presse ou d'édition... : systématiquement, je fournis une copie de mon manuscrit en format rtf.

Le post anonyme est désactivé.
Merci de vous identifier

« Forum technique (liste des messages)10 enregistrements / page 1/1

À la Une de MemoClic

Le saviez vous ? Vous pouvez installer cette bannière ↑ gratuitement sur votre site !