2Sep

Comment extraire des images, du texte et des fichiers incorporés à partir de documents Word, Excel et PowerPoint

Dites que quelqu'un vous a envoyé un document Word avec beaucoup d'images, et vous voulez que vous sauvegardiez ces images sur votre disque dur. Vous pouvez extraire des images à partir d'un document Microsoft Office avec un tour simple.

Si vous avez un fichier Word( .docx), Excel( .xlsx) ou PowerPoint( .pptx) avec des images ou d'autres fichiers incorporés, vous pouvez les extraire( ainsi que le texte du document), sans avoir à les sauvegarderséparément. Et le meilleur de tous, vous n'avez pas besoin de logiciel supplémentaire. Les formats de fichiers Office XML( docx, xlsx et pptx) sont en fait des archives compressées que vous pouvez ouvrir comme n'importe quel fichier. zip normal avec Windows.À partir de là, vous pouvez extraire des images, du texte et d'autres fichiers incorporés. Vous pouvez utiliser le support. zip intégré de Windows, ou une application comme 7-Zip si vous préférez.

Si vous avez besoin d'extraire des fichiers d'un document Office plus ancien, comme un fichier. doc,. xls ou. ppt, vous pouvez le faire avec un petit logiciel gratuit. Nous détaillerons ce processus à la fin de ce guide.

Comment extraire le contenu d'un fichier Office plus récent( .docx,. xlsx ou. pptx)

Pour accéder au contenu interne d'un document Office XML, ouvrez l'Explorateur de fichiers( ou l'Explorateur Windows dans Windows 7), accédez à lafichier à partir duquel vous voulez extraire le contenu et sélectionnez le fichier.

Appuyez sur "F2" pour renommer le fichier et changer l'extension( .docx,. xlsx ou. pptx) en ".zip".Laissez la partie principale du nom de fichier seul. Appuyez sur "Entrée" lorsque vous avez terminé.

La boîte de dialogue suivante vous avertit de la modification de l'extension du nom de fichier. Cliquez "Oui"

Windows reconnaît automatiquement le fichier comme un fichier compressé.Pour extraire le contenu du fichier, faites un clic droit sur le fichier et sélectionnez "Extraire tout" dans le menu contextuel.

Dans la boîte de dialogue "Sélectionner une destination et extraire les fichiers", le chemin d'accès au contenu du fichier. zip s'affiche dans la zone d'édition "Les fichiers seront extraits dans ce dossier".Par défaut, un dossier portant le même nom que le nom du fichier( sans l'extension de fichier) est créé dans le même dossier que le fichier. zip. Pour extraire les fichiers dans un autre dossier, cliquez sur "Parcourir".

Accédez à l'endroit où vous voulez extraire le contenu du fichier. zip, en cliquant sur "Nouveau dossier" pour créer un nouveau dossier, si nécessaire. Cliquez sur "Select Folder".

Pour ouvrir une fenêtre Explorateur de fichiers( ou Explorateur Windows) avec le dossier contenant les fichiers extraits affichés une fois qu'ils sont extraits, cochez la case "Afficher les fichiers extraits une fois l'opération terminée" de façon à cocher la case. Cliquez sur "Extract".

Comment accéder aux images extraites

Inclus dans le contenu extrait est un dossier nommé "mot", si votre fichier original est un document Word( ou "xl" pour un document Excel ou "ppt" pour un document PowerPoint).Double-cliquez sur le dossier "mot" pour l'ouvrir.

Double-cliquez sur le dossier "media".

Toutes les images du fichier original se trouvent dans le dossier "media".Les fichiers extraits sont les images originales utilisées par le document. Dans le document, il peut y avoir un redimensionnement ou d'autres propriétés, mais les fichiers extraits sont les images brutes sans que ces propriétés soient appliquées.

Comment accéder au texte extrait

Si Office n'est pas installé sur votre PC et que vous devez extraire le texte d'un fichier Word( ou Excel ou PowerPoint), vous pouvez accéder au texte extrait dans le fichier "document.xml"."Fichier dans le dossier" mot ".

Vous pouvez ouvrir ce fichier dans un éditeur de texte, tel que le Bloc-notes ou WordPad, mais il est plus facile à lire dans un éditeur XML spécial, tel que le programme gratuit, Bloc-notes XML.Tout le texte du fichier est disponible en blocs de texte brut, quel que soit le style et / ou la mise en forme appliqués dans le document lui-même. Bien sûr, si vous voulez télécharger un logiciel gratuit pour voir ce texte, vous pouvez aussi télécharger LibreOffice, qui peut lire les documents Microsoft Office.

Comment extraire des objets OLE incorporés ou des fichiers attachés

Pour accéder aux fichiers incorporés dans un document Word lorsque vous n'avez pas accès à Word, ouvrez d'abord le fichier Word dans WordPad( qui est intégré à Windows).Vous remarquerez peut-être que certaines icônes de fichier incorporées ne s'affichent pas, mais elles sont toujours présentes. Certains des fichiers incorporés peuvent avoir des noms de fichiers partiels. WordPad ne prend pas en charge toutes les fonctionnalités de Word, donc certains contenus peuvent s'afficher de manière incorrecte. Mais vous devriez pouvoir accéder aux fichiers.

Si nous faisons un clic droit sur l'un des fichiers incorporés dans notre exemple de fichier Word, l'une des options est "Open PDF Object".Cela ouvre le fichier PDF dans le programme de lecture de PDF par défaut sur votre PC.De là, vous pouvez enregistrer le fichier PDF sur votre disque dur.

Si WordPad n'a pas d'option pour ouvrir votre fichier, notez son type de fichier ici. Par exemple, notre deuxième fichier dans ce document est un fichier. mp3.

Ensuite, retournez dans votre dossier "Files from [Document]" et double-cliquez sur le dossier "embeddings" dans le dossier "word".

Malheureusement, les types de fichiers ne sont pas conservés dans les noms de fichiers. Ils ont tous une extension de fichier ".bin" à la place. Si vous savez quels types de fichiers sont incorporés dans le fichier, vous pouvez probablement déduire quel fichier correspond à la taille du fichier. Dans notre exemple, nous avions un fichier PDF et un fichier MP3 intégré dans notre document. Parce que le fichier MP3 est probablement plus grand que le fichier PDF, nous pouvons déterminer quel fichier est en regardant les tailles des fichiers et ensuite les renommer en utilisant les extensions correctes. Ci-dessous, nous renommons le fichier MP3.

Notez que tous les fichiers ne s'ouvriront pas nécessairement en utilisant ce processus. Par exemple, notre fichier PDF s'est ouvert correctement à partir de WordPad, mais nous n'avons pas réussi à l'ouvrir en renommant son fichier. bin.

Une fois que vous avez extrait le contenu du fichier compressé, vous pouvez rétablir l'extension du fichier d'origine à. docx,. xlsx ou. pptx. Le fichier restera intact et peut être ouvert normalement dans le programme correspondant.

Comment extraire des images à partir de documents Office plus anciens( .doc,. xls ou. ppt)

Si vous devez extraire des images à partir d'un document Office 2003( ou antérieur), il existe un outil gratuit appelé Assistant d'extraction d'image Office.facile. Ce programme vous permet également d'extraire des images de plusieurs documents( de même type ou de types différents) à la fois. Téléchargez le programme et installez-le( il y a aussi une version portable disponible si vous préférez ne pas l'installer).

Exécutez le programme et l'écran d'accueil s'affiche. Cliquez sur Suivant".

Premièrement, nous devons sélectionner le fichier à partir duquel vous voulez extraire les images. Sur l'entrée &Écran de sortie, cliquez sur le bouton "Parcourir"( icône de dossier) situé à droite de la zone d'édition du document.

Accédez au dossier contenant le document souhaité, sélectionnez-le et cliquez sur "Ouvrir".

Le dossier contenant le fichier sélectionné devient automatiquement le dossier de sortie. Pour créer un sous-dossier dans ce dossier nommé le même que le fichier sélectionné, cliquez sur la case à cocher "Créer un dossier ici" afin qu'il y ait une coche dans la case. Ensuite, cliquez sur "Suivant".

Sur l'écran Prêt à démarrer, cliquez sur "Démarrer" pour commencer l'extraction des images.

L'écran suivant s'affiche pendant les processus d'extraction.

Sur l'écran Terminé, cliquez sur le bouton "Cliquez ici pour ouvrir le dossier de destination" pour afficher les fichiers image résultants.

Parce que nous avons choisi de créer un sous-dossier, nous obtenons un dossier contenant les fichiers image extraits du fichier.

Vous verrez toutes les images sous forme de fichiers numérotés.

Vous pouvez également extraire des images de plusieurs fichiers à la fois. Pour ce faire, sur l'entrée &Écran de sortie, cliquez sur la case à cocher "Batch Mode" afin qu'il y ait une coche dans la case.

L'entrée de lot et ampère;L'écran de sortie s'affiche. Cliquez sur "Ajouter des fichiers".

Dans la boîte de dialogue Ouvrir, naviguez jusqu'au dossier contenant l'un des fichiers à partir duquel vous voulez extraire les images, sélectionnez les fichiers en utilisant la touche "Maj" ou "Ctrl" pour sélectionner plusieurs fichiers et cliquez sur "Ouvrir".

Vous pouvez ajouter des fichiers d'un autre dossier en cliquant à nouveau sur "Ajouter des fichiers", en naviguant jusqu'au dossier de la boîte de dialogue Ouvrir, en sélectionnant les fichiers souhaités et en cliquant sur "Ouvrir".

Une fois que vous avez ajouté tous les fichiers à partir desquels vous voulez extraire des images, vous pouvez choisir de créer un dossier distinct pour chaque document dans le même dossier que chaque document dans lequel les fichiers image seront sauvegardés en cliquant sur "Créer un dossier".pour chaque document "case à cocher afin qu'il y ait une coche dans la case.

Vous pouvez également spécifier le dossier de sortie comme étant "identique au dossier d'entrée de chaque fichier" ou entrer ou sélectionner un dossier personnalisé en utilisant la boîte d'édition et le bouton "Parcourir" sous cette option. Cliquez sur "Suivant" une fois que vous avez sélectionné les options souhaitées.

Cliquez sur "Démarrer" sur l'écran Prêt à démarrer.

L'écran suivant affiche la progression de l'extraction.

Le nombre d'images extraites s'affiche sur l'écran Terminé.Cliquez sur "Fermer" pour fermer l'Assistant Office Image Extraction.

Si vous choisissez de créer un dossier distinct pour chaque document, vous verrez des dossiers portant le même nom que les fichiers contenant les images, quel que soit le ou les dossiers de sortie spécifiés.

Encore une fois, nous obtenons toutes les images sous forme de fichiers numérotés pour chaque document.

Vous pouvez maintenant renommer les images, les déplacer et les utiliser dans vos propres documents. Assurez-vous juste que vous avez le droit de les utiliser légalement.