単語、エクセル、パワーポイント文書から画像、テキスト、埋め込みファイルを抽出する方法

誰かがあなたに画像をたくさん書いたWord文書を送ったとしたら、それらの画像をハードディスクに保存しておきたいとします。簡単なトリックでMicrosoft Officeドキュメントからイメージを抽出することができます。

画像やその他のファイルが埋め込まれたWord(.docx)、Excel(.xlsx)、またはPowerPoint(.pptx)ファイルがある場合は、それぞれを個別に保存する必要はなく、文書のテキストと同様に抽出できます。 。そして何よりも、あなたは特別なソフトウェアを必要としません。 Office XMLベースのファイル形式(docx、xlsx、およびpptx)は、Windowsでnormal.zipファイルのように開くことができる圧縮されたアーカイブです。そこから、画像、テキスト、その他の埋め込みファイルを抽出することができます。必要に応じて、Windowsのbuilt-in.zipサポート、または7-Zipのようなアプリを使用できます。

古いオフィスの文書(a.doc、.xls、または.pptファイルなど)からファイルを抽出する必要がある場合は、小さなフリーソフトウェアでそれを行うことができます。このガイドの最後にそのプロセスを詳述します。

XMLベースのOfficeドキュメントの内部コンテンツにアクセスするには、ファイルエクスプローラ(またはWindows 7のWindowsエクスプローラ)を開き、コンテンツを抽出するファイルに移動してファイルを選択します。

“F2″を押してファイルの名前を変更し、拡張子(.docx、.xlsx、または.pptx)を “.zip”に変更します。ファイル名の主要部分だけを残してください。完了したら「Enter」を押します。

次のダイアログボックスに、ファイル名拡張子の変更に関する警告が表示されます。 [はい]をクリックします。

WindowsはファイルをZIPファイルとして自動的に認識します。ファイルの内容を抽出するには、ファイルを右クリックし、ポップアップメニューから「すべて抽出」を選択します。

「宛先の選択とファイルの抽出」ダイアログボックスで、.zipファイルの内容が抽出されるパスが「ファイルはこのフォルダに展開されます」の編集ボックスに表示されます。デフォルトでは、ファイル名と同じ名前(ファイル拡張子なし)のフォルダーが.zipファイルと同じフォルダーに作成されます。別のフォルダにファイルを抽出するには、[参照]をクリックします。

必要に応じて、「新しいフォルダ」をクリックして新しいフォルダを作成するために、.zipファイルの内容を抽出する場所に移動します。 [フォルダの選択]をクリックします。

抽出されたファイルが含まれているフォルダを含むファイルエクスプローラ(またはWindowsエクスプローラ)ウィンドウを開くには、「完了時に抽出されたファイルを表示する」チェックボックスをオンにして、チェックボックスをオンにします。 「抽出」をクリックします。

元のファイルがWord文書(またはExcel文書の場合は「xl」、PowerPoint文書の場合は「ppt」)の場合、抽出された内容には「word」という名前のフォルダが含まれます。 “word”フォルダをダブルクリックして開きます。

「media」フォルダをダブルクリックします。

元のファイルのすべてのイメージは “media”フォルダにあります。抽出されたファイルは、文書によって使用される原画像である。ドキュメント内にサイズ変更やその他のプロパティが設定されている可能性がありますが、抽出されたファイルはこれらのプロパティが適用されていない生のイメージです。

OfficeがPCにインストールされておらず、Word(またはExcelまたはPowerPoint)ファイルからテキストを抽出する必要がある場合は、「word」フォルダの「document.xml」ファイルで抽出されたテキストにアクセスできます。

このファイルは、メモ帳やワードパッドなどのテキストエディタで開くことができますが、無料のプログラムXMLメモ帳などの特殊なXMLエディタで読みやすくなっています。ファイルのすべてのテキストは、ドキュメント自体に適用されているスタイルや書式に関係なく、プレーンテキストの塊で利用できます。もちろん、このテキストを表示するためにフリーソフトウェアをダウンロードする場合は、Microsoft Officeドキュメントを読むことができるLibreOfficeをダウンロードすることもできます。

WordにアクセスできないときにWord文書の埋め込みファイルにアクセスするには、まずWordPad(Windowsに組み込まれています)でWordファイルを開きます。埋め込まれたファイルアイコンのいくつかは表示されませんが、それでも表示されます。一部の埋め込みファイルには部分的なファイル名が含まれている場合があります。ワードパッドはWordのすべての機能をサポートしていないため、一部のコンテンツが正しく表示されないことがあります。しかし、ファイルにアクセスできるはずです。

サンプルWordファイルの埋め込みファイルの1つを右クリックすると、オプションの1つが「Open PDF Object」になります。これにより、PC上のデフォルトのPDFリーダープログラムでPDFファイルが開きます。そこからPDFファイルをハードドライブに保存することができます。

WordPadにファイルを開くオプションがない場合は、そのファイルの種類をメモしてください。たとえば、この文書の2番目のファイルはa.mp3ファイルです。

次に、[Document]フォルダから “Files”フォルダに戻り、 “word”フォルダ内の “embeddings”フォルダをダブルクリックします。

残念ながら、ファイルの種類はファイル名に保存されません。彼らはすべて “.bin”ファイル拡張子を持っています。ファイルに埋め込まれているファイルの種類がわかっている場合は、おそらくファイルのサイズによってどのファイルが推測されるのでしょうか。この例では、PDFファイルとMP3ファイルがドキュメントに埋め込まれています。 MP3ファイルはPDFファイルよりもサイズが大きい可能性が高いため、ファイルのサイズを調べて正しいファイルを特定し、正しい拡張子を使用して名前を変更することができます。以下では、MP3ファイルの名前を変更しています。

このプロセスでは、必ずしもすべてのファイルが開かれるとは限りません。たとえば、PDFファイルがワードパッドから正しく開かれた場合など、そのファイルを開くことはできません。

圧縮ファイルの内容を抽出したら、元のファイルの拡張子を.docx、.xlsx、または.pptxに戻すことができます。ファイルはそのまま残っており、対応するプログラムで正常に開くことができます。

Office 2003(またはそれ以前)のドキュメントからイメージを抽出する必要がある場合は、Office Image Extraction Wizardという無料のツールがあり、このタスクを簡単に実行できます。このプログラムでは、複数のドキュメント(同じタイプまたは異なるタイプのドキュメント)から一度にイメージを抽出することもできます。プログラムをダウンロードしてインストールします(インストールしない場合は、ポータブル版もあります)。

プログラムを実行すると、ようこそ画面が表示されます。 [次へ]をクリックします。

まず、イメージを抽出するファイルを選択する必要があります。入力と出力画面で、ドキュメント編集ボックスの右側にある「ブラウズ」(フォルダアイコン)ボタンをクリックします。

必要な文書を含むフォルダに移動して選択し、[開く]をクリックします。

選択したファイルを含むフォルダが自動的に出力フォルダになります。選択したファイルと同じ名前のフォルダ内にサブフォルダを作成するには、[ここにフォルダを作成する]チェックボックスをオンにして、ボックスにチェックマークが付いているようにします。次に、「次へ」をクリックします。

Ready to Start画面で、「Start」をクリックしてイメージの抽出を開始します。

抽出プロセス中に以下の画面が表示されます。

終了画面で、結果の画像ファイルを表示するには、「ここをクリックして保存先フォルダを開く」をクリックします。

サブフォルダの作成を選択したので、ファイルから抽出されたイメージファイルを含むフォルダが作成されます。

すべての画像が番号付きのファイルとして表示されます。

一度に複数のファイルから画像を抽出することもできます。これを行うには、Input&Output(入力と出力)画面で、[Batch Mode]チェックボックスをオンにして、チェックボックスをオンにします。

バッチ入出力画面が表示されます。 [ファイルの追加]をクリックします。

[開く]ダイアログボックスで、イメージを抽出するファイルを含むフォルダに移動し、[Shift]キーまたは[Ctrl]キーを使用して複数のファイルを選択し、[開く]をクリックします。

[ファイルの追加]をもう一度クリックし、[開く]ダイアログボックスのフォルダに移動し、目的のファイルを選択して[開く]をクリックすることで、別のフォルダからファイルを追加できます。

イメージを抽出するすべてのファイルを追加した後は、「フォルダを作成する」をクリックしてイメージファイルを保存する各ドキュメントと同じフォルダ内のドキュメントごとに別々のフォルダを作成することができます各文書 “チェックボックスをオンにすると、ボックスにチェックマークが付きます。

出力フォルダを「各ファイルの入力フォルダと同じ」に指定するか、そのオプションの下の編集ボックスと「参照」ボタンを使用してカスタムフォルダを入力または選択することもできます。必要なオプションを選択したら、「次へ」をクリックします。

Ready to Start画面で「Start」をクリックします。

抽出の進行状況を示す次の画面が表示されます。

完成した画面に抽出された画像の数が表示されます。 [閉じる]をクリックしてOffice Image Extraction Wizardを終了します。

ドキュメントごとに別々のフォルダを作成することを選択した場合は、指定した出力フォルダのうち、イメージを含むファイルと同じ名前のフォルダが表示されます。

ここでも、すべての画像を各文書の番号付​​きファイルとして取得します。

これで、イメージの名前を変更し、イメージを移動し、自分のドキュメントで使用することができます。合法的に使用する権利があることを確認してください。

「Office Image Extraction Wizard」のダウンロードは開けません。

どのようにして開けますか?

これは、Firefox / Windows 10にインシデントなしでダウンロードしてインストールします。

他のブラウザを使用していただきありがとうございます。私はWindows 7でTorchを使用していましたが、決して走らないでしょう。だから今私はちょうどGoogle Chromeを使ってみましたが、うまくいきましたが、Torchを使ってみるとまだ動作しません。

とにかく私は今、それらをダウンロードすることができます。

私は携帯用のものを試してみるつもりです。

「Office Image Extraction Wizard」のダウンロードは開けません。

どのようにして開けますか?

これは、Firefox / Windows 10に無事にダウンロードしてインストールします。

他のブラウザを使用していただきありがとうございます。私はWindows 7でTorchを使用していましたが、決して走らないでしょう。だから今私はちょうどGoogle Chromeを使ってみましたが、うまくいきましたが、Torchを使ってみるとまだ動作しません。

とにかく今すぐダウンロードできます。

私は携帯用のものを試してみるつもりです。

ボブ・ロスは、PBSで長年に渡って行われたアート・ショーである「絵の喜び」を無料で撮影しました。彼はアート用品とアートレッスンを通じて金銭をすべて手に入れました。