Wordでもらった画像付きファイルを画像と文字データに分けて使いたい

やりたいこと

仕事で受け取った画像の入ったWordファイル(xxx.docx)を、画像と文字データに分けて使いたい。使っているWordは2013

 

やり方1

  1. Wordファイルを開いて「ファイル」→「名前を付けて保存」
  2. 「現在のフォルダー」や「参照」などで保存先フォルダーを選んで、「ファイルの種類」を「書式なし(*.txt)」を選択して、テキストを保存
  3. 「ファイル」→「閉じる」
  4. もう一度Wordファイルを開いて「ファイル」→「名前を付けて保存」
  5. 「現在のフォルダー」や「参照」などで保存先フォルダーを選んで、「ファイルの種類」を「Webページ(*.htm、*.html)」を選択して、Webページとして保存
  6. 「ファイル」→「閉じる」
  7. [ファイル名.html]ファイルと[ファイル名.files]フォルダが作成され、そのフォルダー内に画像も入っています。
    (画像ファイルはオリジナルファイルと、Word内で縮小したりトリミングしたりしたものの2種類が含まれています)

 

やり方2

もう一つのやり方は

  1. エクスプローラーの「名前の変更」でdocxの拡張子をzipに変える
    (拡張子が表示されていなければ「表示」→「ファイル名拡張子」にチェックを入れる)
  2. 拡張子を変えたファイルを展開
  3. 展開されたフォルダー中のword/media/フォルダにwordで使われている画像ファイルが保存されています
  4. WordファイルをCtrl-Aで全選択し、Ctrl-Cでコピー。メモ帳などのテキストエディタに貼り付ければテキストのみを抽出できます。

 

Wordファイル中の画像の劣化について

上記どちらの方法で画像とテキストを分けたとしても、Wordファイル作成時に画像を圧縮しないように設定して保存しないと、画像は圧縮されて、貼り付けたときの元画像は残っていません。

圧縮せずに保存するには、

  1. 「ファイル」→「オプション」をクリック
  2. 「詳細設定」で「イメージのサイズと画質」下の「ファイル内のイメージを圧縮しない」にチェックを入れて「OK」をクリック
    「イメージのサイズと画質」の横の選択ボックスで、すべての新規文書か、この文書だけかを選択できる。

参考:画像の圧縮を無効にする