Как я могу извлечь данные из поврежденного файла .docx?

Файл моей подруги поврежден .docx поврежден, и я пытаюсь восстановить текст из него. Я узнал, что .docx - это, по сути, zip-файл, который содержит папки и набор XML-файлов (и один из них содержит текст документа). Я выполнил следующую команду в Ubuntu 10.10, чтобы распаковать архив:

unzip portfolio.docx -d file-dir

Результат, который я получил:

End-of-central-directory signature not found. Either this file is not a zipfile, or it constitutes one disk of multi-part archive. In the latter case the central directory and zipfile comment will be found on the last disk(s) of this archieve.
unzip: cannot find zipfile directory in one of portfolio.docx or portfolio.docx.zip, and cannot find portfolio.docx.ZIP, period.

В Windows 8.1 я пробовал WinZip, 7zip, WinRar и Zip2Fix, но без каких-либо удачи.

Файл весит около 20 Кб, поэтому я знаю, что внутри есть какой-то контент. Есть ли способ разархивировать ?

2
задан 10 December 2013 в 15:51

1 ответ

Запустите:

cp portfolio.docx portfolio.zip

Или просто переименуйте portfolio.docx в portfolio.zip, и вы сможете открыть результирующий файл portfolio.zip с помощью диспетчера архивов и извлечь их.

Редактировать: Я только что провел быструю проверку, файлы, скорее всего, находятся в word/document.xml или docProps/core.xml в извлеченной папке.

Другое редактирование: Если результирующий zip-файл поврежден, посмотрите здесь .

0
ответ дан 10 December 2013 в 15:51

Другие вопросы по тегам:

Похожие вопросы: