Файл моей подруги поврежден .docx поврежден, и я пытаюсь восстановить текст из него. Я узнал, что .docx - это, по сути, zip-файл, который содержит папки и набор XML-файлов (и один из них содержит текст документа). Я выполнил следующую команду в Ubuntu 10.10, чтобы распаковать архив:
unzip portfolio.docx -d file-dir
Результат, который я получил:
End-of-central-directory signature not found. Either this file is not a zipfile, or it constitutes one disk of multi-part archive. In the latter case the central directory and zipfile comment will be found on the last disk(s) of this archieve.
unzip: cannot find zipfile directory in one of portfolio.docx or portfolio.docx.zip, and cannot find portfolio.docx.ZIP, period.
В Windows 8.1 я пробовал WinZip, 7zip, WinRar и Zip2Fix, но без каких-либо удачи.
Файл весит около 20 Кб, поэтому я знаю, что внутри есть какой-то контент. Есть ли способ разархивировать ?
Запустите:
cp portfolio.docx portfolio.zip
Или просто переименуйте portfolio.docx
в portfolio.zip
, и вы сможете открыть результирующий файл portfolio.zip
с помощью диспетчера архивов и извлечь их.
Редактировать: Я только что провел быструю проверку, файлы, скорее всего, находятся в word/document.xml
или docProps/core.xml
в извлеченной папке.
Другое редактирование: Если результирующий zip-файл поврежден, посмотрите здесь .