Как преобразовать документ от Google Docs до текстового файла

Как я получил бы весь текст в документе от Google Docs и преобразовал бы его в текстовый файл, предпочтительно путь, который может использоваться в сценарии? Был бы wget работа? такой как:

wget https://docs.google.com/document/d/documentcode > googledoc.txt

Если так, я смог бы использовать сокращенный URL?

4
задан 22 January 2018 в 11:52

2 ответа

Никакая потребность передать по каналу к другой программе для преобразования файла. Можно загрузить с Google Docs в любом поддерживаемом формате, при помощи существующих параметров в адресе URL.

https://docs.google.com/document/d/FILE_ID/export?format=FORMAT

где:

  • FILE_ID идентификатор строки конечного файла и;
  • FORMAT предпочтительный формат файла т.е. txt

Затем при загрузке документа с Google Docs, поскольку текстовый файл прост при помощи wget или веб-браузер. Оба метода загрузят документ как текстовый файл как ожидалось.

Я судил меня, и вывод выглядит примерно так:

$ wget https://docs.google.com/document/d/FILE_ID/export?format=txt
--####-##-## ##:##:##--  https://docs.google.com/document/d/FILE_ID/export?format=txt
Resolving docs.google.com (docs.google.com)...
Connecting to docs.google.com (docs.google.com)... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/plain]
Saving to: ‘export?format=txt’

    [ <=>                                    ] 649         --.-K/s   in 0s      

####-##-## ##:##:## (##.# MB/s) - ‘export?format=txt’ saved [649]

Адрес URL для других продуктов, таких как Google Sheets, Google Presentation или даже Google Drive немного отличался бы.

С точки зрения документации единственное соответствующее руководство, которое я нашел, было этим датированным сообщением в блоге приблизительно 2014. Существует эта страница руководства разработчика для Google Drive, но не полезна как есть. Это - все.

2
ответ дан 1 December 2019 в 10:15

Загрузите Google Doc как документ слова с расширением файла .docx. Удостоверьтесь, что у Вас есть docxtxt пакет, уже установленный. Затем выполните команду docx2txt, сопровождаемую под названием Ваш файл. Например...

docx2txt report.docx

0
ответ дан 1 December 2019 в 10:15

Другие вопросы по тегам:

Похожие вопросы: