Как я получил бы весь текст в документе от Google Docs и преобразовал бы его в текстовый файл, предпочтительно путь, который может использоваться в сценарии? Был бы wget
работа? такой как:
wget https://docs.google.com/document/d/documentcode > googledoc.txt
Если так, я смог бы использовать сокращенный URL?
Никакая потребность передать по каналу к другой программе для преобразования файла. Можно загрузить с Google Docs в любом поддерживаемом формате, при помощи существующих параметров в адресе URL.
https://docs.google.com/document/d/FILE_ID/export?format=FORMAT
где:
FILE_ID
идентификатор строки конечного файла и;FORMAT
предпочтительный формат файла т.е. txt
Затем при загрузке документа с Google Docs, поскольку текстовый файл прост при помощи wget
или веб-браузер. Оба метода загрузят документ как текстовый файл как ожидалось.
Я судил меня, и вывод выглядит примерно так:
$ wget https://docs.google.com/document/d/FILE_ID/export?format=txt
--####-##-## ##:##:##-- https://docs.google.com/document/d/FILE_ID/export?format=txt
Resolving docs.google.com (docs.google.com)...
Connecting to docs.google.com (docs.google.com)... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/plain]
Saving to: ‘export?format=txt’
[ <=> ] 649 --.-K/s in 0s
####-##-## ##:##:## (##.# MB/s) - ‘export?format=txt’ saved [649]
Адрес URL для других продуктов, таких как Google Sheets, Google Presentation или даже Google Drive немного отличался бы.
С точки зрения документации единственное соответствующее руководство, которое я нашел, было этим датированным сообщением в блоге приблизительно 2014. Существует эта страница руководства разработчика для Google Drive, но не полезна как есть. Это - все.
Загрузите Google Doc как документ слова с расширением файла .docx. Удостоверьтесь, что у Вас есть docxtxt пакет, уже установленный. Затем выполните команду docx2txt, сопровождаемую под названием Ваш файл. Например...
docx2txt report.docx