Загрузка и / или импорт данных R из github [duplicate]

Я пытаюсь прочитать CSV из github в R:

latent.growth.data <- read.csv("https://github.com/aronlindberg/latent_growth_classes/blob/master/LGC_data.csv")

Однако это дает мне:

Error in file(file, "rt") : cannot open the connection
In addition: Warning message:
In file(file, "rt") : unsupported URL scheme

Я попробовал ?read.csv, ?download.file , getURL (который возвратил только странный HTML), а также руководство по импорту данных, но все еще не может понять, как заставить его работать.

Что я делаю неправильно?

39
задан 11 September 2015 в 11:32

6 ответов

curl может не работать в Windows по крайней мере для меня

Это то, что сработало для меня в Windows

download.file ("https://github.com/aronlindberg/ latent_growth_classes / master / LGC_data.csv ", destfile =" /tmp/test.csv",method="wininet")

В Linux

download.file (" https://github.com/aronlindberg/latent_growth_classes/master/LGC_data.csv ", destfile =" /tmp/test.csv",method="curl")

0
ответ дан 15 August 2018 в 16:57

Понимая, что вопрос очень старый, Google по-прежнему сообщал о нем как о главном результате (по крайней мере, для меня), поэтому я решил предоставить ответ на 2015 год.

Люди обычно переносятся теперь на curl (включая известный httr), как описано r-bloggers, который предлагает следующее очень простое решение:

library(curl)

x <- read.csv( curl("https://raw.githubusercontent.com/trinker/dummy/master/data/gcircles.csv") )
4
ответ дан 15 August 2018 в 16:57

Я использую R 3.0.2, и этот код выполняет задание.

urlfile<-'https://raw.github.com/aronlindberg/latent_growth_classes/master/LGC_data.csv'
dsin<-read.csv(urlfile)

, а также

urlfile<-'https://raw.github.com/aronlindberg/latent_growth_classes/master/LGC_data.csv'
dsin<-read.csv(url(urlfile))

edit (sessionInfo)

R version 3.0.2 (2013-09-25)
Platform: i386-w64-mingw32/i386 (32-bit)

locale:
[1] LC_COLLATE=Polish_Poland.1250  LC_CTYPE=Polish_Poland.1250   
[3] LC_MONETARY=Polish_Poland.1250 LC_NUMERIC=C                  
[5] LC_TIME=Polish_Poland.1250    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

loaded via a namespace (and not attached):
[1] tools_3.0.2
13
ответ дан 15 August 2018 в 16:57
  • 1
    Цитата из ?url: Обратите внимание, что схема URL «https: //» не поддерживается, кроме Windows. – daroczig 16 May 2014 в 18:48
  • 2
    работал для меня, меняя 'https: //' для 'http: //' – Andriy T. 29 April 2015 в 19:31

Из документации url:

Обратите внимание, что соединения «https: //» не поддерживаются (за некоторыми исключениями в Windows).

Таким образом, проблема в том, что R не разрешает ссылки на https URL.

Вы можете использовать download.file с curl:

download.file("https://raw.github.com/aronlindberg/latent_growth_classes/master/LGC_data.csv", 
    destfile = "/tmp/test.csv", method = "curl")
20
ответ дан 15 August 2018 в 16:57

В том же стиле, что и Ахмед, я решил обновить ответ, так как теперь вы можете просто использовать пакет Хэдли readr. Следует отметить только одно: вам нужно, чтобы URL-адрес был сырым контентом (см. [F3] ниже). Вот пример:

library(readr)
data <- read_csv("https://raw.githubusercontent.com/RobertMyles/Bayesian-Ideal-Point-IRT-Models/master/Senate_Example.csv")

Voilà!

4
ответ дан 15 August 2018 в 16:57

Это то, чем я помогаю развивать rio. Это в основном универсальный пакет импорта / экспорта данных, который поддерживает HTTPS / SSL и передает тип файла из его расширения, что позволяет вам читать в основном все, используя одну функцию импорта:

library("rio")

Если вы захватите " raw "для вашего CSV из Github, вы можете загрузить одну строку с помощью import:

import("https://raw.githubusercontent.com/aronlindberg/latent_growth_classes/master/LGC_data.csv")

В результате получается data.frame:

     top100_repository_name   month monthly_increase monthly_begin_at monthly_end_with
1                    Bukkit 2012-03                9              431              440
2                    Bukkit 2012-04               19              438              457
3                    Bukkit 2012-05               19              455              474
4                    Bukkit 2012-06               18              475              493
5                    Bukkit 2012-07               15              492              507
6                    Bukkit 2012-08               50              506              556
...
3
ответ дан 15 August 2018 в 16:57
  • 1
    Я пробую это и получаю get_ext(file) : file has no extension – Adrian 28 May 2015 в 05:16
  • 2
    @Adrian В последней версии Github появилась небольшая опечатка. Либо установите более старую версию из CRAN, либо установите ее из Github, и она будет работать для вас. – Thomas 28 May 2015 в 08:47
  • 3
    Спасибо - проблема исправлена. Ваше решение - единственное, что сработало для меня (Windows 8.1) – Adrian 28 May 2015 в 10:05

Другие вопросы по тегам:

Похожие вопросы: