Я пытаюсь прочитать CSV из github в R:
latent.growth.data <- read.csv("https://github.com/aronlindberg/latent_growth_classes/blob/master/LGC_data.csv")
Однако это дает мне:
Error in file(file, "rt") : cannot open the connection
In addition: Warning message:
In file(file, "rt") : unsupported URL scheme
Я попробовал ?read.csv, ?download.file , getURL (который возвратил только странный HTML), а также руководство по импорту данных, но все еще не может понять, как заставить его работать.
Что я делаю неправильно?
curl может не работать в Windows по крайней мере для меня
Это то, что сработало для меня в Windows
download.file ("https://github.com/aronlindberg/ latent_growth_classes / master / LGC_data.csv ", destfile =" /tmp/test.csv",method="wininet")
В Linux
download.file (" https://github.com/aronlindberg/latent_growth_classes/master/LGC_data.csv ", destfile =" /tmp/test.csv",method="curl")
Понимая, что вопрос очень старый, Google по-прежнему сообщал о нем как о главном результате (по крайней мере, для меня), поэтому я решил предоставить ответ на 2015 год.
Люди обычно переносятся теперь на curl (включая известный httr), как описано r-bloggers, который предлагает следующее очень простое решение:
library(curl)
x <- read.csv( curl("https://raw.githubusercontent.com/trinker/dummy/master/data/gcircles.csv") )
Я использую R 3.0.2, и этот код выполняет задание.
urlfile<-'https://raw.github.com/aronlindberg/latent_growth_classes/master/LGC_data.csv'
dsin<-read.csv(urlfile)
, а также
urlfile<-'https://raw.github.com/aronlindberg/latent_growth_classes/master/LGC_data.csv'
dsin<-read.csv(url(urlfile))
edit (sessionInfo)
R version 3.0.2 (2013-09-25)
Platform: i386-w64-mingw32/i386 (32-bit)
locale:
[1] LC_COLLATE=Polish_Poland.1250 LC_CTYPE=Polish_Poland.1250
[3] LC_MONETARY=Polish_Poland.1250 LC_NUMERIC=C
[5] LC_TIME=Polish_Poland.1250
attached base packages:
[1] stats graphics grDevices utils datasets methods base
loaded via a namespace (and not attached):
[1] tools_3.0.2
Из документации url:
Обратите внимание, что соединения «https: //» не поддерживаются (за некоторыми исключениями в Windows).Таким образом, проблема в том, что R не разрешает ссылки на https URL.
Вы можете использовать download.file с curl:
download.file("https://raw.github.com/aronlindberg/latent_growth_classes/master/LGC_data.csv",
destfile = "/tmp/test.csv", method = "curl")
В том же стиле, что и Ахмед, я решил обновить ответ, так как теперь вы можете просто использовать пакет Хэдли readr. Следует отметить только одно: вам нужно, чтобы URL-адрес был сырым контентом (см. [F3] ниже). Вот пример:
library(readr)
data <- read_csv("https://raw.githubusercontent.com/RobertMyles/Bayesian-Ideal-Point-IRT-Models/master/Senate_Example.csv")
Voilà!
Это то, чем я помогаю развивать rio. Это в основном универсальный пакет импорта / экспорта данных, который поддерживает HTTPS / SSL и передает тип файла из его расширения, что позволяет вам читать в основном все, используя одну функцию импорта:
library("rio")
Если вы захватите " raw "для вашего CSV из Github, вы можете загрузить одну строку с помощью import:
import("https://raw.githubusercontent.com/aronlindberg/latent_growth_classes/master/LGC_data.csv")
В результате получается data.frame:
top100_repository_name month monthly_increase monthly_begin_at monthly_end_with
1 Bukkit 2012-03 9 431 440
2 Bukkit 2012-04 19 438 457
3 Bukkit 2012-05 19 455 474
4 Bukkit 2012-06 18 475 493
5 Bukkit 2012-07 15 492 507
6 Bukkit 2012-08 50 506 556
...