Как загрузить набор данных от командной строки (такой как Google Collaboratory) в Kaggle?

Я считал некоторые команды для загрузки файла или набора данных от терминала Google Collaboratory или Linux в к GitHub (см. мой предыдущий вопрос).

Однако я понятия не имею о том, как я могу загрузить набор данных от оболочки Google Collaboratory или Linux в Kaggle непосредственно через команды. Как я могу достигнуть этого?

0
задан 6 November 2018 в 07:13

1 ответ

1 Подготовка

На основе официальной документации API Kaggle:

  1. Установите интерфейс командной строки Kaggle (здесь через ЗЕРНЫШКО, диспетчер пакетов Python):

    sudo apt install python3-pip
    pip3 install --user kaggle
    
  2. Создайте каталог конфигурации для следующего шага:

    mkdir ~/.kaggle
    
  3. Аутентификация:

    Для использования общедоступного API Kaggle необходимо сначала аутентифицировать использование маркера API. От заголовка сайта нажмите на свое изображение профиля пользователя, затем на “Моей Учетной записи” из выпадающего меню. Это возьмет Вас к Вашим настройкам учетной записи в https://www.kaggle.com/account. Прокрутите вниз к разделу страницы, маркировал API:

    Для создания нового маркера нажмите на кнопку “Create New API Token”. Это загрузит новый аутентификационный маркер на Вашу машину.

    Сохраните его как ~/.kaggle/kaggle.json, так как это - то, где CLI будет искать его по умолчанию. Можно просто скопировать и вставить тот путь к диалогу выбора файла веб-браузера.

2 загрузки набора данных

Снова из той же официальной документации API:

Создайте новый Набор данных

Вот шаги, которые можно выполнить для создания нового набора данных на Kaggle:

  1. Создайте папку, содержащую файлы, которые Вы хотите загрузить.

  2. Выполненный

    kaggle datasets init -p /path/to/dataset
    

    генерировать файл метаданных.

  3. Добавьте метаданные своего набора данных к сгенерированному файлу, datapackage.json.

  4. Выполненный

    kaggle datasets create -p /path/to/dataset
    

    создать набор данных.

Ваш набор данных будет частным по умолчанию. Можно также добавить a -u флаг, чтобы обнародовать его, когда Вы создаете его или перешли к “Настройкам”> “Совместное использование” от страницы Вашего набора данных, чтобы обнародовать его или доля с сотрудниками.

Создайте новую версию Набора данных

Если требуется загрузить новую версию существующего набора данных, выполните эти шаги:

  1. Выполненный

    kaggle datasets init -p /path/to/dataset
    

    генерировать файл метаданных (если у Вас уже нет одного).

  2. Удостоверьтесь id поле в dataset-metadata.json (или datapackage.json) точки к Вашему набору данных.

  3. Выполненный:

    kaggle datasets version -p /path/to/dataset -m "Your message here"
    

Эти инструкции являются основными командами, требуемыми начать с созданием и обновлением Наборов данных на Kaggle. Можно узнать больше деталей из официальной документации относительно GitHub:

При рассмотрении моего ответа это оказалось хорошим способом сказать Вам прочитайте руководство.;-]

0
ответ дан 27 October 2019 в 05:19

Другие вопросы по тегам:

Похожие вопросы: