6
ответов

Как отсортировать кадр данных панд с помощью значений из нескольких столбцов?

У меня есть следующий кадр данных: df = панды. DataFrame ([{'c1 ':3, 'c2 ':10}, {'c1 ':2, 'c2 ':30}, {'c1 ':1, 'c2 ':20}, {'c1 ':2, 'c2 ':15}, {'c1 ':2, 'c2 ':100}]) Или, в человекочитаемой форме: c1 c2 0 3 10 1...
вопрос задан: 12 July 2013 22:15
4
ответа

Сравнение двух кадров данных и получение различий

У меня есть два кадра данных. Примеры: df1: Фруктовый Цвет Цифры Даты 24.11.2013 Банана 22,1 Желтых 24.11.2013 Оранжевых 8,6 Оранжевых 24.11.2013 Apple 7.6 Green 24.11.2013 Сельдерея 10,2 Green df2: Дата...
вопрос задан: 23 May 2017 15:26
3
ответа

Измените конкретные значения столбцов данных, что наиболее эффективно?

Мне нужно изменить значения конкретных элементов в столбце dataframe, я использовал цикл for, чтобы сделать это вручную, есть ли способ использовать идиомы или. Где это более эффективно? Я считаю, что код ниже ...
вопрос задан: 13 August 2018 14:52
3
ответа

вопрос задан: 22 November 2017 03:18
2
ответа

Кадр данных Spark отличает столбцы с дублированным именем

Так как я знаю в Кадре данных Spark, который для нескольких столбцов может иметь то же имя как показано в ниже снимка кадра данных: [строка (a=107831, f=SparseVector (5, {0: 0.0, 1: 0.0, 2: 0.0, 3: 0.0, 4: 0.0}), =...
вопрос задан: 5 January 2019 19:00
2
ответа

Как добавить булевую серию в python DataFrame на основе другой серии в упомянутом DataFrame?

ТАК. Долгое время, первый раз. Я не уверен, что мой набор данных запатентован, но я могу упростить. Я имею дело с DataFrame, который включает состояния, и мне дали некоторые списки, которые содержат информацию о ...
вопрос задан: 13 August 2018 15:59
2
ответа

как получить количество строк каждой группы в пандах после groupby [duplicate]

скажем, я сгруппировал свои данные, как показано ниже: groups = df.groupby (['column1']) Теперь я хочу знать количество строк в каждой группе.
вопрос задан: 30 May 2018 09:37
2
ответа

вопрос задан: 13 November 2015 03:24
1
ответ

Как добавить суффикс (или префикс) к каждому имени столбца?

Я хочу добавить суффикс _x к каждому имени столбца как так: featuresA = myPandasDataFrame.columns.values + '_x', Как я делаю это? Кроме того, если я хотел добавить x_ как суффикс, как был бы решение...
вопрос задан: 29 January 2019 00:54
1
ответ

Spark DataFrame groupBy и вид в порядке по убыванию (pyspark)

Я использую pyspark (Python 2.7.9/Spark 1.3.1) и имею кадр данных GroupObject, который я должен отфильтровать и вид в порядке по убыванию. Попытка достигнуть его через эту часть кода...
вопрос задан: 6 January 2019 17:05
1
ответ

Принудите несколько столбцов к факторам сразу

У меня есть демонстрационный кадр данных как ниже: данные <-data.frame (матрица (образец (1:40), 4, 10, dimnames = список (1:4, БУКВЫ [1:10]))) я хочу знать, как я могу выбрать несколько столбцов и преобразовать их...
вопрос задан: 29 November 2018 07:04
1
ответ

Изменить формат даты столбца даты в виде данных [dубликат]

У меня есть этот файл данных panda df. Имя Дата Оценка Score2 Joe 26-12-2007 53.45 53.4500 Joe 27-12-2007 52.38 52.7399 Joe 28-12-2007 51.71 51.8500 Я хотел бы преобразовать ...
вопрос задан: 13 August 2018 15:51
1
ответ

Создать пустой кадр данных с именами столбцов путем присвоения строкового вектора? [дубликат]

1.create пустой кадр данных y <-data.frame () 2.assign x, строковый вектор, к y как его имена столбцов x <-c ("имя", "возраст", "пол") colnames (y) <-x Результат: Ошибка в 'colnames <-' ('*...
вопрос задан: 22 September 2015 11:48
1
ответ

Замена немногих значений в столбце кадра данных панд с другим значением

У меня есть кадр данных панд df, как проиллюстрировано ниже: Специализированный А-ч BrandName B I ABC J D K AB L я хочу заменить 'ABC' и 'AB' в столбце BrandName by A. Может...
вопрос задан: 21 November 2014 14:17
0
ответов

Добавление столбцов путем разделения числа и удаление дубликатов

У меня есть dataframe, как показано ниже (это сокращенный пример, у меня есть еще много строк и столбцов): CH1 CH2 CH3 1 3434 282 7622 2 4442 6968 8430 3 4128 6947 478 4 6718 6716 3017 5 3735 ...
вопрос задан: 13 August 2018 16:06
0
ответов

как предопределить тип данных столбцов в python и проверить каждый столбец на основе этого условия, в dataframe

Мне нужно предварительно обработать файл csv в python, поэтому я хотел предопределить тип данных для каждого столбца, а затем проверить каждое значение столбца по значению, чтобы выполнить предопределенное условие, если какой-либо из столбцов ...
вопрос задан: 13 August 2018 15:52
0
ответов

Объект GroupedData не имеет атрибута 'show', когда он делает поворот в блоке данных искры

Я хочу повернуть световой блок данных, я ссылаюсь на документацию pyspark и на основе функции поворота, ключ - это .groupBy ('name'). Pivot ('name', values ​​= None). Вот мой набор данных, В [75]: spDF.show () Out [...
вопрос задан: 13 August 2018 14:14
0
ответов

Фильтровать строки кадра данных Pandas по значениям уникальности данного столбца [duplicate]

Я пытаюсь понять, как уменьшить количество строк кадра данных Pandas до единственных экземпляров, где данный столбец имеет уникальные значения. Что-то, что имело бы смысл, было бы: получить индексы первого ...
вопрос задан: 11 June 2017 11:20
0
ответов

Заполните 3 столбца в одной части данных panda, используя значения поиска в другом фрейме данных [duplicate]

У меня есть два фрейма данных: df_source и df_dest следующим образом: & gt; & gt; & gt; & gt; & gt; df_source = pd.read_csv ('Product_Lookup.csv') & gt; & gt; & gt; & gt; & gt; df_source ProdCode ProdName ProdUPC ProdQty 0 131 ...
вопрос задан: 8 June 2016 11:31