pyspark: выборка общих данных из фрейма данных при сравнении значений данных столбцов

У меня есть два фрейма данных pyspark, подобные этому. data_frame A

+----+---+
|name1| id1|
+----+---+
|   a|  3|
|   b|  5|
|   c|  7|
+----+---+

data_frame B

+----+---+
|name2| id2|
+----+---+
|   a|  13|
|   b|  15|
|   c|  17|
|   d|  6|
|   e|  0|
|   f|  3|
+----+---+

Я хочу получить содержимое Dataframe B, если совпадают значения name1 (from df a) и name2 (from df b). как показано ниже. o / p dataframe

+----+---+
|name2| id2|
+----+---+
|   a|  13|
|   b|  15|
|   c|  17|
+----+---+

Я хочу избежать дорогостоящих методов, таких как collect () и т. д. Как это можно сделать в искры apache?

0
задан 13 August 2018 в 13:48

1 ответ

[F1]
0
ответ дан 15 August 2018 в 17:04

Другие вопросы по тегам:

Похожие вопросы: