Почему Spark подчеркивает развязку схемы, памяти, хранилища?

Это может быть то, что вы ищете. Если это не имеет никакого отношения к вашему вопросу, возможно, это станет более понятным.

dconf read /org/cinnamon/desktop/screensaver/xscreensaver-hack

Это также может помочь:

dconf list /org/cinnamon/desktop/screensaver/
0
задан 13 August 2018 в 14:17

1 ответ

Вот пример после этой цитаты в книге ... Но в любом случае, Spark имеет мало общего с микросервисами.

В книге говорится, что память, которую Spark читает, может быть разделена на многих аппаратных машинах. Это разрешено через файловые системы Hadoop Compatible, будь то HDFS, S3 или другие. По сравнению с другими системами HPC, которые понимают только уровень файловой системы UNIX, Hadoop предоставляет более согласованный API для разных типов хранилищ.

Для хранения в памяти у Spark есть подключаемые сериализаторы.

. Для хранения на диске Spark (через Hadoop) может хранить данные в форматах, содержащих самоописанные схемы, которые читаются на -request, а не предопределено и хранится извне, например, в базе данных.

По сравнению с системами HPC, о которых говорит книга, другие инструменты, связанные с Hadoop, могут читать те же файлы, что и Spark, поэтому вы не привязаны к одному проприетарному формату, который будет работать только с этой средой HPC , поэтому он развязан

0
ответ дан 15 August 2018 в 17:04

Другие вопросы по тегам:

Похожие вопросы: