Является ли моя команда оптимальным клонировать диск?

Doc для GtkCalendar: http://developer.gnome.org/gtk/2.24/GtkCalendar.html

Общее объяснение для основанного на нуле:

Использование нуля для запуска подсчет на самом деле является трюком оптимизации от программистов Ассамблеи. Вместо того, чтобы присваивать 1 регистру count, они XOR'или регистр с самим собой, что было немного быстрее в цикле CPU. Это означало, что подсчет начнется с 0 и будет всегда соответствовать длине элементов, исключая последний.

Кроме того, использование нуля также популярно с помощью арифметики указателей, где вы бы использовали один базовый указатель указывая на некоторую выделенную память плюс второй указатель, который был бы смещен от этого базового указателя. Здесь, используя нулевое значение, очень важно указать смещение на базу блока памяти. (Общая логика массива имеет тенденцию быть базовым адресом плюс размер записи смещения x.)

И числа, основанные на нулевом значении? Часто многие среды программирования вычисляют данные за несколько дней с тех пор, как некоторые данные по умолчанию. 31 декабря 1899 года - популярная дата, хотя в качестве базовой даты было много других дат. Все остальные даты смещены от этой базы и будут храниться только как один номер. Фракции будут использоваться для указания часов, минут и секунд, где 0,25 будет 24/4 = 6 часов. Таким образом, чтобы преобразовать дату в настоящую дату, вся окружающая среда должна сделать это, чтобы преобразовать это число в настоящую дату.

Однако комбинация массивов с нулевым основанием и значений месяца на основе 1 проблема. Чтобы получить название месяца месяца 9, вам нужно будет получить элемент 8 из массива месяца. Некоторые разработчики были бы счастливы с уменьшением номера месяца, прежде чем получить его имя. Другие предпочли изменить месяц на что-то ноль-основанное, потому что люди просто хотят знать имя, а не число.

Кроме того, есть более чем одна причина, по которой можно было подумать, что в Date / Calendar есть неправильные:

Удивительные базы (1900 в качестве базы года в Дате, по общему признанию, для устаревших конструкторов; 0 в качестве базы месяца в обоих). Mutability - использование неизменяемых типов упрощает работу с действительно эффективными значениями. Недостаточный набор типов: приятно иметь дату и календарь как разные вещи, но разделение «локальных» и «зональных» значений отсутствует, а также дата / время против даты и времени. API, который приводит к уродливому коду с магическими константами, а не явно названным методам. API, о котором очень сложно рассуждать - все дело о том, когда вещи пересчитаны и т. д. Использование конструкторов без параметров по умолчанию «сейчас», что приводит к жесткому тестированию кода
1
задан 25 January 2013 в 15:37

1 ответ

Как говорили другие, нет универсально правильного размера блока; то, что оптимально для одной ситуации, или одна часть аппаратного обеспечения может быть ужасно неэффективной для другой. Кроме того, в зависимости от работоспособности дисков может быть предпочтительнее использовать другой размер блока, чем тот, который является «оптимальным».

Одна вещь, которая довольно надежна на современном оборудовании, заключается в том, что размер блока по умолчанию 512 байты, как правило, почти на порядок медленнее, чем более оптимальная альтернатива. Когда я сомневаюсь, я обнаружил, что 64K является довольно солидным современным дефолтом. Хотя 64K обычно не является оптимальным размером блока, по моему опыту он, как правило, намного эффективнее, чем по умолчанию. 64K также имеет довольно солидную историю надежности работы: вы можете найти сообщение из списка рассылки Eug-Lug около 2002 года, рекомендуя размер блока 64K.

Для определения оптимального размера блока вывода, Я написал следующий скрипт, который тестирует запись тестового файла 128M с dd в разных размерах блоков по умолчанию от 512 байт до максимум 64M. Будьте осторожны, этот сценарий использует dd внутренне, поэтому используйте с осторожностью.

dd_obs_test.sh:

#!/bin/bash

# Since we're dealing with dd, abort if any errors occur
set -e

TEST_FILE=${1:-dd_obs_testfile}
TEST_FILE_EXISTS=0
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=1; fi
TEST_FILE_SIZE=134217728

if [ $EUID -ne 0 ]; then
  echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi

# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
  # Calculate number of segments required to copy
  COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))

  if [ $COUNT -le 0 ]; then
    echo "Block size of $BLOCK_SIZE estimated to require $COUNT blocks, aborting further tests."
    break
  fi

  # Clear kernel cache to ensure more accurate test
  [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches

  # Create a test file with the specified block size
  DD_RESULT=$(dd if=/dev/zero of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync 2>&1 1>/dev/null)

  # Extract the transfer rate from dd's STDERR output
  TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')

  # Clean up the test file if we created one
  if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi

  # Output the result
  printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done

сообщение из списка рассылки Eug-Lug [!d2 ]

Я тестировал этот скрипт только на системе Debian (Ubuntu) и на OSX Yosemite, поэтому, возможно, потребуется некоторое улучшение для работы с другими вариантами Unix.

By по умолчанию команда создаст тестовый файл с именем dd_obs_testfile в текущем каталоге. В качестве альтернативы вы можете указать путь к пользовательскому тестовому файлу, указав путь после имени сценария:

$ ./dd_obs_test.sh /path/to/disk/test_file

. Вывод скрипта - это список проверенных размеров блоков и их соответствующих скоростей передачи, таких как поэтому:

$ ./dd_obs_test.sh
block size : transfer rate
       512 : 11.3 MB/s
      1024 : 22.1 MB/s
      2048 : 42.3 MB/s
      4096 : 75.2 MB/s
      8192 : 90.7 MB/s
     16384 : 101 MB/s
     32768 : 104 MB/s
     65536 : 108 MB/s
    131072 : 113 MB/s
    262144 : 112 MB/s
    524288 : 133 MB/s
   1048576 : 125 MB/s
   2097152 : 113 MB/s
   4194304 : 106 MB/s
   8388608 : 107 MB/s
  16777216 : 110 MB/s
  33554432 : 119 MB/s
  67108864 : 134 MB/s

(Примечание: единица скорости передачи будет варьироваться в зависимости от ОС)

Чтобы проверить оптимальный размер блока чтения, вы можете использовать более или менее тот же процесс, но вместо чтения из /dev/zero и записи на диск, вы должны прочитать с диска и записать в /dev/null. Сценарий для этого может выглядеть так:

dd_ibs_test.sh:

#!/bin/bash

# Since we're dealing with dd, abort if any errors occur
set -e

TEST_FILE=${1:-dd_ibs_testfile}
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=$?; fi
TEST_FILE_SIZE=134217728

# Exit if file exists
if [ -e $TEST_FILE ]; then
  echo "Test file $TEST_FILE exists, aborting."
  exit 1
fi
TEST_FILE_EXISTS=1

if [ $EUID -ne 0 ]; then
  echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi

# Create test file
echo 'Generating test file...'
BLOCK_SIZE=65536
COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))
dd if=/dev/urandom of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync > /dev/null 2>&1

# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
  # Clear kernel cache to ensure more accurate test
  [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches

  # Read test file out to /dev/null with specified block size
  DD_RESULT=$(dd if=$TEST_FILE of=/dev/null bs=$BLOCK_SIZE 2>&1 1>/dev/null)

  # Extract transfer rate
  TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')

  printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done

# Clean up the test file if we created one
if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi

Просмотр в GitHub

Важное различие в этом случае состоит в том, что test file - это файл, написанный скриптом. Не указывайте эту команду в существующем файле, или существующий файл будет перезаписан случайными данными!

Для моего конкретного оборудования я обнаружил, что 128K был наиболее оптимальным размером входного блока на жестком диске, а 32K был наиболее оптимальным на SSD.

Хотя этот ответ охватывает большинство моих находок, мне нужно было определить оптимальный размер блока dd достаточно, чтобы я написал View on GitHub об этом. Вы можете найти более подробную информацию о тестах, которые я там провел.

Это сообщение StackOverflow также может быть полезно: dd: Как рассчитать оптимальный размер блока?

4
ответ дан 25 May 2018 в 02:09
  • 1
    Научите человека ловить рыбу = +1 – HackSlash 15 February 2018 в 20:34
  • 2
    @ tdg5 Это отличный скрипт, но он запускается в фатальные ошибки при выполнении из Cygwin в среде Windows 7. Есть ли версия, которая будет работать на Cygwin? – Hashim 31 March 2018 в 03:07

Другие вопросы по тегам:

Похожие вопросы: