Отказы сегментации Ubuntu 12.10, поврежденные отчеты о катастрофическом отказе, случайные буквы, изменяющиеся в файлах

У меня есть Ubuntu 12.10, на SSD (Гибкость OCZ 3 128 ГБ), со скромно разогнанным i5-2500k (4.4 ГГц) на материнской плате P8Z68V_LX. Я думаю, что может быть проблема с SSD. Его довольно неиспользованное, и на в настоящее время только 11% полно.

Рабочий рубин на направляющих, когда вещи иногда загадочно повреждаются, обычно, потому что где-нибудь в оперативных библиотеках буква, кажется, изменилась. Например, в хеше "S" был изменен на "{", и несколько дней спустя в файле ложка-вилки заголовок определения изменился на "s {ite", когда это должен был ясно быть "комплект".

Ubuntu сталкивалась со многими внутренними ошибками и не могла сообщить о них, таким образом порождая другую ошибку сообщить об этом... и так далее. Иногда это жалуется на неправильное дополнение.

Это не моя основная машина работы, таким образом, я стремлюсь экспериментировать на ней для обнаружения, каково это.

smartctl изверг:

> sudo smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-3.5.0-27-generic] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     SandForce Driven SSDs
Device Model:     OCZ-AGILITY3
Serial Number:    OCZ-822QB5MV0QDI394P
LU WWN Device Id: 5 e83a97 e3d1ecf1a
Firmware Version: 2.15
User Capacity:    120,034,123,776 bytes [120 GB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  ACS-2 revision 3
Local Time is:    Thu Apr 18 15:40:12 2013 BST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x02) Offline data collection activity
          was completed without error.
          Auto Offline Data Collection: Disabled.
Self-test execution status:      (   1) The previous self-test routine completed
          without error or no self-test has ever
          been run.
Total time to complete Offline
data collection:    ( 1465) seconds.
Offline data collection
capabilities:        (0x7f) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Abort Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    (  48) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.
SCT capabilities:          (0x0021) SCT Status supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   090   090   050    Pre-fail  Always       -       0/2566041
  5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       0
  9 Power_On_Hours_and_Msec 0x0032   100   100   000    Old_age   Always       -       731h+39m+09.960s
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       256
171 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       68
177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       1
181 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
182 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   030   030   000    Old_age   Always       -       30 (Min/Max 30/30)
195 ECC_Uncorr_Error_Count  0x001c   120   120   000    Old_age   Offline      -       0/2566041
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Unc_Soft_Read_Err_Rate  0x001c   120   120   000    Old_age   Offline      -       0/2566041
204 Soft_ECC_Correct_Rate   0x001c   120   120   000    Old_age   Offline      -       0/2566041
230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100
231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
233 SandForce_Internal      0x0000   000   000   000    Old_age   Offline      -       481
234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       454
241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       454
242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       1025

SMART Error Log not supported
SMART Self-test Log not supported
SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Обновление:

Выполнили Memtest86, первоначально он отображал много ошибок от второй передачи, таким образом, я перезапустил и проверил напряжения BIOS, они были всеми хорошо. Downclocked к нормальной скорости 3.3 ГГц, перепроверенным напряжениям, все хорошо.

Напряжения:

CPU  : 1.096V
3.3V : 3.344V
5V   : 5.000V
12V  : 12.096V

Повторно выполнил Memtest86 в течение ночи:

Time 16:23:23  Iterations: 6  AdsrMode:64Bit   Pass: 24 Errors:65535+

Error Confidence Value: 50
Lowest Error Address: 00180a73000 - 6154.4MB
Highest Error Address: 001dffffffc - 7679.9MB
Bits in Error Mask: ffffffff
Bits in Error - Total: 32  Min: 1  Max:31  Avg:32768
Max Contiguous Errors: 65535+

После документов о MemTest86 это предполагает, что значение уверенности выше 100 предлагает уверенность в проблемах памяти. Учитывая, что его только 50, я буду подкачивать RAM вокруг и видеть, является ли это RAM или материнская плата.

Update2:

Я подкачал 2 Поршня на 4 ГБ, Слоняется поблизости между A2 и B2 (это - то, как они, как предполагается, входят, не A1 и B1, который был бы слишком интуитивен) выполнил memtest, 6 передач, и ничего не произошло. Разогнанный к 4.3 ГГц, 6 передач и ничто снова. Возможно, я не усаживал RAM правильно...

Update3:

Оставленный его работающий на основе выходных, найденных ошибками, которые предлагают, он может быть проблема с материнской платой:

Time:  61:07:22   Iterations:240   AdrsMode:64Bit   Pass: 106   Errors: 65535+

Error Confidence Value: 77
Lowest Error Address  : 001c0027000 -  7168.1MB
Highest Error Address : 001dffffffc -  7679.9MB
Bits in Error Mask    : ffffffff
Bits in Error - Total : 32  Min: 1  Max: 31  Avg: 32768
Max Contiguous Errors : 65535+

Мое лучшее предположение - то, потому что адрес все еще высок (выше 4 ГБ после свопинга поршня между используемыми слотами), это - проблема с материнской платой.

Update3:

Поместите RAM в слоты A1 и B1. MemTest сделал 44 передачи, никакие ошибки. Конечно, проблема с материнской платой - один из слотов плох. Я не стремился бы обвинить материнскую плату ASUS, это была, вероятно, поставка или мои придурковатые руки.

0
задан 23 April 2013 в 11:46

1 ответ

Проблема была с материнской платой, в частности были ошибки памяти при использовании определенного слота памяти. MemTest86 - ценный инструмент!

0
ответ дан 23 April 2013 в 11:46

Другие вопросы по тегам:

Похожие вопросы: