У меня есть Ubuntu 12.10, на SSD (Гибкость OCZ 3 128 ГБ), со скромно разогнанным i5-2500k (4.4 ГГц) на материнской плате P8Z68V_LX. Я думаю, что может быть проблема с SSD. Его довольно неиспользованное, и на в настоящее время только 11% полно.
Рабочий рубин на направляющих, когда вещи иногда загадочно повреждаются, обычно, потому что где-нибудь в оперативных библиотеках буква, кажется, изменилась. Например, в хеше "S" был изменен на "{", и несколько дней спустя в файле ложка-вилки заголовок определения изменился на "s {ite", когда это должен был ясно быть "комплект".
Ubuntu сталкивалась со многими внутренними ошибками и не могла сообщить о них, таким образом порождая другую ошибку сообщить об этом... и так далее. Иногда это жалуется на неправильное дополнение.
Это не моя основная машина работы, таким образом, я стремлюсь экспериментировать на ней для обнаружения, каково это.
smartctl изверг:
> sudo smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-3.5.0-27-generic] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF INFORMATION SECTION ===
Model Family: SandForce Driven SSDs
Device Model: OCZ-AGILITY3
Serial Number: OCZ-822QB5MV0QDI394P
LU WWN Device Id: 5 e83a97 e3d1ecf1a
Firmware Version: 2.15
User Capacity: 120,034,123,776 bytes [120 GB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: ACS-2 revision 3
Local Time is: Thu Apr 18 15:40:12 2013 BST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x02) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 1) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 1465) seconds.
Offline data collection
capabilities: (0x7f) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Abort Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 48) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x0021) SCT Status supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 090 090 050 Pre-fail Always - 0/2566041
5 Retired_Block_Count 0x0033 100 100 003 Pre-fail Always - 0
9 Power_On_Hours_and_Msec 0x0032 100 100 000 Old_age Always - 731h+39m+09.960s
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 256
171 Program_Fail_Count 0x0032 000 000 000 Old_age Always - 0
172 Erase_Fail_Count 0x0032 000 000 000 Old_age Always - 0
174 Unexpect_Power_Loss_Ct 0x0030 000 000 000 Old_age Offline - 68
177 Wear_Range_Delta 0x0000 000 000 000 Old_age Offline - 1
181 Program_Fail_Count 0x0032 000 000 000 Old_age Always - 0
182 Erase_Fail_Count 0x0032 000 000 000 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
194 Temperature_Celsius 0x0022 030 030 000 Old_age Always - 30 (Min/Max 30/30)
195 ECC_Uncorr_Error_Count 0x001c 120 120 000 Old_age Offline - 0/2566041
196 Reallocated_Event_Count 0x0033 100 100 003 Pre-fail Always - 0
201 Unc_Soft_Read_Err_Rate 0x001c 120 120 000 Old_age Offline - 0/2566041
204 Soft_ECC_Correct_Rate 0x001c 120 120 000 Old_age Offline - 0/2566041
230 Life_Curve_Status 0x0013 100 100 000 Pre-fail Always - 100
231 SSD_Life_Left 0x0013 100 100 010 Pre-fail Always - 0
233 SandForce_Internal 0x0000 000 000 000 Old_age Offline - 481
234 SandForce_Internal 0x0032 000 000 000 Old_age Always - 454
241 Lifetime_Writes_GiB 0x0032 000 000 000 Old_age Always - 454
242 Lifetime_Reads_GiB 0x0032 000 000 000 Old_age Always - 1025
SMART Error Log not supported
SMART Self-test Log not supported
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Обновление:
Выполнили Memtest86, первоначально он отображал много ошибок от второй передачи, таким образом, я перезапустил и проверил напряжения BIOS, они были всеми хорошо. Downclocked к нормальной скорости 3.3 ГГц, перепроверенным напряжениям, все хорошо.
Напряжения:
CPU : 1.096V
3.3V : 3.344V
5V : 5.000V
12V : 12.096V
Повторно выполнил Memtest86 в течение ночи:
Time 16:23:23 Iterations: 6 AdsrMode:64Bit Pass: 24 Errors:65535+
Error Confidence Value: 50
Lowest Error Address: 00180a73000 - 6154.4MB
Highest Error Address: 001dffffffc - 7679.9MB
Bits in Error Mask: ffffffff
Bits in Error - Total: 32 Min: 1 Max:31 Avg:32768
Max Contiguous Errors: 65535+
После документов о MemTest86 это предполагает, что значение уверенности выше 100 предлагает уверенность в проблемах памяти. Учитывая, что его только 50, я буду подкачивать RAM вокруг и видеть, является ли это RAM или материнская плата.
Update2:
Я подкачал 2 Поршня на 4 ГБ, Слоняется поблизости между A2 и B2 (это - то, как они, как предполагается, входят, не A1 и B1, который был бы слишком интуитивен) выполнил memtest, 6 передач, и ничего не произошло. Разогнанный к 4.3 ГГц, 6 передач и ничто снова. Возможно, я не усаживал RAM правильно...
Update3:
Оставленный его работающий на основе выходных, найденных ошибками, которые предлагают, он может быть проблема с материнской платой:
Time: 61:07:22 Iterations:240 AdrsMode:64Bit Pass: 106 Errors: 65535+
Error Confidence Value: 77
Lowest Error Address : 001c0027000 - 7168.1MB
Highest Error Address : 001dffffffc - 7679.9MB
Bits in Error Mask : ffffffff
Bits in Error - Total : 32 Min: 1 Max: 31 Avg: 32768
Max Contiguous Errors : 65535+
Мое лучшее предположение - то, потому что адрес все еще высок (выше 4 ГБ после свопинга поршня между используемыми слотами), это - проблема с материнской платой.
Update3:
Поместите RAM в слоты A1 и B1. MemTest сделал 44 передачи, никакие ошибки. Конечно, проблема с материнской платой - один из слотов плох. Я не стремился бы обвинить материнскую плату ASUS, это была, вероятно, поставка или мои придурковатые руки.
Проблема была с материнской платой, в частности были ошибки памяти при использовании определенного слота памяти. MemTest86 - ценный инструмент!