Как я диагностирую внезапное замедление

Выполнение особенно вычисляет - интенсивная задача на моем компьютере (Tecra W50) в течение больше, чем нескольких секунд заставляет его становиться очень медленным. Производительность не возвращается к нормальному после того, как задача завершится.

  • Выполнение time python3 -c "for i in range(10000000): pass" печать за 0.2 секунды до запусков компьютера, являющихся медленным, но спустя 2.1 секунды после этого.

  • Перезагрузка решает проблему до следующего раза, когда я выполняю интенсивную задачу.

  • dmesg не показывает ничего за прошлые 2 часа

  • htop шоу низкое использование ресурсов, и с точки зрения ЦП и с точки зрения RAM.

  • Я недавно не сделал dist-обновления, но я действительно устанавливал новое (3.16.0-38-универсальное) ядро

Как я должен приблизиться к этой проблеме?

Править:

На основе проницательного комментария Harald я вывел /proc/cpuinfo прежде и после выполнения вычисления - интенсивная задача. Разность довольно говорит:

@@ -5,7 +5,7 @@
 model name : Intel(R) Core(TM) i7-4810MQ CPU @ 2.80GHz
 stepping   : 3
 microcode  : 0x1c
-cpu MHz        : 2800.218
+cpu MHz        : 609.218
 cache size : 6144 KB
 physical id    : 0
 siblings   : 8

(это становится повторным 8 раз с подобными числами).

Еще некоторые данные (взятый, в то время как вещи все еще работали быстро):

/ $ cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_driver
intel_pstate
/ $ cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
powersave
/ $ cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_max_freq
3800000
/ $ cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_min_freq
800000
/ $ cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_available_governors 
performance powersave

И вызов датчиков, в то время как задача работает (перед замедлением) приводит к этому:

$ sensors
acpitz-virtual-0
Adapter: Virtual device
temp1:        +99.0°C  (crit = +102.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Physical id 0:  +99.0°C  (high = +84.0°C, crit = +100.0°C)
Core 0:         +97.0°C  (high = +84.0°C, crit = +100.0°C)
Core 1:         +99.0°C  (high = +84.0°C, crit = +100.0°C)
Core 2:         +93.0°C  (high = +84.0°C, crit = +100.0°C)
Core 3:         +86.0°C  (high = +84.0°C, crit = +100.0°C)

Только несколько секунд спустя это - до 60, и все медленнее.

Я сделал некоторые более точные синхронизации: маленький сценарий Python выше с одним дополнительным нулем изменяется от

real    0m2.869s
user    0m2.868s
sys 0m0.004s

прежде, чем выполнить что-либо интенсивное к

real    0m19.208s
user    0m19.217s
sys 0m0.004s

после нескольких секунд тяжелой работы.

Вот что cpuinfo | grep MHz говорит, в то время как быстрый тест работает:

cpu MHz     : 3799.359
cpu MHz     : 3800.015
cpu MHz     : 3156.453
cpu MHz     : 2791.250
cpu MHz     : 3623.484
cpu MHz     : 3120.687
cpu MHz     : 2887.828
cpu MHz     : 3129.656

и в то время как медленный тест работает:

cpu MHz     : 608.015
cpu MHz     : 599.921
cpu MHz     : 610.531
cpu MHz     : 590.406
cpu MHz     : 642.906
cpu MHz     : 576.515
cpu MHz     : 606.484
cpu MHz     : 593.468

Синхронизации, кажется, не изменяются слишком много после echo "50" | sudo tee /sys/devices/system/cpu/intel_pstate/max_perf_pct:

real    0m18.938s
user    0m18.909s
sys 0m0.036s

и при этом они не изменяются после echo 100:

real    0m20.201s
user    0m20.195s
sys 0m0.016s

Проблема не появляется на 3.13.0-37-универсальном. Вывод sensors все еще как выше, но производительность маленького теста Python неизменна прежде и после теста. Вывод cpuinfo следующие:

cpu MHz     : 800.000
cpu MHz     : 2801.000
cpu MHz     : 800.000
cpu MHz     : 800.000
cpu MHz     : 800.000
cpu MHz     : 800.000
cpu MHz     : 800.000
cpu MHz     : 800.000

то, которое имеет смысл, так как тест является единственным, распараллелило. На том ядре некоторые вещи отличаются, также:

$ cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_driver
acpi-cpufreq
$ cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
ondemand
$ cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_max_freq
2801000
$ cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_min_freq
800000
$ cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_available_governors 
conservative ondemand userspace powersave performance 

Я также получил вывод турбостата немного прежде, во время, и после вычисления - интенсивная задача на intel_pstate драйвер:

Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -       9    0.57    1662    2793       0    0.85    0.01    0.05   98.53      45      48   95.66    0.00    0.00    0.00    2.35    0.06    0.00
   0       0      19    1.18    1643    2793      29    0.32    0.00    0.00   98.50      45      48   95.66    0.00    0.00    0.00    2.35    0.06    0.00
   0       1       2    0.15    1643    2793      29    1.35
   1       2       7    0.45    1476    2793      29    0.85    0.05    0.18   98.47      43
   1       3      10    0.59    1654    2793      29    0.71
   2       4       8    0.49    1644    2794      29    0.23    0.00    0.00   99.28      43
   2       5       3    0.18    1624    2794      29    0.54
   3       6       5    0.34    1475    2794      29    1.80    0.00    0.00   97.85      43
   3       7      22    1.19    1824    2794      29    0.95
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -    2142   60.38    3547    2794       0    4.77    0.07    0.15   34.64      89      89   30.27    0.00    0.00    0.00   36.95   30.53    0.00
   0       0    2138   60.55    3530    2794      32    3.22    0.02    0.17   36.03      80      89   30.27    0.00    0.00    0.00   36.95   30.53    0.00
   0       1    2153   60.36    3568    2794      32    3.41
   1       2    2144   60.46    3547    2794      32    6.65    0.12    0.04   32.73      89
   1       3    2127   60.10    3539    2794      32    7.01
   2       4    2113   59.67    3542    2794      32    3.95    0.07    0.02   36.29      78
   2       5    2160   60.52    3569    2794      32    3.10
   3       6    2133   59.95    3558    2794      32    6.13    0.07    0.35   33.49      72
   3       7    2163   61.41    3522    2794      32    4.68
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -    3548   98.89    3588    2794       0    1.11    0.00    0.00    0.00      91      91    0.00    0.00    0.00    0.00   56.62   47.73    0.00
   0       0    3542   98.73    3588    2794      32    1.27    0.00    0.00    0.00      84      91    0.00    0.00    0.00    0.00   56.62   47.73    0.00
   0       1    3540   98.67    3588    2794      32    1.33
   1       2    3553   99.02    3588    2794      32    0.98    0.00    0.00    0.00      91
   1       3    3582   99.84    3588    2794      32    0.16
   2       4    3518   98.06    3588    2794      32    1.94    0.00    0.00    0.00      84
   2       5    3563   99.31    3588    2794      32    0.69
   3       6    3586   99.95    3588    2794      32    0.05    0.00    0.00    0.00      78
   3       7    3499   97.53    3588    2794      32    2.47
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -    3565   99.30    3590    2794       0    0.70    0.00    0.00    0.00      95      95    0.00    0.00    0.00    0.00   56.53   47.58    0.00
   0       0    3570   99.46    3590    2794      27    0.54    0.00    0.00    0.00      89      95    0.00    0.00    0.00    0.00   56.53   47.58    0.00
   0       1    3574   99.57    3590    2794      27    0.43
   1       2    3589   99.98    3590    2794      27    0.02    0.00    0.00    0.00      95
   1       3    3563   99.26    3590    2794      27    0.74
   2       4    3519   98.01    3590    2794      27    1.99    0.00    0.00    0.00      87
   2       5    3589   99.98    3590    2794      27    0.02
   3       6    3558   99.11    3590    2794      27    0.89    0.00    0.00    0.00      80
   3       7    3556   99.05    3590    2794      27    0.95
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -    2861   98.83    2895    2794       0    1.17    0.00    0.00    0.00      93      93    0.00    0.00    0.00    0.00   46.17   38.07    0.00
   0       0    2854   98.57    2896    2794      43    1.43    0.00    0.00    0.00      89      93    0.00    0.00    0.00    0.00   46.17   38.07    0.00
   0       1    2854   98.70    2891    2794      43    1.30
   1       2    2853   98.57    2895    2794      43    1.43    0.00    0.00    0.00      93
   1       3    2892   99.79    2898    2794      43    0.21
   2       4    2865   98.92    2896    2794      43    1.08    0.00    0.00    0.00      87
   2       5    2821   97.81    2884    2794      43    2.19
   3       6    2874   99.17    2898    2794      43    0.83    0.00    0.00    0.00      83
   3       7    2873   99.15    2898    2794      43    0.85
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -    2834   98.72    2871    2794       0    1.27    0.00    0.00    0.00      97      97    0.00    0.00    0.00    0.00   46.45   38.38    0.00
   0       0    2823   98.37    2870    2794      50    1.63    0.00    0.00    0.00      95      97    0.00    0.00    0.00    0.00   46.45   38.38    0.00
   0       1    2842   99.00    2871    2794      50    1.00
   1       2    2839   98.80    2873    2794      50    1.20    0.00    0.00    0.00      97
   1       3    2868   99.72    2876    2794      50    0.28
   2       4    2817   98.17    2869    2794      50    1.81    0.01    0.01    0.00      93
   2       5    2813   98.16    2866    2794      50    1.82
   3       6    2832   98.61    2872    2794      50    1.39    0.00    0.00    0.00      88
   3       7    2841   98.95    2871    2794      50    1.05
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -    2172   98.67    2202    2793       0    1.33    0.00    0.00    0.00      95      95    0.00    0.00    0.00    0.00   34.06   26.79    0.00
   0       0    2171   97.75    2221    2793      60    2.25    0.00    0.00    0.00      93      95    0.00    0.00    0.00    0.00   34.06   26.79    0.00
   0       1    2156   98.42    2190    2793      60    1.57
   1       2    2175   98.74    2202    2793      60    1.26    0.00    0.00    0.00      95
   1       3    2180   99.24    2197    2793      60    0.76
   2       4    2173   98.73    2201    2793      60    1.27    0.00    0.00    0.00      93
   2       5    2161   98.52    2194    2794      60    1.48
   3       6    2181   98.88    2206    2794      60    1.12    0.00    0.00    0.00      87
   3       7    2180   99.08    2200    2794      60    0.92
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -    2415   98.38    2455    2793       0    1.61    0.00    0.00    0.01      70      70    0.00    0.00    0.00    0.00   38.87   31.59    0.00
   0       0    2377   97.24    2444    2793      54    2.73    0.00    0.00    0.03      68      70    0.00    0.00    0.00    0.00   38.87   31.59    0.00
   0       1    2392   97.66    2449    2793      54    2.31
   1       2    2449   99.32    2466    2793      54    0.68    0.00    0.00    0.00      70
   1       3    2418   98.61    2452    2793      54    1.39
   2       4    2437   99.00    2462    2793      54    1.00    0.00    0.00    0.00      66
   2       5    2393   97.79    2447    2793      54    2.21
   3       6    2426   98.58    2461    2793      54    1.42    0.00    0.00    0.00      68
   3       7    2430   98.82    2459    2793      54    1.18
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -    1626   98.64    1648    2794       0    1.36    0.00    0.00    0.00      66      66    0.00    0.00    0.00    0.00   24.97   18.61    0.00
   0       0    1628   98.45    1654    2794      41    1.55    0.00    0.00    0.00      63      66    0.00    0.00    0.00    0.00   24.97   18.61    0.00
   0       1    1648   99.49    1656    2794      41    0.51
   1       2    1630   98.82    1650    2794      41    1.18    0.00    0.00    0.00      66
   1       3    1607   98.05    1639    2794      41    1.95
   2       4    1637   98.85    1656    2794      41    1.15    0.00    0.00    0.00      63
   2       5    1638   99.18    1652    2794      41    0.82
   3       6    1645   99.25    1657    2794      41    0.75    0.00    0.00    0.00      64
   3       7    1571   97.01    1620    2794      41    2.99
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -     594   99.29     598    2794       0    0.71    0.00    0.00    0.00      63      63    0.00    0.00    0.00    0.00    7.26    2.11    0.00
   0       0     600   98.85     607    2794       9    1.15    0.00    0.00    0.00      61      63    0.00    0.00    0.00    0.00    7.26    2.11    0.00
   0       1     585   99.28     590    2794       9    0.72
   1       2     604   99.58     607    2794       9    0.42    0.00    0.00    0.00      63
   1       3     582   98.72     590    2794       9    1.28
   2       4     605   99.71     607    2794       9    0.29    0.00    0.00    0.00      60
   2       5     589   99.86     590    2794       9    0.14
   3       6     598   98.49     607    2794       9    1.51    0.00    0.00    0.00      59
   3       7     589   99.87     589    2794       9    0.13
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -     368   61.51     598    2794       0    3.20    0.26    1.62   33.41      58      58   25.93    0.00    0.00    0.00    5.52    1.30    0.00
   0       0     369   60.85     607    2794       9    0.78    0.28    2.22   35.86      58      58   25.93    0.00    0.00    0.00    5.52    1.30    0.00
   0       1     349   59.17     590    2794       9    2.46
   1       2     365   60.08     607    2794       9    3.01    0.60    0.16   36.15      58
   1       3     359   60.87     590    2794       9    2.21
   2       4     376   61.97     607    2794       9    2.48    0.09    4.07   31.40      56
   2       5     351   59.60     590    2794       9    4.84
   3       6     376   61.86     607    2794       9    7.83    0.07    0.02   30.23      56
   3       7     398   67.65     589    2794       9    2.03
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -       7    1.11     603    2794       0    1.28    0.02    0.02   97.57      54      56   91.75    0.00    0.00    0.00    2.43    0.03    0.00
   0       0      17    2.77     609    2794       9    0.49    0.05    0.03   96.65      54      56   91.75    0.00    0.00    0.00    2.43    0.03    0.00
   0       1       1    0.20     640    2794       9    3.07
   1       2       6    0.95     615    2794       9    3.56    0.02    0.03   95.45      54
   1       3      20    3.39     585    2794       9    1.11
   2       4       1    0.22     659    2794       9    0.31    0.00    0.00   99.47      53
   2       5       1    0.21     634    2794       9    0.32
   3       6       2    0.29     628    2794       9    1.01    0.00    0.00   98.70      54
   3       7       5    0.89     604    2794       9    0.41
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -       8    1.38     602    2794       0    1.68    0.02    0.01   96.92      53      55   89.75    0.00    0.00    0.00    2.45    0.03    0.00
   0       0       9    1.49     613    2794       9    0.55    0.05    0.00   97.90      53      55   89.75    0.00    0.00    0.00    2.45    0.03    0.00
   0       1       1    0.16     650    2794       9    1.89
   1       2      13    2.14     609    2794       9    3.66    0.02    0.00   94.19      52
   1       3      20    3.42     584    2794       9    2.37
   2       4       8    1.30     612    2794       9    0.52    0.00    0.03   98.14      51
   2       5       2    0.25     627    2794       9    1.58
   3       6       2    0.35     635    2794       9    2.21    0.01    0.00   97.44      52
   3       7      11    1.92     597    2794       9    0.64
Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt 
   -       -       8    1.26     601    2794       0    1.45    0.02    0.01   97.26      52      54   90.61    0.00    0.00    0.00    2.40    0.03    0.00
   0       0       6    0.93     622    2794       9    0.37    0.01    0.00   98.69      52      54   90.61    0.00    0.00    0.00    2.40    0.03    0.00
   0       1       1    0.15     653    2794       9    1.16
   1       2       8    1.23     611    2794       9    4.54    0.00    0.01   94.21      51
   1       3      26    4.41     584    2794       9    1.37
   2       4      11    1.76     611    2794       9    0.48    0.03    0.05   97.68      50
   2       5       2    0.30     621    2794       9    1.94
   3       6       2    0.30     642    2794       9    1.23    0.02    0.00   98.45      50
   3       7       6    1.04     602    2794       9    0.50

Некоторая дополнительная информация (после выполнения интенсивной задачи):

10:00:26 /sys/class/thermal
$ sudo grep -r . *
cooling_device0/type:Processor
cooling_device0/power/control:auto
cooling_device0/power/async:disabled
cooling_device0/power/runtime_enabled:disabled
cooling_device0/power/runtime_active_kids:0
cooling_device0/power/runtime_active_time:0
grep: cooling_device0/power/autosuspend_delay_ms: Input/output error
cooling_device0/power/runtime_status:unsupported
cooling_device0/power/runtime_usage:0
cooling_device0/power/runtime_suspended_time:0
cooling_device0/cur_state:0
cooling_device0/max_state:10
cooling_device1/type:Processor
cooling_device1/power/control:auto
cooling_device1/power/async:disabled
cooling_device1/power/runtime_enabled:disabled
cooling_device1/power/runtime_active_kids:0
cooling_device1/power/runtime_active_time:0
grep: cooling_device1/power/autosuspend_delay_ms: Input/output error
cooling_device1/power/runtime_status:unsupported
cooling_device1/power/runtime_usage:0
cooling_device1/power/runtime_suspended_time:0
cooling_device1/cur_state:0
cooling_device1/max_state:10
cooling_device2/type:Processor
cooling_device2/power/control:auto
cooling_device2/power/async:disabled
cooling_device2/power/runtime_enabled:disabled
cooling_device2/power/runtime_active_kids:0
cooling_device2/power/runtime_active_time:0
grep: cooling_device2/power/autosuspend_delay_ms: Input/output error
cooling_device2/power/runtime_status:unsupported
cooling_device2/power/runtime_usage:0
cooling_device2/power/runtime_suspended_time:0
cooling_device2/cur_state:0
cooling_device2/max_state:10
cooling_device3/type:Processor
cooling_device3/power/control:auto
cooling_device3/power/async:disabled
cooling_device3/power/runtime_enabled:disabled
cooling_device3/power/runtime_active_kids:0
cooling_device3/power/runtime_active_time:0
grep: cooling_device3/power/autosuspend_delay_ms: Input/output error
cooling_device3/power/runtime_status:unsupported
cooling_device3/power/runtime_usage:0
cooling_device3/power/runtime_suspended_time:0
cooling_device3/cur_state:0
cooling_device3/max_state:10
cooling_device4/type:Processor
cooling_device4/power/control:auto
cooling_device4/power/async:disabled
cooling_device4/power/runtime_enabled:disabled
cooling_device4/power/runtime_active_kids:0
cooling_device4/power/runtime_active_time:0
grep: cooling_device4/power/autosuspend_delay_ms: Input/output error
cooling_device4/power/runtime_status:unsupported
cooling_device4/power/runtime_usage:0
cooling_device4/power/runtime_suspended_time:0
cooling_device4/cur_state:0
cooling_device4/max_state:10
cooling_device5/type:Processor
cooling_device5/power/control:auto
cooling_device5/power/async:disabled
cooling_device5/power/runtime_enabled:disabled
cooling_device5/power/runtime_active_kids:0
cooling_device5/power/runtime_active_time:0
grep: cooling_device5/power/autosuspend_delay_ms: Input/output error
cooling_device5/power/runtime_status:unsupported
cooling_device5/power/runtime_usage:0
cooling_device5/power/runtime_suspended_time:0
cooling_device5/cur_state:0
cooling_device5/max_state:10
cooling_device6/type:Processor
cooling_device6/power/control:auto
cooling_device6/power/async:disabled
cooling_device6/power/runtime_enabled:disabled
cooling_device6/power/runtime_active_kids:0
cooling_device6/power/runtime_active_time:0
grep: cooling_device6/power/autosuspend_delay_ms: Input/output error
cooling_device6/power/runtime_status:unsupported
cooling_device6/power/runtime_usage:0
cooling_device6/power/runtime_suspended_time:0
cooling_device6/cur_state:0
cooling_device6/max_state:10
cooling_device7/type:Processor
cooling_device7/power/control:auto
cooling_device7/power/async:disabled
cooling_device7/power/runtime_enabled:disabled
cooling_device7/power/runtime_active_kids:0
cooling_device7/power/runtime_active_time:0
grep: cooling_device7/power/autosuspend_delay_ms: Input/output error
cooling_device7/power/runtime_status:unsupported
cooling_device7/power/runtime_usage:0
cooling_device7/power/runtime_suspended_time:0
cooling_device7/cur_state:0
cooling_device7/max_state:10
cooling_device8/type:LCD
cooling_device8/power/control:auto
cooling_device8/power/async:disabled
cooling_device8/power/runtime_enabled:disabled
cooling_device8/power/runtime_active_kids:0
cooling_device8/power/runtime_active_time:0
grep: cooling_device8/power/autosuspend_delay_ms: Input/output error
cooling_device8/power/runtime_status:unsupported
cooling_device8/power/runtime_usage:0
cooling_device8/power/runtime_suspended_time:0
cooling_device8/cur_state:0
cooling_device8/max_state:100
cooling_device9/type:intel_powerclamp
cooling_device9/power/control:auto
cooling_device9/power/async:disabled
cooling_device9/power/runtime_enabled:disabled
cooling_device9/power/runtime_active_kids:0
cooling_device9/power/runtime_active_time:0
grep: cooling_device9/power/autosuspend_delay_ms: Input/output error
cooling_device9/power/runtime_status:unsupported
cooling_device9/power/runtime_usage:0
cooling_device9/power/runtime_suspended_time:0
cooling_device9/cur_state:-1
cooling_device9/max_state:50
thermal_zone0/mode:enabled
thermal_zone0/temp:83000
thermal_zone0/type:acpitz
thermal_zone0/power/control:auto
thermal_zone0/power/async:disabled
thermal_zone0/power/runtime_enabled:disabled
thermal_zone0/power/runtime_active_kids:0
thermal_zone0/power/runtime_active_time:0
grep: thermal_zone0/power/autosuspend_delay_ms: Input/output error
thermal_zone0/power/runtime_status:unsupported
thermal_zone0/power/runtime_usage:0
thermal_zone0/power/runtime_suspended_time:0
grep: thermal_zone0/emul_temp: Permission denied
thermal_zone0/trip_point_0_temp:102000
thermal_zone0/trip_point_0_type:critical
thermal_zone0/policy:step_wise
thermal_zone0/passive:0
thermal_zone1/temp:51000
thermal_zone1/type:x86_pkg_temp
thermal_zone1/power/control:auto
thermal_zone1/power/async:disabled
thermal_zone1/power/runtime_enabled:disabled
thermal_zone1/power/runtime_active_kids:0
thermal_zone1/power/runtime_active_time:0
grep: thermal_zone1/power/autosuspend_delay_ms: Input/output error
thermal_zone1/power/runtime_status:unsupported
thermal_zone1/power/runtime_usage:0
thermal_zone1/power/runtime_suspended_time:0
grep: thermal_zone1/emul_temp: Permission denied
thermal_zone1/trip_point_0_temp:0
thermal_zone1/trip_point_0_type:passive
thermal_zone1/trip_point_1_temp:0
thermal_zone1/trip_point_1_type:passive
thermal_zone1/policy:step_wise

И вывод turbostat -d sleep 10

$ sudo ~/dls/turbostat -d sleep 10
turbostat version 4.7 17-June, 2015 - Len Brown 
CPUID(0): GenuineIntel 13 CPUID levels; family:model:stepping 0x6:3c:3 (6:60:3)
CPUID(6): APERF, DTS, PTM, EPB
RAPL: 5578 sec. Joule Counter Range, at 47 Watts
cpu5: MSR_NHM_PLATFORM_INFO: 0x80838f3011c00
8 * 100 = 800 MHz max efficiency frequency
28 * 100 = 2800 MHz base frequency
cpu5: MSR_IA32_POWER_CTL: 0x0004005d (C1E auto-promotion: DISabled)
cpu5: MSR_TURBO_RATIO_LIMIT: 0x24242526
36 * 100 = 3600 MHz max turbo 4 active cores
36 * 100 = 3600 MHz max turbo 3 active cores
37 * 100 = 3700 MHz max turbo 2 active cores
38 * 100 = 3800 MHz max turbo 1 active cores
cpu5: MSR_CONFIG_TDP_NOMINAL: 0x0000001c (base_ratio=12)
cpu5: MSR_CONFIG_TDP_LEVEL_1: 0x00000000 ()
cpu5: MSR_CONFIG_TDP_LEVEL_2: 0x00000000 ()
cpu5: MSR_CONFIG_TDP_CONTROL: 0x80000000 ( lock=1)
cpu5: MSR_TURBO_ACTIVATION_RATIO: 0x00000000 (MAX_NON_TURBO_RATIO=0 lock=0)
cpu5: MSR_NHM_SNB_PKG_CST_CFG_CTL: 0x1e008405 (UNdemote-C3, UNdemote-C1, demote-C3, demote-C1, locked: pkg-cstate-limit=5: pc7s)
cpu0: MSR_IA32_ENERGY_PERF_BIAS: 0x00000006 (balanced)
cpu0: MSR_CORE_PERF_LIMIT_REASONS, 0x38210000 (Active: ) (Logged: Transitions, MultiCoreTurbo, PkgPwrL2, Auto-HWP, PROCHOT, )
cpu0: MSR_GFX_PERF_LIMIT_REASONS, 0x00000000 (Active: ) (Logged: )
cpu0: MSR_RING_PERF_LIMIT_REASONS, 0x0c000000 (Active: ) (Logged: PkgPwrL1, PkgPwrL2, )
cpu0: MSR_RAPL_POWER_UNIT: 0x000a0e03 (0.125000 Watts, 0.000061 Joules, 0.000977 sec.)
cpu0: MSR_PKG_POWER_INFO: 0x00000178 (47 W TDP, RAPL 0 - 0 W, 0.000000 sec.)
cpu0: MSR_PKG_POWER_LIMIT: 0x4281d600dc8178 (UNlocked)
cpu0: PKG Limit #1: ENabled (47.000000 Watts, 28.000000 sec, clamp DISabled)
cpu0: PKG Limit #2: ENabled (58.750000 Watts, 0.002441* sec, clamp DISabled)
cpu0: MSR_PP0_POLICY: 0
cpu0: MSR_PP0_POWER_LIMIT: 0x00000000 (UNlocked)
cpu0: Cores Limit: DISabled (0.000000 Watts, 0.000977 sec, clamp DISabled)
cpu0: MSR_PP1_POLICY: 0
cpu0: MSR_PP1_POWER_LIMIT: 0x00000000 (UNlocked)
cpu0: GFX Limit: DISabled (0.000000 Watts, 0.000977 sec, clamp DISabled)
cpu0: MSR_IA32_TEMPERATURE_TARGET: 0x00641000 (100 C)
cpu0: MSR_IA32_PACKAGE_THERM_STATUS: 0x88310808 (51 C)
cpu0: MSR_IA32_THERM_STATUS: 0x88310808 (51 C +/- 1)
cpu2: MSR_IA32_THERM_STATUS: 0x88340808 (48 C +/- 1)
cpu4: MSR_IA32_THERM_STATUS: 0x88340808 (48 C +/- 1)
cpu6: MSR_IA32_THERM_STATUS: 0x88330808 (49 C +/- 1)
    Core     CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz     SMI  CPU%c1  CPU%c3  CPU%c6  CPU%c7 CoreTmp  PkgTmp Pkg%pc2 Pkg%pc3 Pkg%pc6 Pkg%pc7 PkgWatt CorWatt GFXWatt
       -       -       4    0.72     612    2794       0    1.10    0.02    0.01   98.16      51      53   93.95    0.00    0.00    0.00    2.26    0.02    0.00
       0       0       8    1.23     617    2794      18    1.48    0.03    0.01   97.26      51      53   93.95    0.00    0.00    0.00    2.26    0.02    0.00
       0       1       3    0.55     602    2794      18    2.16
       1       2      12    1.93     609    2794      18    0.76    0.05    0.02   97.24      49
       1       3       5    0.84     598    2794      18    1.85
       2       4       2    0.32     637    2794      18    0.87    0.00    0.00   98.81      49
       2       5       2    0.26     616    2794      18    0.92
       3       6       3    0.42     628    2794      18    0.25    0.00    0.00   99.32      50
       3       7       1    0.19     630    2794      18    0.49
10.003772 sec

Вывод sudo rdmsr -a 0x19a прежде, чем выполнить интенсивную задачу:

$ sudo rdmsr -a 0x19a
0
0
0
0
0
0
0
0

После:

$ sudo rdmsr -a 0x19a
1c
1c
1c
1c
1c
1c
1c
1c

Нет ничего в kern.log о температурах

4
задан 29 March 2016 в 18:12

2 ответа

Я хотел бы попытаться помочь Вам с Вашей проблемой.
я хотел бы, чтобы Вы попытались помочь мне понять Ваш конкретный вопрос лучше.

условие, где относительно недавний процессор Intel блокирует на уровне приблизительно 600 МГц, где минимум pstate для пакета составляет 800 МГц, много раз наблюдалось. Однако я только знаю об условии произойти после резюме от приостанавливания для трамбовки. Кроме того, условие (приблизительно 75% того, относительно чего попросили, не блокировка на той частоте) имеет (правильно или неправильно) приписанный проблеме с BIOS, особенно в РЕДАКТИРОВАНИИ Dell E6320.

: Теория: С текущей версией intel_pstate драйвера любое участие тепловой регулировки через Модуляцию Часов приведет к частоте ЦП, о которой сообщают, заблокированной в некоторой очень низкой частоте.
acpi-cpufreq драйвер не страдает от этой проблемы. Обратите внимание, что предложенный набор патча для intel_pstate драйвера также не страдает от этой проблемы.
В дополнение к желаемым данным турбостата, дополнительный регистр MSR поможет подтвердить или отклонить эту теорию.

Был бы Вы быть готовым сделать эти тесты и отредактировать результаты в Ваш вопрос:

. После замедляются. Сделайте Ваш time python3 -c "for i in range(10000000): pass" тест. Сделайте его приблизительно в 10 или 100 раз дольше, и в то время как это работает, делают grep MHz /proc/cpuinfo. Весь ЦП, упорно продолжил приблизительно 600 МГц? (в Вашей исходной регистрации не ясно мне, если 600 МГц были просто, потому что это было неактивно, или если это застревает там.)

. После новой начальной загрузки, и перед какой-либо интенсивной задачей, Ваша небольшая тестовая вещь работает быстрее, чем 0,2 секунды (возможно, используют в 10 или 100 раз дольше для извлечения большего количества значащих цифр)? И какие частоты ЦП Вы получаете? Т.Е. были 2 800 МГц, Вы уже перечислили приблизительно 0.75 X 3 800 МГц. или будет ЦП на самом деле переходить к 3 800 МГц (в зависимости от действия по другим центральным процессорам, и если турбо включено).

. Для предотвращения частоты запираются, патч был добавлен к intel_pstate драйверу с 4.2RC (предвыпускная версия) ряд. Если результат теста 1 выше состоял в том, что частота заблокирована, был бы Вы быть готовыми попробовать ядро 4.3RC4 . Это не могло бы разблокировать в Вашем случае, потому что проблема (как отличающаяся от проблемы BIOS) была, приостанавливают связанный.

. Если результатом теста 1 выше этого является частота, заблокирован, то это разблокировало его?:

$ echo "50" | sudo tee /sys/devices/system/cpu/intel_pstate/max_perf_pct
50

ожидают 5 секунд, чтобы гарантировать, что каждый ЦП переключается. Может потребоваться до 4 секунд для неактивного ЦП для фактического выполнения передачи через intel_pstate драйвер.

$ echo "100" | sudo tee /sys/devices/system/cpu/intel_pstate/max_perf_pct
100

И если это действительно разблокировало его, это остается приблизительно в 0,75 раза, каково это должно быть?

также проверьте свои настройки BIOS. Однако я не знаю то, что Вы искали бы.

alos рассматривают Ваш /var/log/kern.log файл для любых тепловых похожих сообщений.

будет полезно обеспечить прежде и после того, как замедление произведет от:

sudo turbostat -d sleep 10

или, для более старых версий турбостата это могло бы все еще быть:

sudo turbostat -v sleep 10

Также необходимый другой регистр MSR (потребности однажды на начальную загрузку sudo modprobe msr первый):

sudo rdmsr -a 0x19a

Также необходимый вывод от:

cd /sys/class/thermal
grep -r . *

Вы, возможно, должны были бы установить linux-tools пакет для получения турбостата, и если та версия турбостата не является достаточно новой, Вы, возможно, должны были бы сделать sudo modprobe msr сначала.

От Ваших тестов, Ваша основная проблема, кажется, что Ваш процессор перегревает и сокращает самостоятельно для защиты себя. Однако это кажется тупику при этом условии, и не восстанавливаются. Я очень хотел бы понять, почему, и упомянутые выше тесты турбостата обеспечит некоторое понимание. В особенности (я думаю), мы интересуемся пониманием и декодированием MSR_IA32_PACKAGE_THERM_STATUS строка для различных условий и различных драйверов. Мы также интересуемся пониманием и декодированием IA32_CLOCK_MODULATION MSR (0x19A).

От Ваших тестов, появляется, как будто проблема только присутствует с intel_pstate драйвером частотного масштабирования а не acpi cpufreq драйвер частотного масштабирования. Я думал, что intel_pstate драйвер использовался по умолчанию для когда-то теперь.

, Если Вы просто хотите продолжить вещи, можно отключить использование intel_pstate драйвера частотного масштабирования. Отредактируйте файл /etc/default/grub, возможно, делая копию сначала, и добавьте intel_pstate=disable к GRUB_CMDLINE_LINUX_DEFAULT строка. Вот пример от одного из моих компьютеров:

GRUB_CMDLINE_LINUX_DEFAULT="ipv6.disable=1 intel_pstate=disable net.ifnames=1 biosdevname=0 crashkernel=384M-:128M"

необходимо будет сделать редактирование как sudo, и необходимо будет работать sudo update-grub впоследствии, затем перезагрузка.

Однако я был бы крайне признательным, если, когда разрешения времен, Вы продолжите помогать исследовать проблему с intel_pstate драйвером как никакой компьютер, у меня есть доступ к, имеет проблему.

, Если Вы испытываете затруднения из-за пакета инструментов Linux, существует турбостат на моем веб-сайте, который должен работать. удвойтесь u удваивают u, двойные кузницы точки u отмечают точкой com / ~doug/linux/intel_pstate/energy/turbostat. Это также включено в источник ядра, необходимо было бы просто скомпилировать его.

РЕДАКТИРОВАНИЕ: Наблюдения от 14 образцов турбостата:

14 образцов турбостата показывают тепловые связанные проблемы. Неактивная температура кажется немного высоким, как делает неактивную частоту тактовой частоты ЦП. Кажется, существует некоторая переменная степень тепловой регулировки перед заблокированным работоспособным состоянием. Сводка от этих 14 образцов:

Sample CPU Avg_MHz   %Busy Bzy_MHz TSC_MHz  CPU%c7  PkgTmp PkgWatt CorWatt Throttled  Comment
   1     -       9    0.57    1662    2793   98.53      48    2.35    0.06  no        High idle temp and Bzy clock
   2     -    2142   60.38    3547    2794   34.64      89   36.95   30.53  no
   3     -    3548   98.89    3588    2794    0.00      91   56.62   47.73  no
   4     -    3565   99.30    3590    2794    0.00      95   56.53   47.58  no        Very high Temp
   5     -    2861   98.83    2895    2794    0.00      93   46.17   38.07  yes X 29
   6     -    2834   98.72    2871    2794    0.00      97   46.45   38.38  yes X 29
   7     -    2172   98.67    2202    2793    0.00      95   34.06   26.79  yes X 22  More Thermal throttling
   8     -    2415   98.38    2455    2793    0.01      70   38.87   31.59  yes X 25  Less Thermal throttling
   9     -    1626   98.64    1648    2794    0.00      66   24.97   18.61  yes X 16  More Thermel throttling
  10     -     594   99.29     598    2794    0.00      63    7.26    2.11  yes X 6   Locked up state
  11     -     368   61.51     598    2794    3.41      58    5.52    1.30  yes X 6
  12     -       7    1.11     603    2794    7.57      56    2.43    0.03  yes X 6   
  13     -       8    1.38     602    2794    6.92      55    2.45    0.03  yes X 6
  14     -       8    1.26     601    2794   97.26      54    2.40    0.03  yes X 6   High idle temperature 
2
ответ дан 1 December 2019 в 10:03

Ваша система BIOS использует Модуляцию Часов в качестве метода для защиты себя от тепловой перегрузки. В то время как это желает уменьшить производительность системы небольшим количеством, 75% номинального максимума, производительность на самом деле ограничивается 75% очень минимального. Кроме того, кажется, что, после того как Модуляция Часов была занята, это никогда не сбрасывает. В его текущей форме intel_pstate драйвер частотного масштабирования ЦП является существенно несовместимым с Модуляцией Часов и будет всегда управлять целью pstate к минимуму независимо от действующей нагрузки. Однако acpi-cpufreq драйвер масштабирования ЦП хорошо работает с Модуляцией Часов и является рекомендуемым драйвером для Вас.

то, что целая история? Нет. С, я думаю, Ядро 4.5, intel_pstate драйвер имеет некоторые изменения на основе идентификатора ЦП, такого, что некоторыми процессорами будут управлять основанные на загрузке алгоритмы, которые совместимы с Модуляцией Часов, и некоторыми процессорами будут управлять основанные на производительности алгоритмы, которые не совместимы с Модуляцией Часов. Ваш процессор, ID=0X3C, все еще будет базирующейся производительностью.

1
ответ дан 1 December 2019 в 10:03

Другие вопросы по тегам:

Похожие вопросы: