coolbits «Отсутствуют вентиляторы» после добавления разветвителя Pcie

Я работаю над сборкой своего персонального компьютера.

Я использую материнскую плату TB85.

Сначала я тестировал конфигурацию с 5 битами GPU,

затем я тестировал конфигурацию с 6 битами GPU,

Оба работали нормально.

Когда я запускаю " nvidia-sensor " в терминале, он показывает терморегуляторы и все ползунки.

также нормально работает следующее:

sudo nvidia-xconfig -a --cool-bits=4
let NumGPU=6
for (( n=0; n < NumGPU; n++))
do
        /usr/bin/nvidia-settings -a "[gpu:$n]/GPUFanControlState=1"
        /usr/bin/nvidia-settings -a "[fan:$n]/GPUTargetFanSpeed=100"
done

Я использовал разделитель GPU с 1 на 4, чтобы добавить седьмой GPU.

Тогда у меня были:

  • GTX 1070
  • GTX 1070
  • GTX 1060
  • GTX 1060
  • GTX 1060
  • GTX 1060
  • GTX 1060

(2 GTX 1070 + 5 GTX 1060)

в этой конфигурации «SETI @ home» продолжает работать, однако два графических процессора больше не имеют управления вентилятором.

jstateson@tb85-nvidia:~/Desktop$ nvidia-smi
Fri Jul 26 08:21:45 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 390.116                Driver Version: 390.116                   |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 1070    Off  | 00000000:01:00.0  On |                  N/A |
|100%   41C    P2   101W / 151W |   1499MiB /  8117MiB |     91%      Default |
+-------------------------------+----------------------+----------------------+
|   1  GeForce GTX 106...  Off  | 00000000:02:00.0 Off |                  N/A |
|100%   62C    P2   121W / 120W |   1300MiB /  6078MiB |     95%      Default |
+-------------------------------+----------------------+----------------------+
|   2  GeForce GTX 106...  Off  | 00000000:03:00.0 Off |                  N/A |
|100%   59C    P2   115W / 120W |   1292MiB /  3019MiB |     92%      Default |
+-------------------------------+----------------------+----------------------+
|   3  GeForce GTX 106...  Off  | 00000000:04:00.0 Off |                  N/A |
|100%   64C    P2    83W / 120W |   1292MiB /  3019MiB |     93%      Default |
+-------------------------------+----------------------+----------------------+
|   4  GeForce GTX 1070    Off  | 00000000:05:00.0 Off |                  N/A |
|  0%   45C    P2    85W / 151W |   1315MiB /  8119MiB |     87%      Default |
+-------------------------------+----------------------+----------------------+
|   5  GeForce GTX 106...  Off  | 00000000:09:00.0 Off |                  N/A |
|100%   57C    P2    84W / 120W |   1292MiB /  3019MiB |    100%      Default |
+-------------------------------+----------------------+----------------------+
|   6  GeForce GTX 106...  Off  | 00000000:0A:00.0 Off |                  N/A |
| 48%   65C    P2    60W / 120W |   1045MiB /  3019MiB |     52%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1222      G   /usr/lib/xorg/Xorg                            86MiB |
|    0      1685      G   /usr/bin/gnome-shell                          97MiB |
|    0     12951      C   ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90  1303MiB |
|    1      1222      G   /usr/lib/xorg/Xorg                             6MiB |
|    1     12922      C   ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90  1281MiB |
|    2      1222      G   /usr/lib/xorg/Xorg                             6MiB |
|    2     12917      C   ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90  1273MiB |
|    3      1222      G   /usr/lib/xorg/Xorg                             6MiB |
|    3     12944      C   ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90  1273MiB |
|    4     12958      C   ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90  1303MiB |
|    5      1222      G   /usr/lib/xorg/Xorg                             6MiB |
|    5     12932      C   ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90  1273MiB |
|    6     12970      C   ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90  1033MiB |
+-----------------------------------------------------------------------------+

xorg.conf выглядит нормально, и монитор работает нормально, но я не могу получить доступ к вентиляторам №4 и №6, как показано выше.

Я также заметил, что идентификаторы шины меняются на 1..4, затем переходят к 9 и A.

Я изменил свой цикл NumGPU на 7, а также попробовал 15, но та же проблема.

Я также заметил, что по крайней мере один из графических процессоров на сплиттере имеет работающее управление вентилятором.

Я не могу сказать, есть ли у 2-го или нет, так как не могу разобраться в идентификационных номерах автобусов.

Перед установкой разделителя идентификаторы были « 0: 01: 0 .. 0: 06: 0 », что имеет смысл.

Может быть, 18.04 и драйвер NVIDIA 390 не справляется со сплиттерами?

Когда ID был 1..6 вентиляторы были 0..5, но как мне обрабатывать 9 и "A"?

0
задан 26 July 2019 в 23:12

1 ответ

Это, кажется, проблема синхронизации. Вероятно, причина различными GPU и поведением 4-in=1 PCIe multipler и порядок, в котором GPU были расположены и возможно поставщик (pny, evga, msi).

Я подкачал gtx1070 платы как плату, которая имела единственный вентилятор, не вращал ее вентилятор достаточно быстро, и она находилась в стойке, где это не не получило много воздуха. Другой gtx1070 имел пару вентиляторов и был более выставлен большим вентиляторам охлаждения поэтому, если бы он отстал, то он все еще работал бы прохладный. После свопинга кабелей USB3 (все находятся на переходных платах) я обнаружил, что ВСЕ имели включенный coolbits. Каждый GPU имел временный ползунок, но только GPU № 5 не достигал %100. Я поднял настройки Nvidia, и это имело ползунок (как все теперь сделали), и я установил его на %100. Я не должен был запускать тот скрипт во второй раз.

Таким образом, мое заключение состоит в том, что 4 в 1 обработанный OK, но тонкие аппаратные различия вызвали coolbits механизм к не получить полный контроль. т.е.: могло быть более устойчивым.

Найденная информация [РЕДАКТИРОВАНИЯ] об идентификаторе шины и как использовать coolbits здесь Wiki archlinux

надежда это помогает кому-то еще

0
ответ дан 23 October 2019 в 08:55

Другие вопросы по тегам:

Похожие вопросы: