Я работаю над сборкой своего персонального компьютера.
Я использую материнскую плату TB85.
Сначала я тестировал конфигурацию с 5 битами GPU,
затем я тестировал конфигурацию с 6 битами GPU,
Оба работали нормально.
Когда я запускаю " nvidia-sensor
" в терминале, он показывает терморегуляторы и все ползунки.
также нормально работает следующее:
sudo nvidia-xconfig -a --cool-bits=4
let NumGPU=6
for (( n=0; n < NumGPU; n++))
do
/usr/bin/nvidia-settings -a "[gpu:$n]/GPUFanControlState=1"
/usr/bin/nvidia-settings -a "[fan:$n]/GPUTargetFanSpeed=100"
done
Я использовал разделитель GPU с 1 на 4, чтобы добавить седьмой GPU.
Тогда у меня были:
(2 GTX 1070 + 5 GTX 1060)
в этой конфигурации «SETI @ home» продолжает работать, однако два графических процессора больше не имеют управления вентилятором.
jstateson@tb85-nvidia:~/Desktop$ nvidia-smi
Fri Jul 26 08:21:45 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 390.116 Driver Version: 390.116 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 1070 Off | 00000000:01:00.0 On | N/A |
|100% 41C P2 101W / 151W | 1499MiB / 8117MiB | 91% Default |
+-------------------------------+----------------------+----------------------+
| 1 GeForce GTX 106... Off | 00000000:02:00.0 Off | N/A |
|100% 62C P2 121W / 120W | 1300MiB / 6078MiB | 95% Default |
+-------------------------------+----------------------+----------------------+
| 2 GeForce GTX 106... Off | 00000000:03:00.0 Off | N/A |
|100% 59C P2 115W / 120W | 1292MiB / 3019MiB | 92% Default |
+-------------------------------+----------------------+----------------------+
| 3 GeForce GTX 106... Off | 00000000:04:00.0 Off | N/A |
|100% 64C P2 83W / 120W | 1292MiB / 3019MiB | 93% Default |
+-------------------------------+----------------------+----------------------+
| 4 GeForce GTX 1070 Off | 00000000:05:00.0 Off | N/A |
| 0% 45C P2 85W / 151W | 1315MiB / 8119MiB | 87% Default |
+-------------------------------+----------------------+----------------------+
| 5 GeForce GTX 106... Off | 00000000:09:00.0 Off | N/A |
|100% 57C P2 84W / 120W | 1292MiB / 3019MiB | 100% Default |
+-------------------------------+----------------------+----------------------+
| 6 GeForce GTX 106... Off | 00000000:0A:00.0 Off | N/A |
| 48% 65C P2 60W / 120W | 1045MiB / 3019MiB | 52% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 1222 G /usr/lib/xorg/Xorg 86MiB |
| 0 1685 G /usr/bin/gnome-shell 97MiB |
| 0 12951 C ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90 1303MiB |
| 1 1222 G /usr/lib/xorg/Xorg 6MiB |
| 1 12922 C ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90 1281MiB |
| 2 1222 G /usr/lib/xorg/Xorg 6MiB |
| 2 12917 C ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90 1273MiB |
| 3 1222 G /usr/lib/xorg/Xorg 6MiB |
| 3 12944 C ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90 1273MiB |
| 4 12958 C ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90 1303MiB |
| 5 1222 G /usr/lib/xorg/Xorg 6MiB |
| 5 12932 C ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90 1273MiB |
| 6 12970 C ...x41p_V0.98b1_x86_64-pc-linux-gnu_cuda90 1033MiB |
+-----------------------------------------------------------------------------+
xorg.conf
выглядит нормально, и монитор работает нормально, но я не могу получить доступ к вентиляторам №4 и №6, как показано выше.
Я также заметил, что идентификаторы шины меняются на 1..4, затем переходят к 9 и A.
Я изменил свой цикл NumGPU
на 7, а также попробовал 15, но та же проблема.
Я также заметил, что по крайней мере один из графических процессоров на сплиттере имеет работающее управление вентилятором.
Я не могу сказать, есть ли у 2-го или нет, так как не могу разобраться в идентификационных номерах автобусов.
Перед установкой разделителя идентификаторы были « 0: 01: 0 .. 0: 06: 0
», что имеет смысл.
Может быть, 18.04 и драйвер NVIDIA 390 не справляется со сплиттерами?
Когда ID был 1..6 вентиляторы были 0..5, но как мне обрабатывать 9 и "A"?
Это, кажется, проблема синхронизации. Вероятно, причина различными GPU и поведением 4-in=1 PCIe multipler и порядок, в котором GPU были расположены и возможно поставщик (pny, evga, msi).
Я подкачал gtx1070 платы как плату, которая имела единственный вентилятор, не вращал ее вентилятор достаточно быстро, и она находилась в стойке, где это не не получило много воздуха. Другой gtx1070 имел пару вентиляторов и был более выставлен большим вентиляторам охлаждения поэтому, если бы он отстал, то он все еще работал бы прохладный. После свопинга кабелей USB3 (все находятся на переходных платах) я обнаружил, что ВСЕ имели включенный coolbits. Каждый GPU имел временный ползунок, но только GPU № 5 не достигал %100. Я поднял настройки Nvidia, и это имело ползунок (как все теперь сделали), и я установил его на %100. Я не должен был запускать тот скрипт во второй раз.
Таким образом, мое заключение состоит в том, что 4 в 1 обработанный OK, но тонкие аппаратные различия вызвали coolbits механизм к не получить полный контроль. т.е.: могло быть более устойчивым.
Найденная информация [РЕДАКТИРОВАНИЯ] об идентификаторе шины и как использовать coolbits здесь Wiki archlinux
надежда это помогает кому-то еще