Возможно, у вас есть ноу-хау, чтобы исправить это. Я протестировал мой отредактированный скрипт, но я борюсь с двумя переменными. Мне нужно установить число GPU в «str» и температуру в «newstr». Кажется, что с первой строкой все отлично, а «grep» работает, но когда дело доходит до второго, он останавливается. Я посчитал пробелы 101 раз. Вы знаете, если это проблема.
Вот мой скрипт:
#!/bin/bash
# --- WatchdogGpuTemp.sh v.0.1.2 ---
# Author: DanHansen[at]Denmark
# Thanks to "Terdon" Ubuntu Forums
# Application: nvidia-smi
# Filename: watchdoggputemp.sh
# Logfile: watchdoggputemp.log
# Message file for status warning: watchdoggputempwarning.txt
# Message file for status critical: watchdoggputempcritical.txt
# Work directory: /home/username/shellscripts/
# Log directory: /home/username/logs/
# Message directory: /home/username/shellscripts/messages/
#
# --- WatchdogGpuTemp.sh v.0.1.2 ---
echo "JOB RUN AT $(date)"
echo "======================================="
echo ''
echo 'CPU Warning Limit set to => '$1
echo 'CPU Shutdown Limit set to => '$2
echo ''
echo ''
nvidia-smi -q -d temperature | grep GPU | perl -pe '/^GPU/ && s/\n//' | grep ^GPU
echo ''
echo ''
for i in 1 2 3 4
do
str=$(nvidia-smi -q -d temperature | grep GPU | perl -pe '/^GPU/ && s/\n//' | grep ^GPU "GPU 0000:0$i:00.0")
newstr=${str:54:2}
if [ ${newstr} -ge $1 ]
then
echo '====================================================================' >>/home/username/logs/watchdoggputemp.log
echo $(date) >>/home/username/logs/watchdoggputemp.log
echo '' >>/home/username/logs/watchdoggputemp.log
echo ' STATUS WARNING - NOTIFYING : TEMPERATURE GPU' $i 'EXCEEDED' $1 '=>' $newstr >>/home/username/logs/watchdoggputemp.log
echo ' ACTION : EMAIL SENT' >>/home/username/logs/watchdoggputemp.log
echo '' >>/home/username/logs/watchdoggputemp.log
echo '====================================================================' >>/home/username/logs/watchdoggputemp.log
# Status Warning Email Sending Code
# WatchdogGpuTemp Alert! Status Warning - Notifying!"
/usr/bin/msmtp -d --read-recipients </home/username/shellscripts/messages/watchdoggputempwarning.txt
echo 'Email Sent.....'
fi
if [ ${newstr} -ge $2 ]
then
echo '====================================================================' >>/home/username/logs/watchdoggputemp.log
echo $(date) >>/home/username/logs/watchdoggputemp.log
echo '' >>/home/username/logs/watchdoggputemp.log
echo ' STATUS CRITICAL - SHUTDOWN : TEMPERATURE GPU' $i 'EXCEEDED' $2 '=>' $newstr >>/home/username/logs/watchdoggputemp.log
echo ' ACTION : EMAIL SENT & SYSTEM SHUTDOWN' >>/home/username/logs/watchdoggputemp.log
echo '' >>/home/username/logs/watchdoggputemp.log
echo '====================================================================' >>/home/username/logs/watchdoggputemp.log
# Status Critical Email Sending Code:
# WatchdogGpuTemp Alert! Status Critical - Shutdown!"
/usr/bin/msmtp -d --read-recipients </home/username/shellscripts/messages/watchdoggputempcritical.txt
echo 'Email Sent.....'
echo 'System will now shutdown.....'
/sbin/shutdown -h now
exit
else
echo ' Temperature GPU '$i' OK at =>' $newstr
echo ''
fi
done
echo 'Status - All GPUs are within critical temperature limits'
echo ''
Вот результат при запуске скрипта:
# ./watchdoggputemp.sh 55 60
JOB RUN AT Sun Jun 28 10:13:57 CEST 2015
=======================================
CPU Warning Limit set to => 55
CPU Shutdown Limit set to => 60
GPU 0000:01:00.0 GPU Current Temp : 49 C
GPU 0000:02:00.0 GPU Current Temp : 46 C
GPU 0000:03:00.0 GPU Current Temp : 52 C
GPU 0000:04:00.0 GPU Current Temp : 51 C
grep: GPU 0000:01:00.0: No such file or directory
./watchdoggputemp.sh: line 68: [: -ge: unary operator expected
./watchdoggputemp.sh: line 86: [: -ge: unary operator expected
Temperature GPU 1 OK at =>
grep: GPU 0000:02:00.0: No such file or directory
./watchdoggputemp.sh: line 68: [: -ge: unary operator expected
./watchdoggputemp.sh: line 86: [: -ge: unary operator expected
Temperature GPU 2 OK at =>
grep: GPU 0000:03:00.0: No such file or directory
./watchdoggputemp.sh: line 68: [: -ge: unary operator expected
./watchdoggputemp.sh: line 86: [: -ge: unary operator expected
Temperature GPU 3 OK at =>
grep: GPU 0000:04:00.0: No such file or directory
./watchdoggputemp.sh: line 68: [: -ge: unary operator expected
./watchdoggputemp.sh: line 86: [: -ge: unary operator expected
Temperature GPU 4 OK at =>
Status - All GPUs are within critical temperature limits
] Я попробовал 4-е предложение, команду сценария, но при тестировании результат снова выглядит. Нет номера графического процессора. Поэтому я думаю, что ваше первое предложение для меня самое лучшее, но я все еще борюсь с температурной переменной «newstr».:
# nvidia-smi -q -d temperature | while read line; do [[ $line =~ C$ ]] && printf "%s : %s\n" "$last" "$line"; last="$line"; done
Temperature : GPU Current Temp : 51 C
Temperature : GPU Current Temp : 46 C
Temperature : GPU Current Temp : 53 C
Temperature : GPU Current Temp : 50 C
Итак, Тердон, если есть какой-либо способ, вы можете помочь мне через финиш Здесь я буду очень благодарен. Как поместить температуру в «newstr». Это, кажется, лучшее решение в моем маленьком сценарии.
Глядя так много, чтобы услышать от вас;)