11 KiB
11 KiB
12. Решение проблем
В этом разделе собраны типичные проблемы, возникающие при эксплуатации инфраструктуры, и способы их устранения.
Содержание
- SSH: не удаётся подключиться
- Samba: не монтируются шары
- NPM: сертификат не выпускается
- Docker: контейнер не запускается
- Proxmox: ВМ не стартует
- Grafana: нет данных
- Immich: не загружаются фото
- Jellyfin: аппаратное ускорение не работает
- Общие проверки
SSH: не удаётся подключиться
Симптомы
Connection refusedPermission denied (publickey)- Таймаут подключения
Проверка
- Доступен ли хост по сети:
ping 192.168.1.201 - Слушает ли SSH:
ssh -v user@192.168.1.201 - Проверьте файрвол на хосте:
ufw status iptables -L -n -v | grep 22 - Проверьте конфиг SSH на хосте:
grep -E '^(PermitRootLogin|PasswordAuthentication|PubkeyAuthentication)' /etc/ssh/sshd_config
Решение
- Если порт не слушается:
systemctl status sshd - Если файрвол блокирует: разрешить порт 22 из нужной подсети
- Если проблема с ключами: убедиться, что ключ добавлен в
~/.ssh/authorized_keysи права на файлы корректны (600для ключа,700для.ssh)
Samba: не монтируются шары
Симптомы
mount error(13): Permission deniedmount error(112): Host is down- В Windows не видит шару
Проверка
- Работает ли Samba на сервере:
systemctl status smbd - Правильный ли протокол (версия SMB):
smbclient -L //192.168.1.203 -U zailon - Проверка конфигурации:
testparm
Решение
- Убедиться, что пользователь существует в Samba:
pdbedit -L - Проверить
hosts allowвsmb.conf– должна быть разрешена подсеть клиента - Для Docker-контейнеров (qbittorrent) проверить, что учётные данные в
/etc/smb-creds/qbкорректны и файл имеет права600 - Если используется шифрование
required, убедиться, что клиент его поддерживает (для Windows 10/11 включено по умолчанию)
NPM: сертификат не выпускается
Симптомы
- В интерфейсе NPM сертификат в статусе
Error - Ошибка
Failed to issue certificateв логах
Проверка
- Доступен ли домен из интернета:
dig ab.zailon.ru - Открыт ли порт 443 на роутере
- Логи NPM:
docker logs npm 2>&1 | grep -i error
Решение
- Убедиться, что DNS-запись
Aдля домена указывает на внешний IP188.73.191.202 - Убедиться, что порт 443 на роутере проброшен на
192.168.1.201:443 - Если используется Let's Encrypt, проверить, что не превышен лимит запросов
- Для внутренних доменов (без публичного доступа) использовать самоподписанные сертификаты или DNS-челлендж
Docker: контейнер не запускается
Симптомы
docker startвыдаёт ошибку- Контейнер падает сразу после запуска
- В логах ошибки
Проверка
- Посмотреть логи контейнера:
docker logs <container_name> - Проверить, нет ли конфликта портов:
docker ps -a ss -tulnwp | grep <port> - Проверить права на монтированные тома:
ls -la /path/to/mount
Решение
- Исправить ошибки в конфигурации (обычно они видны в логах)
- Освободить занятый порт или изменить маппинг портов в
docker-compose.yml - Убедиться, что пользователь внутри контейнера имеет доступ к смонтированным папкам (UID/GID)
Proxmox: ВМ не стартует
Симптомы
- Ошибка
TASK ERROR: unable to open file '/etc/pve/nodes/olimp/qemu-server/205.conf' - Ошибка
kvm: no such device - ВМ зависает на старте
Проверка
- Статус служб Proxmox:
systemctl status pve-cluster pvedaemon qemu-server - Проверить наличие свободного места на хранилище:
pvesm status - Посмотреть логи:
journalctl -u pvedaemon -f
Решение
- Если проблема с конфигурационным файлом – восстановить из бэкапа (см. раздел 11)
- Если не хватает памяти – остановить другие ВМ или увеличить ресурсы
- Если ошибка KVM – убедиться, что виртуализация включена в BIOS и модули загружены:
lsmod | grep kvm
Grafana: нет данных
Симптомы
- Дашборды не отображают метрики
- Ошибка
No dataилиData source not found
Проверка
- Доступен ли источник данных (VictoriaMetrics, Loki):
curl http://192.168.1.208:8428/api/v1/query?query=up curl http://192.168.1.208:3100/loki/api/v1/query_range?query={job="node_exporter"} - Работает ли Promtail на хостах:
systemctl status promtail - Проверить конфигурацию источников данных в Grafana (Settings → Data Sources)
Решение
- Перезапустить VictoriaMetrics, Loki, Promtail
- Проверить сетевые доступы между
manageи другими хостами (порты 8428, 3100, 9080) - Убедиться, что файлы конфигурации Promtail корректны (пути к логам, метки)
Immich: не загружаются фото
Симптомы
- Ошибка загрузки в веб-интерфейсе или приложении
- Файлы не появляются в библиотеке
Проверка
- Статус контейнеров Immich:
docker ps | grep immich - Логи сервера:
docker logs immich_server | tail -50 - Доступность хранилища:
df -h /mnt/immich
Решение
- Проверить права на папку загрузок: должны быть доступны пользователю внутри контейнера (обычно 1000:1000)
- Убедиться, что база данных PostgreSQL работает и доступна
- Проверить конфигурацию обратного прокси (NPM) – не обрезает ли большие файлы (должно быть
client_max_body_size 2000m)
Jellyfin: аппаратное ускорение не работает
Симптомы
- Высокая загрузка CPU при воспроизведении
- В логах ошибки
Failed to open VAAPI device
Проверка
- Наличие устройства
/dev/driв контейнере:docker exec jellyfin ls -la /dev/dri - Установлены ли драйверы на хосте:
apt list --installed | grep -E 'intel-media-va-driver|mesa-va-drivers'
Решение
- Добавить в
docker-compose.yml:devices: - /dev/dri:/dev/dri - Установить драйверы на хосте
media:apt install intel-media-va-driver-non-free - Включить аппаратное ускорение в настройках Jellyfin (Администрирование → Воспроизведение → Аппаратное ускорение → VAAPI)
Общие проверки
Если проблема не локализована, выполните следующие шаги:
-
Логи – первое, что нужно смотреть:
- Системные:
journalctl -xe - Docker:
docker logs <container> - Samba:
tail -f /var/log/samba/log.smbd
- Системные:
-
Сеть – проверить доступность и открытые порты:
ping 192.168.1.200 traceroute 192.168.1.200 nmap -p 22,80,443 192.168.1.201 -
Диски – проверить свободное место:
df -h pvesm status # на Proxmox -
Файрвол – временно отключить для теста:
ufw disable # только для теста! -
Перезагрузка – иногда помогает:
reboot
Связанные разделы: