Преминете към основното съдържание

NVIDIA DGX Spark

Обща информация

ПараметърСтойност
Hostnamegx10-804f
LAN IP10.42.9.37
Потребителrosen
GPUNVIDIA (CUDA 12.8)
РоляASR сървър (speech-to-text) + vLLM post-processing
ДостъпLAN only + Cloudflare Tunnel (dictaro-pro)
GitHub RunnerSelf-hosted runner с label dgx-spark

Архитектура

Docker Compose услуги

УслугаImageПортGPUОписание
asrCustom (Dockerfile.cuda128)8765ДаОсновен ASR с faster-whisper
dashboardCustom8766НеУеб интерфейс за мониторинг
llmvLLM8000ДаLLM за post-processing (Gemma 3 12B)
proxynginx-НеReverse proxy, routing, метрики endpoints
data-collectorCustom8767НеСайдкар за Azure Blob + Log Analytics
node-exporterprom/node-exporter9100НеСистемни метрики (CPU, RAM, disk)
dcgm-exporternvidia/dcgm-exporter9400ДаGPU метрики (температура, натоварване, памет)
promtailgrafana/promtail-НеИзпращане на логове към Loki

Деплоймент

ASR сървърът се деплойва автоматично чрез GitHub Actions (deploy-asr.yml):

  1. Workflow се тригва от push в server/ или ръчно
  2. Изпълнява се на self-hosted runner [dgx-spark]
  3. Проверява GPU наличност с nvidia-smi
  4. Издърпва Docker image-и и билдва ASR стека
  5. Health check: до 30 опита × 5 секунди на http://localhost:8765/health

Секрети

СекретОписание
ASR_SERVER_API_KEYAPI ключ за автентикация на клиенти
CLOUDFLARE_TUNNEL_TOKENToken за dictaro-pro tunnel
HF_TOKENHugging Face token за сваляне на модели
AZURE_STORAGE_CONNECTION_STRINGЗа data-collector → Azure Blob
LOG_ANALYTICS_DCE_ENDPOINTData Collection Endpoint
LOG_ANALYTICS_DCR_RULE_IDData Collection Rule ID
AZURE_CLIENT_ID/SECRET/TENANT_IDЗа data-collector Azure auth

Поддръжка

Проверка на състоянието

ssh rosen@10.42.9.37
cd ~/whisper-keyboard/server
docker compose ps
nvidia-smi
curl http://localhost:8765/health

Рестартиране

docker compose down && docker compose up -d --build

Логове

docker compose logs asr --tail 100 -f
docker compose logs llm --tail 100 -f