ce65df27e2
Инцидент 22.05.2026 утро: liderra-queue.service крашился signal=9/KILL каждые ~60с на RefreshSupplierSessionJob, после 5 крашей systemd блокировал рестарт. OOM-killer в dmesg пуст, память здорова (peak ~200 МБ из 2 ГБ), crm.bp-gr.ru отвечает. Корень: дефолтный Laravel queue:work --timeout=60 убивал worker через pcntl_alarm+posix_kill за 5 секунд до того, как PlaywrightBridge успевал поднять Chromium (cold-start на 2GB VM ~65с — это уже знали и увеличили TIMEOUT_SECONDS=180 в PlaywrightBridge.php HOTPATCH 21.05, но таймаут самого воркера в systemd-unit упустили). Поймано через bpftrace tracepoint:signal:signal_generate — sender pid == target pid, comm=php (PHP сам себе шлёт SIGKILL). Fix: --timeout=300 в ExecStart (180s PlaywrightBridge + 120s запас). На сервере применён через drop-in /etc/systemd/system/liderra-queue.service.d/timeout.conf как safety-net. Verified live: RefreshSupplierSessionJob отработал 1 мин. 5 сек. DONE (до фикса — 1 мин. FAIL → KILL цикл).