Wer keine extra Netzwerkkarten benutzt für den Cluster Traffic bekommt unter Umständen bei hoher Netzwerklast Timeouts von corosync.
Um das Problem zu beheben OHNE ein extra Cluster Netzwerk aufzubauen kann man die Timings von corosync ein bisschen abschwächen.
Eine Erklärung aller Parameter gibt es z.B. hier: https://manpages.debian.org/unstable/corosync/corosync.conf.5.en.html
Um es kurz zu machen. Wir ändern auf einem dem Cluster zugehörigen Proxmox die /etc/pve/corosync.conf
und ergänzen sie um folgende Parameter:
knet_ping_interval: 200 knet_ping_timeout: 5000 knet_pong_count: 1 token: 1000
Ein fertiger Konfigurationsblock sieht dann z.B. so aus:
totem { cluster_name: pvecluster config_version: 10 ip_version: ipv4 secauth: on version: 2 token: 1000 interface { linknumber: 0 knet_ping_interval: 200 knet_ping_timeout: 5000 knet_pong_count: 1 } }
Nicht vergessen die config_version
um eins zu erhöhen. Nach dem abspeichern wird die Konfig dann auf alle Cluster Member automatisch verteilt und ist aktiv.