Wer keine extra Netzwerkkarten benutzt für den Cluster Traffic bekommt unter Umständen bei hoher Netzwerklast Timeouts von corosync.
Um das Problem zu beheben OHNE ein extra Cluster Netzwerk aufzubauen kann man die Timings von corosync ein bisschen abschwächen.

Eine Erklärung aller Parameter gibt es z.B. hier: https://manpages.debian.org/unstable/corosync/corosync.conf.5.en.html

Um es kurz zu machen. Wir ändern auf einem dem Cluster zugehörigen Proxmox die /etc/pve/corosync.conf und ergänzen sie um folgende Parameter:

knet_ping_interval: 200
knet_ping_timeout: 5000
knet_pong_count: 1
token: 1000

Ein fertiger Konfigurationsblock sieht dann z.B. so aus:

totem {
    cluster_name: pvecluster
    config_version: 10
    ip_version: ipv4
    secauth: on
    version: 2
    token: 1000
    interface {
        linknumber: 0
        knet_ping_interval: 200
        knet_ping_timeout: 5000
        knet_pong_count: 1
    }
}

Nicht vergessen die config_version um eins zu erhöhen. Nach dem abspeichern wird die Konfig dann auf alle Cluster Member automatisch verteilt und ist aktiv.