[Sammelthread] Proxmox Stammtisch

gea · 18.04.2020

MisterY schrieb:
Warum nutzt du nicht nextcloud?

NextCloud ist eines von den Überteilen, mit denen man sich ansatzweise sowas wie eine Google Gsuite basteln kann. Es ist aber das absolute "Softwaremonster"und kombiniert alles was regelmäßig als Sicherheitsproblem gilt (Webserver, PHP, SQL, SSL + die tausend Add-Ons). Die Probleme die es regelmäßig auch mit dem ansich kleineren Packet Typo3 gibt sollten da eine Warnung sein. NextCloud ist daher eine sicherheitstechnisch sehr aufwändig zu wartende Sache. Durch die vielen Abhängigkeiten ist zudem Virtualisierung ein Muss um das Basissystem stabil zu halten.

Meistens nutzt man aber eh nur den Sync and Share Teil. Also einen Cloudspeicher zum Syncronisieren des Laptop/Desktops per Webbrowser oder Sync Tool und eventuell zum anonymen Sharen eines Dokuments per Weblink.

Ich nutze dafür nur noch Amazon Simple Storage S3 mit dem OpenSource Programm minIO. Im Gegensatz zu Nextcloud ist das nur eine einzige zu startende Datei unter Linux/Unix. Das muss man nicht virtualisieren, hat keinerlei Abhängigkeiten und ist zudem von der Performance unerreicht schnell.

Ich hab für Unix/OmniOS ein paar Infos zusammengefasst wie ich das unter ZFS als zusätzliche Sharing Option/ZFS Eigenschaft neben NFS und SMB nutze. Das meiste ist aber Linux/Unix unabhängig, https://forums.servethehome.com/index.php?threads/amazon-s3-compatible-zfs-cloud-with-minio.27524/

MisterY · 18.04.2020

Der Knackpunkt ist aber: bei Nextcloud sind meine Daten bei mir. Bei Amazon nicht.

Ich habe hier sensible Forschungsdaten und die würde ich niemals aus der Hand geben.

morph027 · 18.04.2020

S3 mit Minio (oder eben OpenIO oder sonstwas) liegt ja auch bei dir ....

MisterY · 18.04.2020

Und was ist der Vorteil gegenüber ZFS und Ceph?

gea · 18.04.2020

ZFS ist Basis für einen Fileserver im LAN auf dem man direkt mit Protokollen wie FC/iSCSI, NFS oder SMB arbeiten kann. Es hat Redundanz, Versionierung, Datensicherheit und Verschlüssellung. Einen Clusterbetrieb unterstützt ZFS nicht direkt, man kann einzelne ZFS Filer aber als Cluster Nodes nutzen. Im Internet sollte man die üblichen Fileserver Protokolle wie NFS oder SMB auf gar keinen Fall nutzen. Internet ist ja für direktes Arbeiten auf dem Server wie über SMB eh viel zu langsam (daher Cloud=sync and share).

Amazon S3 kann man zunächst als Sharing Protokoll wie ftps oder https sehen, nur halt ausgelegt auf Internet Objectstorage und Cloud sync and share. Mit minIO kann man damit S3 Cloud Sharing/ Veeam/ Cloud Backup für einen ZFS Filer nachrüsten.

Mit S3 und minIO kann man nicht nur ein ZFS Dateisystem im Internet freigeben sondern auch Cluster aus vielen Servern aufbauen um Redundanz, Performance und ultrahohe Kapazität zu erreichen. Amazon selber arbeitet mit seiner S3 Infrastruktur so aber für sehr viele Anforderungen (außer 99,99999% uptime und Exa/Zettabyte Storage) ist S3 auf einem ZFS single Server perfekt, eventuell ergänzt um ein Dualhead HA Cluster. Zusätzlich kann man so S3 inhouse anbieten und muss nicht eigene Daten auf Amazon Servern irgendwo in der Welt speichern.

Ceph ist ein Cluster Dateisystem das in seinen Features noch über S3 hinausgeht, aber dafür deutlich komplexer und auch langsamer ist als S3 das "nur" die Funktion Cloud/Objekt Storage abdeckt.

S3 mit single node auf ZFS ist dagen das was man als idiotensicher/ dau kompatibel bezeichnen kann wenn man nichts anderes will als einen lokalen Filer auch zusätzlich als sicheren Cloudstorage im Internet zu nutzen.

2Stoned · 25.04.2020

Hat hier jemand zufällig erfolgreich eine AMD GPU and eine Linux VM durchgereicht? Ich möchte eine Sapphire RX580 Nitro+ an eine LinuxVM durchreichen (habe Arch Linux und Ubuntu versucht), erhalte aber weder ein Bild direkt von der Grafikkarte, noch kann ich mich mit den auf der VM automatisch startenden TeamViewer verbinden. DIe proxmox interne noVNC Konsole zeigt bloss Guest has not initialized the display (yet).

Host ist der folgende:

CPU: AMD Ryzen 3950X
Mainboard: Gigabyte Aorus Ultra, Virtualisierungs-Sachen (virtualisation, IOMMU, ARI, ACS) sind alle eingeschaltet
GPU: Sapphire RX580 Nitro+ 4G

proxmox ist up-to-date mit Kernel 5.4.

Code:

proxmox-ve: 6.1-2 (running kernel: 5.4.27-1-pve)
pve-manager: 6.1-8 (running version: 6.1-8/806edfe1)
pve-kernel-5.4: 6.1-8
pve-kernel-helper: 6.1-8
pve-kernel-5.3: 6.1-6
pve-kernel-5.4.27-1-pve: 5.4.27-1
pve-kernel-5.3.18-3-pve: 5.3.18-3
pve-kernel-5.3.18-2-pve: 5.3.18-2
ceph-fuse: 12.2.11+dfsg1-2.1+b1
corosync: 3.0.3-pve1
criu: 3.11-3
glusterfs-client: 5.5-3
ifupdown: 0.8.35+pve1
ksm-control-daemon: 1.3-1
libjs-extjs: 6.0.1-10
libknet1: 1.15-pve1
libpve-access-control: 6.0-6
libpve-apiclient-perl: 3.0-3
libpve-common-perl: 6.0-17
libpve-guest-common-perl: 3.0-5
libpve-http-server-perl: 3.0-5
libpve-storage-perl: 6.1-5
libqb0: 1.0.5-1
libspice-server1: 0.14.2-4~pve6+1
lvm2: 2.03.02-pve4
lxc-pve: 3.2.1-1
lxcfs: 4.0.1-pve1
novnc-pve: 1.1.0-1
proxmox-mini-journalreader: 1.1-1
proxmox-widget-toolkit: 2.1-3
pve-cluster: 6.1-4
pve-container: 3.0-23
pve-docs: 6.1-6
pve-edk2-firmware: 2.20200229-1
pve-firewall: 4.0-10
pve-firmware: 3.0-7
pve-ha-manager: 3.0-9
pve-i18n: 2.0-4
pve-qemu-kvm: 4.1.1-4
pve-xtermjs: 4.3.0-1
qemu-server: 6.1-7
smartmontools: 7.1-pve2
spiceterm: 3.1-1
vncterm: 1.6-1
zfsutils-linux: 0.8.3-pve1

In GRUB habe ich: GRUB_CMDLINE_LINUX_DEFAULT="net.ifnames=0 biosdevname=0 quiet amd_iommu=on iommu=pt video=efifb:off"

amdgpu und radeon Treiber sind blacklistet und werden auch nicht geladen. Die GPU wird glaube ich auch nicht vom host übernommen, da die Lüfter auf 100% weiterdrehen, was sonst (auch unter proxmox) nicht der Fall ist.

Die VM ist wie folgt eingerichtet:

Code:

agent: 1
balloon: 8192
bios: ovmf
bootdisk: scsi0
cores: 12
cpu: host
efidisk0: VMstorage:vm-102-disk-1,size=1M
hostpci0: 0a:00,pcie=1,romfile=sapphire.rom
ide2: local:iso/ubuntu-20.04-desktop-amd64.iso,media=cdrom
machine: q35
memory: 60000
name: Ubuntu
net0: virtio=B2:5E:C6:CA:A0:A5,bridge=vmbr0,firewall=1
numa: 1
ostype: l26
scsi0: VMstorage:vm-102-disk-0,cache=writeback,discard=on,size=32G,ssd=1
scsihw: virtio-scsi-pci
shares: 5000
smbios1: uuid=bd85f4fe-370e-4299-9ce2-a39f2f997fe9
sockets: 1
vmgenid: fdfa3441-a8f0-48f5-8063-2d633183ffa4

Syslog beim Start der VM mit GPU:

Code:

Apr 24 16:18:00 pvehost systemd[1]: Starting Proxmox VE replication runner...
Apr 24 16:18:00 pvehost systemd[1]: pvesr.service: Succeeded.
Apr 24 16:18:00 pvehost systemd[1]: Started Proxmox VE replication runner.
Apr 24 16:18:27 pvehost pvedaemon[5286]: start VM 102: UPID:pvehost:000014A6:00012328:5EA2F533:qmstart:102:root@pam:
Apr 24 16:18:27 pvehost pvedaemon[1520]: <root@pam> starting task UPID:pvehost:000014A6:00012328:5EA2F533:qmstart:102:root@pam:
Apr 24 16:18:27 pvehost kernel: pcieport 0000:00:03.1: AER: Uncorrected (Non-Fatal) error received: 0000:00:03.1
Apr 24 16:18:27 pvehost kernel: pcieport 0000:00:03.1: AER: PCIe Bus Error: severity=Uncorrected (Non-Fatal), type=Transaction Layer, (Requester ID)
Apr 24 16:18:27 pvehost kernel: pcieport 0000:00:03.1: AER:   device [1022:1483] error status/mask=00100000/04400000
Apr 24 16:18:27 pvehost kernel: pcieport 0000:00:03.1: AER:    [20] UnsupReq               (First)
Apr 24 16:18:27 pvehost kernel: pcieport 0000:00:03.1: AER:   TLP Header: 34000000 0a000010 00000000 80008000
Apr 24 16:18:27 pvehost kernel: pcieport 0000:00:03.1: AER: Device recovery successful
Apr 24 16:18:27 pvehost systemd[1]: Started 102.scope.
Apr 24 16:18:27 pvehost systemd-udevd[5290]: Using default interface naming scheme 'v240'.
Apr 24 16:18:27 pvehost systemd-udevd[5290]: link_config: autonegotiation is unset or enabled, the speed and duplex are not writable.
Apr 24 16:18:27 pvehost systemd-udevd[5290]: Could not generate persistent MAC address for tap102i0: No such file or directory
Apr 24 16:18:27 pvehost kernel: device tap102i0 entered promiscuous mode
Apr 24 16:18:27 pvehost systemd-udevd[5290]: link_config: autonegotiation is unset or enabled, the speed and duplex are not writable.
Apr 24 16:18:27 pvehost systemd-udevd[5290]: Could not generate persistent MAC address for fwbr102i0: No such file or directory
Apr 24 16:18:27 pvehost systemd-udevd[5289]: link_config: autonegotiation is unset or enabled, the speed and duplex are not writable.
Apr 24 16:18:27 pvehost systemd-udevd[5296]: link_config: autonegotiation is unset or enabled, the speed and duplex are not writable.
Apr 24 16:18:27 pvehost systemd-udevd[5289]: Using default interface naming scheme 'v240'.
Apr 24 16:18:27 pvehost systemd-udevd[5296]: Using default interface naming scheme 'v240'.
Apr 24 16:18:27 pvehost systemd-udevd[5296]: Could not generate persistent MAC address for fwln102i0: No such file or directory
Apr 24 16:18:27 pvehost systemd-udevd[5289]: Could not generate persistent MAC address for fwpr102p0: No such file or directory
Apr 24 16:18:27 pvehost kernel: fwbr102i0: port 1(fwln102i0) entered blocking state
Apr 24 16:18:27 pvehost kernel: fwbr102i0: port 1(fwln102i0) entered disabled state
Apr 24 16:18:27 pvehost kernel: device fwln102i0 entered promiscuous mode
Apr 24 16:18:27 pvehost kernel: fwbr102i0: port 1(fwln102i0) entered blocking state
Apr 24 16:18:27 pvehost kernel: fwbr102i0: port 1(fwln102i0) entered forwarding state
Apr 24 16:18:27 pvehost kernel: vmbr0: port 2(fwpr102p0) entered blocking state
Apr 24 16:18:27 pvehost kernel: vmbr0: port 2(fwpr102p0) entered disabled state
Apr 24 16:18:27 pvehost kernel: device fwpr102p0 entered promiscuous mode
Apr 24 16:18:27 pvehost kernel: vmbr0: port 2(fwpr102p0) entered blocking state
Apr 24 16:18:27 pvehost kernel: vmbr0: port 2(fwpr102p0) entered forwarding state
Apr 24 16:18:27 pvehost kernel: fwbr102i0: port 2(tap102i0) entered blocking state
Apr 24 16:18:27 pvehost kernel: fwbr102i0: port 2(tap102i0) entered disabled state
Apr 24 16:18:27 pvehost kernel: fwbr102i0: port 2(tap102i0) entered blocking state
Apr 24 16:18:27 pvehost kernel: fwbr102i0: port 2(tap102i0) entered forwarding state
Apr 24 16:18:33 pvehost kernel: vfio-pci 0000:0a:00.0: vfio_ecap_init: hiding ecap 0x19@0x270
Apr 24 16:18:33 pvehost kernel: vfio-pci 0000:0a:00.0: vfio_ecap_init: hiding ecap 0x1b@0x2d0
Apr 24 16:18:33 pvehost kernel: vfio-pci 0000:0a:00.0: vfio_ecap_init: hiding ecap 0x1e@0x370
Apr 24 16:18:34 pvehost kernel: pcieport 0000:00:03.1: AER: Uncorrected (Non-Fatal) error received: 0000:00:03.1
Apr 24 16:18:34 pvehost kernel: pcieport 0000:00:03.1: AER: PCIe Bus Error: severity=Uncorrected (Non-Fatal), type=Transaction Layer, (Requester ID)
Apr 24 16:18:34 pvehost kernel: pcieport 0000:00:03.1: AER:   device [1022:1483] error status/mask=00100000/04400000
Apr 24 16:18:34 pvehost kernel: pcieport 0000:00:03.1: AER:    [20] UnsupReq               (First)
Apr 24 16:18:34 pvehost kernel: pcieport 0000:00:03.1: AER:   TLP Header: 34000000 0a000010 00000000 80008000
Apr 24 16:18:34 pvehost kernel: pcieport 0000:00:03.1: AER: Device recovery successful
Apr 24 16:18:34 pvehost pvedaemon[1520]: <root@pam> end task UPID:pvehost:000014A6:00012328:5EA2F533:qmstart:102:root@pam: OK
Apr 24 16:19:00 pvehost systemd[1]: Starting Proxmox VE replication runner...
Apr 24 16:19:00 pvehost systemd[1]: pvesr.service: Succeeded.
Apr 24 16:19:00 pvehost systemd[1]: Started Proxmox VE replication runner.
Apr 24 16:20:00 pvehost systemd[1]: Starting Proxmox VE replication runner...
Apr 24 16:20:00 pvehost systemd[1]: pvesr.service: Succeeded.
Apr 24 16:20:00 pvehost systemd[1]: Started Proxmox VE replication runner.
Apr 24 16:21:00 pvehost systemd[1]: Starting Proxmox VE replication runner...
Apr 24 16:21:00 pvehost systemd[1]: pvesr.service: Succeeded.
Apr 24 16:21:00 pvehost systemd[1]: Started Proxmox VE replication runner.
Apr 24 16:21:05 pvehost systemd[1]: Starting Cleanup of Temporary Directories...
Apr 24 16:21:05 pvehost systemd[1]: systemd-tmpfiles-clean.service: Succeeded.
Apr 24 16:21:05 pvehost systemd[1]: Started Cleanup of Temporary Directories.
Apr 24 16:21:37 pvehost pvedaemon[1520]: <root@pam> successful auth for user 'root@pam'
Apr 24 16:22:00 pvehost systemd[1]: Starting Proxmox VE replication runner...
Apr 24 16:22:00 pvehost systemd[1]: pvesr.service: Succeeded.
Apr 24 16:22:00 pvehost systemd[1]: Started Proxmox VE replication runner.
Apr 24 16:23:00 pvehost systemd[1]: Starting Proxmox VE replication runner...
Apr 24 16:23:00 pvehost systemd[1]: pvesr.service: Succeeded.
Apr 24 16:23:00 pvehost systemd[1]: Started Proxmox VE replication runner.
Apr 24 16:23:02 pvehost pvedaemon[6094]: starting vnc proxy UPID:pvehost:000017CE:00018E7A:5EA2F646:vncproxy:102:root@pam:
Apr 24 16:23:02 pvehost pvedaemon[1520]: <root@pam> starting task UPID:pvehost:000017CE:00018E7A:5EA2F646:vncproxy:102:root@pam:
Apr 24 16:23:05 pvehost pvedaemon[1520]: <root@pam> end task UPID:pvehost:000017CE:00018E7A:5EA2F646:vncproxy:102:root@pam: OK
Server View

Ich weiss langsam nicht, was ich sonst noch ausprobieren könnte. :/ Testweise habe ich eine Netzwerkkarte durchgereicht, dass hat zumindest geklappt. Aber die GPU will einfach nicht. :/

MisterY · 25.04.2020

Warum lädst du die sapphire.rom?

Versuche Mal
machine: pc-q35-3.1

2Stoned · 25.04.2020

Habe die ROM testweise geladen, da es manchmal helfen soll. Aber mit oder ohne ROM, auch mit machine: pc-q35-3.1 erhalte ich nur Status: internal error und kann nicht auf die VM zugreifen (TeamViewer oder noVNC).

2Stoned · 25.04.2020

Nachdem ich im BIOS (host) ARI, ACS und AER ausgeschaltet habe, klappt der passthrough.

Dafür kann ich mich jetzt bei meiner Ubuntu VM nicht einloggen. Sobald ich das Passwort eingebe und enter drücke, wird der Bildschirm schwarz und ich bin wieder beim Login-Bildschirm. :/

Edit: ich musste "Ubuntu on Wayland" auswählen, damit ich mich einloggen konnte.

Beitrag automatisch zusammengeführt: 25.04.2020

Nun habe ich aber das Problem, dass ich die VM nicht neu starten kann, ohne den Host selbst auch neu zu starten...

2Stoned · 25.04.2020

So, machine wieder auf q35 zurückstellen und ein qm set ID -args '-machine type=q35,kernel_irqchip=on' scheint geholfen zu haben. Nun klappt auch ein Reboot aus der VM selbst heraus (manchmal). Reboot über proxmox klappt jedoch nicht.

2Stoned · 25.04.2020

So, ich habe nun ein Setting gefunden, mit welchem GPU passthrough, mit relativ wenigen Einschränkungen funktioniert. Shutdown der VM (aus der VM raus) und späterer Neustart (vom Host aus) funktioniert nicht. Reboot von der VM aus funktioniert jedoch.

Grundsätzlich habe ich mich an folgenden Guides orientiert: [1], [2], [3], [4]
Nebst den dort aufgeführten Massnahmen musste ich noch folgendes machen:

~~ARI~~, AER, ACS im BIOS deaktivieren
~~qm set ID -args '-machine type=q35,kernel_irqchip=on'~~ [5]
GRUB_CMDLINE_LINUX_DEFAULT="net.ifnames=0 biosdevname=0 quiet amd_iommu=on iommu=pt video=efifb:off"
- video=efifb:off ist nicht nötig, läuft bei mir auch ohne dieses Argument!
statt radeon muss amdgpu auf die Treiber-blacklist

Meine Konfig ist:

Code:

agent: 1
args: -machine type=q35
audio0: device=ich9-intel-hda,driver=spice
balloon: 8192
bios: ovmf
bootdisk: scsi0
cores: 12
cpu: host
efidisk0: VMstorage:vm-102-disk-1,size=1M
hostpci0: 0a:00,pcie=1
machine: q35
memory: 60000
name: Ubuntu
net0: virtio=B2:5E:C6:CA:A0:A5,bridge=vmbr0,firewall=1
numa: 1
ostype: l26
scsi0: VMstorage:vm-102-disk-0,cache=writeback,discard=on,size=32G,ssd=1
scsihw: virtio-scsi-pci
shares: 5000
smbios1: uuid=bd85f4fe-370e-4299-9ce2-a39f2f997fe9
sockets: 1
usb0: host=046d:c52b,usb3=1
usb1: host=1af3:0001,usb3=1
usb2: host=04d9:0169,usb3=1
usb3: host=046d:0819,usb3=1
usb4: host=048d:8297,usb3=1
vga: none
vmgenid: fdfa3441-a8f0-48f5-8063-2d633183ffa4

Vielleicht dient dies ja sonst jemandem mit einem ähnlichen Problem...

Edit: Konnte die Einschränkungen noch etwas reduzieren (durchgestrichene Sachen waren doch nicht nötig).

MisterY · 26.04.2020

Ich habe da eine Konfigurationsfrage zu Clustern.
Ich habe ein 2-Node-Cluster, wobei Node 2 nur bei Bedarf läuft. Wenn der RAM auf Node 1 voll wird, möchte ich gerne Node 2 per WOL starten (das funktioniert) und möchte gerne die Live-Migration nutzen, um die LXCs auf den zweiten Node zu migrieren. Auf Node 1 läuft ZFS und ich möchte natürlich weiterhin Snaphots nutzen können. Aber für die Live-Migration muss es ja auf einem Shared-Storage liegen, und ZFS kann man ja scheinbar nicht für eine zweite Node freigeben. Und mit NFS funktioniert natürlich kein Snapshot mehr.
Habt ihr da eine Lösung?

gea · 26.04.2020

Es gibt zwei Lösungswege mit ZFS

1. NFS auf einem ZFS Dateisystem. Da werden Snaps gemacht und das NFS Share wird entweder aif Node 1 oder Node 2 gemounted. Man muss Vorkehrungen treffen damit das Share nicht gleichzeitig genutzt wird.

2. Ein ZFS Pool mit Multipath z.B. SAS Platten. Je einen SAS Anschluß einer Platte geht zu Node 1, der andere zu Node 2. Damit sehen beide Nodes die Platten. Man muss Vorkehrungen treffen damit die Platten nicht gleichzeitig genutzt werden. Diese Lösung nutze ich unter ZFS als Cluster in a Box unter Solarish, prinzipiell ließe sich das auch unter Linux realisieren, http://www.napp-it.org/doc/downloads/z-raid.pdf

Lösung 2 ist viel schneller da kein Netzwerk benutzt wird sondern direkter Plattenzugriff.

VirtuGuy · 26.04.2020

Leg am zweiten Server ebenfalls einen zfs Pool an. Dann kannst du die Replikation/Live Migration nutzen, ein Shared Storage ist dafür nicht notwendig.

MisterY · 26.04.2020

Aktuell ist kein zfs am zweiten node möglich.
Ich habe einen NFS Share erstellt, da funktioniert aber snapshots nicht.
edit: der Grund, warum Snapshots unter NFS nicht funktioniert: Das Volume wird in ein RAW umformatiert und nutzt keine ZFS "Partition" (komme gerade nicht auf den korrekten Namen).

martingo · 26.04.2020

Ich bin nicht sicher, ob das so klappt,vaber Du könntest auf Host A ein zfs-over-isci storage erstellen und dann wechselweise mounten.

MisterY · 26.04.2020

Das ist ja auch total umständlich.

der Grund, warum Snapshots unter NFS nicht funktioniert: Das Volume des LXC wird in ein RAW umformatiert und nutzt keine ZFS "Partition" (komme gerade nicht auf den korrekten Namen).

edit: wie sieht es mit "zfs set sharenfs=on /tank/nfs" aus? Wie mountet man das in Proxmox?

martingo · 26.04.2020

Dataset/Filesystem.

Du willst halt auch etwas für Deinen ganz speziellen Fall, der gänzlich an jeder üblichen Praxis vorbeigeht.
Was ist der Grund, dass Du Node B nicht auf zfs umstellen kannst? Zumal er doch eh die meiste Zeit schläft?
CephFS kannst Du Dir auch noch ansehen, wobei dafür üblicherweise 3 Nodes benötigt werden und Du das Quorum auf dem Primärnode erhöhen müsstest.

Eine Zweizeiler Lösung im Sinne von "mach da den Haken rein und wähl dort dies aus" wirst Du nicht finden.

MisterY · 26.04.2020

Der Grund ist, dass ich keine Festplatten vorrätig habe und ich auch nicht vor Ort bin, sondern alles Remote mache. Aber wenn ich da mal ZFS einrichte, muss dann der Poolname identisch sein?

Weiteres Problem:
Wenn Node 2 offline geht, geht die Load von Node 1 hoch, da der natürlich versucht auf shares auf node 2 zuzugreifen. Gibt es da einen Workaround?

Stueckchen · 26.04.2020

Da es um LXC geht und nicht um VMs geht zfs over iscsi (leider) nicht.
Klassisches iSCSI und darauf dann zfs sollte aber gehen oder du könntest eine Art pseude zfs auf node2 machen:
Also eine zfs.img erstellen und das dann als zfs formatieren und mounten. Ka wie das mit Leistung ist, aber könnte klappen und dann wenn wieder vor Ort auf eine HDD/SSD umziehen.
Sonst wäre Ceph oder vll gluster eine Idee, aber ka ob da snapshots gehen.

MisterY · 28.04.2020

Hi,
ich habe jetzt ZFS über ISCSI in Proxmox eingebunden, jedoch kann ich keine LXCs dort drauf speichern. Wie kann man das machen? So wie ich das sehe, kann man nur VMs darauf installieren, da ich aber keine VMs nutze, ist das absolut sinnfrei.

Was ist denn der Grund, warum man überhaupt in Proxmox Clustern kann, wenn man noch nichtmal ein verteiltes Dateisystem mit Snapshots für LXC nutzen kann??

was auch komisch ist: seit gestern steigt die Load-Average auf Node 1 auf 500 % an, wenn Node 2 offline ist. Es existiert kein Shared storage auf Node 2 (allesamt deaktiviert), dennoch steigt es wieder an. Ich glaube, es liegt daran: "
Apr 28 11:48:04 pve kernel: nfs: server 192.168.20.10 not responding, timed out
Apr 28 11:48:06 pve kernel: nfs: server 192.168.20.10 not responding, still trying

Das ist auf Node 2. Aber Node 2 hat keinen NFS share?

VirtuGuy · 28.04.2020

LXC bringt entsprechenden Snapshot Support mit, dazu muss aber auch dein Storage mitspielen. NFS/CIFS oder Block-Lösungen wie iSCSI/Gluster, bringen eben NICHT den notwendigen Support mit. Hier musst du die Backups darunterliegend erledigen (z.B. LVM oder ZFS Snapshots). Auch Ceph ist für dich keine Option, du hast keinen aktiven Cluster der dauerhaft den Sync ermöglicht.

Wenn ZFS vorerst keine Option ist, würde ich am Host1 eine NFS Freigabe per ZFS erstellen. DIe Container kannst du dann wie gewünscht zwischen den Hosts hin und herschieben. Für Backups musst du dann mit ZFS Snaphots am Host1 vorlieb nehmen müssen. In 8-10 Monaten wirst du mit "Proxmox Backup" womöglich eine Lösung bekommen die auch deine Anforderung besser abdeckt.

MisterY · 28.04.2020

Hier: https://pve.proxmox.com/wiki/Storage steht jedoch, dass ZFS over ISCSI sowohl Snapshots als auch Shared mitbringt.

wie meinst du das mit NFS per ZFS?

VirtuGuy · 28.04.2020

ZFS over iSCSI kann Snapshots, du kannst darüber aber auch andere Filesysteme nutzen. Der Snapshotsupport kommt durch ZFS und nicht iSCSI.

Ich hätte NFS verwendet da es in deiner recht "speziellen" Umgebung weniger Probleme machen sollte. Die Snapshots/Backups müsstest du dann aber wie gesagt über ZFS auf Filesystemebene lösen. Dazu findest du auch diverse Tools die es einfacher machen, z.B. zfssnap, znapzend,...

MisterY · 28.04.2020

Ich habe nun auf dem zweiten Node zwei ZFS aus einzel-Disks erstellt.
Wie kann ich das nun machen?

VirtuGuy · 28.04.2020

Was machen? Snapshots gehen dann ootb. Die MIgration erfordert im Grunde nur das deine Pools auf beiden Clusterknoten mit dem selben Namen definiert sind.

MisterY · 29.04.2020

Muss da nicht der "Storage" den selben Namen haben? Denn der meldet immer "ZFSTank (Name des Storage) nicht auf Node 2 vorhanden". Wenn ich aber ein zweites Storage mit "ZFSTank" anlegen will, meldet der immer "bereits vorhanden".

martingo · 29.04.2020

Der Storage darf nicht auf "shared" stehen.

dapcfreek · 30.04.2020

Hallo zusammen,

da mir das letzte mal so gut geholfen wurde (danke dafür), kommt gleich noch zwei Fragen

-ich habe Proxmox bei mir auf einer alten Hardware installiert. War eigentlich nur zum Test gedacht, ist aber für eine ganze Zeit ein produktives System gewesen. Jetzt will ich aber den kompletten Server auf eine potente HW umziehen. Wie stelle ich das am besten an?
-aktuell lasse ich regelmäßig automatisch ein Backup auf ein NFS-Laufwerk machen. Leider kann dieser nur immer ein einziges Backup machen und löscht die alten. Woran liegt das? Die Einstelleungen, welche ich gegooglet habe, kann ich leider nicht finden.

Danke und Grüße

martingo · 01.05.2020

1. zu präferieren seitens Proxmox ist immer Shutdown der Maschine, Backup, Transfer des Backups per scp o.ä., restoren auf dem neuen Node. Wenn die Versionen ähnlich sind, könntest Du noch einen Cluster bilden, dabei müsste der alte der Master sein (da auf den Slaves keine Maschinen liegen dürfen). Dort dann Live Migration. Vorteil: kürzere Downtime, höheres Risiko mit wenig Nutzen, wenn der Cluster nicht dauerhaft bestehen soll. Ich würde Backup/Restore empfehlen.
2. Ein aktuelles Proxmox vorausgesetzt (ich habe 6.1), WebGUI: Datacenter > Storage > local (NICHT: local-zfs) > Max Backups: 1 -> x > ändern, speichern etc.

[Sammelthread] Proxmox Stammtisch

Urgestein

Urgestein

Enthusiast

Urgestein

Urgestein

Enthusiast

Urgestein

Enthusiast

Enthusiast

Enthusiast

Enthusiast

Urgestein

Urgestein

Experte

Urgestein

Experte

Urgestein

Experte

Urgestein

Experte

Urgestein

Anhänge

Experte

Urgestein

Experte

Urgestein

Experte

Urgestein

Experte

Enthusiast

Experte

Ähnliche Themen