Im Zuge unseres Artikels zu den Optimierungen für das GPU-Mining haben wir zwar bereits elf Grafikkarten in den unterschiedlichsten Einstellungen und für drei Alt-Coins getestet, allerdings ist das Thema damit noch nicht ganz ausgereizt. Anders als bei den aktuellen Grafikkarten mit NVIDIA-GPU, kann bei den AMD-Grafikkarten das BIOS in der Art angepasst werden, dass auch die VRAM-Timings optimiert werden können. Dieses Thema haben wir im ursprünglichen Artikel komplett außen vorgelassen, wollen dies nun aber nachholen.
Zunächst einmal aber noch ein paar Worte zum aktuellen Zustand der Kryptowährungen bzw. des Minings mit GPUs. Nahezu alle Währungen haben in den vergangenen sechs Monaten im Kurs um etwa 60 % eingebüßt. Allerdings macht es den Eindruck, als seien die Kurse damit auch wieder etwas stabiler geworden. Die täglichen und wöchentlichen Kursschwankungen sind geringer geworden. Wie bereits mehrfach angeführt, kann man sich über den Sinn und Unsinn von Kryptowährungen streiten, allerdings macht es nicht den Eindruck, als würden diese in naher Zukunft wieder verschwinden. Die Blockchain-Technologie insgesamt ist sinnvoll und hat mit den Währungen derzeit nur einen prominenten Anwendungsfall. Dies könnte und wird sich sicherlich auch noch ändern.
Zudem bleibt es dabei: Aufgrund des Strompreises und den Anschaffungskosten lohnt der Betrieb eines Mining-Systems hierzulande nur in Ausnahmefällen. Die Hersteller allerdings investieren weiterhin in entsprechende Hardware – wie zuletzt auf der Computex zu sehen war. Dabei betreiben die Hersteller solcher Mining-Karten einen recht großen Aufwand für diese neue "Spezialhardware". Es wird nicht einfach eine GPU mit Speicher kombiniert und auf ein bestehendes PCB verlötet, auf dem dann die Display-Anschlüsse nicht bestückt werden. Im Falle von PC-Partner oder besser Sapphire werden sogar neue Dual-GPU-Karten entwickelt. Diese basieren allerdings auf der Radeon RX 470 und damit auf der betagten Ellesmere-GPU. Zudem kommt kein PCI-Express-Bridge-Chip zum Einsatz, da dieser zu teuer wäre, sondern die GPUs werden über das PCI-Express-x2-Interface mit jeweils nur einer Lane angebunden.
Hintergrund der VRAM-Timings
Die Geschwindigkeit des Speichers hat einen großen Einfluss auf die Mining-Leistung einer Grafikkarte. Dies gilt für solche Karten mit AMD-GPU ebenso wie für solche mit NVIDIA-GPU. Nun haben wir im ersten Schritt der Optimierung am Takt von GPU und Speicher, sowie an der Leistungsaufnahme gedreht und konnten damit beispielsweise bei gleicher Rechenleistung die Leistungsaufnahme um 70 W reduzieren, was natürlich einen deutlichen Anstieg der Effizienz zur Folge hat.
Der Takt ist aber nur einer der Faktoren, der für die Leistung des VRAMs eine Rolle spielt. Ein weiterer sind die Timings und diese kennen wir schon vom DDR-Arbeitsspeicher auf dem Mainboard. Neben dem Takt gibt es hier auch Angaben wie 18-19-19-39-1T, welche die wichtigsten Settings beim Speicher sind, es gibt aber noch Dutzende weitere Timings.
Ebenso ist es beim GDDR5-Speicher der Grafikkarten. In einem sogenannten Strap werden die Timing-Informationen der einzelnen Hersteller festgehalten. Der VRAM auf den aktuellen Grafikkarten stammt von Herstellern wie Elpida (gehört nun zu Micron), Sk Hynix, Micron oder Samsung. Je nachdem welcher Hersteller bzw. Chip zum Einsatz kommt, sind auch die Timings andere.
Die Timings und der Takt werden im BIOS in Abhängigkeit zueinander gespeichert. Je höher der Takt, desto weniger aggressiv sind die Timings normalerweise. Es gilt eine gute Mischung aus Takt und Timings zu finden, damit die Leistung am Ende optimal ist. Es bringt wenig nur die Timings oder nur den Takt zu optimieren.
Es gibt nun drei Wege:
1. Selbst Hand anlegen und das BIOS derart optimieren, dass die verbesserten Straps zum Einsatz kommen.
2. Es gibt fertigt konfigurierte Straps für bestimmte Kombinationen aus GPU und Speicherhersteller, die einfach nur noch ins BIOS "kopiert" werden müssen.
3. Ein fertig optimiertes BIOS für die eigene Grafikkarte verwenden. Diese BIOS-Versionen der beliebtesten Karten sind im Internet in entsprechenden Foren zu finden.
Bevor wir nun loslegen können, müssen wir also wissen, welcher Speicher zum Einsatz kommt. Dies wird uns beispielsweise mittels GPU-Z angezeigt. In diesem Fall verbaut ist Speicher aus dem Hause Samsung. Außerdem können wir mit GPU-Z die BIOS-Datei auslesen, was mittels der Schaltfläche (Pfeil) unterhalb der AMD-Radeon-Logos möglich ist. Diese BIOS-Datei können wir anpassen und später wieder auf die Karte flashen. Für das Flashen bietet sich der Einsatz von ATIWinFlash an.
An dieser Stelle kann nun ein fertig optimiertes BIOS für die jeweilige Karte verwendet werden oder aber wir gehen einen Schritt weiter und optimieren eigenhändig.
Dazu müssen wir das eben ausgelesene BIOS im Polaris BIOS Editor öffnen. Es gibt aktuell das Problem, dass es von der beliebtesten Version 1.6.7 viele mir Viren und anderer Maleware verseuchte Versionen im Netz gibt. Wir haben hier einen Screenshot der Version 1.4.1, die zwar einige Werte falsch interpretiert, die eigentliche Modifikation der Timings aber ermöglicht. Rechts unten ist die Tabelle zu sehen – links die Angaben zur Taktrate des Speichers und rechts daneben der Strap zu den Timings. Das rechte Bild zeigt die einzelnen Timings in Form der Straps noch einmal etwas deutlicher.
Es ist nur notwendig die Timings zu den schnellsten Taktraten anzupassen, da die Karte ja während des Minings mit den schnellsten Taktraten laufen soll. 1.750, 2.000 oder 2.250 MHz sind hier die typischen Schritte – je nachdem welcher Takt am Ende anliegt.
Wie auch schon bei den BIOS-Versionen gibt es fertig optimierte Straps für die jeweiligen Speicherhersteller. Diese können per Polaris BIOS Editor einfach in die jeweiligen Felder geschrieben werden. Mittels des SRBPolaris-Editors können wir aber auch die Straps manuell anpassen. Ein Strap-Editor hilft uns dabei die einzelnen Werte in einen fertigen Strap zu verwandeln.
Jeder Wert im HEX-Code des Straps entspricht einem bestimmten Speichertiming. Genauer wollen wir an dieser Stelle nicht darauf eingehen, da dies wie auch bei den Timings für Arbeitsspeicher ein sehr komplexes Thema ist.
Es gibt einige grundsätzliche Herangehensweisen, die die Arbeit mit den Timings vereinfachen können. So macht es häufig Sinn, die Timings für sagen wir 2.000 MHz mit denen für 1.750 MHz zu überschreiben. Bei niedriger Taktfrequenz sind die Timings aggressiver, können aber häufig auf die höhere Taktfrequenz übertragen werden. Dazu ist es dann nicht notwendig, Kenntnisse über jede einzelne Timing-Einstellung zu haben.
Wie gesagt, es gibt in den einschlägigen Foren diverse Einträge zu den vorgefertigten Straps bei bestimmten Taktfrequenzen des Speichers. Es kursiert auch eine Tabelle, welche einige der Timings direkt gegenüberstellt. In der Szene der Miner gibt es Nutzer, die jedes einzelne Timing testen, um auch wirklich das Optimum aus der Karte zu bekommen. Dies nimmt sehr viel Zeit in Anspruch und kann auch nicht auf jeden Speicher übertragen, sondern muss immer wieder ausgetestet werden. Am Ende muss die Karte 24 Stunden am Tag und sieben Tage die Woche stabil laufen.
Rechenleistung mit Timings-Optimierung
Wir haben uns nun die Leistung und Effizienz der Sapphire Nitro Radeon RX 470 8G D5 Mining Edition und Pulse Radeon RX 580 8GD5 noch einmal mit optimierten VRAM-Timings angeschaut.
Betrieben wurden diese einerseits mit den folgenden Taktraten:
- Sapphire Pulse Radeon RX 580 8GD5: 900 MHz GPU-Takt / 1.800 MHz GDDR5-Takt
- Sapphire Nitro Radeon RX 470 8G D5 Mining Edition: 1.000 MHz GPU-Takt / 2.000 MHz GDDR5-Takt
Wir konnten die Karten mit dem angepassten BIOS aber noch einmal etwas höher takten und erreichten dabei die folgenden Werte, die wir ebenfalls in den Tests berücksichtigen:
Sapphire Pulse Radeon RX 580 8GD5: 1.120 MHz GPU-Takt / 2.050 MHz GDDR5-Takt
Sapphire Nitro Radeon RX 470 8G D5 Mining Edition: 1.120 MHz GPU-Takt / 2.050 MHz GDDR5-Takt
Wir haben die optimierten Timings von Sapphire bekommen, denn hier hat man bereits ausführliche Tests gemacht – auch weil diese Karten in den eigenen Mining-Rigs zum Einsatz kommen. Die dazugehörigen BIOS-Dateien können wir gerne zur Verfügung stellen.
Werbung
Durch die schärferen Timings steigt die Leistung massiv an. Auch wenn wir den GPU- und Speichertakt nicht weiter erhöhen, können wir die Hash-Leistung bereits um 25 bis 30 % steigern. Mit den noch einmal verbesserten Taktraten steigt die Rechenleistung noch einmal leicht an.
Die Leistungsaufnahme wird durch die veränderten Timings nicht beeinflusst bzw. die Änderungen liegen innerhalb der Messungenauigkeiten. Durch die etwas erhöhten Taktraten der weiteren Optimierung steigt die Leistungsaufnahme wieder leicht an.
Da die veränderten Timings keinerlei Einfluss auf die Leistungsaufnahme haben, steigt die Effizienz durch die gesteigerte Hash-Leistung natürlich noch einmal deutlich an. Diese ist mit den höheren Taktraten zwar wieder etwas geringer, aber immer noch deutlich besser als ohne die optimierten Timings.
Fazit
Wir hatten das Thema VRAM-Timings im ersten Artikel zur den optimierten GPUs ausgeklammert, da das Thema von den Nutzern noch einmal deutlich mehr abverlangt, als einfach nur 3-4 Regler in einem Overlocking-Tool zu schieben. Wir wollten dies aber nicht ignorieren, auch weil es einige Fragen dazu gab. Die Ergebnisse sind sehr erstaunlich und in dieser Form auf viele Karten mit AMD-GPU übertragbar – besonders aber auf die Radeon RX 470/480 bzw. Radeon RX 570/580. Dies gilt aber nicht nur für Ether aus dem Ethereum-Netzwerk, sondern auch für Monero und einige andere Alt-Coins. Für jede Kryptowährung können andere Timings bzw. ein anderes Verhältnis für Takt und Timings günstig sein. Insofern sind die Möglichkeiten für die Optimierung nahezu unbegrenzt. Ein Plus im einstelligen Prozentbereich spielt im Mining bereits eine große Rolle. Wir sprechen hier durch die optimierten Timings aber sogar von 25 bis 30 % und dies ist damit ein Faktor, der nicht zu ignorieren ist.
An dieser Stelle kommt eine auf das Mining optimierte Hardware wieder ins Spiel. Mit einer solchen Optimierung ist aber nicht die Kühlung oder eine andere Funktion der Karte gemeint (die hauptsächlich die Kosten für die Hardware reduzieren sollen), sondern die Möglichkeit viele BIOS-Versionen auf der Karte zu speichern. Im Falle der Sapphire Nitro Radeon RX 470 8G D5 Mining Edition sind es derer beispielsweise vier und so kann der Nutzer dieser Karte neben einem Gaming-BIOS auch noch drei weitere ablegen – eines beispielsweise auf Ethereum und eines auf Monero hin optimiert. In jedem Fall sollte bei Änderungen des BIOS immer ein Backup vorhanden sein, auf das wieder gewechselt werden kann.
Die Messungen zeigen, welchen Einfluss die optimierten Timings auf die Hash-Leistung haben können. Wir hätten dies in diesem Umfang nicht erwartet. Allerdings ist das Optimieren der Timings auch sehr zeit-intensiv, zumindest aber muss eine ausreichend umfangreiche Recherche betrieben werden, damit die Timings auch zur eigenen Karte passen. Es gibt einige Anleitungen im Netz, die den Nutzer dabei unterstützen können.