Bruteforce Benchmark (Update V0.11 released )

Janchu88 · 09.03.2020

Rangliste Version 0.1-0.11

Leistung (MH/s)	CPU	CPU Setting	Ram	Ram Setting	User
809,013	Threadripper 3990X (SMT off)	3600 MHz @ 0.968V Lukü	4x16 GB DDR4 3200 CL22	3200 IF 1:1	Kullberg
577,72	Threadripper 3970X	stock - ca. 3900 MHz Lukü	4x16 GB DDR4 3600 CL16	3600 IF 1:1 \| Kullberg	Kullberg
334,659	Ryzen 3950X	4,4GHz @ 1,325v (load) mit WaKü	2 x 16GB DDR3200CL14@3800CL15	3800MHz IF 1:1	the_patchelor
323,77	Ryzen 3950X	4,4GHz @ 1,385v mit WaKü	2 x 8GB cl16	3800MHz IF 1:1	Holzmann
262,367	Ryzen 3900X	4,60GHz @ 1,375v (load) mit WaKü	2 x 16GB DDR4000 CL19	3790MHz CL14-15-11-28 1T - IF 1:1	Hoschi
254,588	Ryzen 3900X	4,45Ghz @ 1,392v	2x8GB GSKILL RipJaws V	3733MHz 14-14-14-28 mit IF 1:1	Janchu88
167,576	i9 7900X	4,60GHz @ 1,160v (load) mit WaKü	4 x 8GB DDR3200 CL14	3200MHz 14-14-14-34	thebagger
143,891	Ryzen 2700	4,2GHz @ 1,4V mit WaKü	4 x 8GB DDR3600 CL15	3533MHz 14-15-14-30-44	Bullseye13
111,097	i7 8700k	5 GHz @ 1,336v (load) mit WaKü	2 x 16GB DDR4 3200 CL15	3800MHz CL16-17-17-32	AG1M
101,064	i5 8600K	4,8GHz @ 1,27v mit LuKü	2 x 8GB DDR3000 CL15	3000MHz 15-16-16-35	PogoPunk
50,606	FX-8350	@HPC Mode	4xDDR31866 unbuffered ECC	stock	Phantomias88

Archiv Rangliste v0.0

Leistung (MH/s)	CPU	CPU Setting	Ram	Ram Setting	User
263,729	Ryzen 3950X	4,3GHz @ 1,256v (load) mit WaKü	2 x 16GB DDR3200CL14@3800CL15	3800MHz IF 1:1	the_patchelor
261,631	Ryzen 3950X	4,4GHz @ 1,38v mit WaKü	2 x 8GB DDR4 CL19	3800MHz IF 1:1	Holzmann
229,77	Ryzen 3900X	4,60GHz @ 1,375v (load) mit WaKü	2 x 16GB DDR4000 CL19	3790MHz IF 1:1	Hoschi
218,357	Ryzen 3900X	4,4GHz @ 1,3v mit WaKü	2 x 16GB DDR3200 CL16	3533MHz IF 1:1	Janchu88
203,361	2 x Xeon 2697 v3(ES) (28c/56t)	3,1GHz	128GB DDR4 ECC	2133 15-15-15-36 1T	Maniac
190,466	Xeon 2699v4 (ES) (22c/44t)	2,88GHz	128GB DDR4 ECC	2460 15-15-15-36 1T	Maniac
138,522	i9 7900X	4,6GHz @ 1,191v(load) mit WaKü	4 x 8GB DDR3200 CL14	3200MHz 14-14-14-34	thebagger
129,883	i9 9900K	5GHz	n.A.	n.A.	yilem76
124,223	Ryzen 2700	4,2Ghz	4 x 8 GB DDR4	3533Mhz CL14	Bullseye13
117,784	Ryzen 3600	Stock	DDR4 3600er	stock	Sven
100,742	i7 8700K	5GHz	2 x 16GB DDR4	3800MHz CL16	AG1M
85,614	i7 8700K	Stock	n.A.	n.A.	Anonym
81,337	Ryzen 1600X	Stock	2 x 8 GB DDR4	3200MHz CL14	LuckySh0t
40,775	i7 6700K	4,6GHz	2 x 8GB DDR4 2400	3000MHz CL15	Kenaz
40,299	i5 1035G4	Stock	8 GB DDR4 3766	stock	gongplong

Grüße,

ich hab mich in letzter Zeit wieder etwas mehr mit dem Programmieren beschäftigt und wollte mich unter anderem intensiver mit den Themen Kryptographie und Multithreading beschäftigten. Irgendwie ist auf dem Weg die Idee entstanden ein Tool zu schreiben, welches mit Hilfe von Bruteforce Klartexte zu Hashes findet, das verwendete Verfahren ist in dem Fall erstmal zweitrangig. Hierbei wollte ich Threading nutzen, um alle CPU Kerne sinnvoll zu nutzen. Ja, natürlich gibt es fertige Tools, die das sicherlich besser können, aber der Weg ist hier das Ziel.

Am Wochenende habe ich das ganze dann mal in Erstes Programm gegossen. Noch rustikal gehalten, auf reiner Kommandozeilenebene, rechnet das Programm anhand eines definierten Zeichensatzes (der grundsätzlich beliebig veränderbar ist) alle Kombinationen durch, erzeugt einen passenden String (Zeichenkette) und füttert das Hashverfahren mit dem String. Im letzten Schritt wird dann geprüft, ob der erzeugte Hash mit dem zu knackenden Hash übereinstimmt. Für den Test habe ich mal auf den SHA-512 Algorithmus gesetzt, das Hashverfahren ist aber grundsätzlich beliebig austauschbar.

Nachdem das dann lief, habe ich den Code so umgeschrieben, dass diese Aufgabe parallel von mehreren Threads erledigt werden kann. Nach enttäuschenden ersten Resultaten (die Skalierung war mies) habe ich dann noch einige Stunden mit Optimierungen zugebracht, bis ich an diesen Punkt kam:

1 Hash beinhaltet hierbei : neuen Input erzeugen, Hash berechnen, vergleichen mit Ziel Hash. Daher unter Nutzung aller Threads kann ich bis zu 186 Millionen Kombinationen pro Sekunde durchprobieren.

Noch nicht perfekt, aber sowohl die 12 Kerne skalieren fast linear und auch Hyperthreading bringt noch etwas über 10% mehr Performance.
Ja und hier hätte ich gerne mal geguckt, wie es auf anderen CPUs so skaliert!

Nachtrag: Die Skalierung mit dem Ramtakt habe ich auch mal getestet. Auch dieser auf diesen spricht das Programm durchaus gut an. (CPU auf 3,8GHz fix für den Test)

Wie gesagt, das Programm ist noch alles andere als Fertig, aber es läuft soweit und liefert konstante Resultate. Es ist voreingestellt auf einen Zeichensatz mit 95 möglichen Zeichen und alle Kombinationen bis 5 Zeichen Länge, was ungefähr 7,7 Milliarden Kombinationen bedeutet. Entgegen einer Echtwelt Anwendung habe ich es so eingestellt, dass er die 7,7Mrd Kombinationen auch nach gefundenem Treffer zu Ende rechnet. Auf dem Ryzen 3900X brauche ich dafür dann ca 6 Min und 54 Sekunden bei 24 Threads. Singlethreaded braucht es dafür schon über eine Stunde...

Download Version 0.11

Changelog 0.11
- Genauere Erkennung Anzahl CPU Kerne
Win x64: https://drive.google.com/open?id=1xj7O3IpfB8lAmk9V_8slHZDacSJ95B84

Archiv

Download Version 0.1

Changelog 0.1
- Performance verbessert
- Auslastung optimiert
- Skalierung optimiert
- Nice 2 Have: Exe ist nun komplett Standalone und hat ein schickes Icon bekommen
Win x64: https://drive.google.com/open?id=18ncFdHW9tg8jwP4-6wHYUZUoufM3t_9D

Version 0.0
vorläufiger Quellcode für Interessierte:

Program.cs

drive.google.com

Download Standalone Windows 64 Bit

Win x64.zip

drive.google.com

Download Standalone Mac OS X 64 Bit

OSX x64.zip

drive.google.com

Download Standalone Linux 64 Bit

Linux x64.zip

drive.google.com

Download Plattformunabhängig (.net core runtime oder .net core Desktop runtime 3.x erfoderlich: Download hier: https://dotnet.microsoft.com/download/dotnet-core/3.1)

current build.zip

drive.google.com

Daher, viel Spaß beim testen!

_________________________________________________

PS: Was zum nachdenken: Die Komplexität ergibt sich hier aus dem großzügig gewählten Zeichensatz der 95 verschiedene Zeichen beinhaltet. Würde ich diesen auf bspw. nur Kleinbuchstaben oder nur Großbuchstaben beschränken, wären alle Kombinationen bis 10 Zeichen Länge ebenfalls in unter 10 Min geknackt.... Komplexität ist das eine, aber Leute nutzt lange Passwörter!

Holzmann · 09.03.2020

Wie führt man den bench den aus, fehlt da doch der Link zum DL?

Janchu88 · 09.03.2020

mi scuzi, ist nachgereicht

Holzmann · 09.03.2020

Bei dp Click auf "ConsoleApp2.exe" tut sich bzw. öffnet sich bei mir nichts, was mach ich falsch?

Janchu88 · 09.03.2020

A) Alle Dateien aus der zip liegen im selben verzeichnis?
B) https://dotnet.microsoft.com/download/dotnet-core/3.1 runtime fehlt

Holzmann · 09.03.2020

Ja alle Dateien im selben Verzeichnis und ASP.NET Core Runtime 3.1.2 wurde jetzt installiert.

Tut sich aber immer noch nichts.

Janchu88 · 09.03.2020

Hmm, bin mit der neuen Version auch noch nicht so vertraut, was die virtuelle Umgebung angeht. Aber bin mir nicht sicher, ob ASP.net (Web Anwendungen) auch die desktop/Kommandozeilen libraries enthält. Daher installiere mal die Desktop runtime (unten drunter). Wenn es dann nicht klappt, muss ich nochmal ran und ggf anders exportieren.

Ps: danke fürs rumprobieren. Habe logischerweise das SDK drauf, dass alle Komponenten enthält

Holzmann · 09.03.2020

Mit Desktop runtime läuft es ….

5.52 Minuten für den 3950x /32 pbo:

Janchu88 · 09.03.2020

Danke fürs probieren! Sieht für mich auch vom Ergebnis her aus, als würde es zu meinem passen

Gerade noch diesen Artikel gefunden... https://docs.microsoft.com/en-us/dotnet/core/deploying/

Nun gemäß des Artikels Runtime unabhänige Exporte erstellt, die Standalone laufen und oben die Download links aktualisiere ich umgehend!

Mehr Ergebnisse bitte

gerne auch mit verschiedenen thread Einstellungen.

Holzmann · 09.03.2020

5:28

Mit OC all Core auf 4.35GHZ

235,734 MH/s | Holzmann | Ryzen 3950X | 4,35GHZ @ 1,288v und WaKü

Janchu88 · 09.03.2020

@Holzmann: Es sind 5:28 Min... du hast die Dezimale Minute eingeführt

Ich schlage vor wir nehmen die MegaHashes/s als Vergleichwert!

dann will ich auch mal mit nem run, ohne Hintergrund Tasks, etc.

190,366 MH/s - Ryzen 3900X - Stock Turbo @ -0,1,25v und WaKü - Janchu88

edit: kleine Rangliste oben eingefügt

Janchu88 · 09.03.2020

Hier ein i7 8700k @ Stock run (kam via whatsapp)

Beitrag automatisch zusammengeführt: 09.03.2020

Und 2 weiter via whatsapp

Wäre evtl noch interessant wie weit der speichertakt relevant ist. Das kann ich morgen mal testen!

I7 8550U

Ryzen 3600

gongplong · 10.03.2020

Surface Pro 7 (i5 1035G4, 8Gb, 128 Gb SSD)

Woozy · 10.03.2020

@Kullberg Da muss ich leider an dich denken

Janchu88 · 10.03.2020

So... ich hab auch ein Update. Zunächst ein Paar Worte Testen der Ram Geschwindigkeiten und dann ein Nachtrag Score meinerseits

. Vorweg: Hatte ohnehin noch Probleme mit meinem Ram nach Ersteinbau und habe mich dann heute nochmal ausführlich mit selbigem beschäftigt... es hat sich gelohnt. Später mehr dazu.

Habe um die Messgenauigkeit etwas zu erhöhen den Ryzen auf 3,8GHz fix gesetzt und dann bei den verschiedenen Geschwindigkeiten je 3 Runs gemacht und nen Mittelwert gebildet. Die Infinity Fabric habe ich jeweils 1:1 zum Ram betrieben, da das die beste performance geben soll. Hier das Ergebnis (auch im ersten Post hinzugefügt):

wie man sieht macht der Ram Takt selbst bei verhältnismäßig moderatem CPU Takt durchaus einen Unterschied von bis zu knapp 5%. Je schneller die CPU wird, desto denke besser wird es auch nach oben hin skalieren. Stuzig wurde ich, da der Ryzen 3600 hier extrem gut im Kurs lag und ich ihn etwas zu stark im Vergleich zu meinem 3900X fand. Für mich kam nur der bessere und schnellere Speicher als differenzierendes Merkmal in Frage (verstärkt durch den Umstand, dass meine Settings suboptimal waren)

Alle Probleme beseitigt, Dual Channel läuft nun und die Performance ging richtig gut hoch, Ryzen scheint schnellen Ram tendenziell sehr gut nutzen zu können. Statt der ehemals DDR2866 Singlechannel nun auf DDR3533 Dualchannel und die Infinity Fabric auf 1:1 bei 1766MHz gesetzt. Dazu mal 4,4GHz Allcore und siehe da, es gibt nen mächtigen Schub nach vorne. :bigok:

PS: Rangliste updated

yilem76 · 10.03.2020

i9 9900k@5ghz

Kullberg · 11.03.2020

Woozy schrieb:
@Kullberg Da muss ich leider an dich denken

Der Benchmark ist leider ungeeignet für Rechner mit mehr als 64 logischen Cores - da er processor groups nicht unterstützt.
Processor Groups

Holzmann · 11.03.2020

@Janchu88
Der Benchmaster meldet sich zurück mit 4.4GHZ

Für die Liste: Ram gekoppelter Modus 1900/1900 cl16

256,305 MH/s | Holzmann | Ryzen 3950X | 4,4GHZ @ 1,3v und WaKü | 2x8 GB 3800 CL16

AG1M · 11.03.2020

100,742 MH/s | AG1M | Intel i7 8700K @ 5 Ghz | 2x16 GB DDR4 @ 3800 CL16

Kenaz · 11.03.2020

40,775 MH/s | Kenaz | i7 6700K @ 4,6 GHz | 2x8 GB DDR4-2400 @ 3000 CL15

Maniac81 · 11.03.2020

Ich habe mal meine beiden Xeon Systeme drauf los gelassen:
2 x Xeon 2697v3 (ES) @ 3,1Ghz, 128GB DDR3 Ecc reg 2133 15-15-15-36 1T

Xeon 2699V4 (ES) @ ~2,88Ghz, 128GB DDR4 ECC reg 2460 15-15-15-36 1T

Janchu88 · 13.03.2020

Liste updated

@Kullberg

ich schau mal, wie aufwendig es sich gestalten würde auch mehrere Numa Nodes zu implementieren - möchte aber keine Versprechungen machen!

Kullberg · 14.03.2020

Es geht nicht um NUMA Nodes, der Threadripper 3990X hat nur Einen. Es geht um Processor Groups. In C++ musst Du die Threads mit SetThreadGroupAffinity den Processor Groups zuordnen. Die Anzahl der Processor Groups verrät Dir GetActiveProcessorGroupCount(). Wenn Du 2 Processor Groups hast, kriegt halt die eine Hälfte der Threads eine GroupAffinity zur Group 0 und die andere Hälfte zur Group 1. Ist eigentlich einfach.

Holzmann · 14.03.2020

Wollte gerade nochmal eine Schippe drauflegen, mit 4,425 mhz aber trotz guter Temperatur steigt immer ein Kern aus /:

Wo sind die guten 3950x oder TR2 CPUs, mein score sollte doch noch fallen hier, oder nicht?

Holzmann · 16.03.2020

@Janchu88
Der Benchmaster meldet sich eindrucksvoll zurück mit 4425mhz :bigok:

:

257,203 MH/s | Holzmann | Ryzen 3950X | 4,425GHZ @ 1,36v und WaKü | 2x8 GB 3800 CL16

Edit: Der Reaktorraum melden 4.45 GHZ möglich aber nicht empfohlen. 🤪

Kullberg · 17.03.2020

In der Rangliste ist ein Fehler - auch Xeon E5 26xx v3 haben DDR4 RAM.
@Janchu88
Ich kenne mich mit c# nicht aus - gibt es da die von mir o.g. Befehle nicht?
Bei mehr Cores begrenzt übrigens der Speicher - auf nem 3990X (SMT ausgeschaltet) zeigen die Cores nur 40% Auslastung.

Janchu88 · 17.03.2020

ist drin und korrigiert!

am WE schaue ich nochmal wegen der maximalen Kernzahl (hab da schon was hilfreiches gefunden) und der Skalierung, werde mal die so getaufte "Chunksize" erhöhen. Die gibt letztenendes vor wie groß die blöcke sind, die sich die threads vom main programm wegnehmen. Momentan sind das 32768 Iterationen, bis wieder der Thread exklusive Zugriff auf den globalen Index erfolgen muss. Hierüber weiss der Thread nach Abschluss quasi, wo er weiter rechnen soll (Ergo warten andere Threads, wenn sie zeitgleich auch was brauchen)

Daher will momentan jeder Thread momentan alle 1-2ms (Je nach Thread Performance) ms den exklusiven Zugriff auf den globalen Index beanspruchen. Denke den Wert könnte man getrost etwas erhöhen. Kann man sich ein stück weit vorstellen wie die Größe der Renderquadrate beim Cinebench, welche man vergrößert. Aktuell wären sie noch recht winzig

Bullseye13 · 21.03.2020

Hab nochmal nach nem frischem reboot laufen lassen:

124,223 MH/s | Bullseye13 | AMD R7 2700 @ 4.2 Ghz | 4x8 GB DDR4 @ 3533 CL14

Luckysh0t · 21.03.2020

81,337 MH/s | Luckysh0t | AMD Ryzen 5 1600X Stock | 2x8 GB DDR4 @ 3200 CL14

Holzmann · 21.03.2020

Wo sind die 16 kerner mit 4.4ghz+ ?

Bruteforce Benchmark (Update V0.11 released )

Kapitän zur See , HWLUXX Vize-Superstar

The Saint

Kapitän zur See , HWLUXX Vize-Superstar

The Saint

Kapitän zur See , HWLUXX Vize-Superstar

The Saint

Kapitän zur See , HWLUXX Vize-Superstar

The Saint

Kapitän zur See , HWLUXX Vize-Superstar

The Saint

Kapitän zur See , HWLUXX Vize-Superstar

Kapitän zur See , HWLUXX Vize-Superstar

Enthusiast

Lesertest-Fluraufsicht

Kapitän zur See , HWLUXX Vize-Superstar

Urgestein

Computer Schach Freak

The Saint

Legende

Experte

Urgestein

Kapitän zur See , HWLUXX Vize-Superstar

Computer Schach Freak

The Saint

The Saint

Computer Schach Freak

Kapitän zur See , HWLUXX Vize-Superstar

Urgestein

Enthusiast

Anhänge

The Saint