Registrieren

Suche

JavaScript ist deaktiviert. Für eine bessere Darstellung aktiviere bitte JavaScript in deinem Browser, bevor du fortfährst.

Suchergebnisse

Neuer AI-Server

passt
- tcg
- Beitrag #130
- 07.05.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

Mal kurz ein ganz anderes Thema: Wollen wir mal einen KI-Laberthread aufmachen ? Finden neue evtl. einfacher. Ich hab aber auch kein Problem das hier laufen zu lassen...
- tcg
- Beitrag #116
- 14.04.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

Gemma3:27b hat wohl ein Leak... Wie auch immer das bei LLMs geht...
- tcg
- Beitrag #113
- 04.04.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

hab den context erhöht, ja, aber das braucht vram, nicht gpu power... alles soweit original...
- tcg
- Beitrag #112
- 02.04.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

da ist die 4090 mit ~37 tps bei mir nicht so viel schneller ;-)
- tcg
- Beitrag #110
- 02.04.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

Wie schnell rennt das denn bei dir ? Das ist bei mir brutal langsam ! Auch das 1b ist seeehr langsam. geht hier nur das 27b... Seltsamerweise geht das recht gut ?!?
- tcg
- Beitrag #108
- 01.04.2025
- Forum: (Home-) Server/Workstation Forum
[Sammelthread] Gigabyte MC12-LE0 (AM4, B550, servertauglich: IPMI, Dual Lan, ECC)

seh ich das richtig, kann man die stacken ??? also z.b. 2 davon für 4x4x4x4 ?
- tcg
- Beitrag #3.329
- 29.03.2025
- Forum: Mainboard-Sammelthreads
Neuer AI-Server

mit 24GB kommst du schonmal recht weit ...
- tcg
- Beitrag #107
- 29.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

schöne karte, wahrscheinlich auch angenehm schnell. wenn man es schaffen würde auch die performance aufzuaddieren... dann wären 3 * 4060/16gb genau so teuer aber deutlich besser. wenn halt ... es gibt wohl lösungen und möglichkeiten, aber das ist mir zu viel gebastel gerade. obwohl es sich bei...
- tcg
- Beitrag #100
- 27.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

mit einer 5070ti/16gb kommst du schon recht weit. damit gehen übliche 14b modelle schon mal. allerdings: wenn du context willst brauchst du wesentlich mehr ram hab ich gelernt :-( 2*16gb sollte, stand momentan, recht gut sein... mir gehen die 24gb aus wenn ich qwq:32b mit >15000 context laufen...
- tcg
- Beitrag #98
- 27.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

also chatgpt lokal benutzen und einfach mal spielen ;-) wie ich auch... ja, der gedanke passt soweit. ich hatte mir mal die 4060/16gb rausgesucht, und dann gleich ein paar davon. hab den plan nach vortest mit 10 gpus jetzt erstmal wieder verworfen. ich kann dir nen günstigen server anbieten...
- tcg
- Beitrag #96
- 27.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

Im Prinzip ja. Du kannst GPUs "stacken" (ich hab hier 10 im Server) und dann größere Modelle laufen lassen. Was genau hast du vor ? edit: so ein llama3.2:3b läuft eigentlich schon überall lokal... wie groß solls denn sein ? wobei ich llama erstmal durch qwq ersetzt habe, das ist deutlich...
- tcg
- Beitrag #93
- 27.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

hab mal gefragt, aber meine frau hat gesagt 50k sind gerade nicht drin :-(
- tcg
- Beitrag #90
- 24.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

ich tippe eher auf 30-50k
- tcg
- Beitrag #88
- 20.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

Ja, hab schon mehrere Versuche durch... Bis auf ollama selbst compilieren. Ich hoffe ja noch dass es irgendwann läuft.
- tcg
- Beitrag #86
- 17.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

Die sind gar nicht mal so langsam... "Wormhole™ n300 performs at up to 466TFLOPS (FP8)." (Zum Vergleich: 4090 = 661 FP8-TFLOPS) Die Teile sind (fast) bezahlbar: n300d = <$1500 ;-) Und die kann man wohl stacken ;-)
- tcg
- Beitrag #83
- 15.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

Hmm, mein Laptop hat so eine "NPU" eingebaut, seh ich im Taskmanager. Kann man das Teil evtl. für LLMs benutzen ? Die GPU is eine 780m, die wäre ja super, wird aber von ollama nicht unterstützt ("wegen rocm" oder so)...
- tcg
- Beitrag #82
- 14.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

ne GPU mit so-dimm slots, will ich auch ;-)
- tcg
- Beitrag #77
- 13.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

ollama run qwq ;-) 1741778578 ah, oh, das meinst du... nein: Kann ich LLMs auf dem HAILO-8 ausführen, bpsw. LLAMA? LLMs = Large Language Modelle (so etwas wie ChatGPT / GPT4-o, bzw. LLAMA, Falcon, usw.) Nein, dafür ist der HAILO-8 nicht ausgelegt. Grafikkarten auf denen diese LLMs...
- tcg
- Beitrag #75
- 12.03.2025
- Forum: (Home-) Server/Workstation Forum
Neuer AI-Server

oder einfach kurz warten, schon gibts ne neue LLM die viel besser ist und weniger RAM braucht... ich hab mal qwq (32b) probiert, ist schon imposant !
- tcg
- Beitrag #68
- 11.03.2025
- Forum: (Home-) Server/Workstation Forum

Suche

Zurück

Oben Unten refresh