Schlagwort: Geschwindigkeitsoptimierung für große Modelle mit Multi-GPU-Betrieb