Trotzdem, oder gerade deswegen, passt Nvidia nun das neue CUDA Toolkit in Version 3.2 extra auf die Karten der Fermi Reihe an, was in deutlichen Geschwindigkeitsverbesserungen der CUDA/PhysX Implementierungen resultiert.  So steigerte man die Geschwindigkeit bei der Größenänderung von 3D Objekten um den Faktor 3 – 7, je nachdem, welcher Chip zum Einsatz kommt. Auch die Matrixmultiplikationen, welche unter anderem bei der Berechnung von Daten durch SETI@Home und ähnliche Clients genutzt werden, können allgemein zwischen 50% und 300% schneller ausgeführt werden. Zusätzlich wurde die Beschleunigung von H.264 Videomaterial nun Teil des CUDA Toolkits, sodass der Entwickler sich nicht mehr mit dem GPU SDK herumschlagen muss. Man kann also sagen, es richtet sich hauptsächlich an Spieledesigner für spezielle Optimierungen. Neu hinzugekommen ist auch die Unterstützung für Nvidia Quadro & Tesla Karten mit 6 GB Grafikspeicher,  oder die Debugfunktion auf Multi GPU Systemen.

 

 

Außerdem widmete man sich dem Intel Compiler, was eventuell auf die angekündigte SSE2 Optimierung hindeuten könnte, welche die CUDA Berechnung auch auf Systemen ohne Nvidia Grafikkarte deutlich beschleunigen würde – zur Zeit kommt hierfür nur die x86 Befehlseinheit zum Einsatz, welche von beiden CPU Schmieden sehr stiefmütterlicher behandelt wird, da sie SSE in all seinen Ausbauformen weit unterlegen ist, sowohl im Programmieraufwand als auch in der Leistung. Auch die verbesserte Integration des Microsoft Visual Studio soll den Entwicklern bei der  schnellen Umsetzung helfen und gute Eigenschaften aus beiden Systemen vereinen.


Quelle: Nvidia Developer