In der Vergangenheit wurden bei GPU-Architekturen kleine Aufgaben auf mehreren GPU-Kernen parallel ausgeführt. Dies stand im Gegensatz zu CPUs, die eine große Aufgabe auf einem einzigen leistungsstarken CPU-Kern ausführen. Seitdem haben GPUs einen weiten Weg zurückgelegt, um die Verarbeitungsmöglichkeiten für Geräte-, PC- und Serverplattformen zu beschleunigen.
Nehmen wir als Beispiel die Verwendung einer GPU für leistungsstarke Serverstationen. Früher war es nicht möglich, eine ähnliche Architektur für die eingebettete Plattform zu verwenden, da die Form, die Passform und die Leistungsanforderungen des Designs dies nicht zuließen. Jetzt sehen wir, wie der NVIDIA Tegra K1 (192 GPU-Kerne) die Kepler-GPU-Architektur nutzt und Leistungsdaten liefert, die denen von HPC-Systemen (High Performance Computing) entsprechen.
Abbildung 1 Der NVIDIA Tegra K1 Mobilprozessor ist in zwei Varianten erhältlich - eine mit Quad-Core 32-Bit ARM A15 und die zweite mit Dual-Core 64-Bit ARM v8 Architektur.
Diese Architektur macht die Hochleistungs-DSPs überflüssig und ersetzt sie durch Multicore-GPUs.
Ein weiterer Mythos bei der Verwendung von GPUs in Designs war, dass sie viel Strom und einen eigenständigen Host-Prozessor benötigen. Der Tegra K1 räumt mit diesem Mythos auf, indem er ein Sub-10-W-SoC mit integrierten Quad-Core-ARM-Cortex-A15-Prozessoren bietet, die leistungsfähiger sind als Standard-Host-Prozessoren. Diese GPU-Architektur ist in der Lage, über 300 GFLOPS an 32-Bit-Gleitkommaberechnungen durchzuführen. Der Tegra K1 ist stromsparend und liefert im Vergleich zu konkurrierenden mobilen Prozessoren fast fünfzig Prozent mehr Leistung pro Watt.
Der ermutigendste Vorteil ist jedoch die Möglichkeit, rechenintensive und grafische Anwendungen zu portieren.
Dies ist dank der Unterstützung von CUDA Parallel Programming und Desktop-Grafik-APIs durch den Tegra K1 leicht möglich. Die Leistung der GPU und des ARM-Kerns machen ihn auch für mobiles Computing interessant. Die Anwendungen sind vielfältig und reichen vom Consumer-Bereich für Tablets, Smartphones, virtuelle Spiele und Augmented Reality bis hin zum Automobilbereich für Navigation, ADAS und Infotainment sowie für Überwachungsvideoanalyse, Objekt-/Gesichtserkennung, Bewegungsverfolgung und die neuen UAV-Drohnen!
NVDIA bietet eine komplette Entwicklungsumgebung mit der neuesten Version von UBUNTU, die auf das Tegra K1 Board portiert wurde. Dies macht es neuen Anwendern der NVIDIA-Mobilplattform leicht. Auf der Webseite finden Sie alle Informationen zur Entwicklung auf dem Tegra K1 Board
Ich muss sagen, dass der Tegra K1 Prozessor der weltweit erste Supercomputer im mobilen Bereich ist, der die Leistung von GPU und Host-Prozessor in einem einzigen Chip vereint. Die Entwicklungstools und die Unterstützung durch das NVIDIA-Entwicklerforum machen die Wahl für jede neue mobile Embedded-Entwicklung viel einfacher.
eInfochips ist ein Specialty OEM Partner und auch ein CUDA Trainingspartner von NVIDIA. Das Unternehmen verfügt über ein Team von geschulten CUDA-Programmierern, die ihre Dienstleistungen im Bereich Elektronikdesign durch die Entwicklung von Systemsoftware und QA-Services ergänzen.