iX-Magazin: Revolutionäres KI-Modell aus China DeepSeek versetzt Konkurrenz in Aufruhr
Hannover, 21. Februar 2025 – Das chinesische Start-up DeepSeek hat mit seinem neuen KI-Modell R1 für Aufsehen in der Tech-Branche gesorgt. In Ausgabe 3/2025 zeigt das IT-Profimagazin iX: DeepSeek punktet im Vergleich zur westlichen Konkurrenz mit Open Source und günstigeren Services. Das Sprachmodell kann es außerdem mit den besten Modellen von OpenAI aufnehmen und übertrifft diese teilweise sogar.
Während westliche Tech-Konzerne Milliarden in ihre Sprachmodelle investieren und deren Entwicklung streng geheim halten, präsentiert DeepSeek sein KI-Modell als Open Source. „Die KI-Ingenieure der großen Firmen analysieren sicher bereits sehr genau, was DeepSeek gemacht hat und wie sie davon profitieren können. Ein heißes Rennen beginnt“, kommentiert iX-Redakteur Philipp Steevens die Entwicklung. Fachleute sind von der leistungsfähigen Konkurrenz aus China weniger überrascht.
DeepSeek-R1 zeichnet sich durch seine besonderen Reasoning-Fähigkeiten aus und setzt neue Maßstäbe beim maschinellen Denken: „Das Modell kann komplexe Probleme systematisch lösen und macht dabei seine ‚Gedankengänge‘ transparent – im Gegensatz zu den oft undurchsichtigen Antworten anderer KI-Systeme“, erklärt Steevens. Bei Logikrätseln prüft es systematisch alle Möglichkeiten und entscheidet sich für die einzige widerspruchsfreie Lösung. „Auch bei mathematischen Aufgaben wie Primfaktorzerlegungen demonstriert das Modell strukturiertes Vorgehen.“
Der kostenlose Service erfordert lediglich eine Registrierung. Wer das Modell selbst betreiben möchte, benötigt allerdings leistungsstarke Hardware: Etwa 1,3 TByte RAM, also zehn leistungsstarke Nvidia-H200-Grafikkarten mit jeweils 141 GByte Speicher, sind notwendig. „Für ressourcenbeschränkte Anwender bietet DeepSeek auch kleinere, quantisierte Modelle an – allerdings mit Qualitätseinbußen“, betont der iX-Redakteur.
Experten sehen die fehlende Transparenz bei den Trainingsdaten kritisch. Es gibt Vermutungen, dass das Modell mit GPT-4-generierten Daten trainiert wurde. Zudem achtet das Frontend auf Konformität mit chinesischer Politik.
Unabhängig der Kontroversen entwickelt sich DeepSeek rasant weiter und hat mit dem Janus-Modell bereits ein multimodales System vorgestellt, das auch Bilder generieren kann. Steevens: „Die westlichen Tech-Giganten stehen zunehmend unter Druck.“
Für die Redaktionen: Auf Wunsch schicken wir Ihnen gerne die vollständige Artikelstrecke zur Rezension.
Nutzen Sie unsere Presse-Newsletter: Damit informieren wir Sie über aktuelle Pressemitteilungen, Neuigkeiten aus dem Medienhaus heise und neueste Inhalte aus unseren Print- und Digitalangeboten – melden Sie sich direkt an!