Veröffentlicht am: 29. Januar 2025Von: Kategorien: Content Marketing

Noch kürzlich kündigte der US-Präsident Donald Trump das milliardenschwere Infrastrukturprojekt für Künstliche Intelligenz (KI) „Stargate“ an – wenige Tage später erschüttert das chinesische Sprachmodell DeepSeek die Börsen weltweit. Die Welt der Künstlichen Intelligenz wird immer dynamischer. Mit DeepSeek betritt ein neuer Player die Bühne. Doch was verbirgt sich hinter dem schnellen Aufstieg? Was steckt hinter dem Sprachmodell, das den Westen so stark beschäftigt?

Was ist DeepSeek?

DeepSeek ist ein neues fortschrittliches Sprachmodell des gleichnamigen chinesischen Start-ups.  Es gehört zu den sogenannten Large Language Models (LLMs) und wurde darauf trainiert, natürliche Sprache zu verstehen und zu generieren. Das Besondere: DeepSeek übertrifft führende Modelle wie das OpenAI-Modell ChatGPT. Dabei war die Entwicklung angeblich nicht nur deutlich kostengünstiger als bei der Konkurrenz, sondern benötigte auch nur ein Zehntel der üblichen Rechenressourcen. Das Start-up von Liang Wenfeng hatte bereits vor einigen Monaten mit seinem R1-Lite-Modell für Aufsehen gesorgt. Die neu erschienene R1-Version kann sich nun mit dem OpenAI-Modell messen.

Das R1-Modell zeichnet sich insbesondere durch seine Fähigkeiten aus, komplexe Aufgaben in den Bereichen Textgenerierung, Übersetzung und Datenanalyse zu bewältigen. Dabei zeigt das Modell einige innovative Features auf:

  • Chain of Thought: Die sogenannte Gedankenkette ermöglicht, dass das Modell seine Überlegungen Schritt für Schritt darlegt. Das Aufzeigen der einzelnen Gedankenschritte erlaubt es, Fehler in der Argumentation leichter zu erkennen und zu korrigieren.
  • Reinforcement Learning: Statt das Sprachmodell mit korrekten Antworten zu trainieren, setzt DeepSeek R1 auf Reinforcement Learning. Dabei lernt es durch eigene Erkundungen und Anpassungen, also nach dem Trial-and-Error-Prinzip.
  • Model Distillation: Angesichts der enormen Größe des ursprünglichen DeepSeek-Modells mit 671 Milliarden Parametern ist der Ressourcenbedarf immens. Um die Effizienz zu steigern, wird das große Modell genutzt, um kleinere Modelle zu trainieren. Diese distillierten Modelle erreichen eine ähnliche Leistung mit weniger Speicher und Rechenressourcen.

Was unterscheidet DeepSeek von OpenAI?

DeepSeek und OpenAI sind beides führende Akteure im Bereich der KI. Dennoch unterscheiden sie sich in verschiedenen Aspekten, darunter ihre Herkunft, Ziele und Marktstrategien.

DeepSeekOpenAI
HerkunftDeepseek ist ein chinesisches KI-Unternehmen, das sich speziell auf den chinesischen Markt bezieht. Es ist sprachlich, kulturell und regulatorisch an die Anforderungen Chinas ausgerichtet.
 
Dabei muss es sich an die Vorgaben der chinesischen Regierung halten, einschließlich Zensur und Datenschutzbestimmung.
OpenAI ist ein US-amerikanisches Unternehmen mit einem globalen Fokus.
 
Seine Modelle sind für eine breite internationale Nutzerschaft konzipiert und orientieren sich an westlichen Standards für Datenschutz und Transparenz.
Technologie und GeschäftsmodellEin bedeutender Vorteil von DeepSeek ist seine Effizienz – das Modell läuft auch auf weniger leistungsstarker Hardware gut, was besonders für Schwellenländer und kleinere Unternehmen attraktiv ist. Deep Seek stellt sein Modell als Open Source zur Verfügung.
 
Berichte deuten darauf hin, dass das Sprachmodell eine neuartige Architektur verwendet, die komplexe Aufgaben schneller und präziser lösen kann.
Die OpenAI-Modelle sind für ihre Leistungsfähigkeit und Flexibilität bekannt.
 
OpenAI hingegen wurde ursprünglich als Open-Source-Organisation gegründet, hat sich aber mittlerweile kommerzialisiert. Die neuesten Modelle sind nur über kostenpflichtige Schnittstellen zugänglich, weder der Quellcode noch die Trainingsdaten sind einsehbar.
EthikAls chinesisches Unternehmen unterliegt DeepSeek wahrscheinlich strengen staatlichen Vorgaben. Zudem gibt es wenige Informationen über die interne Funktionsweise.OpenAI hat sich verpflichtet, die KI-Entwicklung transparent und ethisch zu gestalten. Dabei hält sich das Unternehmen an westliche Datenschutzgesetzte wie die DSGVO.

Was steckt hinter dem Hype?

Die westliche Tech-Welt reagiert alarmiert auf DeepSeek. Meta hat mehrere Krisenteams eingerichtet, um DeepSeek zu analysieren und mögliche Auswirkungen auf eigene Modelle zu bewerten. Innerhalb weniger Tage wurde die DeepSeek-App zur meistgeladenen Anwendung im US-amerikanischen iOS App Store und überholte ChatGPT – ein Ereignis, das die Nvidia-Aktien um 18 % einbrechen ließ. Der Kursrückgang ist auf die enge Verbindung des führenden KI-Chipherstellers mit OpenAI zurückzuführen und spiegelt die Sorge der Investoren wider, dass DeepSeeks effizienteres Modell die Nachfrage nach Nvidia-Hochleistungs-GPUs senken könnte.

Doch wie bei jeder neuen Technologie ist Vorsicht geboten. Expertinnen und Experten warnen davor, die Leistungsfähigkeit zu überschätzen. In einigen Tests konnte DeepSeek zwar beeindruckende Ergebnisse erzielen – es bleibt jedoch abzuwarten, wie es sich in der Praxis bewährt.

Nicht zu vergessen sind die kulturellen und sprachlichen Einschränkungen. DeepSeek wurde für den chinesischen Markt optimiert. In anderen Sprachen und kulturellen Kontexten könnte es demnach weniger gut abschneiden.

Was sind die Risiken?

DeepSeek hat zweifellos Eindruck hinterlassen und das Potenzial, die KI-Branche nachhaltig zu verändern. Seine Leistungsfähigkeit und Kosteneffizienz könnten ihm nicht nur in China, sondern auch global eine wichtige Rolle verschaffen. Dennoch bleiben Fragen offen, insbesondere hinsichtlich der staatlichen Kontrolle Chinas und damit verbundener Themen wie Zensur und Datenschutz. So gibt das Unternehmen an, gesammelte Informationen auf Servern in der Volksrepublik China zu speichern.

Ob die Krisenteams von Meta-CEO Mark Zuckerberg wirklich benötigt werden, bleibt abzuwarten. Was jedoch sicher ist: DeepSeek wird die westliche Tech-Industrie zu weiteren Innovationen antreiben.

Beitrag teilen

zur Autorin

Lara Krampe

Lara Krampe ist PR-Redakteurin in den Teams IT & Telekommunikation und Dienstleistungen bei Sputnik. Die gebürtige Münsteranerin ist ursprünglich Ingenieurin und absolvierte ihren Master in Technik- und Innovationskommunikation an der Fachhochschule Bonn-Rhein-Sieg. In ihrer Freizeit kocht und backt sie leidenschaftlich gerne, verbringt Zeit mit Freunden und Familie sowie ihre Wochenenden mit Blumeneinkäufen auf dem Wochenmarkt.