Eine Low-Code-Plattform, die die Einfachheit von No-Code mit der Leistung von Full-Code verbindet 🚀
Jetzt kostenlos starten
7. März 2025
4
min lesen

Ich habe QwQ-32B getestet, Alibabas neue logische KI – deshalb ist sie überraschend leistungsstark

Georgi Miloradowitsch
Forscher, Texter und Usecase-Interviewer
Inhaltsverzeichnis

Ich setzte mich mit neuer Neugier hin und testete QwQ-32B – das neueste Open-Source-KI-Modell des Qwen-Teams von Alibaba. Sie behaupten, dass dieses 32-Milliarden-Parameter-Modell Giganten wie DeepSeek-R1 ebenbürtig sein könnte, das über 20-mal so viele Parameter bietet. Etwas hoffnungsvoll machte ich mich daran, herauszufinden, wie viel KI man in 32 Milliarden Parameter packen kann. Und ehrlich? Es hat meine Erwartungen übertroffen.

Erste Eindrücke: Überraschende Effizienz – ÄNDERN SIE ES, BITTE

Ich habe bei QwQ-32B eine Vielzahl von Aufgaben gestellt – von einfachen Matheaufgaben und Programmieraufgaben bis hin zu logischen Rätseln. Die Antworten? Schnell, präzise und wirklich aufschlussreich. Mit nur 32 Milliarden Parametern konnte es bemerkenswerterweise mit Giganten wie DeepSeek-R1 (mit 671 Milliarden Parametern) mithalten und demonstrierte damit, was sich wie eine schlanke, aber leistungsstarke Intelligenz anfühlt.

Die Benchmarkwerte sprechen Bände:

  • GPQA: 65.2 % Genauigkeit (wissenschaftliches Denken auf Hochschulniveau), was mit OpenAI o1-mini vergleichbar ist
  • ZIEL: Erstaunliche Genauigkeit von 79.5 % in einem Benchmark zum Testen der Fähigkeiten des Modus bei mathematischen Aufgaben. Dieses Ergebnis ist ähnlich wie bei DeepSeek R1 und viel höher als bei OpenAI o1-mini
  • Codierungsherausforderungen: Hat sich mit soliden 63.4 % auf LiveCodeBench behauptet

Die Zahlen sind beeindruckend, aber wirklich faszinierend ist, mit welcher Effizienz diese Ergebnisse erzielt wurden.

Tiefes Denken: differenziert, scharfsinnig und seltsam intuitiv

QwQ-32B hat eine bemerkenswerte Fähigkeit, subtile Bedeutungsebenen zu durchdringen – fast wie ein tief nachdenklicher Partner. Neugierig, seine Grenzen zu erweitern, bat ich ihn, die Symbolik zu interpretieren, die in einem Gedicht namens „Daddy“ von Sylvia Plath verborgen ist. Er sezierte die Metaphern so elegant, dass ich glaube, er hätte Literaturkritik studiert.

Davon ermutigt, habe ich etwas Praktischeres ausprobiert:

  • Könnte es den komplexen juristischen Fachjargon aus einem aktuellen Dokument zur Technologieregulierung in einfaches, umgangssprachliches Englisch übersetzen? Dies gelang mühelos, ohne dass entscheidende Feinheiten verloren gingen.
  • Könnte es logische Fehler aufdecken, die in einem absichtlich irreführenden Nachrichtenartikel versteckt sind? Beeindruckenderweise wurde jeder Widerspruch genau aufgezeigt und es wurden präzise Korrekturen angeboten.
  • Könnte es wirksame, aber nicht offensichtliche Verbesserungen einer komplizierten SQL-Abfrage vorschlagen? Dadurch wurde nicht nur die Leistung optimiert, sondern auch erklärt, warum jede Änderung wichtig ist.

Auch bei mehrstufigen Aufgaben oder langen, strukturierten Diskussionen bleibt die Übersichtlichkeit und Kohärenz erhalten. Beeindruckenderweise hat das System bei einer besonders komplexen Finanzprognose nicht nur mögliche Ergebnisse vorhergesagt, sondern systematisch alle Annahmen und Risikofaktoren dargelegt und damit eine methodische Transparenz gezeigt, die selbst bei menschlichen Analysten selten anzutreffen ist.

Obwohl QwQ-32B nur mit einem Bruchteil der Parameteranzahl seiner größten Konkurrenten arbeitet, erzeugt es durchweg schnell und zuverlässig anspruchsvolle Ergebnisse. Während Modelle mit zehnmal mehr Parametern oft träge Reaktionszeiten aufweisen, schafft QwQ-32B einen Ausgleich zwischen Argumentationstiefe und schneller Ausgabe. 

QwQ-32B hat seine Nuancen

Obwohl mich QwQ-32B beeindruckt hat, wurden bei der Erkundung seiner Grenzen einige faszinierende Nuancen deutlich:

  • Rekursive Argumentationsschleifen: Wie viele andere Denkmodelle neigt QwQ-32B zum rekursiven Denken. Anstatt seine Gedanken schnell zu einem Abschluss zu bringen, kreist es immer wieder um dieselben logischen Punkte und erstellt umfangreiche, ausführliche Erklärungen. 
  • Unerwarteter Sprachwechsel: Gelegentlich vermischte sich Englisch auf unerklärliche Weise mit Bruchstücken einer anderen Sprache.
  • Übervorsichtige Originalität: Die Ergebnisse von QwQ-32B wirkten manchmal übervorsichtig. Die kreativen Fähigkeiten des Modells waren zweifellos ausgefeilt, aber es war risikoscheu und bevorzugte ausgetretene Denkpfade gegenüber eher fantasievollen oder spekulativen Ansätzen. 

Warum ist das wichtig (und wie können Sie es bei der Automatisierung nutzen)?

QwQ-32B zeigt, dass jeder auf leistungsstarke, effiziente KI-Technologie zugreifen kann. QwQ-32B-Preview-API Der Preis beträgt 0.12 USD pro Million Eingabetoken und 0.18 USD pro Million Ausgabetoken. Damit ist es eines der kostengünstigsten Modelle auf dem Markt. 

Wenn Sie also in der Forschung, Inhaltserstellung oder sogar Produktentwicklung tätig sind, kann Ihnen die Verfolgung der Entwicklung dieser KI und deren Integration in reale Arbeitsabläufe einen erheblichen Wettbewerbsvorteil verschaffen. Eine der besten Möglichkeiten, das Modell zu nutzen, sind Low-Code-Automatisierungsszenarien auf Latenode.

Erfahren Sie, was Ihre Kunden wirklich denken

Das Sammeln von Feedback über Formulare ist einfach, doch das manuelle Sortieren der Antworten und das Verstehen der Kundenstimmung wird schnell überwältigend, langsam und ineffizient.

Konfiguration:

  1. Google Forms: Kunden geben Feedback oder Bewertungen über ein einfaches Formular ab.
  2. QwQ-32B API (über HTTP-Anfrage): Analysiert das Feedback automatisch, kategorisiert die Stimmung und fasst die wichtigsten Punkte zusammen.
  3. Slack: Teilt kategorisierte Erkenntnisse und prägnante Zusammenfassungen sofort mit Ihrem Team.
  4. Google Blätter: Speichert alle Feedback-Analysen übersichtlich, sodass Sie sie leicht nachverfolgen und später wieder verwenden können.

Durch diese Automatisierung werden verstreute Kundenmeinungen sofort in klare, umsetzbare Erkenntnisse umgewandelt. So kann Ihr Team schneller reagieren, Produkte wirksam verbessern und für zufriedene Kunden sorgen – und das alles ohne langwierige manuelle Verarbeitung.

Warum sollten Sie die Automatisierung auf Latenode ausprobieren?

Bei Latenode geht es nicht nur um Automatisierung – es geht darum, hochmoderne KI wie QwQ-32B mühelos direkt in Ihre täglichen Arbeitsabläufe einzubinden. Integrieren Sie Datenbanken, Apps und KI-Modelle ohne Programmierkenntnisse. 

Möchten Sie immer einen Schritt voraus sein und wichtige Erkenntnisse automatisch nutzen? Versuchen Sie Ihr erstes Automatisierungsszenario mit Latenknoten, und verwandeln Sie den Hype noch heute in echten Geschäftswert.

Erstellen Sie unbegrenzte Integrationen mit Verzweigung, mehreren Triggern, die in einen Knoten gelangen, verwenden Sie Low-Code oder schreiben Sie Ihren eigenen Code mit AI Copilot.

In der Zwischenzeit werde ich weiter erforschen, wie diese seltsam menschliche KI meinen Arbeitsablauf beeinflusst.

Verwandte Blogs

Anwendungsfall

Unterstützt von