In dieser Woche stehen bahnbrechende Fortschritte im Bereich der Künstlichen Intelligenz (KI) im Fokus. OpenAI erweitert den Zugang zu ihrer „Deep Research“-Funktion und stellt ein neues, leichtgewichtiges Modell vor, das umfassende Internetrecherchen auch für kostenlose Nutzer ermöglicht. Parallel dazu kündigt das Unternehmen die Veröffentlichung eines offenen KI-Modells mit beeindruckenden Kontextfenstern und der Fähigkeit zur Anbindung weiterer KI-Systeme an. Microsoft bringt mit dem 365 Copilot Chat verbesserte KI-gestützte Tools für Unternehmen auf den Markt, während das chinesische Startup DeepSeek mit einem kosteneffizienten Modell den Wettbewerb belebt. Weitere Innovationen betreffen KI-basierte Videogenerierung, Echtzeit-Übersetzungen bei Ray-Ban Metas sowie intelligente Assistenten auf mobilen Plattformen. Ergänzt wird das Bild durch verstärkte Anstrengungen zur Transparenz und Sicherheit von KI-Anwendungen, etwa durch Anthropic, und strategische Partnerschaften. In Europa lenkt der AI Action Summit den Blick auf langfristige Investitionen und Regulierung, die den verantwortungsvollen Umgang mit KI fördern sollen. Insgesamt verdeutlichen die aktuellen Entwicklungen eine beschleunigte Integration von KI-Technologien in Forschung, Wirtschaft und Alltag.
OpenAI erweitert Deep Research für alle Nutzer mit neuem Nutzungskonzept
OpenAI hat ihr Deep Research-Feature nun auch für Nutzer des kostenlosen Tarifs von ChatGPT zur Verfügung gestellt. Nutzer haben in der kostenlosen Version fünf Recherchemöglichkeiten pro Monat. Das neue Konzept unterscheidet zwischen einer vollständigen und einer leichteren Version der Deep Research, die auf O4 Mini basiert:
- Die leichte Version bietet nahezu identische Qualität, erzeugt aber kürzere, ressourcenschonende Antworten.
- Nutzer der Plus-, Team- und Pro-Pläne stehen zunächst die vollen Deep Research-Kapazitäten zur Verfügung; nach Ausschöpfen dieses Limits wird auf die leichtere Variante automatisch umgestellt.
Die tiefgehende Internetrecherche wird damit einem breiteren Publikum zugänglich, ohne die Systemressourcen zu überlasten.
Voraussicht auf OpenAI’s frei verfügbares, leistungsstarkes Open-Model mit API-Integration
Für den Sommer 2025 ist die Einführung eines leistungsstarken, frei verfügbaren Modells von OpenAI angekündigt. Das Modell soll:
- Kostenlos herunterladbar sein — ohne API-Zwang oder Cloudbindung.
- Lokale Nutzung ermöglichen, was Datensouveränität und Privatsphäre fördert.
- Mit einer Ziel-Performance aufwarten, die sogar Meta’s Llama 4 und Deepseek übertrifft, inklusive einer potenziell sehr großen Kontextlänge.
- Laut Gerüchten komplexe Anfragen an geschlossene OpenAI-Modelle via API übergeben können, um noch bessere Ergebnisse zu liefern.
Sollte der Funktionsumfang wie spekuliert umgesetzt werden, steht ein signifikanter Wandel im Bereich lokal ausgeführter KI bevor.
Perplexity bringt smarten digitalen Assistenten mit erweiterten Alltagsfunktionen
Die neue „Perplexity Assistant“-Funktion in der iOS-App hebt den digitalen Alltag auf ein neues Level:
- Sprachbefehle, Medien abspielen, E-Mails verfassen, Meetings verschieben, Reservierungen buchen und Erinnerungen setzen sind möglich.
- Termine und Kalenderinformationen können abgefragt werden.
Das Feature kommt damit den lang ersehnten Erwartungen an eine „smarte Siri-Alternative“ sehr nah, befindet sich aber teils noch in der Optimierungsphase.
Microsoft 365 Copilot erhält erweiterte Agentenfunktionen für tiefere Datenanalysen
Die neue Version des Microsoft 365 Copilot bietet jetzt ein ausgebautes Agentensystem:
- Agenten für Analyse und Recherche können gezielt große Mengen an Unternehmensdaten auswerten.
- Copilot Notebooks und ein Agent-Store erleichtern individuelle Anpassungen für spezifische Use Cases.
- Integration von Drittanbieter-Plattformen wie monday.com, Dropbox und Trello wird unterstützt.
Der neu strukturierte Copilot hilft Firmen, komplexe Arbeitsprozesse durch spezialisierte KI-Assistenten zu automatisieren.
Neues Recall-Feature von Microsoft ermöglicht sicheres Zurückverfolgen von Aktivitäten lokal
Microsoft führt mit dem „Recall“-Feature eine Suchfunktion ein, die Aktivitäten auf dem eigenen Rechner lokal zurückverfolgbar macht:
- Nutzer können digital „zurückspulen“ und alle bearbeiteten Inhalte, Apps und Webseiten wiederfinden.
- Das Feature ist jetzt als Opt-in und mit granularem Datenschutz verfügbar.
- Alle Daten bleiben ausschließlich lokal auf dem Gerät und werden nicht an Microsoft übermittelt.
LTX Studio senkt Videoproduktionskosten durch Integration von Googles V2 Modell
LTX Studio hat das Google V2 Videogenerierungsmodell integriert und bietet damit den derzeit günstigsten Zugang zu V2-generierten Videos:
- 65 Cent für 8 Sekunden Video im Vergleich zu 4 Dollar auf Googles Cloud-Plattform.
- Bilder können in animierte Videos verwandelt werden; auch eigene Prompts oder Modelle (z.B. LTXV) sind nutzbar.
LTX Studio positioniert sich als offene, flexible Lösung für KI-basierte Videoproduktion.
Ray-Ban Metas führen Offline-aktive Live-Übersetzungen für praktische Nutzung ein
Die Ray-Ban Meta Smart Glasses unterstützen nun Live-Übersetzungen – auch ohne Internetverbindung:
- Sprachpakete können vorab heruntergeladen werden.
- Gesprochene Sprache wird in Echtzeit direkt ins Ohr übersetzt.
Anthropic fokussiert Ethik und Risikominderung mit neuen Modellen und Forschungen
Anthropic hat in den letzten Wochen vermehrt Forschung zu Ethik, Risiken und Schadensreduktion publiziert:
- Claude 3.7 ist jetzt weniger strikt, lehnt 45% weniger harmlose Anfragen ab, bleibt aber bei Gefahrenquellen wachsam.
- Verschiedene Studien und Blogposts zeigen, wie das Unternehmen Missbrauch und Manipulation proaktiv erkennt und Accounts sperrt.
- Dario Amodei (CEO) betont die Bedeutung schneller Fortschritte in der „Interpretierbarkeit“ und warnt vor unvorhersehbaren Risiken durch fehlendes Verständnis der Modell-Intelligenz.
Der Fokus liegt auf dem verantwortungsvollen und transparenten Umgang mit KI, bevor weitere große Releases erfolgen.
API-Neuigkeiten: OpenAI und Grock erweitern Entwicklerzugänge zu Bild- und Sprachmodellen
OpenAI stellt fortschrittliche Bildgenerierungsmodelle jetzt auch via API bereit; Entwickler können so direkt eigene Anwendungen auf diese Technologien stützen.
Grock bietet mit dem neuen Gro 3 Mini einen weiteren kompakten, leistungsfähigen API-Endpunkt, der laut Benchmarks Modelle wie Gemini 2.5 Flash und Claude 3.7 Sonnet zu niedrigeren Preisen schlägt.
Adobe Firefly und Crea AI verbessern KI-basierte Bild- und 3D-Content-Erstellung
- Adobe Firefly bietet mit dem neuen Image 4 Ultra und 4 Standard deutlich bessere Ergebnisse und mehr Auswahlmöglichkeiten zwischen verschiedenen Modellen.
- Crea AI ermöglicht fortan Bildbearbeitungen im Chat und stellt mit „Stage“ einen 3D-Umgebungseditor bereit, der Bilder und Texte in editierbare 3D-Assets umwandelt.
- Tencent veröffentlicht Hunan 3D 2.5 mit hohem Qualitätssprung für 3D-Objekte und Animationen.
Offene Wettbewerbsdynamik im Browsermarkt durch OpenAI und strategische Überlegungen
OpenAI signalisiert Interesse am Browsermarkt. Im Rahmen eines US-Kartellverfahrens gab OpenAI bekannt, im Falle eines Verkaufs auch für den Chrome-Browser bieten zu wollen — möglicherweise, um in Zukunft einen eigenen KI-first-Browser auf dieser Basis zu entwickeln.