Meinung: Warum KI-Agenten die Zukunft des Alltags-KI sind

Image generated with OpenAI

Meinung: Warum KI-Agenten die Zukunft des Alltags-KI sind

Lesezeit: 7 Min.

2025 scheint das Jahr der Agentic AI zu sein. OpenAI, Microsoft, Anthropic und andere große Technologieunternehmen haben ihre bisher fortschrittlichsten KI-Modelle veröffentlicht, die in der Lage sind, komplexe Aufgaben zu erfüllen, die im letzten Jahr noch nicht möglich waren. Aber was genau sind KI-Agenten und wie viel von dieser Technologie ist real versus Hype?

Schritt zu halten mit den KI-Trends der letzten Jahre kann anstrengend sein. Wir sind von der grundlegenden KI zur generativen KI, dann zur schlussfolgernden KI gekommen, und jetzt dominieren KI-Agenten die Diskussion. In den letzten Monaten haben mehrere Technologieunternehmen neue KI-Agenten vorgestellt und hervorgehoben, wie attraktiv Arbeitsabläufe werden, die sie verbinden.

Im Januar hat OpenAI seinen ersten KI-Agenten, Operator, eingeführt, der in der Lage ist, Aufgaben autonom auszuführen, wie beispielsweise das Surfen im Internet, das Reservieren eines Restaurants oder das Beschaffen von Konzertkarten für Sie, basierend auf Ihren Vorlieben und Kriterien.

Zwei Monate später veröffentlichte das chinesische KI-Startup Zhipu AutoGLM Rumination, einen kostenlosen KI-Agenten, der unabhängig agieren und Reisen für Benutzer planen kann. Und erst vor ein paar Tagen hat Microsoft „Computer Use“ für Copilot Studio vorgestellt, was KI-Agenten weitere autonome Fähigkeiten verleiht, einschließlich der Möglichkeit, die Kontrolle über den Desktop des Benutzers zu übernehmen.

Aber dieser Trend handelt nicht nur von Unternehmen, die coole neue Produkte auf den Markt bringen – es geht um ein komplexes und sich ständig weiterentwickelndes Feld, das verschiedene Formen von KI mit menschlicher Interaktion verbindet. Technikbegeisterte und Experten gleichermaßen haben sich stark optimistisch über Agentic AI geäußert.

„Ein Trend, über den ich ebenfalls begeistert bin, ist der Workflow von KI-Agenten“, sagte KI-Experte und Mitbegründer von Coursera und DeepLearning Andrew Ng, auf der Snowflake’s BUILD 2024 Konferenz im November. „Würde man mich fragen, welche die wichtigste KI-Technologie ist, auf die man achten sollte? Ich würde sagen, es ist Agentic AI.“

Also, was genau sind KI-Agenten? Erbringen sie tatsächlich die Leistung, die Experten behaupten? Hier ist ein kurzer Überblick über die wichtigsten Aspekte dieser aufkommenden Technologie und die neuesten Entwicklungen.

Was sind KI-Agenten?

Wie Unternehmen wie OpenAI und Microsoft gezeigt haben, sind KI-Agenten Technologien, die komplexe Aufgaben bewältigen können, indem sie autonom verschiedene Anwendungen und Software kombinieren.

Im Grunde genommen sind sie „traditionelle“ KI-Chatbots – aber fortschrittlicher, fähig Aufgaben zu erledigen, die über das hinausgehen, was wir in den letzten zwei Jahren gewohnt waren. Dazu gehören Planung, Surfen im Internet, das Merken Ihrer Interessen und sogar das Erledigen Ihrer Einkäufe ohne Schritt-für-Schritt-Anleitung, da sie Dinge selbst herausfinden.

Google Cloud definiert KI-Agenten als „Software-Systeme, die KI nutzen, um Ziele zu verfolgen und Aufgaben im Auftrag der Benutzer zu erfüllen.“

Was diese KI-Modelle wirklich besonders macht, sind ihre fortgeschrittenen Denkfähigkeiten, die es ihnen ermöglichen, mehrere Arten von Informationen – Audio, Text, Video, Code und Bilder – gleichzeitig zu verarbeiten. Sie können komplexe Situationen so verstehen, wie es Menschen tun würden, handeln und mit Software und Plattformen interagieren.

Viele Technologieunternehmen drängen ihre KI-Modelle nun auf diese nächste Stufe.

Vor wenigen Tagen gab OpenAI bekannt, dass seine KI-Modelle o3 und o4-mini „denken“ mit Bildern und diese manipulieren können – zum Beispiel durch Zuschneiden oder Transformieren. Unterdessen ermöglicht Microsofts neue Funktion „Computer Use“ es seinen KI-Agenten, grafische Benutzeroberflächen zu erkennen.

„Wenn eine Person die App verwenden kann, kann der Agent das auch,“ sagte Charles Lamanna, Corporate Vice President, Business & Industry Copilot bei Microsoft, in der Ankündigung.

Die nächste Stufe: Agentic KI-Technologie

Während viele Technologieunternehmen ultrasmarte KI-Chatbots entwickeln, geht die agentische KI einen Schritt weiter. Diese Technologie konzentriert sich auf den Aufbau von Systemen, in denen mehrere dieser KI-Agenten interagieren und verschiedene Aufgaben ausführen können, um genauere und vollständigere Ergebnisse zu liefern.

In ihrem Vortrag über „Die Macht der KI-Agenten“ auf einer kürzlich von mir besuchten Tech Talk Veranstaltung, die von eDreams organisiert wurde, erklärte KI-Expertin Patricia Gutierrez Faxas, dass diese Systeme verschiedene Strukturen annehmen können. Multi-Agenten-Systeme können komplexe Aufgaben in einfachere unterteilen, sie spezialisierten Agenten zuweisen und verschiedene Arten von Netzwerken bilden.

Ein KI-Agent kann eine „Supervisor“-Rolle übernehmen, kleinere Aufgaben an andere spezialisierte Agenten delegieren, oder mehrere Agenten können gleichzeitig an separaten Aufgaben arbeiten und koordinieren, um das endgültige Ergebnis zu liefern. Einige der Vorteile dieser Systeme sind eine verbesserte Genauigkeit, größere Privatsphäre und reduzierte Fehler.

Andrew Ng stimmt diesem Ansatz zu. Während seines Vortrags auf der BUILD 2024 betonte er die Bedeutung von Agentic AI-Workflows für die Verarbeitung komplexer Aufgaben mit deutlich besseren Ergebnissen. Der Leistungssprung von Modellen wie GPT-3.5 zu GPT-4 – und ihre stärkeren Ergebnisse bei Coding-Benchmarks – ist größtenteils auf Agentic-Workflows und Agentic-Reasoning zurückzuführen.

Wie werden KI-Agenten unser Leben beeinflussen?

Technologieunternehmen gehen unterschiedliche Wege im Bereich der agentialen KI. OpenAI hat sich auf Ideen für den alltäglichen Nutzer konzentriert. Bei der Einführung von Operator erklärte das Team in einem Video, dass eine Person einfach an ein Gericht denken könnte, das sie zubereiten möchte, ChatGPT bitten könnte, das beste Rezept zu finden, und sogar die notwendigen Zutaten von einem Online-Supermarkt kaufen lassen könnte.

Das KI-Modell könnte Nachfragen stellen und vor dem Ausführen kritischer Aufgaben, wie zum Beispiel dem Abschluss eines Kaufs mit der Kreditkarte des Benutzers, innehalten. Benutzer können Ausgabenlimits festlegen oder verlangen, dass der Assistent vor jedem Kauf um Bestätigung bittet.

Die Möglichkeiten, wie normale Menschen KI-Agenten nutzen können, scheinen endlos zu sein, aber die bisher beliebtesten Einsatzmöglichkeiten beinhalten die Rolle als Reiseagenten, persönliche Einkäufer und Verwaltungsassistenten – schließlich, wer würde nicht eine personalisierte Technologie wollen, die E-Mails versendet, wichtige Geburtstage merkt und sich um Steuern kümmert?

Microsoft hat einen stärker unternehmensorientierten Ansatz gewählt. Das Unternehmen hat demonstriert, wie Marketingagenturen KI-Agenten zur Automatisierung der Marktdatenerfassung und zur Erstellung von erkenntnisgetriebenen Analysen nutzen können, oder wie große Unternehmen sie für die Rechnungsbearbeitung innerhalb ihrer Systeme einsetzen können.

Dennoch, obwohl all diese Anwendungsfälle revolutionär klingen, stimmen Experten darin überein, dass noch ein langer Weg vor uns liegt. Die meisten Menschen können KI-Agenten noch nicht zur Verbesserung ihres Alltags nutzen, da viele dieser Funktionen, wie Operator, nur Pro-Nutzern zur Verfügung stehen, ein Abonnement, das 200 Dollar pro Monat kostet.

Also, entspricht die agentische KI dem Hype?

Viele Medienüberschriften versprechen eine neue KI-Revolution, angeführt von Agentic AI. In der Branche herrscht zweifellos viel Hype – und die Realität könnte nicht weit dahinter liegen. Ein kürzlich von IBM veröffentlichter Bericht zeigte, dass viele Entwickler diese Technologie aktiv erforschen und entwickeln.

„IBM und Morning Consult haben eine Umfrage unter 1.000 Entwicklern durchgeführt, die KI-Anwendungen für Unternehmen entwickeln, und 99% von ihnen gaben an, dass sie KI-Agenten erforschen oder entwickeln“, erklärte Dr. Maryam Ashoori, Direktorin des Produktmanagements bei IBM watsonx.ai. „Die Antwort ist also ja, 2025 wird das Jahr des Agenten sein.“

Experten weisen jedoch darauf hin, dass es mehrere Interpretationen dessen gibt, was KI-Agenten wirklich sind und wie sie sich verhalten sollten. Infolgedessen hängt der Fortschritt und die Leistung aktueller KI-Agenten oft von der Perspektive und den Standards der Person ab, die die Technologie bewertet.

Was sicher ist, ist, dass viele Experten und Entscheidungsträger fest an diese Technologie glauben und stark in ihre Entwicklung investieren. Eine kürzlich durchgeführte Studie ergab, dass 84% der IT-Führungskräfte KI-Agenten ebenso vertrauen wie Menschen, und OpenAI erwartet bis 2029 einen Umsatz von rund 125 Milliarden Dollar.

Obwohl die Agentic AI-Technologie noch nicht vollständig entwickelt ist und ihre Akzeptanz nicht so weit verbreitet ist wie die von Chatbots – hauptsächlich aufgrund ihrer hohen Kosten – ist klar, dass der überwältigende Optimismus und die Begeisterung für diesen Trend stark genug sind, um in den kommenden Monaten bedeutende Veränderungen voranzutreiben.

Hat dir der Artikel gefallen?
Wir freuen uns über eine Bewertung!
Ich mag es gar nicht Nicht so mein Fall War ok Ziemlich gut Ich liebe es

Wir freuen uns, dass dir unsere Arbeit gefallen hat!

Würdest du uns als geschätzte Leserin oder geschätzter Leser eine Bewertung auf Trustpilot schreiben? Das geht schnell und bedeutet uns sehr viel. Danke, dass du am Start bist!

Bewerte uns auf Trustpilot
0 Bewertet von 0 Nutzern
Titel
Kommentar
Danke für dein Feedback