Einführung in Kthena: LLM-Inferenz für die cloudnative Ära
TL;DR Kthena ist ein neues cloud-natives System für die Inferenz von Large Language Models (LLMs), …
Die jährliche Umfrage der Cloud Native Computing Foundation zeigt, dass Kubernetes sich als das bevorzugte „Betriebssystem“ für KI-Anwendungen etabliert hat, mit 82 % der Container Nutzer, die es in Produktionsumgebungen einsetzen. Cloud-native Technologien sind mittlerweile der Standard für moderne Anwendungen, während die Integration von KI und Kubernetes neue Möglichkeiten für Unternehmen eröffnet.
Die Ergebnisse der CNCF-Jahresumfrage verdeutlichen, dass Kubernetes nicht mehr als aufkommende Technologie betrachtet wird, sondern als zuverlässige Grundlage für moderne Unternehmensinfrastrukturen. Diese Entwicklung ermöglicht es Unternehmen, kritische KI-Workloads sicher zu skalieren und zu operationalisieren. Die Umfrage zeigt, dass 98 % der befragten Organisationen cloud-native Techniken übernommen haben, was darauf hinweist, dass diese Technologien über die Phase der frühen Anwender hinausgewachsen sind und sich als Standard für die Bereitstellung und Verwaltung moderner Anwendungen etabliert haben.
Die Nutzung von Kubernetes in Produktionsumgebungen ist von 66 % im Jahr 2023 auf 82 % gestiegen. Zudem geben 59 % der Organisationen an, dass ein Großteil ihrer Entwicklungs- und Bereitstellungsprozesse nun cloud-native ist. Dennoch ist die Neuanwendung von cloud-nativen Ansätzen langsamer geworden, da 10 % der Organisationen entweder in den frühen Phasen sind oder cloud-native Technologien gar nicht nutzen.
Kubernetes hat sich als bevorzugte Plattform für die Ausführung von KI-Inferenz-Workloads positioniert, wobei 66 % der Organisationen, die generative KI-Modelle hosten, Kubernetes zur Verwaltung ihrer Inferenzlasten einsetzen. Allerdings bleibt die Häufigkeit der KI-Bereitstellungen vorsichtig, da nur 7 % der Organisationen täglich Modelle bereitstellen, während 47 % dies gelegentlich tun. Es wird auch festgestellt, dass 44 % der Befragten noch keine KI/ML-Workloads auf Kubernetes ausführen, was den frühen Reifegrad der KI-Produktion unterstreicht.
Die Umfrage hebt die Verbindung zwischen operativer Reife und der Nutzung standardisierter Plattformen hervor. Teams setzen zunehmend GitOps-Workflows und interne Entwicklerplattformen ein, um Skalierung und Komplexität zu bewältigen. 58 % der als „cloud-native Innovatoren“ eingestuften Organisationen verwenden GitOps-Prinzipien umfassend, im Vergleich zu nur 23 % der „Anwender“. Die Backstage-Projekt (Interne Entwicklerportale) hat sich als eines der am schnellsten wachsenden CNCF-Projekte etabliert.
Im Bereich der Observability hat sich OpenTelemetry als dominierende Kraft entwickelt und zeigt, dass Observability von einer isolierten Entscheidung zu einem strategischen Pfeiler der cloud-nativen Operationen geworden ist. OpenTelemetry ist jetzt das Projekt mit der zweithöchsten Geschwindigkeit innerhalb der CNCF und hat über 24.000 Mitwirkende. Außerdem berichten fast 20 % der Befragten, dass sie Profiling als Teil ihres Observability-Stacks nutzen, was neue Prioritäten signalisiert.
Die Umfrageergebnisse deuten darauf hin, dass Kubernetes nicht nur als Orchestrierungstool, sondern als zentrales Element der modernen Infrastruktur fungiert. Die Integration von KI in cloud-native Umgebungen erfordert robuste und skalierbare Systeme, die Kubernetes bereitstellt. Die zunehmende Akzeptanz von GitOps und internen Entwicklerplattformen zeigt, dass Organisationen bestrebt sind, ihre Entwicklungsprozesse zu optimieren und die Effizienz zu steigern. Die wachsende Bedeutung von OpenTelemetry unterstreicht die Notwendigkeit, Observability als integralen Bestandteil der cloud-nativen Strategie zu betrachten.
Die Ergebnisse der Umfrage verdeutlichen, dass Kubernetes und cloud-native Technologien sich als unverzichtbare Bestandteile der modernen IT-Infrastruktur etabliert haben. Die fortschreitende Integration von KI in diese Systeme wird voraussichtlich neue Möglichkeiten für Innovation und Effizienz in der Unternehmenslandschaft schaffen.
Dieser Beitrag wurde automatisch aus dem englischsprachigen Original erstellt und auf Deutsch zusammengefasst. Wir bieten diesen Service an, um Sie bei der oft zerklüfteten und überwiegend englischsprachigen News-Situation im Bereich Cloud-Native Software, Souveräne Cloud, Kubernetes und Container-Technologien zeitnah auf Deutsch zu informieren.
TL;DR Kthena ist ein neues cloud-natives System für die Inferenz von Large Language Models (LLMs), …
TL;DR Ingress-nginx wird Anfang 2026 archiviert und erhält keine Wartung oder Sicherheitsupdates …
TL;DR Im Jahr 2025 hat das k0s-Projekt bedeutende Fortschritte in der Kubernetes-Community gemacht, …