Neue Wege im KI-Management: Die Gateway API Inference Extension
Moderne generative KI- und große Sprachmodelle (LLMs) stellen Kubernetes vor einzigartige …
Wir freuen uns, die allgemeine Verfügbarkeit der Gateway API v1.3.0 bekanntzugeben! Diese Version wurde am 24. April 2025 veröffentlicht und bringt spannende neue Funktionen mit sich.
Die Version 1.3.0 der Gateway API führt das prozentuale Request Mirroring als neue Funktion im Standard Kanal ein. Außerdem gibt es drei experimentelle Features: CORS-Filter, einen standardisierten Mechanismus zur Zusammenführung von Listenern und Gateways sowie Retry Budgets.
Die Aufnahme in den Standard-Kanal bedeutet, dass ein hohes Maß an Vertrauen in die API-Oberfläche besteht und Rückwärtskompatibilität garantiert wird. Entwickler können sich also darauf verlassen, dass die neuen Features stabil und zukunftssicher sind.
Ein Highlight der neuen Version ist das prozentuale Request Mirroring. Diese Erweiterung ermöglicht es, HTTP-Anfragen an einen anderen Backend zu duplizieren, was besonders bei Blue-Green-Deployments nützlich ist. So können Sie die Auswirkungen von Anfrage-Skalierungen auf die Anwendungsleistung testen, ohne die Antworten für die Clients zu beeinträchtigen.
Bisher wurde das Mirroring für alle Anfragen an einen backendRef
durchgeführt. Mit der neuen Funktion können Benutzer jedoch einen Teil der Anfragen angeben, die sie spiegeln möchten, entweder prozentual oder als Bruchteil. Dies ist besonders nützlich, wenn Dienste eine hohe Anzahl von Anfragen erhalten.
Hier ist ein Beispiel, bei dem 42% der Anfragen an “foo-v1” an “foo-v2” gespiegelt werden:
apiVersion: gateway.networking.k8s.io/v1
kind: HTTPRoute
metadata:
name: http-filter-mirror
labels:
gateway: mirror-gateway
spec:
parentRefs:
- name: mirror-gateway
hostnames:
- mirror.example
rules:
- backendRefs:
- name: foo-v1
port: 8080
filters:
- type: RequestMirror
requestMirror:
backendRef:
name: foo-v2
port: 8080
percent: 42 # Dieser Wert muss eine Ganzzahl sein.
Sie können auch das partielle Mirroring mit einem Bruch konfigurieren. Hier ist ein Beispiel, bei dem 5 von 1000 Anfragen an “foo-v1” an “foo-v2” gespiegelt werden:
rules:
- backendRefs:
- name: foo-v1
port: 8080
filters:
- type: RequestMirror
requestMirror:
backendRef:
name: foo-v2
port: 8080
fraction:
numerator: 5
denominator: 1000
Diese neuen Funktionen bieten Entwicklern und DevOps-Teams die Möglichkeit, ihre Anwendungen flexibler und robuster zu gestalten. Bei ayedo sind wir begeistert von den Fortschritten der Gateway API und stehen Ihnen als Partner zur Seite, um diese neuen Features effektiv zu nutzen!
Quelle: Kubernetes Blog
Moderne generative KI- und große Sprachmodelle (LLMs) stellen Kubernetes vor einzigartige …
In der Welt der Kubernetes-Entwicklung gibt es spannende Neuigkeiten: JobSet wurde eingeführt, eine …
Effizientes Management von Kubernetes-Clustern wird zunehmend wichtiger, insbesondere bei wachsender …