Verlassen Sie sich nicht auf den lokalen Cache. Lernen Sie Workflows und Befehle kennen, mit denen SREs kaskadierende DNS-Fehler isolieren.

Wenn kritische Alarmierungen auslösen und Kunden melden, dass Ihr Dienst nicht erreichbar ist, ist der Instinkt, Pods neu zu starten. Aber wenn Ihre internen Metriken grünes Licht geben, liegt wahrscheinlich ein DNS-Problem vor.
Effektive SREs raten nicht; sie isolieren die Fehlerdomäne. Das Debuggen eines DNS-Problems erfordert, Ihre Infrastruktur zu verlassen und die Reise eines Pakets vom Nutzergerät bis zum autoritativen Nameserver nachzuahmen.
Der häufigste Fehler von Ingenieuren ist das Testen mit 'ping' über die lokale Konfiguration. Wenn das System kürzlich eine negative Antwort (NXDOMAIN) erhalten oder eine veraltete IP gecacht hat, wird es Sie belügen.
Eine sehr effektive Technik ist es, zu beweisen, dass das Backend gesund ist, indem man das DNS absichtlich umgeht. Verwenden Sie curl, um eine Verbindung zur bekannten IP zu erzwingen:
curl -v --resolve ihre-domain.com:443:192.0.2.1 https://ihre-domain.com
Wenn diese Anfrage erfolgreich ist, haben Sie bewiesen, dass Ihre Server und Load Balancer gesund sind. Lediglich die Namensauflösung ist defekt.
dig @1.1.1.1 ihre-domain.com A
dig +trace ihre-domain.com
Beobachten Sie die Ausgabe. Wenn der Ablauf bis zum autoritativen Server fehlschlägt, ist Ihre Zone beschädigt.
Schließen Sie sich Tausenden von Teams an, die sich darauf verlassen, dass Heimdall ihre Websites und APIs rund um die Uhr online hält. Starten Sie noch heute mit unserem kostenlosen Plan.
Kostenlos mit der Überwachung beginnenInfrastructure engineer focused on DNS, networking, and the invisible layers that determine whether applications are reachable.