Page de statut
La page de statut publique de Tale — ce qu'elle couvre, comment les incidents sont périmétrés par service, où vit le flux RSS, et en quoi elle diffère de tes métriques auto-hébergées.
4 min read
La page de statut est le registre canonique de la disponibilité de Tale Cloud. Chaque service rotatif a sa propre ligne de statut, l'historique des incidents est conservé pour la piste d'audit, et la page est le canal que Tale utilise pendant un incident — avant que les courriels ne partent, avant que les tickets de support ne soient répondus, la page est mise à jour.
Lis ceci quand quelque chose se conduit mal et que tu veux savoir si c'est juste toi. Abonne-toi au flux quand tu es responsable de l'intégration côté toi — la page te dit quel service s'est dégradé pour que tu routes l'alerte vers la bonne équipe sans réveiller la mauvaise astreinte.
Un abonnement mis en pratique
La page de statut est à https://status.tale.dev. S'abonner prend une URL :
curl -sS https://status.tale.dev/history.rssLe flux RSS porte chaque changement d'état — ouvert, mise à jour, résolu — pour chaque service. L'abonnement par courriel est le même formulaire en un clic sur la page ; le canal courriel livre les mêmes événements avec un debounce de cinq minutes.
Périmètre par service
| Service | Ce qu'il couvre | Quand il passe au rouge |
|---|---|---|
platform | L'application TanStack Start + Convex — agents, workflows, intégrations, UI. | UI injoignable ; l'API renvoie 5xx ; l'auth est cassée. |
rag | Le service Python FastAPI de traitement de documents — indexation, récupération. | Les téléversements de documents calent ; la récupération est vide. |
crawler | Le service d'extraction web Crawl4AI — utilisé par l'ingestion de documents et le repli Tavily. | Les documents tirés du web échouent ; la recherche profonde cale. |
proxy | Le bord Caddy — terminaison TLS, routage HTTP. | Tout le trafic Tale Cloud est touché. |
db | TimescaleDB — état durable pour la couche Convex et les métadonnées de la plateforme. | Écritures refusées ; la ligne platform passe aussi au rouge. |
Chaque ligne porte les 90 derniers jours d'uptime comme un sparkline. Un incident se lit comme une bande colorée sur la ligne ; cliquer la bande ouvre le chronogramme — première mise à jour, suites, résolution, post-mortem quand l'incident en exige un.
Historique des incidents
L'historique est conservé indéfiniment. Chaque incident enregistre les services touchés, l'énoncé d'impact client, le chronogramme, et le post-mortem quand l'incident dépasse le seuil de sévérité qui en impose un. Le seuil est publié sur la page elle-même ; la règle empirique est tout ce qui a un impact client cross-org et une durée au-dessus de 30 minutes.
La page appartient à la rotation d'astreinte. Les mises à jour sont poussées par l'ingénieur qui tient la page, pas par un système automatisé — le choix est délibéré, parce que la page est aussi le document qui va aux clients et aux auditeurs après coup.
Auto-hébergé : ce qui change
Les instances auto-hébergées n'apparaissent pas sur la page de statut de Tale — la page ne couvre que Tale Cloud. Pour ton propre déploiement, la surface d'observabilité dans le produit est le bon canal : santé des conteneurs depuis tale status, métriques de requêtes depuis les journaux Caddy, et le journal d'audit dans le produit pour les événements du plan de contrôle. La page de dépannage observabilité associe les symptômes aux journaux.
Si tu opères une instance auto-hébergée et veux une page de statut tournée client, fais tourner un des projets open-source de page de statut contre tes propres sondes — Tale n'en livre pas pour les opérateurs auto-hébergés aujourd'hui.
Où cela s'inscrit
La page de statut est le canal opérationnel ; Confiance et conformité est le canal d'audit et liste la page comme preuve du contrôle de disponibilité d'infrastructure. Si tu câbles Tale dans un pipeline et veux que l'intégration réagisse à une panne Tale, le flux RSS est l'entrée ; si tu lis ceci parce que quelque chose dans ton intégration échoue maintenant, la Référence API liste les codes d'erreur sur lesquels tu dois brancher.