Search: [alerting] - jmlrt's links

627 shaares

Filters

Links per page

20 50 100

2 results tagged alerting

Monitoring 101 : Les alertes durant les astreintes - Aldevar

Quelques règles pour mettre en place un système d'alerting de la production pertinent dans le cadre d'astreintes 24/24.

Privilégiez les alertes sur les symptômes (disponibilité du service pour les utilisateurs, temps de réponse...) plutôt que les alertes sur les causes techniques (CPU, RAM, process, erreur 500, ...)
Scripter toutes les actions sur alertes qui peuvent être automatisée
Ne déclencher l'astreinte que pour les alertes qui nécessitent une action immédiate ne pouvant pas être automatisée

monitoring · production · alerting

November 1, 2017 at 12:13:47 UTC * · permalink

·

https://blog.devarieux.net/2017/10/monitoring-101-alertes-durant-astreintes.html

·

Inception: How LinkedIn Deals with Exception Logs | LinkedIn Engineering

LinkedIn utilise un outils maison pour analyser les exceptions dans les logs applicatifs. Chaque nouvelle exception est enregistrée dans une base avec son hash. Le nombre d'occurrence de chaque exception par période de temps est ensuite enregistré dans une autre table. Cette solution nécessite seulement 30Gb pour stocker l'ensemble des exceptions alors qu'une solution ELK nécessiterait 50Pb pour centraliser l'ensemble des logs de leurs applications.

logs · loganalysis · alerting

December 26, 2016 at 15:54:45 UTC * · permalink

·

https://engineering.linkedin.com/blog/2016/12/inception--how-linkedin-deals-with-exception-logs

·