Prometheus Casual Talks #1に参加した時のメモ
資料
特徴
・プロメティウスとプロメテウスと呼ぶ人がいた
・pull型(over HTTP・pushも一応できる)
pushだと中央サーバに負荷がかかる
pullだとサーバを分割したり、取得タイミングを変更したりすることが可能
・クラウドでの利用は、firewallなどの制約があり難しいかも
・クエリをかけることが最大の特徴(fluentdやkibanaなどと同じイメージ)
ただし複雑になりすぎるとツライ
・モニタリングとアラートを兼ね備えている(珍しい)
・各サーバにagent(exporterと呼ぶ)が動作するようにする
supervisordやsystemdでの起動がオススメ
・アラートは別プロセス(Alertmanager)で動作している
まだyoungだが、将来有望。思想として、アラートを減らしたり、まとめてなるべく運用に手間がかからないようにしている
(1度受け取ったアラートはデフォルトで4時間後にアラートするなど)
・殆どの方が、運用は何年間かしているが、重要なところでは利用していない模様だった
・AWSだとt2.small以上が推奨。50-100台ならt2.mediumで十分だったらしい
(1台あたり150-300メトリクス、間隔15秒、1ヶ月でディスク容量は200MBほど消費)
・開発元がUTCを愛しており、ローカルタイムを嫌っている
・設定値に罠がある
デフォルト15日でデータ削除されるなど