Prometheusの人気記事 78件 - はてなブックマーク

1 - 40 件 / 78件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

Prometheusの検索結果1 - 40 件 / 78件

Prometheusに関するエントリは78件あります。監視、 prometheus、運用などが関連タグです。人気エントリには『【AWS】ぼくのかんがえたさいきょうの運用・監視構成 - Qiita』などがあります。

【AWS】ぼくのかんがえたさいきょうの運用・監視構成 - Qiita
- 516 users
- qiita.com/iStone
- テクノロジー
- 2023/02/22
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? AWSのインフラを運用・監視する上で使いやすいと思ったサービスを組み合わせて構成図を作成しました。それぞれのサービスの簡単な説明と類似サービスの紹介、また構成の詳細について説明していきます。 (開発で使用するようなサービスも紹介しますが、あくまでも運用・監視だけの構成です。) 各個人・企業によって環境は違うと思いますし、使いやすいと思うサービスは人それぞれだと思うので、これが正解という訳ではありませんが、参考にしてただければ幸いです。参考になった教材を紹介した記事も作成しました。是非読んでみてください！【AWS】さいきょうの運用・監
- aws
- 監視
- あとで読む
- 運用
- サービス
- cloud
- grafana
- Amazon
- terraform
- qiita
自宅環境監視への入門 - すぎゃーんメモ
- 264 users
- memo.sugyan.com
- テクノロジー
- 2025/02/12
どうも自分は監視についての知識や技術が乏しい、ということに気付いた。そもそも何かを監視するという習慣を持っていないのがまず良くないと反省し、まずは自宅の環境を監視する練習から始めてみることにした。監視とは役割ではなくスキルであり、チーム内の全員がある程度のレベルに至っておくべきです。入門監視 ―モダンなモニタリングのためのデザインパターン環境 Ansible from macOS Ansible Galaxy VictoriaMetricsによる監視 Metricsの取得、収集 Node Exporter VictoriaMetrics (vmsingle, vmagent) SwitchBotによる温度/湿度/CO2濃度の取得 Exporter Grafanaによる可視化 Alertmanagerを使ったアラート通知 Alertmanagerのインストール vmalert によ
障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開
- 188 users
- www.publickey1.jp
- テクノロジー
- 2022/06/16
クラウド対応のログ可視化ツールとして知られる「Grafana」や監視システム「Prometheus」などを開発し提供するGrafana Labsは、障害発生時に担当者へのオンコールを自動化できるオンコールマネジメントソフトウェア「Grafana OnCall」をオープンソースで公開したことを明らかにしました。 Introducing the newest member of our open source family: Grafana OnCall OSS brings on-call management to the open source community #grafanaconline #oncallmanagement https://t.co/Nkq8frQx2r — Grafana (@grafana) June 14, 2022 Grafana OnCallは、昨年（2
- 監視
- あとで読む
- grafana
- 運用
- ツール
- oss
- Monitoring
- サーバ
- ソフトウェア
【 #ISUCON 】最近の若者は ssh しないらしいですよ
- 184 users
- trap.jp
- テクノロジー
- 2023/11/27
(本当のリポジトリはIPアドレスとかいろいろ上がってるのでコピーです) 名前は競技が終わってから考えました。ISUCONで自分たちの代わりにsshしてくれるのでこの名前です。構成大きく分けて、手元の１コマンドで全サーバーでデプロイを行うansibleと、ブラウザで必要な情報を見るobserver(勝手に名前を付けた)に分かれています。 ansibleansibleは、初動で必要なツールを入れるための0_init.ymlと、毎回のデプロイを行う1_deploy.ymlを作りました。典型的なnginx+MySQL+systemdのアプリであればこれらで対応できるようにし、典型でない問題が来た時には、Makefileを書いて 2_make_deploy.yml で対応できるようにしました。 initの方では、下のobserverで必要なexporterなどを入れたり、GitHubの鍵を登録した
- ssh
- あとで読む
- isucon
- サーバ
- コンテナ
- Prometheus
- Ansible
- security

OSS監視ツール徹底比較【2025年版】：あなたの環境に最適な選択はどれか - Qiita
- 176 users
- qiita.com/keitah
- テクノロジー
- 2025/11/02
これにより、柔軟なクエリとアグリゲーションが可能になります。強み 1. Kubernetes / マイクロサービスへの最適化ネイティブ統合: Kubernetes環境では、PodやServiceの自動検出が可能動的環境対応: コンテナの追加・削除に自動で対応高カーディナリティ: 大量のラベルを持つメトリクスを効率的に処理 2. 強力なクエリ言語（PromQL） PromQL（Prometheus Query Language）により、複雑な集計・分析が可能： 3. 豊富なExporterエコシステム公式Exporter: Node Exporter、Blackbox Exporter、HAProxy Exporter等サードパーティ: MySQL、PostgreSQL、Redis、Nginxなど、あらゆるミドルウェアに対応カスタムExporter: 独自アプリケーションのメト
- 監視
- あとで読む
- OSS
- 運用
- server
- ツール
- tool
- サーバ
Grafana Lokiで構築する大規模ログモニタリング基盤 / Grafana Loki Deep Dive
- 130 users
- speakerdeck.com/line_developers
- テクノロジー
- 2021/11/04
CloudNative Days Tokyo 2021での登壇資料です https://event.cloudnativedays.jp/cndt2021/talks/1252
- Grafana
- Loki
- kubernetes
- logging
- ログ
- あとで読む
- monitoring
- アーキテクチャ
- GrafanaLoki
- logs
TimescaleDB 雑感
- 130 users
- zenn.dev/shiguredo
- テクノロジー
- 2023/01/07
現在は TimescaleDB から Akamai Connected Cloud の Managed Database (PostgreSQL) への移行を進めています。移行理由 Managed Service for TimescaleDB の費用が高いサポート対応があまり良いとは言えないサービス全体を Akamai Connected Cloud へ移行したため、統一したい TimescaleDB は期待した性能はでなかった PostgreSQL 拡張は扱いづらかった TSDB の集計が PostgreSQL で行うとリソースを食べ過ぎる Akamai Connected Cloud の Managed Database (PostgreSQL) と Object Storage という組み合わせへ移行します。集計処理は DuckDB の PostgreSQL 拡張機能を利
21社の監視・オブザーバビリティアーキテクチャ特集 - Findy Tools
- 126 users
- findy-tools.io
- テクノロジー
- 2024/08/28
デジタル時代の企業にとって、システムの安定稼働と迅速な問題解決は、競争力を維持するための重要な要素です。21社にご寄稿頂いた「Amazon CloudWatch」「Datadog」「Grafana」「New Relic」「Prometheus」「Sentry」「Splunk」の各ツールレビュー記事を参照・抜粋し、それぞれの企業がどのようにシステムの健全性を確保し、未来の課題に備えているのかをアーキテクチャを通してご紹介します。 ※ツール名・ご寄稿企業名共にアルファベット順で掲載しております Amazon CloudWatchAWS CloudWatchは、AWSのクラウドリソースとアプリケーションの監視と管理を行うためのサービスです。メトリックス、ログ、イベントなどを収集、追跡し、可視化することで、システム全体の状態を把握し、問題の早期発見と解決をサポートします。 ▼Amazon Clou
時雨堂クラウドサービスを支える技術 v1
- 111 users
- zenn.dev/voluntas
- テクノロジー
- 2022/02/11
v2 へ移行中です円安の影響や、自社製品がスケールアウトに対応したこと、Cloudflare LB の WebSocket の挙動が残念だったことなどを踏まえ、サービス構成を変更を検討中です。脱 Vultr Egress 料金が Linode だと Vultr の半額 Linode へ移行脱 Cloudflare LB Linode の NodeBalancers へ移行マルチリージョンでの利用は Linode の Akamai Global Load Balancer 公開待ち脱 Cloudflare サポートに不安があるため Akamai へ移行脱 TimescaledB 移行は Linode PostgreSQL の提供開始待ち OLAP は DuckDB + S3 互換オブジェクトストレージへ移行ログ保存は VictoriaLogs へ移行予定脱 DataPacke
GitHub - mehrdadrad/tcpprobe: Modern TCP tool and service for network performance observability.
- 97 users
- github.com/mehrdadrad
- テクノロジー
- 2021/07/04
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- tcp
- network
- performance
- tool
- github
- observability
- ツール
- あとで読む
- socket
- cli
メンテナンスコスト削減を実現したOpenTelemetryへの挑戦～NTTデータに学ぶ、オブザーバビリティの取り組み～ - Findy Tools
- 90 users
- findy-tools.io
- テクノロジー
- 2024/08/14
公開日 2024/08/14更新日 2024/08/28メンテナンスコスト削減を実現したOpenTelemetryへの挑戦～NTTデータに学ぶ、オブザーバビリティの取り組み～オブザーバビリティの重要性が高まっている現在、その実現に向けたオープンソースプロジェクトであるOpenTelemetryが注目を集めています。一方、OpenTelemetryの具体的な導入事例やOpenTelemetryを用いたオブザーバビリティの取り組みについては、発信されている情報はまだ多くありません。そんななか、Findy Toolsでは株式会社NTTデータの取り組みに注目。NTTデータでは、クラウドネイティブ環境やマイクロサービスアーキテクチャの採用増加に伴い、システムが複雑に。この課題に対応するため、OpenTelemetry を軸としたオブザーバビリティの実現に積極的に取り組んでいるといいます。今回
Microsoftの中の人、「新しいBing」のAIモデル「プロメテウス」を解説
- 80 users
- www.itmedia.co.jp
- テクノロジー
- 2023/02/24
米MicrosoftがOpenAIのLLM「ChatGPT」採用の「新しいBing」を公開して2週間以上が経過した。Microsoftで検索とAI担当のCVP（コーポレートバイスプレジデント）を務めるジョルディ・リバス氏が2月22日（現地時間）、Microsoft傘下のLinkedInに「Building the New Bing」というブログを投稿し、新しいBingについて解説した。新しいBingでは、OpenAIが昨夏に共有した「GPT-3.5よりはるかに強力な、ChatGPTを強化するLLM」（「GPT-4」とはしていない）を採用している。この次世代GPTは強力ではあるが、他のLLMと同様にトレーニングデータが古い（GPT-3.5のトレーニングデータは2021年までのもの）ため、Bingのバックエンド機能と組み合わせることで最新データを利用できるように開発したのがAI技術「Prom
- AI
- Bing
- microsoft
- あとで読む
- OpenAI
- ChatGPT
Grafana Integrationsを使って10分でMacOSのダッシュボードを作成し、Grafanaの基礎を学ぶ | DevelopersIO
- 74 users
- dev.classmethod.jp
- テクノロジー
- 2024/08/16
「Grafanaのダッシュボードあれこれ触ってみたいけれど、実際やるなら自分の身近にある機器のメトリクスを使ってやってみたいよなぁ」 Grafanaには、学習目的でTestData data sourceが公式から提供されています。ダッシュボードの表示形式を手を動かしながら学ぶには良いデータソースなのですが、いかんせんテスト用のデータなので、実際のユースケースからは遠かったり、クエリがシナリオとして隠蔽されているため、Grafanaの基本であるPrometheusやLokiを学ぶには不向きです。どうしたもんかと考えていたところ、だれの環境にもあるクライアントPC（Mac, Windows, Linux）をデータソースとして使うのが、実際のデータに触れるには手っ取り早いんじゃないか？ということで、Grafana CloudのIntegrationsの機能を利用して試してみました。設定自体
- Grafana
- あとで読む
- prometheus
- 監視
- 学習
- network
OpenTelemetry 良い感じ - 誰かの役に立てばいいブログ
- 62 users
- ymmt.hatenablog.com
- テクノロジー
- 2023/11/09
最初に断っておきますと、OpenTelemetry を良く知っていたり真面目に調査しようという人が読むべき内容はここにはありません。公式ドキュメントなりをご参照ください。これは最近 OpenTelemetry を使いだした一般人の感想記事です。さて、いけてる Web 開発者、特にバックエンド開発者の方はオブザーバビリティという言葉は聞き及んでいるかと思います。なかでもオブザーバビリティ三種の神器と言われている（？）ログ、メトリクス、分散トレーシングをどう実装するか頭を悩ませているかもしれません。頭を悩ませてきた、あるいは頭を悩ませている理由の一つは、これらを実装するときに特定の実装向けになりがちであったためです。メトリクスであれば最近は Prometheus 向けに /metrics エンドポイントとして提供する実装が多いといった話です。しかしながら、あらゆる人が Promet
Prometheusのメトリックタイプを徹底解説！使い分けでオブザーバビリティを高めよう - カミナシエンジニアブログ
- 61 users
- kaminashi-developer.hatenablog.jp
- テクノロジー
- 2025/06/26
カミナシの認証認可ユニットでソフトウェアエンジニアをしているトモ=ロウです。早速ですが皆さんPrometheusはご存知ですか？ Prometheusは、システムメトリクスの監視に特化したオープンソースのモニタリングシステムです。時系列データを収集・保存し、強力なクエリ言語PromQLを使って分析することで、システムの健全性を詳細に可視化できます。プル型（Prometheusサーバが監視対象のシステムからメトリックをポーリングする形式）を採用している点が特徴的です。私のチームではPrometheusを使ってメトリクスの収集・分析を行なっています。Prometheusの利用を検討する際に多くの方が最初に感じるのは「メトリックタイプがよく分からん…」ではないでしょうか？少なくとも私はそうでした。公式ドキュメントを読んでも、一部の概念が難解に感じられたり、具体的なユースケースがイメージしづら
OSSでオブザーバビリティを実現する (Grafana Stack x OpenTelemetry on Kubernetes) - RAKUS Developers Blog | ラクスエンジニアブログ
- 53 users
- tech-blog.rakus.co.jp
- テクノロジー
- 2024/09/26
はじめにこんにちは。SREの gumamon です！ NewRelic、Datadog、モダンな監視ツール(オブザーバビリティ)って良いですよね。弊社もKubernetes(k8s)等を利用した環境が増えてきた折、そろそろ必要になってきたのですが、NewRelic、Datadog等のクラウドサービスはランニングコストが高くなりがちです。では内製できないかやってみよう！・・・というようなことを昨年度から取り組んでいたのですが、やっとこさ形になりましたので改めてブログで紹介させて頂こうと思います。今回ご紹介するのは、大まかなシステムの構成と設計時の観点です。各コンポーネントの詳細や工夫できた点などについては、改めて別の記事でご紹介できればと思います。また、「オブザーバビリティとは？」や「試行錯誤の過程」については、以前執筆した以下のブログをご参照ください。 tech-blog.raku
- opentelemetry
- grafana
- kubernetes
- 監視
- あとで読む
- SRE
- oss
ハンズオンで学ぶ Prometheus による Kubernetes 監視のしくみ - RAKUS Developers Blog | ラクスエンジニアブログ
- 52 users
- tech-blog.rakus.co.jp
- テクノロジー
- 2025/03/28
目次はじめに Prometheusとはハンズオン環境を構築しよう Prometheusを触ってみよう Prometheusによる監視の全体像をつかもうまとめはじめにこのブログの目的 (と、ごあいさつ) こんにちは。SREの gumamon です！最近、Kubernetesを使う現場がどんどん増えてきました。 Kubernetesは自律的にいろいろ動いてくれる分、「今なにが起きているのか」を把握するのが意外と難しいです。特に、構成が動的に変わるKubernetesでは、サービスディスカバリ機能のある監視ツールが欠かせません。そんな中で、Kubernetesのメトリクス監視といえば、今やPrometheusがデファクトスタンダードです。このブログでは、PrometheusがどのようにKubernetesの情報を集めているのかを、ハンズオン形式で体験しながら理解していきます。
Spring Boot アプリケーションにおけるメトリクスの取り方の基本
- 50 users
- engineering.linecorp.com
- テクノロジー
- 2022/12/21
LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog LINE の Business Platform 開発担当フェローの Matsuno です。今回は Spring Boot でアプリケーションを開発した場合のメトリクスの勘所についてご紹介しようと思います。我々のチームでは Kotlin + Spring Boot での開発がデファクトスタンダードとなっているのですが、正直まだまだこのテクニカルスタックで開発しているエンジニアは日本では少ないのです。そこで、実際の運用の雰囲気を感じていただければと思いまして今回の記事を書くことにしました。メトリクス取得の基本我々のチームではメトリクスの格納先として Prometheus を利用しています。 Prometheus で格納し
- Spring Boot
- Spring
- 監視
- java
- あとで読む
- 運用
ISUCONにおけるGrafana・Loki活用Tips - ぽよメモ
- 50 users
- poyo.hatenablog.jp
- テクノロジー
- 2024/12/13
はじめに今回のスコア Grafana・Loki活用Tips 表示範囲内のログ全てから統計値を計算するレスポンスが遅かったログを特定するスロークエリログの統計値も計算したい当日やったこと今後の展望はじめにこれはあくあたん工房アドベントカレンダー 2024 13日目の記事です。他の記事も面白いので、是非見ていってください。今回のスコア今年も過去回↓と同じくtaxio、shanpuと3人でチームツナ缶として出場しました。 poyo.hatenablog.jp 最高得点2万点くらい、最終スコア17110点で、おそらく80位前後くらい58位（ChatGPT調べ）くらいでした（failが多かったよう）。惨敗です。 Grafana・Loki活用Tips やっていることは前回と大きく変わらないのですが、いくつか改善を入れているのでそれを紹介します。表示範囲内のログ全てから統計値を計算す
- Grafana
- loki
- isucon
- 監視
- あとで読む
- ツール
非インフラエンジニアがPrometheusとGrafanaで簡単サーバモニタリング - RAKUS Developers Blog | ラクスエンジニアブログ
- 49 users
- tech-blog.rakus.co.jp
- テクノロジー
- 2024/02/13
概要 Prometheus未経験の非インフラエンジニアが、Grafanaでサーバモニタリングができるようになるまでの軌跡を記録します。とりあえず、モニタリングができることが目標なので運用面の考慮等はしていませんが、参考になれば幸いです。概要きっかけ Prometheusとは Grafanaとは今回構築する環境の構成 ①prometheus server ②exporter ③Grafana インストール前提条件 ②exporterのインストール（１）ソースをダウンロード（２）ダウンロードしたソースを解凍する（３）node_exporterを起動する（４）node_exporterの起動確認 ①prometheus serverのインストール（１）ソースをダウンロード（２）ダウンロードしたソースを解凍する（３）Prometheusの設定ファイルを編集する（４）p
ペパボでもオブザーバビリティ研修を実施しています - Pepabo Tech Portal
- 46 users
- tech.pepabo.com
- テクノロジー
- 2024/07/23
技術部の染矢です。研修中にドット絵を作っていたと思えば、いつの間にか技術研修をする側になっていました。なんとまあ、時の流れというのは恐ろしいものでしょうか。ペパボでは今年から新卒技術研修の一環として「オブザーバビリティ研修」を実施することにしました。ペパボの中では新しい取り組みであるため、オブザーバビリティ研修のみの内容で一記事を執筆することにしました。他の研修内容も含めたまとめ記事も近いうちに公開されることでしょう。この記事では、オブザーバビリティ研修を新卒技術研修に組み込んだ意図と、研修内容、また研修設計時に考えていたことを紹介します。オブザーバビリティ研修を取り入れた背景ペパボの新卒技術研修では複数の技術を学びます。WebアプリケーションフレームワークからWebフロントエンド、インフラ、機械学習など幅広い技術を、実際に手を動かしながら習得します。昨年までの研修で、次の課題が
GKE Autopilot を半年運用してみて...めっちゃラク！ - Beatrust techBlog
- 45 users
- tech.beatrust.com
- テクノロジー
- 2022/04/19
Beatrust で SRE をやっている Yuta（中川裕太）です．運用がラクにできように色々と改善したり，セキュリティ向上したり，インフラ作ったり API 開発したりしています．今回のブログでは，Google App Engine (GAE) から Google Kubernetes Engine (GKE) Autopliot へ移行し半年間運用してみて感じたメリットやハマりポイントについて紹介します．モチベーション Beatrust では初期立ち上げの開発コストを下げるため，もともと GAE を用いて開発運用してきました．様々なお客様にご利用いただく中で，嬉しいことに今後 10 倍，100 倍のユーザ数成長が見込めるようになってきました．そういった状況下で以下のような GAE の課題も顕在化しており，インフラの抜本的見直しを実施する必要がありました． GAE では Auto
- GCP
- kubernetes
- gke
- 運用
- autopilot
- k8s
- 開発
- インフラ
ABEMA のオブザーバビリティアーキテクチャ変遷 - Findy Tools
- 42 users
- findy-tools.io
- テクノロジー
- 2024/12/25
「ABEMA」は、テレビのイノベーションを目指し「新しい未来のテレビ」として展開する動画配信事業です。開局 8 年目に入り、ニュース、アニメ、恋愛、格闘、バラエティなど、多彩なジャンルの約 25 チャンネルを 24 時間 365 日放送しています。 2024 年 9 月には月間アクティブユーザー数が 3,000万を突破し、多くのユーザーに利用いただいています。 ABEMA | 無料動画・話題の作品が楽しめる新しい未来のテレビ ABEMA | 新しい未来のテレビ「ABEMA」、週間視聴者数が3,000万を突破この成長を支える鍵となっているのが、モニタリングとオブザーバビリティです。本記事では、ABEMAにおけるオブザーバビリティの進化とこれまでの取り組みについてご紹介します。 ABEMAのインフラ構成と2022年以前の監視環境ABEMAでは、Google CloudとAmazon Web
10年もののメトリクス収集機構をリプレースした話 | GREE Engineering
- 39 users
- labs.gree.jp
- テクノロジー
- 2021/10/04
インフラのいわほり（@egmc）です。久々のエントリとなりますが、今回はインフラのMonitoring Unitとして長期的に取り組んでいた監視システムのリプレースについてのお話になります。背景含めて長いエントリとなりますが、監視システムの長期的な運用の考え方、リプレースにあたって考慮した点などなにがしか参考になる点があれば幸いです。何を移行したか？グリーのインフラ環境では冒頭で述べたMonitoring Unitというインフラ横断で監視システムを提供するチームが商用環境向けの共通システムの提供/運用を行っています。監視システムにおけるリソースモニタリングシステムの構成として、オンプレ環境ではGanglia、AWS環境ではPrometheus/Grafanaスタックを採用、運用してきました。規模感としてはざっくりと監視対象ノードがオンプレサーバが約1500台、AWS側は台数変動
Google CloudのPrometheusマネージドサービスが正式版に。6京5000兆のポイントを保持するバックエンド上に構築、事実上無限の指標に対応可能
- 38 users
- www.publickey1.jp
- テクノロジー
- 2022/03/09
Google Cloud上で運用監視ツールのPrometheusをマネージドサービスとして提供する「Google Cloud Managed Service for Prometheus」が正式版となりました。 Prometheusは、マイクロサービスに代表されるような監視対象となるサーバが増減するような動的な分散環境のシステム監視に適したツールとして開発された運用監視ツールです。アプリケーションやコンテナ、Kubernetesのようなオーケストレーションツール、OS、サーバ、ネットワークなど、システムを構成するさまざまな要素を監視対象とすることができ、メトリクスとしてCPUの負荷やメモリ、ストレージの利用率、HTTPのレイテンシなど任意の値を取得、監視できます。状況をグラフで表示しつつ、異常を検知するとアラートを発するなど、システム監視を統合的に行うことができます。さらにリッチなビジ
- Prometheus
- 監視
- あとで読む
- cloud
- google
Prometheusでの監視データ活用マニュアル
- 36 users
- speakerdeck.com/takumanakagame
- テクノロジー
- 2023/04/18
2023/04/17 開催された、Kubernetes Novice Tokyo #24 にて話したスライドです。 https://k8s-novice-jp.connpass.com/event/278196/
🔭 RustでOpenTelemetryをはじめよう | Happy developing
- 34 users
- blog.ymgyt.io
- テクノロジー
- 2023/02/26
本記事ではRustでOpentelemetryをはじめることを目標に以下の点について書きます。 OpenTelemetryの概要RustのapplicationにOpenTelemetryを導入する方法前半は公式docを読みながら登場人物を整理し、後半は実際にdocker-compose上でそれらを動かします。またRustではtracing-opentelemetry crateを利用します。 tracingについては別の記事で基本的な仕組みについて書いたのでopentelemetry固有の処理について述べます。 sample code traceの設定については、別の記事に詳しい説明を書きました。 OpenTelemetryとは最初にOpenTelemetryについての現時点での自分の理解は以下です。 OpenTelemetryとは文脈により以下のいずれかを指す CNFNのprojec
SREエンジニアが目指すGKE共通デプロイ基盤の完成形 - ぐるなびをちょっと良くするエンジニアブログ
- 32 users
- developers.gnavi.co.jp
- テクノロジー
- 2024/02/13
こんにちは。開発部門開発部 Data AI Strategyセクションデータ基盤 Unitの小野です。 2020年8月に入社してから早3年。SREエンジニアとして、日々業務改善に励んでいます。ここ一年ほど、DAOという組織改善プロジェクトを推進していく中で、Google Kubernetes Engine (GKE)を使ったGKE共通デプロイ基盤の整備も進めてきました。 ※ DAOについての詳細はSREエンジニアが組織改善プロジェクトを立ち上げてみたを参照ください SREエンジニアの責務の一つは、プロダクトのリリースサイクルを極限まで短くし、次々と新しいサービスを世の中にリリースすることです。ChatGPTのような誰でも簡単に扱えるAIモデルが誕生したことで、プロダクト開発競争は今後ますます激しくなっていくと予想しており、SREエンジニアの責務の重要性をヒシヒシと感じています。そう
今日から始めるPrometheusによるシステム監視(1) 〜Prometheusの特徴とアーキテクチャ〜 | さくらのナレッジ
- 25 users
- knowledge.sakura.ad.jp
- テクノロジー
- 2021/04/13
この記事は2021年3月6日に行われたオープンソースカンファレンス 2021 Online/Springにおける発表を文章化したものです。今回は「今日から始めるPrometheusによるシステム監視」ということで、Prometheusというツールについてご紹介をしていこうかなと思います。皆さんに「Prometheus完全に理解した」と言えるようになっていただきたい、というのが今回の目標です。本連載は3本で構成されていて、それぞれ以下の内容を扱います。 Prometheusの特徴とアーキテクチャ(この記事) PrometheusとCNCF、Observability Prometheusを使ってみよう Prometheusとは Prometheus（プロメテウス）は、SoundCloudという海外の音楽系サービスのエンジニアによって開発された監視システムです。もともと、Kubernete
最短で理解して運用するGrafana Loki - Enjoy Architecting
- 24 users
- taisho6339.hatenablog.com
- テクノロジー
- 2021/05/26
本記事について Lokiについてまったく知識のない状態の人にとって、1からキャッチアップしていくのはとても大変なことです。特にLokiはマイクロサービスで構成されているため、何を知るべきなのかの全体像が見えにくいと思っています。そのため、Lokiをまったく知らない状態から実際に運用検証を開始するために必要なインプットを体系的にまとめました。具体的には下記の項目で整理します。 Lokiの機能 Lokiを構成するアーキテクチャ Lokiを構成するプロセス Lokiのモニタリング Lokiでのログのリテンション管理 Lokiのデプロイ Lokiでのデータキャッシュ Lokiのベストプラクティス ※前提として、Prometheusについての基本的な知識があれば本記事についてもすぐに理解できるかと思います。 1. Lokiの機能 Grafana Lokiとは？ Lokiは3大監視項目である、
- Grafana
- Loki
- prometheus
- kubernetes
- ログ
- アーキテクチャ
- 運用
- Logging
- k8s
- データ
Grafana,Prometheus,Slothで実現するSLI/SLO管理入門：Slothの裏側を探るPromQL解読ガイド [DeNA インフラ SRE] | BLOG - DeNA Engineering
- 23 users
- engineering.dena.com
- テクノロジー
- 2025/10/21
2025.10.21 技術記事 Grafana,Prometheus,Slothで実現するSLI/SLO管理入門：Slothの裏側を探るPromQL解読ガイド [DeNA インフラ SRE] by yuto.ota #infrastructure #sre #grafana #prometheus #sloth はじめにサービスの信頼性を定量的に評価し、管理するためのSLI/SLO。その実現方法には、高機能なSaaS製品を利用する方法もあれば、PrometheusやGrafanaといったオープンソースソフトウェア（OSS）を組み合わせて構築する方法もあります。特に、コスト面の制約や、既にGrafanaなどの監視基盤が稼働している環境では、後者を選択するケースも少なくありません。しかし、PrometheusとGrafanaでSLI/SLO管理を実現しようとすると、一つの大きな壁に突き当た
ざっくり理解するPrometheusを使った監視システム #1 - WILLGATE TECH BLOG
- 23 users
- tech.willgate.co.jp
- テクノロジー
- 2022/10/27
こんにちは、ウィルゲートで開発室開発基盤ユニットのマネージャーをしている池添(@for__3)です。ウィルゲートでは2019年に監視システムをPrometheusに移行して運用して来ました。 tech.willgate.co.jp tech.willgate.co.jp ですが、社内のメンバーの入れ替わりとともにPrometheusの設定や運用を理解しているメンバーも減ってきていました。そこで、改めてPrometheusのできることやPrometheusを使った監視の仕組みについての社内勉強会を行いました。今回はその際の資料の一部をブログ用に修正しました。監視システム全体の構成 Prometheus Exporter node_exporter blackbox_exporter nginx_vts_exporter proxy_exporter まとめ監視システム全体の構成『
- Prometheus
- 監視
- サーバ
- 設定
- システム
- tech
- あとで読む
re:Invent 2022 で公開された AWS オブザーバビリティに関する最新情報 | Amazon Web Services
- 23 users
- aws.amazon.com
- テクノロジー
- 2022/12/06
Amazon Web Services ブログ re:Invent 2022 で公開された AWS オブザーバビリティに関する最新情報この記事は What’s new in AWS Observability at re:Invent 2022 (記事公開 : 2022 年 11 月 29日) を翻訳したものです。 Amazon CloudWatch、AWS X-Ray、Amazon Managed Grafana、Amazon Managed Service for Prometheus について発表されたAWS オブザーバビリティのまとめとともに、AWS re: Invent 2022 ウィークの Kickoff をしましょう。CloudWatch でインターネットの問題がアプリケーションのパフォーマンスと可用性に与える影響の理解から、Managed Grafana での VPC サ
- aws
- あとで読む
Podのリソース割り当ての推奨値を提案するKRR(Kubernetes Resource Recommender) | Kubernetesスペシャリストが注目する関連ツール探求 | Think IT（シンクイット）
- 22 users
- thinkit.co.jp
- テクノロジー
- 2023/11/01
【2026年の新常識】「良い質問」より「良い前提」。生成AIを動かすコンテキスト設計 1月8日 6:30
CloudNative Days、クラウドネイティブ技術を学べるハンズオン教材をGitHubで一般公開
- 22 users
- codezine.jp
- テクノロジー
- 2023/12/21
12月11日～12日に開催された「CloudNative Days Tokyo 2023」で『一日で学ぶクラウドネイティブ技術実践ハンズオン』の企画を担当したCloudNative Days Tokyo 2023 実行委員会は、同教材を12月8日にGitHub上で一般公開した。『一日で学ぶクラウドネイティブ技術実践ハンズオン』は、Kubernetesやクラウドネイティブ技術に精通した実行委員会のメンバーにより、現在標準的に使用されているクラウドネイティブ技術を一通り学べるように設計されたハンズオン。教材には準備用チャプター1つと10個の通常チャプターが含まれており、準備用チャプターで環境を構築した後、「Prometheus」「Grafana」「OpenTelemetry」「Argo CD」「Argo Rollouts」「Istio」「Cilium」「Hubble」の8つのクラウドネイテ
RubyKaigi 2022の会場ネットワークリポジトリを読み解く | うなすけとあれこれ
- 21 users
- blog.unasuke.com
- テクノロジー
- 2022/11/29
私がこれを書く動機私はKaigi on Railsのオーガナイザーのひとりです。Kaigi on Rails 2023は物理会場にて開催されることが公開されました。そうなるともちろん、会場でのインターネットについてはどうなる、どうする、という問題が出てきます。それに備えて、先輩イベントであるRubyKaigiを参考にしようというわけで、自分の理解のために書くことにしました。おことわり私はRubyKaigi 2022のネットワークをお手伝いしましたが、ケーブルの巻き直し、APの設営、撤収時の諸々を手伝ったのみです。よってこれから言及する内容については、一般参加者に毛が生えた程度の事前知識しかありません。またこれから読み解くコードにおいて、コメントする内容の正確性は一切ないものと思って読んでください。 RubyKaigiのネットワークについて RubyKaigiのネットワークにおけるL
- RubyKaigi
- DNS
- ネットワーク
- AWS
- network
- Ruby
- あとで読む
GitHub - tokuhirom/dashyard: An AI-native Prometheus dashboard.
- 21 users
- github.com/tokuhirom
- テクノロジー
- 2026/02/11
Warning: This project is under active development. APIs, configuration formats, and features may change without notice. An AI-native Prometheus dashboard. Point an LLM at your metrics, get production-ready dashboards in minutes — stored as YAML in git, served from a stateless binary. Why Dashyard? AI-first workflow — gen-prompt scans your Prometheus and builds an LLM prompt. Claude or ChatGPT gene
- AI
- あとで読む
システム管理ツール「Prometheus」が「Prometheus Agent」モードを提供、エッジ環境やIoTなど限られたリソースでも利用可能に
- 20 users
- www.publickey1.jp
- テクノロジー
- 2021/11/25
システム管理ツール「Prometheus」が「Prometheus Agent」モードを提供、エッジ環境やIoTなど限られたリソースでも利用可能に Kubernetesをはじめとするクラウドネイティブを実現するオープンソースソフトウェアの開発を推進する「Cloud Native Computing Foundation」は、システム管理ツール「Prometheus」の新機能「Prometheus Agent」モードを発表しました。 Introducing the Prometheus Agent, a new operating mode from the @PrometheusIO team which enables new workflows such as low-resources environments, edge networks, and IoT Read more on
- prometheus
- monitoring
- IoT
- dev
- techfeed
- software
- あとで読む
GrafanaをClaude DesktopからMCPで触ってみた #grafanaJP | DevelopersIO
- 18 users
- dev.classmethod.jp
- テクノロジー
- 2025/05/21
MCP（Model Context Protocol）を活用し、GrafanaとClaude Desktopを連携させてみました。AIアシスタントによるダッシュボード操作と自然言語でのデータ分析がもたらす新しいオブザーバビリティの可能性を感じてもらえれば。「AI駆動オブザーバビリティって、こんな感じになるんだろうなぁ…」先日開催した、Grafana Meetup Japan #5｜ JAXAにおける観測データの一般公開と衛星運用のLT枠で「GrafanaをClaude DesktopからMCPで触ってみた」というタイトルで登壇しました。登壇では実際にデモも実施してみました。おそらくオブザーバビリティという枠組みの中での生成AIの活用は、こういう方向性に収束していくかなぁという感触を感じられたので、是非どんな内容なのかざっと見てもらいつつ、皆さんの手元のダッシュボードで試してもらえれば
- Grafana
- MCP
- ai
- あとで読む
Golang のEcho で Prometheus Exporter を実装する - じゃあ、おうちで学べる
- 18 users
- syu-m-5151.hatenablog.com
- テクノロジー
- 2023/04/16
はじめに Prometheus でアプリケーションの構築をしているとどうしてもこの値が取りたいのに... と思うことが多々ある。Pushgateway も選択肢として上げられるが今回は選択肢を増やしてほしいという意味でもExporterの実装方法について検討していきます。ExporterはPrometheusのpull モデルに適合し、監視対象のライフサイクルと一貫性があり、スケーラビリティと自動検出の利点を享受できるため、Pushgatewayよりも推奨される方法です。ただし、特定のユースケース（サービスレベルのバッチジョブなど）では、Pushgatewayの使用が適切な場合もあります。Pushgatewayを使う際には以下の問題点があるので注意が必要です。複数のインスタンスを1つのPushgatewayで監視すると、単一障害点とボトルネックが発生する可能性がある。 Prometheu
- prometheus
- docker