はじめに こんにちは、SREチームの森原(@daichi_morihara)です。 今回はDatadogのログのコスト削減に関して最近行った取り組みを共有していきたいと思います。AWSやGCPなどのクラウドに関してはコスト削減・最適化に積極的に取り組んでいる一方で、Datadogに…
yuru-sre.connpass.com お疲れ様です。SREの大木 ( @2357gi ) です。本日は 『ゆるSRE勉強会 #12 SRE乗り越え体験まつり 〜聞いてくれ俺の武勇伝〜』の参加レポです ゆるSRE自体は『ゆるい雰囲気で肩肘張らずにSRE関連のトピックについて話す勉強会』と銘打…
SREの大木 (@2357gi)です。最近スノボのオフトレにトランポリンに行ったら、初めてスノボした時ぐらい体がバキバキの筋肉痛になりました。オススメです。 すでにAWS WAFを導入し、スクレイピング対策としてレートリミットも設定しているものの、GoogleBotな…
はじめに SREチームの森原(@daichi_morihara)です。今日はバッチの監視周りの取り組みについて共有していこうと思います。 これまではバッチのモニタリングに関して、エラーログの検知・対応のみの最低限の監視を行っている状態でした。そこでバッチ関連のオ…
こんにちは。最近は湿気にやられ気味のSREチームの高 (@nogtk) です。 先日、アプリケーションのエラー監視改善の一環として、Datadog ErrorTracking を導入しました。 厳密には、エラーログをデータソースとして扱う ErrorTracking for Logs を導入しており…
はじめに こんにちは。SREチームの森原(@daichi_morihara)です。最近はゴルフにはまっており、先日初めてラウンドをまわりました。スコアは138、伸び代ですね。 今回はAmazon Auroraのクロスアカウントバックアップの実装と、その際に生じたAmazon AuroraのK…
はじめに SREチームの森原(@daichi_morihara)です。今後は積極的に発信していこうという誓いを込めてXのアカウントを作成しました。 今回はEC2+ALBでホストしていたフロントエンドをS3+CloudFrontに移行する際に起きた問題について紹介しようと思います。移…
背景と悩み SREチームの大木(@2357gi)です。いよいよ暖かくなってきましたね。春スキーの季節です。 チーム開発においてCIを如何に高速化するかという話は日夜行われていると思います。 弊社でも同様のことが行われており、その中でパッケージ管理ツールによ…
こんにちは。SREチームの高 (@nogtk)です。ゼノブレイドXリメイクで惑星ミラの探索に勤しんでいる今日この頃です。 直近行った取り組みとして、アプリケーションログの構造化を行い、ログの検索性の向上を行いました。この記事では実際の実装も交えつつ実施…
こんにちはSREチームの宮後(@miya10kei)です。 最近、Keychron K2 HEが届いて天然木のぬくもりを感じています⌨️ 気づいたら1ヶ月ほど経ってしまいましたが、2025年1月26日に開催された「SRE Kaigi 2025」で登壇させていただいたので簡単ですがレポートを書き…
お疲れ様です。大木 @2357gi です。 とっておきの豆知識なのですが、スノーボードというものは滑走時は運動して体が温まり、リフトで体が冷えるので実質交互浴実質サウナであります。 本題ですが、今回はEC2のAWS Patch Managerを用いて本番環境のEC2に自動…
お疲れ様です。今年は豪雪らしくワクワクが止まらないスノーボーダーの2357giです。 AWSリソースをIaCで管理しているプロジェクトにおいて、IaCリポジトリとアプリケーションリポジトリが分かれている中で、どのようにアプリケーション用ECS ServiceのCDを実…
コストと開発体験を両立させるfeature環境の運用方法この記事はニーリーアドベントカレンダー2024の20日目 その1の記事です。 こんにちは、SREチームの森原(@daichi_morihara)です。 今回はニーリーのfeature環境の管理方法について紹介していきたいと思いま…
こんにちはSREチームの宮後(@miya10kei)です。最近、デスクシェルフを買ってからデスク周りがとてもスッキリして大満足しています 前回に続いて非同期タスク関連の取り組みを紹介します! ところで、、、障害が発生したときの調査って大変ですよね?非同期で…
こんにちはSREチームの宮後(@miya10kei)です。最近、7.1がリリースされて攻略に勤しんでいます⚔️ 今回はPark Directの非同期タスク処理に対するメトリクスの収集について紹介します! 背景 Park Directでは非同期タスク処理にCeleryを採用し次の構成で利用し…
こんにちはSREチームの森原(@daichi_morihara)です。テックブログ投稿は今回が初めてですが、今後は高頻度で投稿する予定です! 今回は、タイトルそのままですが「KPI集計のために秒単位の正確性でAuroraのスナップショットを作成する仕組み」を作ったのでご…
こんにちはSREチームの宮後(@miya10kei)です。最近、DisplayLink対応の変換アダプターをGETし、トリプルディスプレイ化していろいろ捗っています! 前回から少し時間が空いてしまいましたが、今回はAmazon Auroraに対して2種類のオートスケーリングポリシー…
こんにちはSREチームの宮後(@miya10kei)です。最近、iPad Air(M2)をゲットしたので便利な使い方を模索しています。 みなさんは踏み台サーバをどうやって構築していますか? 今回、EC2で構築していた踏み台サーバーをECSに移行することでセキュリティ向上 x …
@2357giです。Pixel7aを買った次の日にPixel8aが発表されて悲しいです。 先日EC2で長らく動いていたRedashをECSに載せ替える作業を行ったのですが、データ量が大きいクエリを実行するとタイムアウトしてしまう問題が発生しました。 (大きいクエリとは具体的…
こんにちはSREチームの宮後(@miya10kei)です。最近、スマートホーム化にハマっていていろいろと買い漁っています N+1問題を検知するのって結構大変ですよね? 今回はDatadogを使ってN+1問題を可視化し、パフォーマンス改善につなげた話を紹介したいと思いま…
はじめに SREの大木 ( @2357gi )です。最近美味しいお茶漬けを探しています。 今回は非同期タスクの処理を行うECS Serviceのオートスケーリングをいい感じにした話です。 非同期タスクが大量に積まれた際に、それを実行するworkerを柔軟にスケールアウトさせ…
こんにちはSREチームの宮後(@miya10kei)です。最近、トリュフナッツにハマりビールの消費量が増えています。 AWS CLIを使用する時にaws-vaultは使っていますか? AWSのユーザ管理をAWS IAM Identity Centerに移行した際にaws-vaultの設定でつまずいたので解…
はじめに SREチームの大木( @2357gi )です。 ECS Serviceのオートスケーリングやバッチなど、ECS Taskの起動停止が頻繁に行われる環境でAWS Configを有効にしていると、AWS Configのコストが無邪気に跳ね上がってしまうことがあります。 インターネット上で…
こんにちは、SREチームの宮後(@miya10kei)です。 バイクに乗っていて気持ちが良い季節になってきましたね メッセージキューを利用した非同期タスクを扱っていて、誰しも優先度順にタスクを処理したいなと思ったことがあるのではないでしょうか? 今回はCeler…
はじめに SREチームの大木です。スノボの季節がもう終わりかけており、さみしい限りです。 feature staging環境*( 以下 feature環境 )自体のライフサイクルや管理をどうするか問題、なかなかどこも苦労していると思いますが、その中で今回それなりにいい感じ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。