同社は、月間4400万以上のユーザーが利用する「TVer」という民放公式テレビ配信サービスを運営して
います。
当ポジションでは、SREとしてAWSを中心としたクラウド基盤の信頼性向上、
IaCを活用した安全な変更基盤設計、SLI/SLOに基づいた信頼性判断・改善、
インシデント対応プロセスの改善によるMTTR短縮、アラート・オンコール運用の最適化、
SRE業務改善などを担当します。
巨大で成長を続けるサービスの信頼性を担保する重要な役割を担います。
【具体的には】
・ SREとして具体的に以下の業務に携わっていただきます。
・ AWSを中心としたクラウド基盤における信頼性向上の方針策定
・ IaCを活用した変更を安全に行うための基盤設計
・ SLI/SLOを軸とした信頼性判断・改善の仕組みづくり
・ インシデント対応プロセスの設計・改善によるMTTR短縮
・ アラート・オンコール運用の全体最適による運用負荷の低減
・ SRE業務改善(自動化・AI Agent開発等)の方向付けと推進
・ 技術的な論点整理・レビューを通じた意思決定支援
・ 信頼性向上施策に関わるプロジェクトリード