Senior Site Reliability Engineer SRE

DATVIETVAC
Mức lương
20 triệu
Địa điểm làm việc
Quận 3, Hồ Chí Minh
Kinh nghiệm yêu cầu
Cập nhật
Thông tin cơ bản

Mô tả công việc

Mô tả công việc

Automate repetitive operational tasks via IaC (Terraform), CI/CD (GitHub Actions), and scripting (Python/Bash/Golang).
Own and improve SLOs, SLIs, and error budgets for critical services across playback, login, subscription, recommendation, and API layers.
Collaborate with backend, frontend, and data teams to design fault- tolerant, scalable infrastructure (GKE, Cloud Run, Cloud CDN, etc.).
Contribute to the evolution of our deployment strategy (blue/green, canary, A/B), especially during high- traffic events (e.g. livestreams, premieres).
Drive incident management, root cause analysis (RCA), and postmortem culture for service outages and performance degradation.
Work closely with security and platform teams to ensure system hardening, compliance, and zero- trust principles.
Build and maintain observability stacks (Prometheus, Grafana, OpenTelemetry, Datadog) to proactively detect and resolve issues.
Continuously assess infrastructure cost and performance trade- offs to optimize cloud spend (GCP preferred).

Yêu cầu công việc

Yêu cầu công việc

Familiarity with CI/CD, IaC, and GitOps tools (Terraform, Helm, ArgoCD, Cloud Build).
Strong scripting or programming skills in Python, Go, or Bash.
Proficiency with cloud platforms (preferably GCP), including IAM, Compute, GKE, Cloud CDN, Cloud Logging.
5+ years of experience as SRE, DevOps, or Production Engineer in large- scale environments.
Deep experience with Kubernetes, containers, and service mesh technologies (Istio or Linkerd).
Clear communication skills and a calm, analytical approach to solving complex problems in high- pressure environments.
Solid experience with monitoring, logging, and alerting stacks (e.g. Prometheus, Grafana, ELK, Loki, Datadog).
Strong knowledge of Linux internals, networking, and systems performance tuning.

Nice to Have

Familiarity with error budgets, chaos engineering, and resiliency testing.
Knowledge of multi- region HA, failover, and edge optimization strategies (especially for Asia- Pacific markets).
Experience supporting real- time media systems or video streaming platforms.
Background in supporting platform services for experimentation (A/B), personalization, or user engagement.

Quyền lợi

Tại sao bạn sẽ yêu thích làm việc tại đây

Own the reliability of a platform used by 20M+ users with large- scale live events and high concurrency.
Work in a modern, cloud- native environment (GCP, Kubernetes, Kafka, Iceberg, Cloud CDN).
Be part of a highly autonomous engineering culture focused on velocity, quality, and learning.
Influence architecture and process for the next generation of entertainment infrastructure in Vietnam and beyond.

Cập nhật gần nhất lúc: 2025-08-19 01:05:02

Xem thêm

Đặc điểm công việc

Hạn nộp hồ sơ
20/08/2025
Hình thức làm việc
Đang cập nhật
Cấp bậc
Nhân Viên
Số lượng cần tuyển
Đang Cập Nhật
Ngành nghề
Xây dựng
Khu vực
Quận 3, Hồ Chí Minh
Xem thêm
Xem thêm
Người tìm việc lưu ý:
Bạn đang xem tin Senior Site Reliability Engineer SRE - Mã tin đăng: 5176303. Mọi thông tin liên quan tới tin tuyển dụng này là do người đăng tin đăng tải và chịu trách nhiệm. Chúng tôi luôn cố gắng để có chất lượng thông tin tốt nhất, nhưng chúng tôi không đảm bảo và không chịu trách nhiệm về bất kỳ nội dung nào liên quan tới tin việc làm này. Nếu người tìm việc phát hiện có sai sót hay vấn đề gì xin hãy báo cáo cho chúng tôi

DATVIETVAC

Quy mô: 10 - 25
Trụ sở: 200 Pasteur, 6, 3, Hồ Chí Minh, Việt Nam

Bí kíp tìm việc an toàn

Dưới đây là những dấu hiệu của các tổ chức, cá nhân tuyển dụng không minh bạch:
1. Dấu hiệu phổ biến:
Hình ảnh 1
Nội dung mô tả công việc sơ sài, không đồng nhất với công việc thực tế
Hình ảnh 2
Hứa hẹn "việc nhẹ lương cao", không cần bỏ nhiều công sức dễ dàng lấy tiền "khủng"
Hình ảnh 3
Yêu cầu tải app, nạp tiền, làm nhiệm vụ
Hình ảnh 4
Yêu cầu nộp phí phỏng vấn, phí giữ chỗ...
Hình ảnh 5
Yêu cầu ký kết giấy tờ không rõ ràng hoặc nộp giấy tờ gốc
Hình ảnh 6
Địa điểm phỏng vấn bất bình thường
2. Cần làm gì khi gặp việc làm, công ty không minh bạch:
- Kiểm tra thông tin về công ty, việc làm trước khi ứng tuyển
- Báo cáo tin tuyển dụng với 123job thông qua nút "Báo cáo tin tuyển dụng" để được hỗ trợ và giúp các ứng viên khác tránh được rủi ro
- Hoặc liên hệ với 123job thông qua kênh hỗ trợ ứng viên của 123job:
Hotline: 0961.469.398

Việc làm đề xuất liên quan

Hiện tại chúng tôi chưa có việc làm đề xuất phù hợp với bạn.

Việc làm đã xem gần đây

Từ khóa tìm việc làm tại 123Job
Site reliability engineer tại tỉnh/thành