Site Reliability Engineer SRE- Up 1500- junior
Mô tả công việc
Mô tả công việc
Participate in incident response, root cause analysis, postmortem reviews, and improve incident handling processes.
Design and implement observability systems (metrics, logs, tracing, alerting) using tools like Prometheus, Grafana, ELK, etc.
Manage and improve system reliability through SLO, SLI, and SLA practices.
Be part of the on- call rotation when needed.
Optimize system cost, performance (latency, throughput), and security.
Build and automate CI/CD pipelines and Infrastructure as Code (IaC) using tools such as Terraform, Ansible, Pulumi, Helm.
Operate and optimize Kubernetes clusters (EKS); strong knowledge of Docker, Kubernetes, Helm is required.
Develop internal tools to automate workflows and support other teams.
Support and coordinate with NOC (Network Operation Center) teams.
Collaborate in the analysis, design, and deployment of systems and processes to ensure reliability, observability, and scalability.
Yêu cầu công việc
Yêu cầu công việc
Proficient in CI/CD tools (GitLab CI, Jenkins) and familiar with Git workflows.
Proactive, responsible, and able to work under pressure during incident response.
Hands- on experience with monitoring and alerting systems (Prometheus, Grafana, ELK, Loki, etc.).
Excellent troubleshooting skills — able to analyze issues from OS to application layer.System- thinking mindset, focus on automation, and ability to mentor teammates.
Experience in deploying and managing Kubernetes (EKS is a plus).
Understanding of gRPC, and capable of optimizing nginx connections and network stacks.
2–5 years of experience in SRE / DevOps / Platform Engineering.
Strong Linux background with deep knowledge of kernel, network stack, file system, and processes.
Knowledge of cloud- native networking (CNI, overlay, BGP, eBPF- based load balancing).
Strong understanding of networking concepts (TCP/IP, DNS, Load Balancing, CDN).
Experience with AWS (EKS, EC2, RDS, CloudWatch).
Previously built a complete observability stack.
Experience with high availability and distributed systems.
Experience in building or optimizing Golang SDKs or internal frameworks.
Quyền lợi
Thu nhập
Xét tăng lương theo hiệu quả công việc 6 tháng/ lần
Lĩnh tiền ngày phép dư cuối năm
Lương NET cạnh tranh với thị trường
Thưởng mềm 1 – 2 tháng lương bình quân mỗi năm
Thưởng tháng lương 13
Môi trường làm việc
Môi trường làm việc trẻ trung, thoải mái, bình đẳng
Ăn trưa miễn phí có đầu bếp riêng tại công ty
Thời gian làm việc linh động, trang phục thoải mái
Tận hưởng văn phòng làm việc tiện nghi, sáng tạo với các phòng chức năng
Làm việc cùng đội ngũ trẻ tài năng, đam mê và máu lửa
Du lịch công ty hàng năm, teambuilding hàng quý
Đào tạo và phát triển
Được tiếp xúc và giải quyết các bài toán khó về e- commerce.
Được training các công nghệ mới (Machine Learning, Artifical Intelligence, Nosql, System Design…).
Cập nhật gần nhất lúc: 2025-10-30 18:35:03












