Senior Site Reliability Engineer

CÔNG TY TNHH CỐC CỐC
Mức lương
2500 usd
Địa điểm làm việc
Hà Nội
Kinh nghiệm yêu cầu
Cập nhật
Thông tin cơ bản

Mô tả công việc

You will work at the intersection of systems engineering, performance troubleshooting, and data infrastructure reliability, while partnering closely with engineering teams to embed SRE best practices across the software lifecycle.
We are seeking a Senior Site Reliability Engineer (SRE) with deep expertise in bare- metal Linux systems, performance optimization, and large- scale data platforms. In this role, you will be responsible for ensuring the reliability, scalability, and efficiency of our production environment, which underpins mission- critical data services.
JOB DESCRIPTION
System Reliability & Performance

Optimize resource usage on bare- metal Linux servers to maximize efficiency and reliability.
Own the reliability, scalability, and performance of core production systems.
Perform advanced performance troubleshooting and tuning across OS, network, and application layers.

Data Infrastructure Reliability

Operate and scale our enterprise messaging and event streaming system with Kafka.
Ensure high availability and performance of our data warehouse with ClickHouse.

Automation & Observability

Enhance system observability through metrics, tracing, and logging (Prometheus, Grafana, CheckMK, OpenTelemetry).
Design and maintain alerting systems that balance coverage with actionable signals.

Incident Response & Coordination

Drive blameless postmortems and systemic improvements.
Lead high- severity incident response and cross- team coordination as the arbiter when failures have multi- team impact.

Reliability Culture & Mentorship

Mentor engineers on performance tuning, deployment safety, and reliability- first design.
Promote a culture of automation, ownership, and operational excellence.

Yêu cầu công việc

Experience

5+ years in SRE, systems engineering, or infrastructure- focused roles (with at least 2+ years in a senior or lead position).
Strong track record managing large- scale production systems on bare- metal Linux.

Technical Skills

Expert- level skills in Linux internals, system performance troubleshooting, and tuning.
Experience building and operating highly available distributed systems.
Hands- on experience operating and scaling ClickHouse or similar OLAP database.
Proficiency with Infrastructure- as- Code tools (Terraform, Ansible, etc.).
Solid coding/scripting ability in Python, Go, or Bash.
Hands- on experience operating and scaling Kafka or equivalent messaging systems.

Soft Skills

Advocates for automation and reducing toil.
Analytical problem- solver with a strong performance- first mindset.
Communicates clearly across both technical and non- technical teams.
Thrives in high- accountability, reliability- driven environments.

Nice- to- Have

Hands- on experience operating Kubernetes clusters on a scale.
Prior experience with capacity planning and benchmarking at scale.
Familiarity with modern Data Lakehouse architecture.

Quyền lợi

Few countries have local challengers in the search and browser space. Vietnam is one of those countries thanks to Cốc Cốc. There are a lot of challenges in competing against dominant global players, but also lots of rewards when we succeed.
Competitive benefits:

Special annual leave policy with minimum 19 days/year, plus 1 day off on your birthday.
Competitive salary and bonus scheme with a 13th month salary.
Annual WFH policy.
Performance review twice/year with opportunity to grow or rotate internally.
Great Trade Union benefits such as birthdays, marriage, new born child...
Advanced 24/7 Health Insurance for all employees.

Professional growth:

Opportunities to learn and grow through regular training programs, coaching and internal sharing.
Work in a diverse environment with talented colleagues and partners/customers, local and expats.

Positive workplace:

Cozy pantry with plenty of snacks, juice and coffee/tea every day.
Many interesting hobby clubs to share your passions like English Club, Yoga, Billard or Football.
Different exciting internal events to make you part of the Cốc Cốc family.

Cập nhật gần nhất lúc: 2025-09-08 05:45:02

Xem thêm

Đặc điểm công việc

Hạn nộp hồ sơ
30/10/2025
Hình thức làm việc
Toàn thời gian
Cấp bậc
Nhân Viên
Số lượng cần tuyển
1
Ngành nghề
Xây dựng
Khu vực
Hà Nội
Xem thêm
Xem thêm
Người tìm việc lưu ý:
Bạn đang xem tin Senior Site Reliability Engineer - Mã tin đăng: 5254036. Mọi thông tin liên quan tới tin tuyển dụng này là do người đăng tin đăng tải và chịu trách nhiệm. Chúng tôi luôn cố gắng để có chất lượng thông tin tốt nhất, nhưng chúng tôi không đảm bảo và không chịu trách nhiệm về bất kỳ nội dung nào liên quan tới tin việc làm này. Nếu người tìm việc phát hiện có sai sót hay vấn đề gì xin hãy báo cáo cho chúng tôi

CÔNG TY TNHH CỐC CỐC

Quy mô: 200 - 500
Trụ sở: Tầng 3 - Block AB, 27B Nguyễn Đình Chiểu, P. ĐaKao, Q. 1, TP. HCM

Bí kíp tìm việc an toàn

Dưới đây là những dấu hiệu của các tổ chức, cá nhân tuyển dụng không minh bạch:
1. Dấu hiệu phổ biến:
Hình ảnh 1
Nội dung mô tả công việc sơ sài, không đồng nhất với công việc thực tế
Hình ảnh 2
Hứa hẹn "việc nhẹ lương cao", không cần bỏ nhiều công sức dễ dàng lấy tiền "khủng"
Hình ảnh 3
Yêu cầu tải app, nạp tiền, làm nhiệm vụ
Hình ảnh 4
Yêu cầu nộp phí phỏng vấn, phí giữ chỗ...
Hình ảnh 5
Yêu cầu ký kết giấy tờ không rõ ràng hoặc nộp giấy tờ gốc
Hình ảnh 6
Địa điểm phỏng vấn bất bình thường
2. Cần làm gì khi gặp việc làm, công ty không minh bạch:
- Kiểm tra thông tin về công ty, việc làm trước khi ứng tuyển
- Báo cáo tin tuyển dụng với 123job thông qua nút "Báo cáo tin tuyển dụng" để được hỗ trợ và giúp các ứng viên khác tránh được rủi ro
- Hoặc liên hệ với 123job thông qua kênh hỗ trợ ứng viên của 123job:
Hotline: 0961.469.398

Việc làm đề xuất liên quan

Hiện tại chúng tôi chưa có việc làm đề xuất phù hợp với bạn.

Việc làm đã xem gần đây

Từ khóa tìm việc làm tại 123Job
Site reliability engineer tại tỉnh/thành