Chuyên Viên DevOps Engineer, 5 Năm Kinh Nghiệm, Thu Nhập 20-30 Triệu, Tại Hà Nội
Mô tả công việc
Vận hành, duy trì và tối ưu các cluster K8s (trên openstack)
Thực hiện backup/restore dữ liệu: database (Postgres, MySQL), persistent volume...
Security: scan image container, apply security policy (network policy, RBAC), quản lý truy cập
Viết kịch bản tự động (bash, python) hỗ trợ vận hành hạ tầng (scale, upgrade, provision...)
Thiết lập và vận hành hệ thống giám sát: Prometheus, Grafana, AlertManager, Logging (Loki, ELK...)
Quản lý dịch vụ backend portal (viết bằng Python): tiếp nhận source code, fix bug, deploy, tối ưu vận hành...
Thiết lập và quản lý secrets (Vault, ExternalSecrets, ...)
Thiết lập Helm Charts, quản lý các values, triển khai các ứng dụng multi- tenancy
Quản lý storage: PVC/PV, StorageClass, mở rộng, snapshot...
Hỗ trợ khách hàng sử dụng cluster: hướng dẫn, xử lý sự cố, giải thích về kiến trúc, các best practices...
Tài liệu hóa quy trình DevOps và vận hành (runbook, hướng dẫn khách hàng...)
Thiết lập, quản lý và giám sát CI/CD pipeline
Yêu cầu công việc
Tiêu chuẩn chuyên môn
Nền tảng hệ thống & mạng
Hiểu vững
Linux
(Ubuntu/CentOS/Alma...):
quản lý process, service, log, quyền, cron, systemd
xử lý sự cố CPU/RAM/disk, I/O, load average
Scripting (bash/python)
Nắm cơ bản network: TCP/IP, DNS, HTTP/HTTPS, reverse proxy, LB, firewall (iptables/security group...).
Docker & Container
Biết
Docker
best practice: giảm kích thước image, multi- stage build, bảo mật.
viết & tối ưu Dockerfile
build/push image lên registry (Docker Hub / Harbor / ECR / GitLab Registry...)
Kubernetes (bắt buộc)
Có kiến thức và kinh nghiệm tốt với:
Biết deploy ứng dụng lên K8s bằng:
Kinh nghiệm:
YAML thuần hoặc Helm (ưu tiên Helm/ArgoCD/Kustomize).
scale up/down, rolling update, rollback
debug pod (kubectl logs, describe, exec...)
Hiểu cách hoạt động của OpenStack (Nova, Cinder, Networking); Ưu tiên nếu đã làm việc với Magnum hoặc OpenStack COE
Pod, Deployment, StatefulSet, DaemonSet
xử lý sự cố common: CrashLoopBackOff, ImagePullBackOff, OOMKilled...
Service, Ingress, ConfigMap, Secret
Namespace, RBAC, ResourceQuota, HPA.
Quản lý storage: PVC/PV, storageClass, volume extend
CI/CD & Git
Biết dùng Git thành thạo (branching, MR/PR, code review).
Đã từng setup/maintain CI/CD với một trong các tool:
Tiêu chí:
GitLab CI, GitHub Actions, Jenkins, ArgoCD, Drone...
Biết rollback nhanh khi pipeline fail.
Tự động build, test, scan, build image, deploy lên K8s.
Monitoring – Logging – Alert
Có kinh nghiệm với
một stack giám sát
Biết:
đặt metrics, alert cơ bản (CPU, RAM, error rate, latency, disk, pod restart...)
đọc log, trace để điều tra sự cố.
Prometheus + Grafana / ELK / Loki / Zabbix / Datadog...
Cloud / Hạ tầng
Ít nhất biết một trong:
Hiểu các khái niệm:
backup & restore, snapshot, HA, DR (Disaster Recovery) là gì.
VPC, subnet, SG, load balancer, object storage, block storage...
hoặc Private Cloud / Bare metal: OpenStack, Proxmox, VMWARE, on- prem.
Cloud public: AWS / GCP / Azure (EC2, VPC, Load Balancer, RDS...)
Bảo mật
Nắm các nguyên tắc cơ bản:
bảo mật secret, credential
hardening OS & container, image scanning.
least privilege (RBAC)
Nếu tốt: hiểu thêm về NetworkPolicy, Service Mesh (Istio/Linkerd) là plus.
Python develop:
Đọc hiểu code Python (FastAPI/Flask/Django,,,)
Packaging: Poetry/pipenv/venv
Biết viết API, fix bug, xử lý những logic cơ bản.
Viết unit test cơ bản
Cấp độ từ Middle DevOps K8s trở lên
Biết tự thiết kế pipeline CI/CD → K8s, setup monitoring, logging.
Triển khai & vận hành ít nhất 1 hệ thống K8s thật (prod hoặc staging) với nhiều service.
2–4 năm kinh nghiệm DevOps/SRE.
Tiêu chuẩn thái độ, tư duy, tố chất
Tư duy SRE/DevOps
Chủ động & chịu áp lực
Tinh thần học hỏi
Giao tiếp & phối hợp
Ưu tiên đặc biệt:
không “đổ lỗi” mà tìm nguyên nhân gốc (Root Cause Analysis).
ưu tiên tự động hóa thay vì làm tay
Thông thạo lập trình Python
làm việc được với developer, QA, khách hàng kỹ thuật.
coi “system reliability & uptime” là KPI chính.
K8s & DevOps thay đổi rất nhanh → cần cập nhật công nghệ liên tục.
trình bày vấn đề rõ ràng, dễ hiểu (cả cho người không quá kỹ thuật).
sẵn sàng xử lý sự cố hệ thống (on- call)
Hồ sơ bao gồm:
- CV mô tả quá trình học tập, làm việc và kỹ năng có được
- Sơ yếu lý lịch + ảnh chân dung (bắt buộc)
Ghi chú:
Gdata sẽ hẹn phỏng vấn khi có thông tin đầy đủ
Quyền lợi
Dải lương cứng: từ 20 – 30 triệu/ tháng
Thưởng tháng lương thứ 13 +
Đóng BHXH theo quy định, khám SK định kỳ, thưởng lễ tết, nghỉ mát, chế độ khác
Cập nhật gần nhất lúc: 2025-12-10 01:15:03











