AI Engineer (Model Inference)

FPT SMART CLOUD (FCI)
Mức lương
25 - 60 triệu
Địa điểm làm việc
Hà Nội; Hồ Chí Minh
Kinh nghiệm yêu cầu
Cập nhật
Thông tin cơ bản

Mô tả công việc

là LLM) với hiệu năng, độ ổn định và chi phí tối ưu.
Mục tiêu: Thiết kế, triển khai và tối ưu hệ thống serving cho các mô hình AI (đặc biệt

• Thiết kế và triển khai backend/serving engine cho mô hình AI sử dụng các
framework như vLLM, NVIDIA TensorRT‑LLM, KServe, TorchServe, TensorFlow
Serving hoặc tương đương.
• Xây dựng cơ chế lazy load / on‑demand loading cho các layer hoặc module của mô
hình để tối ưu memory footprint và thời gian khởi tạo.
• Tối ưu hiệu năng inference: batching, caching, quantization, model parallelism,
GPU/CPU utilization, và profiling hệ thống.
• Thiết kế API (REST/gRPC) để expose các dịch vụ inference, tích hợp với các hệ thống
nội bộ, gateway hoặc ứng dụng client.
• Xây dựng pipeline deploy, monitoring, alerting cho các dịch vụ AI production
(logging, metrics, tracing).
• Phối hợp cùng nhóm Research/Applied AI để chuyển giao mô hình (model handoff),
chuẩn hóa định dạng model (ONNX, TensorRT engine, v.v.).

Yêu cầu công việc

• Kinh nghiệm triển khai thực tế các backend/serving engine cho mô hình AI với ít
TensorFlow Serving hoặc tương đương; ưu tiên ứng viên đã từng đưa hệ thống vào
nhất một trong các công cụ: vLLM, NVIDIA TensorRT‑LLM, KServe, TorchServe,
production với SLA rõ ràng.
• Hiểu sâu về kiến trúc mô hình deep learning (đặc biệt là transformer‑based models)
và cơ chế lazy load layer / module (VD: load từng phần model, sharded weights,
memory mapping, offloading giữa CPU/GPU).
• Thành thạo một trong các ngôn ngữ: Python (ưu tiên), kèm theo kinh nghiệm với
một framework web như FastAPI/Flask/Django để xây dựng dịch vụ inference.
• Kiến thức vững về hệ thống backend: HTTP, networking cơ bản, asynchronous
programming, queue, cache (Redis/memory cache), và kiến trúc microservices.
• Kinh nghiệm làm việc với Docker, container orchestration (ưu tiên Kubernetes) và
CI/CD cho dịch vụ AI.
• Hiểu biết về monitoring & observability (Prometheus, Grafana, OpenTelemetry hoặc
tương đương).

Quyền lợi

• Môi trường làm việc: Sáng tạo, cởi mở, tôn trọng sự khác biệt và cá nhân.
• Dự án chiến lược: Tham gia xây dựng các giải pháp AI đổi mới, ứng dụng công nghệ NVIDIA.
• Đào tạo & chứng chỉ: Tài trợ các khóa học và chứng chỉ liên quan (theo đề xuất/phù hợp).
• Cơ hội phát triển: Làm việc trong môi trường năng động, tăng trưởng nhanh, có cơ hội góp phần định hình tương lai dịch vụ AI tại Việt Nam và Nhật Bản.
• Hỗ trợ học tập: Gói hỗ trợ học tập dành cho con em công đoàn FCI.
• Hoạt động & văn hóa: Tham gia các hoạt động và văn hóa doanh nghiệp của FCI và Tập đoàn FPT
• Bảo hiểm xã hội và bảo hiểm y tế: Theo quy định của pháp luật lao động.
• Mức lương: Cạnh tranh, trả theo năng lực; có thể thương lượng
• Cơ hội làm việc: Hợp tác cùng các tập đoàn công nghệ hàng đầu thế giới và đội ngũ nhân sự nhiệt huyết, tài năng.
• Chế độ phúc lợi: Gói FPT Premium Care.

Cập nhật gần nhất lúc: 2026-01-21 08:35:03

Xem thêm

Đặc điểm công việc

Hạn nộp hồ sơ
21/03/2026
Hình thức làm việc
Toàn thời gian
Cấp bậc
Quản Lý / Giám Sát
Số lượng cần tuyển
3
Ngành nghề
IT phần mềm
Khu vực
Hà Nội; Hồ Chí Minh
Xem thêm
Xem thêm
Người tìm việc lưu ý:
Bạn đang xem tin AI Engineer (Model Inference) - Mã tin đăng: 5283330. Mọi thông tin liên quan tới tin tuyển dụng này là do người đăng tin đăng tải và chịu trách nhiệm. Chúng tôi luôn cố gắng để có chất lượng thông tin tốt nhất, nhưng chúng tôi không đảm bảo và không chịu trách nhiệm về bất kỳ nội dung nào liên quan tới tin việc làm này. Nếu người tìm việc phát hiện có sai sót hay vấn đề gì xin hãy báo cáo cho chúng tôi

FPT SMART CLOUD (FCI)

Quy mô: Cập nhật
Trụ sở: Cập nhật

Bí kíp tìm việc an toàn

Dưới đây là những dấu hiệu của các tổ chức, cá nhân tuyển dụng không minh bạch:
1. Dấu hiệu phổ biến:
Hình ảnh 1
Nội dung mô tả công việc sơ sài, không đồng nhất với công việc thực tế
Hình ảnh 2
Hứa hẹn "việc nhẹ lương cao", không cần bỏ nhiều công sức dễ dàng lấy tiền "khủng"
Hình ảnh 3
Yêu cầu tải app, nạp tiền, làm nhiệm vụ
Hình ảnh 4
Yêu cầu nộp phí phỏng vấn, phí giữ chỗ...
Hình ảnh 5
Yêu cầu ký kết giấy tờ không rõ ràng hoặc nộp giấy tờ gốc
Hình ảnh 6
Địa điểm phỏng vấn bất bình thường
2. Cần làm gì khi gặp việc làm, công ty không minh bạch:
- Kiểm tra thông tin về công ty, việc làm trước khi ứng tuyển
- Báo cáo tin tuyển dụng với 123job thông qua nút "Báo cáo tin tuyển dụng" để được hỗ trợ và giúp các ứng viên khác tránh được rủi ro
- Hoặc liên hệ với 123job thông qua kênh hỗ trợ ứng viên của 123job:
Hotline: 0961.469.398

Việc làm đề xuất liên quan

Việc làm đã xem gần đây

Từ khóa tìm việc làm tại 123Job