To deliver these capabilities, we need engineers who can own AI- powered features end- to- end — from design and evaluation through optimization and deployment.
You will work hands- on with LLM APIs and open- source models, prioritizing relevance, stability, latency, and cost efficiency.
This role values deep algorithmic and systems thinking over prompt- only solutions.
We are building reliable, production- grade Generative AI features that power core product experiences.
WHAT YOU’LL DO
• Design and deliver AI- powered features (search, recommendation, personalization) with
measurable improvements in relevance and user impact
• Build and maintain RAG pipelines using embeddings, reranking, filtering, and other
techniques to ensure predictable and high- quality outputs
• Integrate LLM APIs and open- source models into scalable backend systems running in
production
• Define and track offline and online evaluation metrics to objectively measure and
improve quality
• Optimize the trade- off between quality, latency, and cost to enable sustainable AI usage
at scale
• Implement guardrails, fallback mechanisms, and monitoring to ensure system reliability
and safety
• Conduct code reviews and mentor junior engineers to uphold engineering standards
- - - - - -
MÔ TẢ CÔNG VIỆC
• Đảm bảo độ tin cậy: Xây dựng cơ chế guardrails, fallback và monitoring để hệ thống luôn an toàn và sẵn sàng (reliable).
• Design & Ship tính năng AI: Trực tiếp xây dựng các tính năng Search, Recommendation, Personalization với mục tiêu cải thiện trải nghiệm người dùng.
• Tích hợp hệ thống: Đưa LLM APIs và models vào hệ thống Backend, đảm bảo khả năng mở rộng (scale) tốt trên môi trường Production.
• Đo lường chất lượng: Định nghĩa và tracking các metrics (cả online & offline) để đánh giá khách quan hiệu quả của model.
• Xây dựng RAG Pipelines: Build và duy trì hệ thống RAG sử dụng embeddings, reranking, filtering... đảm bảo kết quả đầu ra chất lượng và ổn định.
• Code Quality: Tham gia Code Review và cùng team duy trì tiêu chuẩn kỹ thuật cao (engineering standards).
• Tối ưu bài toán Trade- off: Cân bằng giữa Chất lượng- Độ trễ (Latency)- Chi phí (Cost) để vận hành AI hiệu quả ở quy mô lớn.