AI Research - NLP

CÔNG TY CỔ PHẦN CMC OPENAI
Mức lương
40 triệu
Địa điểm làm việc
Hà Nội
Kinh nghiệm yêu cầu
OccupationalExperienceRequirements, 24
Thông tin cơ bản

Mô tả công việc

Nghiên cứu, đánh giá và cập nhật liên tục các xu hướng, mô hình và kỹ thuật mới nhất trong lĩnh vực Natural Language Processing (NLP) và Generative AI, phục vụ các sản phẩm chuyển đổi số và hệ thống AI nội bộ.
Thiết kế, phát triển và tối ưu hóa các Large Language Model (LLMs) cho nhiều bài toán thực tế, bao gồm nhưng không giới hạn:
Document Understanding, Information Extraction
Text Classification, Summarization, Question Answering
Chatbot/Virtual Assistant
Retrieval- Augmented Generation (RAG)
Xây dựng và tối ưu pipeline fine- tuning, instruction- tuning, preference tuning cho LLMs (SFT, LoRA/QLoRA, PEFT).
Phát triển và triển khai các hệ thống Speech AI, bao gồm:
Alignment, diarization và hậu xử lý dữ liệu âm thanh
Automatic Speech Recognition (ASR) với Whisper, WhisperX, Wav2Vec2
Làm việc với các mô hình mã nguồn mở và thương mại như LLaMA, Mixtral, Qwen, Mistral, kết hợp với Vector Database để xây dựng hệ thống tìm kiếm ngữ nghĩa và RAG ở quy mô lớn.
Thiết kế và tối ưu embedding pipelines, vector indexing, retrieval strategy (hybrid search, reranking).
Đánh giá, phân tích và cải thiện hiệu suất mô hình theo các tiêu chí:
Hallucination, factuality, robustness
Accuracy, latency, throughput, memory footprint
Phối hợp với các nhóm Backend, Data, DevOps để:
Tích hợp mô hình AI vào hệ thống sản phẩm
Triển khai mô hình ở môi trường production (on- premise hoặc cloud)
Thực hiện tài liệu hóa kỹ thuật, báo cáo nghiên cứu và báo cáo tiến độ theo yêu cầu của ban quản lý.

Yêu cầu công việc

Kiến thức & Kỹ năng chuyên môn

Thành thạo các framework và thư viện học sâu:
PyTorch (ưu tiên), TensorFlow
Hugging Face (Transformers, Datasets, PEFT, Accelerate)
Nắm vững các nền tảng và khái niệm cốt lõi của NLP hiện đại:
Sequence- to- Sequence & Decoder- only Models
Transformer, Attention Mechanism
Tokenization, context length, prompt engineering
Word / Sentence / Document Embeddings
Có kinh nghiệm xử lý dữ liệu NLP quy mô lớn:
Dataset curation cho fine- tuning và evaluation
Data cleaning, normalization, deduplication
Có kinh nghiệm thực tế với Vector Databases:
Milvus, Weaviate, Chroma, FAISS
Hiểu rõ embedding dimension, indexing strategy, recall–latency tradeoff
Có kinh nghiệm làm việc với LLMs mã nguồn mở:
LLaMA, Mixtral, Orca, Qwen, Mistral hoặc tương đương
Hiểu biết về các kỹ thuật tối ưu và triển khai mô hình:
vLLM, Triton, TensorRT- LLM (là lợi thế)
Quantization (INT8, INT4, FP8)
Model parallelism, inference optimization

Kỹ năng bổ trợ

Có tư duy nghiên cứu, khả năng đọc – phân tích paper, benchmark và mã nguồn.
Có kinh nghiệm triển khai mô hình trong môi trường production là một lợi thế:
Docker, Kubernetes
REST/gRPC API
Có khả năng đọc hiểu và viết tài liệu kỹ thuật bằng tiếng Anh.

Phẩm chất cá nhân

Tư duy hệ thống, chú trọng chất lượng và khả năng mở rộng của giải pháp.
Tinh thần chủ động, ham học hỏi và sẵn sàng cập nhật công nghệ mới.
Khả năng làm việc độc lập và phối hợp nhóm tốt.

Quyền lợi

Bảo hiểm sức khỏe và các chương trình, chế độ phúc lợi của Tập đoàn CMC (ngày nghỉ sinh nhật, thưởng các dịp lễ/tết/sinh nhật Tập đoàn,…) cùng các chế độ BHXH, BHYT,v.v theo quy định Pháp luật
Thu nhập upto 40M
Môi trường làm việc trẻ trung, năng động, cởi mở, sáng tạo, đồng nghiệp vui vẻ và luôn được tạo cơ hội tiếp cận những công nghệ mới, tiên tiến nhất
Cơ hội học hỏi, tham gia đào tạo và phát triển bản thân tại một Tập đoàn công nghệ lớn hàng đầu Việt Nam, với lộ trình thăng tiến nghề nghiệp rõ ràng
Thưởng hiệu quả công việc, đánh giá năng lực, review lương hàng năm

Cập nhật gần nhất lúc: 2026-01-22 20:40:02

Xem thêm

Đặc điểm công việc

Hạn nộp hồ sơ
03/03/2026
Hình thức làm việc
Toàn thời gian
Cấp bậc
Trưởng Nhóm
Kinh nghiệm yêu cầu
OccupationalExperienceRequirements, 24
Số lượng cần tuyển
3
Ngành nghề
IT phần mềm
Khu vực
Hà Nội
Xem thêm
Xem thêm
Người tìm việc lưu ý:
Bạn đang xem tin AI Research - NLP - Mã tin đăng: 5500349. Mọi thông tin liên quan tới tin tuyển dụng này là do người đăng tin đăng tải và chịu trách nhiệm. Chúng tôi luôn cố gắng để có chất lượng thông tin tốt nhất, nhưng chúng tôi không đảm bảo và không chịu trách nhiệm về bất kỳ nội dung nào liên quan tới tin việc làm này. Nếu người tìm việc phát hiện có sai sót hay vấn đề gì xin hãy báo cáo cho chúng tôi

CÔNG TY CỔ PHẦN CMC OPENAI

Quy mô: Cập nhật
Trụ sở: Cập nhật

Bí kíp tìm việc an toàn

Dưới đây là những dấu hiệu của các tổ chức, cá nhân tuyển dụng không minh bạch:
1. Dấu hiệu phổ biến:
Hình ảnh 1
Nội dung mô tả công việc sơ sài, không đồng nhất với công việc thực tế
Hình ảnh 2
Hứa hẹn "việc nhẹ lương cao", không cần bỏ nhiều công sức dễ dàng lấy tiền "khủng"
Hình ảnh 3
Yêu cầu tải app, nạp tiền, làm nhiệm vụ
Hình ảnh 4
Yêu cầu nộp phí phỏng vấn, phí giữ chỗ...
Hình ảnh 5
Yêu cầu ký kết giấy tờ không rõ ràng hoặc nộp giấy tờ gốc
Hình ảnh 6
Địa điểm phỏng vấn bất bình thường
2. Cần làm gì khi gặp việc làm, công ty không minh bạch:
- Kiểm tra thông tin về công ty, việc làm trước khi ứng tuyển
- Báo cáo tin tuyển dụng với 123job thông qua nút "Báo cáo tin tuyển dụng" để được hỗ trợ và giúp các ứng viên khác tránh được rủi ro
- Hoặc liên hệ với 123job thông qua kênh hỗ trợ ứng viên của 123job:
Hotline: 0961.469.398

Việc làm đề xuất liên quan

Việc làm đã xem gần đây

Từ khóa tìm việc làm tại 123Job
research a tại tỉnh/thành