Data Scientist (Customer Profile)

CÔNG TY CỔ PHẦN MISA
Mức lương
2.5 triệu/tuần
Địa điểm làm việc
Hà Nội
Kinh nghiệm yêu cầu
Cập nhật
Thông tin cơ bản

Mô tả công việc

Vai trò thiết yếu:

Thực hiện phân tích, xử lý và chuẩn bị dữ liệu phục vụ huấn luyện/tinh chỉnh các mô hình LLM.
Đảm bảo dữ liệu phù hợp với yêu cầu kỹ thuật, đáp ứng tiêu chuẩn chất lượng và tuân thủ quy định pháp lý.
Phối hợp với Data Engineers, Data Stewards và AI Engineers để bảo đảm dữ liệu huấn luyện được sẵn sàng và tối ưu cho các pipeline pre- training/fine- tuning LLM.
Áp dụng các kỹ thuật NLP để làm sạch, chuẩn hóa và biến dữ liệu thô thành dữ liệu chất lượng cao.

Trách nhiệm thiết yếu:

Xây dựng và duy trì các pipeline xử lý dữ liệu NLP bán tự động phục vụ huấn luyện mô hình.
Đề xuất cải tiến kỹ thuật nhằm tăng hiệu quả xử lý dữ liệu và tối ưu chi phí.
Thực hiện đánh giá chất lượng dữ liệu (Data Quality Score, tính đa dạng, tính cân bằng corpus).
Làm việc cùng AI Engineers để kiểm thử dữ liệu đầu vào cho pre- training/fine- tuning, đánh giá tính phù hợp và hiệu quả.
Thu thập, tiền xử lý và làm sạch dữ liệu văn bản tiếng Việt từ nhiều nguồn (tài chính, pháp luật, kế toán, quản trị doanh nghiệp…).
Áp dụng các kỹ thuật NLP như tokenization, sentence segmentation, deduplication, normalization để chuẩn hóa dữ liệu.
Gắn nhãn dữ liệu ở mức cơ bản hoặc phối hợp với Data Labeling Specialists để đảm bảo tính chính xác và tính nhất quán.

Yêu cầu công việc

Học vấn:

Cử nhân hoặc Thạc sĩ chuyên ngành Khoa học dữ liệu, Trí tuệ nhân tạo, Công nghệ Thông tin hoặc các lĩnh vực liên quan.

Kinh nghiệm:

Trải nghiệm thực tế trong các dự án chuẩn bị dữ liệu cho huấn luyện mô hình NLP/LLM.
3–5 năm kinh nghiệm trong xử lý dữ liệu văn bản hoặc NLP.

Kiến thức và kỹ năng:

Khả năng làm việc nhóm, giao tiếp hiệu quả với các nhóm AI/ML và kỹ thuật dữ liệu.
Thành thạo Python và các thư viện NLP (Hugging Face, SpaCy, NLTK, OpenNMT).
Kỹ năng phân tích dữ liệu, đánh giá chất lượng và trực quan hóa kết quả.
Kinh nghiệm trong làm sạch dữ liệu, text augmentation, deduplication và corpus building.
Hiểu biết về các yêu cầu dữ liệu cho pre- training/fine- tuning LLM (khối lượng, tính đa dạng, domain- specific corpora).

Ưu tiên:

Kinh nghiệm làm việc với dữ liệu tiếng Việt hoặc ngôn ngữ có tính đa dạng cú pháp cao.
Nắm vững quy định pháp lý quốc tế và trong nước về dữ liệu (GDPR, Decree 13/2023/NĐ- CP).
Hiểu biết về các xu hướng mới trong chuẩn bị dữ liệu cho LLM: synthetic data generation, data augmentation pipelines.

Quyền lợi

Tiên phong công nghệ, uy tín

Hơn 100 giải thưởng trong ngành CNTT trong nước và quốc tế
Xây dựng niềm tin với 270.000 khách hàng là đơn vị HCSN, doanh nghiệp, 2.5 triệu khách hàng cá nhân tại Việt Nam và 20 quốc gia
TOP đầu doanh nghiệp CNTT tăng trưởng liên tục với quy mô nhân sự tăng 20%/năm, doanh thu tăng 15%/năm
Hội tụ 3000 nhân tài cùng khát vọng đưa sản phẩm công nghệ “Make In Vietnam” vươn tầm quốc tế
MISA là doanh nghiệp CNTT xuất sắc nhất khu vực Châu Á- Châu Đại Dương. Tiên phong xuất khẩu giải pháp SaaS

Nền tảng vững chắc cho phát triển sự nghiệp, thăng tiến, quyền lợi

Lương cứng cạnh tranh. Thưởng năng suất dựa trên kết quả công việc từ 2 tháng lương.
Giải thưởng “Gấu vàng": nơi tôn vinh những tài năng xuất sắc nhất
Đánh giá review lương 2 lần/năm, thưởng sáng kiến...
Huấn luyện “Hổ tướng”: chương trình đào tạo quản lý tài năng, bệ phóng trở thành Chiến tướng tinh nhuệ
Gói chăm sóc sức khỏe toàn diện tại Medlatec, cháy hết mình tại các CLB theo sở thích, chương trình teambuilding, du lịch định kỳ

Môi trường thân thiện, chia sẻ, đồng hành

Kết nối tài năng: tập trung phát triển những con người có chung lý tưởng, mục tiêu, cùng trao giá trị và nhận thành công
Công nghệ cao: trang bị máy tính làm việc, tối ưu hiệu suất công việc bằng ứng dụng công nghệ, phần mềm tự động (AMIS, Jira, Power BI, AI Marketing,...)
Nơi làm việc hạnh phúc: MISA mong muốn tạo một môi trường làm việc để bạn luôn cảm thấy hạnh phúc
Tư duy đột phá: môi trường tôn trọng sự khác biệt và đề cao sáng tạo, MISA- er được tự do phát triển các ý tưởng tiến bộ, cải tiến công việc

Cập nhật gần nhất lúc: 2025-10-21 04:25:02

Xem thêm

Đặc điểm công việc

Hạn nộp hồ sơ
19/11/2025
Hình thức làm việc
Toàn thời gian
Cấp bậc
Nhân Viên
Số lượng cần tuyển
1
Ngành nghề
IT phần mềm
Khu vực
Hà Nội
Xem thêm
Xem thêm
Người tìm việc lưu ý:
Bạn đang xem tin Data Scientist (Customer Profile) - Mã tin đăng: 5341268. Mọi thông tin liên quan tới tin tuyển dụng này là do người đăng tin đăng tải và chịu trách nhiệm. Chúng tôi luôn cố gắng để có chất lượng thông tin tốt nhất, nhưng chúng tôi không đảm bảo và không chịu trách nhiệm về bất kỳ nội dung nào liên quan tới tin việc làm này. Nếu người tìm việc phát hiện có sai sót hay vấn đề gì xin hãy báo cáo cho chúng tôi

CÔNG TY CỔ PHẦN MISA

Quy mô: Trên 1000
Trụ sở: Trụ sở: Tầng 9 Tòa Nhà Technosoft, phố Duy Tân, Cầu Giấy, Hà Nội/ VP HCM: Lô 5, Công viên phần mềm Quang Trung, 4 Tô Ký, phường Tân Chánh Hiệp, Quận 12, TPHCM

Bí kíp tìm việc an toàn

Dưới đây là những dấu hiệu của các tổ chức, cá nhân tuyển dụng không minh bạch:
1. Dấu hiệu phổ biến:
Hình ảnh 1
Nội dung mô tả công việc sơ sài, không đồng nhất với công việc thực tế
Hình ảnh 2
Hứa hẹn "việc nhẹ lương cao", không cần bỏ nhiều công sức dễ dàng lấy tiền "khủng"
Hình ảnh 3
Yêu cầu tải app, nạp tiền, làm nhiệm vụ
Hình ảnh 4
Yêu cầu nộp phí phỏng vấn, phí giữ chỗ...
Hình ảnh 5
Yêu cầu ký kết giấy tờ không rõ ràng hoặc nộp giấy tờ gốc
Hình ảnh 6
Địa điểm phỏng vấn bất bình thường
2. Cần làm gì khi gặp việc làm, công ty không minh bạch:
- Kiểm tra thông tin về công ty, việc làm trước khi ứng tuyển
- Báo cáo tin tuyển dụng với 123job thông qua nút "Báo cáo tin tuyển dụng" để được hỗ trợ và giúp các ứng viên khác tránh được rủi ro
- Hoặc liên hệ với 123job thông qua kênh hỗ trợ ứng viên của 123job:
Hotline: 0961.469.398

Việc làm đề xuất liên quan

Việc làm đã xem gần đây

Từ khóa tìm việc làm tại 123Job
Data scientist tại tỉnh/thành