Mô tả công việc:
● Phối hợp với thành viên nhóm dự án, nhóm QA, Test để cải thiện sản phẩm
● Đọc hiểu các paper, github và cải tiến sản phẩm
● Xây dựng các mô hình học máy (AI) để thích ứng với các khó khăn hoặc giải quyết triệt để các vấn đề đã phát hiện được ở giai đoạn phân tích
● Thấu hiểu được khó khăn của khách hàng qua phân tích dữ liệu. Làm việc nhiều hệ thống dữ liệu (data warehouse/data lake) và nền tảng phân tích dữ liệu từ đó đề xuất các giải pháp giúp tăng hiệu quả hoạt động sản xuất kinh doanh.
● Xây dựng kế hoạch công việc, báo cáo, đánh giá công việc của cá nhân.
● Các nhiệm vụ khác được phân công
Yêu cầu
- Tối thiểu 1 năm kinh nghiệm ở vị trí tương đương
- Tốt nghiệp Cao đẳng/Đại học, ưu tiên chuyên ngành CNTT, Trí tuệ nhân tạo, Khoa học máy tính, chuyên ngành khoa học (Toán, vật lý),...
- Kỹ năng phân tích dữ liệu
+ Có Kiến thức thống kê từ đó biết cách thiết kế và đánh giá các A/B testing experiments
+ Thành thạo quy trình phân tích dữ liệu theo CRISP
+ Có kinh nghiệm ít nhất 2/4 loại phân tích: Phân tích mô tả, phân tích tìm nguyên nhân, phân tích chẩn đoán, phân tích đề xuất
+ Có thể phân nhóm (K- mean, DBscan, RFM, etc ) và các kĩ năng phân tích theo nhóm :
+ Kỹ năng đặt câu hỏi, kỹ năng giải quyết vấn đề, kỹ năng báo cáo
- Xây dựng mô hình ML/AI:
+ Khả năng đọc research papers, survey
+ Có khả năng training mô hình với high performance tận dụng được tối đa hardware resources đang có (ví dụ: tính toán song song, phân tán, kết hợp nhiều GPUs)
+ Tối ưu tốc độ mô hình AI trong những điều kiện HW resources khác nhau từ đó hướng đến các mục tiêu như: để có thể giảm kích thướng mô hình, tăng tốc độ inference
+ Thành thạo các lớp bài toán phổ biến: regression, classification, clustering. Gồm cả cách tiếp cận Machine Learning or Deep Learning
+ Có thể làm việc với đa dạng loại dữ liệu: dữ liệu theo dòng thời gian (time series), dữ liệu dạng bảng, dữ liệu văn bản (text), etc
+ Hiểu biết sâu sắc các cách phân tích và đánh giá mô hình học máy: Độ chính xác mô hình, sự công bằng, sự thiên lệch và các cách giải quyết tương ứng
- Kỹ năng về lập trình:
+ Thành thạo SQL để truy vấn và xử lý dữ liệu từ IBM Db2 hoặc IBM Big SQL, Single Store.
+ Thành thạo sử dụng các packages sau để xử lý dữ liệu: NumPy, Pandas (hoặc modin, polars), Spark,
+ Thành thạo một trong các framework sau để phục vụ xây dựng mô hình Deeplearning: Karas, TensorFlow hoặc PyTorch và pytorch- forecasting
+ Thành thạo sử dụng các packages sau để xây dựng mô hình machine learning: Scikit- learn, xgboost, lightgbm, Prophet, AutoML opensources
- Ưu tiên ứng viên
+ Có kinh nghiệm với IBM watson và IBM Cognos Analytics:
+ Xây dựng và triển khai mô hình AI theo MLOps (CP4D MLOps)
* Data Preparation: Sử dụng các giải pháp trong IBM Cloud Pak for Data: Presto/Trino và Spark để làm sạch, chuyển đổi và xử lý dữ liệu.
* Khai phá dữ liệu:
● Làm việc với các công cụ visualization của Watson Studio hoặc IBM Cognos Analytics.
● Kỹ năng vẽ biểu đồ và báo cáo trực quan với Python (Plotly, Matplotlib).
* Xây dựng và quản lý mô hình:
* Xây dựng và quản lý features hiệu quả: Biết sử dụng watson- studio/feature- platform của IBM Db2: Feature Design, Feature Catalog, Feature Engine, Feature Store, Feature Management
● Quản lý phiên bản mô hình (model versioning) và giám sát hiệu suất.
● Xử lý và trực quan hóa dữ liệu
● Sử dụng Watson Machine Learning để huấn luyện, theo dõi, và triển khai mô hình.
● Có hiểu biết AutoAI, AutoML
* Triển khai mô hình AI
● Có kinh nghiệm với IBM Cloud, triển khai trên môi trường Cloud và Hybrid
● Làm việc với IBM Kubernetes Service hoặc OpenShift sử dụng container hóa và triển khai mô hình AI.
● Real- time Analytics: Tích hợp mô hình AI/ML với các luồng dữ liệu real- time từ Apache Kafka hoặc IBM Streams.
● Kỹ năng triển khai mô hình và ứng dụng trên IBM Cloud.