Giá trị thp mang lại
Mục đích công việc
Quản lý hạ tầng dữ liệu của hệ sinh thái THP: Nhằm nâng cao hiệu quả quản lý dữ liệu (thông qua các bước ghi nhận, lưu trữ, báo cáo, trích xuất, chuyển đổi và tải dữ liệu).
– Xác định, thiết kế, triển khai kiến trúc kho dữ liệu:
• Phát triển và quản lý một kho dữ liệu tập trung, tổng hợp dữ liệu từ nhiều nguồn, đảm bảo hiệu suất tối ưu và khả năng mở rộng.
• Áp dụng các phương pháp tốt nhất về mô hình hóa dữ liệu, lưu trữ và truy xuất để hỗ trợ phân tích và báo cáo kinh doanh.
– Xác định, thiết kế, triển khai luồng dữ liệu E2E:
• Xây dựng và duy trì Từ điển Dữ liệu (Data Dictionary):
+ Tài liệu hóa tất cả các trường dữ liệu, loại dữ liệu, nguồn dữ liệu, cách dữ liệu được ghi nhận – lưu trữ – chuyển đổi – báo cáo – trích xuất – tải.
+ Xác định tiêu chuẩn về loại dữ liệu và định dạng dữ liệu.
• Công bố Từ điển Dữ liệu và đào tạo người dùng về cách truy xuất dữ liệu để phân tích.
– Cải thiện tính sẵn sàng, hiệu quả và chất lượng dữ liệu:
• Thiết kế và thực hiện các giải pháp, quy trình và đào tạo để nâng cao chất lượng dữ liệu trong suốt vòng đời của nó.
• Xây dựng giải pháp cung cấp dữ liệu tự động và kịp thời cho người dùng.
• Triển khai các giải pháp tự động hóa các tác vụ dữ liệu thủ công từ đầu đến cuối.
Các điều kiện cần có
– Kỹ năng Kỹ thuật Dữ liệu:
Ngôn ngữ lập trình và scripting:
• Python: Được sử dụng rộng rãi để xử lý dữ liệu và tự động hóa.
• SQL: Cốt lõi trong truy vấn và quản lý cơ sở dữ liệu quan hệ.
• Kỹ năng làm việc với khung dữ liệu lớn.
Hệ thống Quản lý Cơ sở Dữ liệu (DBMS):
• Cơ sở dữ liệu quan hệ: Thành thạo MySQL, PostgreSQL.
• Cơ sở dữ liệu NoSQL: Kinh nghiệm với MongoDB, Cassandra để xử lý dữ liệu phi cấu trúc.
Giải pháp Kho Dữ liệu:
• Công cụ: Hiểu biết về Amazon Redshift, Google BigQuery, Snowflake.
• Thiết kế & Triển khai: Phát triển và quản lý kho dữ liệu tổng hợp từ nhiều nguồn.
Công nghệ Dữ liệu Lớn:
• Frameworks: Kinh nghiệm với Hadoop, Spark, Hive để xử lý dữ liệu lớn.
• Xử lý thời gian thực: Kiến thức về công cụ xử lý dữ liệu streaming.
Mô hình Dữ liệu và Quy trình ETL:
• Công cụ ETL: Thành thạo quy trình Extract, Transform, Load (ETL) để tích hợp và chuyển đổi dữ liệu.
• Mô hình hóa Dữ liệu: Thiết kế mô hình dữ liệu hiệu quả hỗ trợ nhu cầu kinh doanh.
– Bằng cử nhân trong các ngành Khoa học Dữ liệu, Khoa học Máy tính, Hệ thống Thông tin, Kỹ thuật, Quản trị Kinh doanh, Toán học hoặc các lĩnh vực liên quan.
– Kỹ năng CNTT:
Nền tảng Điện toán Đám mây:
• Dịch vụ Dữ liệu: Sử dụng các dịch vụ dữ liệu đám mây để quản lý dữ liệu hiệu quả.
• Dịch vụ: Kinh nghiệm với AWS, Azure, Google Cloud để lưu trữ và xử lý dữ liệu mở rộng.
Hệ điều hành:
• Windows: Hiểu biết về quản lý máy chủ và tích hợp trong môi trường đa nền tảng.
• Linux/UNIX: Thành thạo các lệnh hệ thống, scripting và quản lý tiến trình.
Bảo mật Dữ liệu và Tuân thủ:
• Giao thức bảo mật: Triển khai mã hóa dữ liệu, kiểm soát truy cập và các biện pháp bảo mật khác.
• Tuân thủ quy định: Đảm bảo thực hành dữ liệu tuân thủ các tiêu chuẩn và quy định về bảo vệ dữ liệu trong ngành sản xuất và bất động sản.
Công cụ Trực quan hóa Dữ liệu và BI:
• Công cụ: Thành thạo Tableau, Power BI.
• Phát triển Dashboard: Tạo các bảng điều khiển tương tác cung cấp thông tin chi tiết có giá trị cho các bên liên quan.
Hệ thống Quản lý Phiên bản:
• Công cụ: Kinh nghiệm làm việc với các hệ thống quản lý phiên bản để quản lý mã nguồn và cộng tác nhóm.
Hệ thống Quản lý Cơ sở Dữ liệu (DBMS):
• Thành thạo SQL và NoSQL: Thiết kế, triển khai và quản lý cơ sở dữ liệu quan hệ (MySQL, PostgreSQL) và phi quan hệ (MongoDB) để đáp ứng nhiều loại dữ liệu và cấu trúc.
Công cụ Quản lý Dự án và Hợp tác:
• Phương pháp Agile: Hiểu biết về quản lý dự án Agile và công cụ như Jira, Trello để giám sát dự án dữ liệu và thúc đẩy hợp tác liên phòng ban.
– Thành thạo tiếng Anh và tiếng Việt ở mức giao tiếp, có khả năng đọc, viết và nghe hiểu tiếng Anh.
– Tối thiểu 4 năm làm việc trong vai trò Kỹ sư Dữ liệu (Data Engineer).