etl là gì

Trong quy đổi tài liệu, những dụng cụ trích xuất, quy đổi và chuyên chở (ETL) tiếp tục quy đổi và thống nhất tài liệu thô nhập điểm lưu đệm nhằm sẵn sàng mang đến kho tài liệu đích. Giai đoạn quy đổi tài liệu hoàn toàn có thể tương quan cho tới những loại thay cho thay đổi tài liệu tại đây.

Chuyển thay đổi tài liệu cơ bản

Các quy đổi cơ phiên bản nâng cấp unique tài liệu bằng phương pháp vô hiệu hóa lỗi, thực hiện rỗng tuếch ngôi trường tài liệu hoặc giản dị và đơn giản hóa tài liệu. Sau đấy là những ví dụ về những quy đổi này.

Bạn đang xem: etl là gì

Làm tinh khiết dữ liệu

Làm tinh khiết tài liệu là sự việc vô hiệu hóa những lỗi và ánh xạ tài liệu mối cung cấp thanh lịch format tài liệu đích. Ví dụ: bạn cũng có thể ánh xạ những ngôi trường tài liệu rỗng tuếch trở thành số 0, ánh xạ độ quý hiếm tài liệu “Parent” trở thành “P” hoặc ánh xạ “Child” trở thành “C.”

Chống trùng lặp dữ liệu

Chống trùng lặp nhập quy trình làm sạch sẽ tài liệu là sự việc xác lập và vô hiệu hóa những phiên bản ghi trùng lặp.

Sửa thay đổi format dữ liệu

Sửa thay đổi format là sự việc quy đổi tài liệu, ví dụ như cỗ ký tự động, đơn vị chức năng đo lường và thống kê và độ quý hiếm ngày/giờ, trở thành một format nhất quán. Ví dụ: một công ty lớn thức ăn hoàn toàn có thể đem những hạ tầng tài liệu công thức không giống nhau với những bộ phận được đo vì chưng cả kilogam lộn cân nặng Anh. ETL tiếp tục quy đổi từng đơn vị chức năng thanh lịch cân nặng Anh.

Chuyển thay đổi tài liệu nâng cao

Chuyển thay đổi nâng lên là sự việc dùng những quy tắc sale nhằm tối ưu hóa tài liệu nhằm mục đích phân tách dễ dàng và đơn giản rộng lớn. Sau đấy là những ví dụ về những quy đổi này.

Xem thêm: prime minister là gì

Dẫn xuất

Dẫn xuất là sự việc vận dụng những quy tắc sale nhập tài liệu của khách hàng nhằm đo lường những độ quý hiếm mới mẻ dựa vào những độ quý hiếm hiện tại đem. Ví dụ: bạn cũng có thể quy đổi lệch giá trở thành lợi tức đầu tư bằng phương pháp trừ lên đường ngân sách hoặc tính tổng ngân sách mua sắm và chọn lựa bằng phương pháp nhân giá bán của từng sản phẩm với con số sản phẩm đang được đặt mua.

Gộp ghép

Trong quy trình sẵn sàng tài liệu, gộp ghép là sự việc link những tài liệu tương tự nhau kể từ những mối cung cấp tài liệu không giống nhau. Ví dụ: bạn cũng có thể tính tổng ngân sách mua sắm một sản phẩm bằng phương pháp nằm trong độ quý hiếm mua sắm và chọn lựa kể từ những căn nhà hỗ trợ không giống nhau và chỉ níu lại tổng cuối nhập khối hệ thống đích.

Xem thêm: bản demo là gì

Chia tách

Bạn hoàn toàn có thể phân tách một cột hoặc một tính chất tài liệu trở thành nhiều cột nhập khối hệ thống đích. Ví dụ: nếu như mối cung cấp tài liệu lưu thương hiệu quý khách hàng là “Jane John Doe”, bạn cũng có thể phân tách nó trở thành những cột bọn họ, thương hiệu đệm và thương hiệu.

Tổng hợp

Tổng hợp ý là sự việc nâng cấp unique tài liệu bằng phương pháp hạn chế một trong những lượng rộng lớn những độ quý hiếm tài liệu trở thành một tập luyện tài liệu nhỏ rộng lớn. Ví dụ: độ quý hiếm hóa đơn của đơn đặt mua quý khách hàng hoàn toàn có thể chứa đựng nhiều số chi phí nhỏ không giống nhau. Quý Khách hoàn toàn có thể tóm lược tài liệu bằng phương pháp nằm trong gộp độ quý hiếm nhập một khoảng tầm thời hạn chắc chắn nhằm thiết kế chỉ số độ quý hiếm lâu nhiều năm của quý khách hàng (CLV).

Mã hóa

Bạn hoàn toàn có thể bảo đảm tài liệu mẫn cảm nhằm đáp ứng vâng lệnh luật tài liệu hoặc quyền riêng lẻ của tài liệu bằng phương pháp tăng mã hóa trước lúc luồng tài liệu được truyền cho tới hạ tầng tài liệu đích.