Chuẩn bị dữ liệu tự phục vụ với luồng dữ liệu

Khi khối lượng dữ liệu tiếp tục tăng lên, thì bạn sẽ gặp khó khăn khi hình dữ liệu đó thành thông tin có cấu trúc tốt, có thể hành động được. Bạn muốn dữ liệu sẵn sàng cho các ứng dụng, khối lượng công việc AI hoặc phân tích để bạn có thể nhanh chóng biến khối lượng dữ liệu thành thông tin chi tiết có thể hành động. Với chuẩn bị dữ liệu tự phục vụ trong cổng thông tin Power Apps, bạn có thể chuyển đổi và tải dữ liệu vào Microsoft Dataverse hoặc tài khoản Azure Data Lake Storage Gen2 của tổ chức bạn chỉ với vài cú nhấp chuột.

Luồng dữ liệu đã được giới thiệu để giúp các tổ chức thống nhất dữ liệu từ các nguồn khác nhau và chuẩn bị cho việc sử dụng. Bạn có thể dễ dàng tạo các luồng dữ liệu bằng các công cụ tự phục vụ quen thuộc để nhập, biến đổi, tích hợp và làm phong phú đại dữ liệu. Khi tạo một luồng dữ liệu, bạn sẽ xác định các kết nối nguồn dữ liệu, logic ETL (trích xuất, chuyển đổi, tải) và đích để tải dữ liệu kết quả. Sau khi được tạo, bạn có thể định cấu hình lịch làm mới của luồng dữ liệu để cho biết tần suất làm mới. Ngoài ra, công cụ tính toán theo mô hình mới làm cho quá trình chuẩn bị dữ liệu trở nên dễ quản lý hơn, mang tính quyết định hơn và ít cồng kềnh hơn cho các khách hàng của luồng dữ liệu. Với luồng dữ liệu, các tác vụ từng yêu cầu tổ chức CNTT dữ liệu tạo và giám sát (và nhiều giờ hoặc vài ngày để hoàn thành) giờ đây có thể được xử lý bằng một vài cú nhấp chuột của các cá nhân thậm chí không phải là nhà khoa học dữ liệu, như người tạo ứng dụng, nhà phân tích kinh doanh và người tạo báo cáo.

Luồng dữ liệu lưu trữ dữ liệu trong các bảng. Bảng là một tập hợp các hàng dùng để lưu trữ dữ liệu, tương tự như cách một bảng lưu trữ dữ liệu trong cơ sở dữ liệu. Khách hàng có thể xác định lược đồ bảng tùy chỉnh hoặc tận dụng các bảng tiêu chuẩn của Common Data Model. Common Data Model là ngôn ngữ dữ liệu dùng chung cho các ứng dụng kinh doanh và phân tích để sử dụng. Hệ thống siêu dữ liệu Common Data Model cho phép dữ liệu trở nên nhất quán với ý nghĩa của dữ liệu trên toàn ứng dụng và quy trình kinh doanh, chẳng hạn như Power Apps, Power BI, một số ứng dụng Dynamics 365 (ứng dụng dựa trên mô hình) và Azure, trong đó lưu trữ dữ liệu theo Common Data Model. Sau đó, các bảng kết quả của một luồng dữ liệu có thể được lưu trữ theo một trong các cách sau:

  • Dataverse. Cho phép bạn lưu trữ và quản lý an toàn dữ liệu mà các ứng dụng doanh nghiệp sử dụng bằng Power Apps và Power Automate.

  • Azure Data Lake Storage Gen2. Cho phép bạn cộng tác với những người trong tổ chức của bạn bằng cách sử dụng Power BI, Dữ liệu Azure và dịch vụ AI hoặc các ứng dụng kinh doanh được xây dựng tùy chỉnh để đọc dữ liệu từ kho dữ liệu. Luồng dữ liệu tải dữ liệu tới dữ liệu lưu trữ trong tài khoản Azure Data Lake Storage Gen2 trong thư mục Common Data Model. Thư mục Common Data Modelchứa dữ liệu được lược đồ hóa và siêu dữ liệu ở định dạng chuẩn để tạo điều kiện trao đổi dữ liệu và cho phép khả năng tương tác đầy đủ giữa các dịch vụ sản xuất hoặc sử dụng dữ liệu được lưu trữ trong tài khoản Azure Data Lake Storage của một tổ chức dưới dạng lớp lưu trữ được chia sẻ.

Bạn có thể sử dụng các luồng dữ liệu để nhập dữ liệu từ một tập hợp các nguồn dữ liệu tại chỗ và dựa trên đám mây được hỗ trợ bao gồm Excel, Cơ sở dữ liệu SQL Azure, SharePoint, Azure Data Explorer, Salesforce, Oracle database và nhiều hơn nữa.

Sau khi chọn nguồn dữ liệu, bạn có thể sử dụng trải nghiệm không cần dùng mã/không đòi hỏi quá nhiều công đoạn mã hóa của Power Query để chuyển đổi dữ liệu và ánh xạ đến các bảng tiêu chuẩn trong Common Data Model hoặc tạo các bảng tùy chỉnh. Người dùng nâng cao có thể trực tiếp chỉnh sửa ngôn ngữ M của luồng dữ liệu để tùy chỉnh hoàn toàn các luồng dữ liệu, tương tự như trải nghiệm Power Query mà hàng triệu người dùng Power BI Desktop và người dùng Excel đã biết.

Sau khi bạn tạo và lưu một luồng dữ liệu, bạn sẽ cần chạy nó trong đám mây. Bạn có thể chọn kích hoạt một luồng dữ liệu để chạy thủ công hoặc lên lịch tần suất cho dịch vụ luồng dữ liệu Power Platform để chạy nó cho bạn. Khi một luồng dữ liệu hoàn thành một lần chạy, dữ liệu của nó có sẵn để sử dụng. Để tải dữ liệu luồng dữ liệu vào Dataverse, trình kết nố Common Data Service có thể được sử dụng trong Power Apps, Power Automate, Excel và tất cả các ứng dụng khác hỗ trợ trình kết nối Dataverse. Để lấy từ luồng dữ liệu được lưu trữ trong tài khoản Azure Data Lake Storage Gen2 của tổ chức bạn, bạn có thể sử dụng trình kết nối Luồng dữ liệu Power Platform trong Power BI Desktop hoặc truy cập các tập tin trực tiếp trong kho dữ liệu.

Cách sử dụng luồng dữ liệu

Phần trước cung cấp nền tảng về công nghệ luồng dữ liệu. Trong phần này, bạn có được hướng dẫn cách sử dụng luồng dữ liệu trong một tổ chức.

Lưu ý

Bạn phải có một gói Power Apps trả phí để sử dụng luồng dữ liệu, nhưng bạn không bị tính phí khi sử dụng luồng dữ liệu.

Tải dữ liệu lên Dataverse

Có thể sử dụng các luồng dữ liệu để điền vào các bảng trong Common Data Service để sử dụng trong các ứng dụng Power Apps. Với vài cú nhấp, bạn có thể tích hợp dữ liệu từ các nguồn dữ liệu trực tuyến và tại chỗ.

Mở rộng Common Data Model cho nhu cầu kinh doanh của bạn

Đối với các tổ chức muốn mở rộng và xây dựng theo Common Data Model, các luồng dữ liệu cho phép các chuyên gia nghiệp vụ thông minh tùy chỉnh các bảng tiêu chuẩn hoặc tạo các bảng mới. Sau đó có thể sử dụng cách tùy chỉnh mô hình dữ liệu tự phục vụ này với luồng dữ liệu để xây dựng bảng điều khiển Power BI được thiết kế riêng cho một tổ chức.

Mở rộng khả năng của bạn với các dịch vụ Azure Data và AI

Có thể đặt cấu hình luồng dữ liệu Power Platform để lưu trữ dữ liệu luồng dữ liệu trong tài khoản Azure Data Lake Storage Gen2 của tổ chức bạn. Khi một môi trường được kết nối với data lake của tổ chức của bạn, các nhà khoa học và nhà phát triển dữ liệu có thể tận dụng các sản phẩm Azure mạnh mẽ như Máy học Azure, Azure Databricks, Azure Data Factory, v.v.

Để biết thêm thông tin về tích hợp luồng dữ liệu và Azure Data Lake Storage Gen2, bao gồm cách tạo các luồng dữ liệu trong Azure Data Lake của tổ chức của bạn, hãy xem Kết nối Azure Data Lake Storage Gen2 cho lưu trữ luồng dữ liệu.

Tóm tắt về chuẩn bị dữ liệu tự phục vụ cho đại dữ liệu trong Power Apps

Có nhiều kịch bản và ví dụ trong đó, luồng dữ liệu có thể cho phép bạn kiểm soát tốt hơn và hiểu biết nhanh hơn về dữ liệu kinh doanh của bạn. Những người khác trong tổ chức của bạn có thể tận dụng các luồng dữ liệu thông qua Dataverse, trình kết nối Luồng dữ liệu Power Platform trong Power BI hoặc thông qua truy cập trực tiếp vào thư mục Common Data Service của luồng dữ liệu trong tài khoản Azure Data Lake Storage Gen2 của tổ chức bạn. Bằng mô hình dữ liệu tiêu chuẩn (lược đồ) do Common Data Model xác định, các ứng dụng kinh doanh có thể dựa vào lược đồ của bảng và được tóm tắt từ cách dữ liệu được tạo hoặc từ nguồn dữ liệu. Khi một nguồn dữ liệu hoàn thành một lần chạy theo lịch trình, dữ liệu đã sẵn sàng để mô hình hóa và tạo các ứng dụng, luồng hoặc thông tin chi tiết BI trong một khoảng thời gian rất ngắn... mà trước đây thường mất nhiều tháng hoặc lâu hơn để tạo.

Định dạng chuẩn của Common Data Model cho phép mọi người trong tổ chức của bạn tạo các ứng dụng tạo báo cáo và hình ảnh nhanh chóng, dễ dàng và tự động. Chúng bao gồm, nhưng không giới hạn ở:

  • Ánh xạ dữ liệu của bạn từ nhiều nguồn khác nhau đến các bảng tiêu chuẩn trong Common Data Model để thống nhất dữ liệu và tận dụng lược đồ đã biết để điều khiển các ứng dụng sẵn dùng.

  • Tạo các bảng tùy chỉnh của riêng bạn để thống nhất dữ liệu trong toàn tổ chức của bạn.

  • Tạo báo cáo và bảng thông tin Power BI tận dụng dữ liệu của luồng dữ liệu.

  • Tạo tích hợp với dữ liệu Azure và dịch vụ AI thông qua tài khoản Azure Data Lake Storage Gen2 của tổ chức bạn.

Bước tiếp theo

Bài viết này cung cấp một cái nhìn tổng quan về chuẩn bị dữ liệu tự phục vụ trong cổng thông tin Power Apps và những cách bạn có thể sử dụng nó. Các chủ đề sau đây chứa nhiều chi tiết hơn về các tình huống sử dụng phổ biến cho các luồng dữ liệu:

Để biết thêm thông tin về Power Query và làm mới theo lịch trình, bạn có thể đọc các bài viết sau:

Để biết thêm thông tin về Common Data Model, bạn có thể đọc bài viết tổng quan về nó:

Lưu ý

Bạn có thể cho chúng tôi biết bạn thích dùng ngôn ngữ nào cho tài liệu không? Làm một cuộc khảo sát ngắn. (xin lưu ý, khảo sát này bằng tiếng Anh)

Cuộc khảo sát sẽ mất khoảng bảy phút. Không có dữ liệu cá nhân nào được thu thập (điều khoản về quyền riêng tư).