Dữ liệu là yếu tố cực kỳ quan trọng trong ngành năng lượng ngày nay, đặc biệt là dữ liệu công tơ thông minh (Ảnh st)
Dữ liệu công tơ thông minh tổng hợp có tất cả các lợi ích của dữ liệu thực trong khi vẫn bảo vệ quyền riêng tư của khách hàng.
Dữ liệu rất quan trọng trong ngành năng lượng ngày nay, đặc biệt là dữ liệu công tơ thông minh. Nó cung cấp thông tin về cách thức sử dụng toàn bộ lượng điện năng sau khi được sản xuất. Đã qua rồi cái thời mà các dữ liệu này chỉ dùng để lập hóa đơn. Giờ đây, dữ liệu đang mở đường cho nhiều trường hợp sử dụng khác từ việc cung cấp tính linh hoạt đến lập kế hoạch dài hạn lưới điện.
Giá trị dữ liệu của một cá nhân không lớn, nhưng khi tổng hợp lại - dù ở quy mô của một địa bàn dịch vụ điện lực hay một quốc gia - nó có thể trở thành một dữ liệu đầu vào thiết yếu cho quy trình lập kế hoạch thích hợp. Về bản chất, điều này là động lực thúc đẩy “dữ liệu mở” và “các không gian dữ liệu”, nơi dữ liệu từ nhiều nguồn khác nhau có thể được cung cấp để các bên liên quan sử dụng một cách minh bạch, đúng với mục đích dự kiến.
Điều quan trọng là phải đáp ứng tất cả các yêu cầu về quyền riêng tư để bảo vệ tính bảo mật của khách hàng.
Một cách tiếp cận đã được áp dụng là ẩn danh dữ liệu, nhưng ở đó cũng có sự quan tâm ngày càng tăng đối với việc sử dụng dữ liệu tổng hợp. Để tìm hiểu thêm, Gareth Jones, Tổng Giám đốc Điều hành của Trung tâm cấp năng lượng Net Zero do Octopus Energy tài trợ, đơn vị khai thác lợi thế dữ liệu để đẩy nhanh quá trình chuyển dịch năng lượng, đã cung cấp một số góc nhìn chuyên sâu.
Một trong những dự án của Trung tâm tập trung vào việc phát triển một công cụ tạo dữ liệu công tơ thông minh tổng hợp, gọi là Faraday, và việc tạo ra một bộ dữ liệu công tơ thông minh tổng hợp này đại diện cho toàn bộ Vương quốc Anh. Cả hai đều đã phát hành dưới dạng mã nguồn mở trong dự án OpenSynth thông qua Linux Foundation (LF) Energy.
Mở đầu với bối cảnh của sáng kiến
Hệ thống năng lượng đang thay đổi đầy kịch tính, với nhiều năng lượng tái tạo, tài sản phi tập trung và thay đổi đường cong nhu cầu. Vì vậy, điều thực sự quan trọng là phải hiểu rõ hơn về hành vi tiêu thụ năng lượng của người tiêu dùng để lập kế hoạch và tối ưu hóa cho tương lai và thực hiện quá trình chuyển dịch thành công.
Nhiều công việc mô hình hóa và ra quyết định hiện nay có xu hướng dựa trên dữ liệu từ quá khứ, và Trung tâm cấp năng lượng Net Zero muốn các quy trình đó diễn ra bằng cách sử dụng dữ liệu cập nhật nhất vì các sắc thái, chẳng hạn như dòng công suất hai chiều, rất quan trọng khi chúng ta tiến về phía trước. Nhưng khi xem xét dữ liệu thực, chúng ta gặp phải một số vấn đề, đặc biệt là xung quanh quyền riêng tư. Dữ liệu tổng hợp có tiềm năng to lớn trong việc giải quyết một số vấn đề về quyền riêng tư đó, đồng thời giúp mọi người truy cập dữ liệu mà họ cần.
Vậy thì dữ liệu tổng hợp là gì và việc tạo ra nó như thế nào?
Chúng ta bắt đầu với dữ liệu công tơ thông minh thực tế từ các hộ gia đình và kết hợp chúng với siêu dữ liệu có liên quan thuộc nhiều loại khác nhau, cả về khách hàng và các yếu tố bên ngoài như hiệu suất của tòa nhà, và sau đó sử dụng tất cả các dữ liệu đó để đào tạo mô hình trí tuệ nhân tạo (AI) tạo sinh. Khi đó, chúng ta có thể sử dụng mô hình đó để tạo các đường cong tiêu thụ. Ví dụ, chúng ta có thể yêu cầu đường cong tiêu thụ cho một ngôi nhà biệt lập có xếp hạng hiệu suất năng lượng cao, có các tấm pin mặt trời trên mái nhà và một bộ sạc xe điện (EV) tại lối xe vào, và nó sẽ đưa ra đường cong tiêu thụ hàng ngày với các điểm dữ liệu mỗi nửa giờ cho một hộ gia đình đáp ứng các yêu cầu đó.
Phiên bản đầu tiên của mô hình Faraday đã phát hành dựa trên dữ liệu công tơ thông minh từ các khách hàng của Octopus Energy, bao gồm khoảng 350 triệu điểm dữ liệu từ khoảng 20.000 hộ gia đình. Phiên bản mới nhất này đào tạo dựa trên 1,8 tỷ điểm dữ liệu từ 190.000 hộ gia đình và mang tính đại diện trên toàn quốc.
So sánh các đặc tính thống kê giữa dữ liệu công tơ thông minh thực và dữ liệu công tơ thông minh tổng hợp (Ảnh st)
Dữ liệu tổng hợp khác với dữ liệu ẩn danh như thế nào?
Dữ liệu ẩn danh là dữ liệu thực, nhưng không liên quan đến một hộ gia đình, hoặc dữ liệu đã tổng hợp theo cách nào đó.
Dữ liệu tổng hợp là dữ liệu giả trông giống như dữ liệu thật. Người ta có thể thêm siêu dữ liệu vào đó, chẳng hạn như quyền sở hữu công nghệ cacbon thấp hoặc xếp hạng hiệu suất năng lượng (Thiết kế, Mua sắm và Xây dựng - EPC), v.v.
Tất nhiên, người ta có thể làm điều đó với dữ liệu ẩn danh nhưng thách thức lại quay trở lại với quyền riêng tư. Càng thêm nhiều siêu dữ liệu, quyền riêng tư của dữ liệu nguồn càng bị đe dọa. Với dữ liệu tổng hợp, vì trông có vẻ thật nhưng hoàn toàn là nhân tạo, nên nguồn gốc ban đầu không bao giờ có thể nhận dạng được vì nó không chỉ dựa trên một nguồn mà dựa trên tất cả các hộ gia đình trong tập dữ liệu. Do đó, nó mang tính đại diện.
Lợi ích của dữ liệu tổng hợp là gì?
Đối với các nhu cầu cụ thể như lập hoá đơn và hỗ trợ khách hàng, rõ ràng là cần có dữ liệu thực, nhưng đối với mọi thứ khác, dữ liệu tổng hợp là sự thay thế tuyệt vời và thực sự mang lại nhiều lợi ích hơn vì có thể tạo dữ liệu nhanh hơn mà không bị hạn chế về quyền truy cập.
Với dữ liệu tổng hợp, mô hình có thể tạo ra nhiều đường cong tiêu thụ khác nhau cho cùng một đầu vào, sử dụng tất cả các tập dữ liệu khớp với các đầu vào đó và ở mức độ ít hơn là các tập dữ liệu gần khớp với chúng. Điều này quan trọng vì cuối cùng mỗi hộ gia đình có một đường cong thực tế khác nhau. Điều này là cần thiết trong quy hoạch năng lượng, bởi lẽ chúng ta không thể chỉ dựa vào các giá trị trung bình, mà cần hiểu hành vi ở cấp độ cá nhân để mô hình hóa cách quản lý hiệu quả.
Một lợi ích khác là vì nó có tính tạo sinh, người ta có thể tạo ra quần thể hộ gia đình của riêng mình và những quần thể đó không chỉ là của ngày hôm nay mà còn là những quần thể có thể trông như thế nào trong tương lai. Ví dụ như, chúng ta có thể lấy một quần thể và thêm khoảng 20% EV nữa để tạo ra kịch bản giả định trong tương lai, đây là điều khó thực hiện với dữ liệu thực tế.
Điểm khác biệt nữa là dữ liệu tổng hợp có khả năng mở rộng nên chúng ta có thể tiếp cận toàn bộ các quần thể chứ không chỉ một số tập hợp con.
Dữ liệu tổng hợp đã áp dụng vào những trường hợp sử dụng nào?
Trung tâm cấp năng lượng Net Zero đã nhận được rất nhiều sự quan tâm đến Faraday và cho đến nay, mặc dù vẫn còn ở giai đoạn đầu, nhưng hiện tại một nhóm đa dạng bao gồm các nhà nghiên cứu, các nhà hoạch định chính sách và các nhà điều hành hệ thống đang sử dụng nó.
Ngoài bản phát hành nguồn mở thông qua LF Energy, Trung tâm cấp năng lượng Net Zero còn có nhiều người dùng bên ngoài trên phiên bản Faraday mà trung tâm đang điều khiển. Một trường hợp sử dụng phổ biến là mô hình hóa tác động của nhiều công nghệ khác nhau lên lưới điện, chẳng hạn như máy bơm nhiệt và EV, và cách các đường cong tiêu thụ có thể thay đổi ra sao ở các khu vực cụ thể.
Chúng tôi cũng đã thấy Faraday dùng để mô hình hóa tác động của việc xây dựng các tòa nhà mới trong một khu vực hiện có và cách chúng có thể dẫn đến những tắc nghẽn trên lưới điện, và để mô hình hóa tác động của biểu giá điện thông minh và thời tiết đối với lưới điện.
Cuối cùng, các khả năng là vô tận và chúng tôi kỳ vọng thấy một dải rộng các trường hợp sử dụng đa dạng xuất hiện.
Các bước tiếp theo là gì?
Dữ liệu mà chúng tôi đã công bố có lẽ hữu ích nhất đối với các nhà nghiên cứu thường không có quyền truy cập dữ liệu công tơ thông minh. Chúng tôi hy vọng rằng với cộng đồng OpenSynth, nhiều người sẽ bắt đầu tạo dữ liệu tổng hợp và đóng góp lại cho cộng đồng và sau đó chúng tôi sẽ có được một tập dữ liệu thực sự đa dạng.
Ví dụ, các công ty điện lực có thể sử dụng công nghệ này để xem xét các đường cong tiêu thụ của khách hàng không thuộc cơ sở khách hàng của mình hoặc ở những quốc gia mà công ty không hoạt động.
Các công ty như SSEN và UK Power Networks cùng nhiều công ty khác đã bắt đầu mở các sáng kiến dữ liệu và càng có nhiều dữ liệu có thể cung cấp thì càng tốt. Nhưng như tôi đã đề cập, có những thách thức tiềm ẩn về quyền riêng tư với dữ liệu công tơ thông minh thực tế và ít có khả năng dữ liệu đó có thể chia sẻ với siêu dữ liệu đủ để hữu ích cho nhiều kịch bản mô hình hóa.
Đó chính là điểm mà chúng tôi đặc biệt đánh giá cao ở dữ liệu tổng hợp – khả năng cắt và chia nhỏ các đường cong tiêu thụ, cũng như đính kèm các điểm thông tin khác nhau.
Kể từ khi chúng tôi bắt đầu dự án này, chúng tôi đã nhận được rất nhiều sự quan tâm và yêu cầu truy cập dữ liệu này. Bây giờ chúng tôi rất vui mừng khi thấy các lợi ích của việc nghiên cứu, lập kế hoạch chính sách và cơ sở hạ tầng, và những người khác sử dụng vào những việc mà dữ liệu có thể áp dụng - tất cả đều nhằm hỗ trợ quá trình chuyển dịch năng lượng thành công.
Biên dịch: Phạm Gia Đại
Theo "smart-energy", tháng 2/2025