★上海華瑞眾信技術(shù)有限公司 田海濤,唐俊
摘要: 隨著重點用能單位能耗在線監(jiān)測系統(tǒng)建設的逐步推進,覆蓋1萬家以上重 點用能單位的能耗在線監(jiān)測系統(tǒng)正面臨著企業(yè)能耗上報數(shù)據(jù)質(zhì)量低、持續(xù)性差、 企業(yè)端系統(tǒng)運維管理工作開展不力等諸多問題,無法為?。ㄊ校┘壒?jié)能主管部門 以及國家發(fā)改委、能源局等宏觀政策制定部門提供有效數(shù)據(jù)支撐。本文通過對數(shù) 據(jù)源、數(shù)據(jù)流、數(shù)據(jù)關(guān)鍵節(jié)點的深入分析,提出了一種在企業(yè)端進行數(shù)據(jù)質(zhì)量提 升治理的軟件算法,并在云平臺引入了數(shù)據(jù)質(zhì)量評價指標的綜合解決方案,通過 云邊協(xié)同應用技術(shù)實現(xiàn)了數(shù)據(jù)質(zhì)量提升的目標。
關(guān)鍵詞:數(shù)據(jù)質(zhì)量;數(shù)據(jù)治理;評價指標;云邊協(xié)同
Abstract: With the gradual advancement of the construction of the online monitoring system for energy consumption of key energy-consuming units, the online monitoring system for energy consumption covering more than 10,000 key energy-consuming units is facing many problems such as low quality of the reported data of energy consumption of enterprises, poor sustainability, and ineffective implementation of the operation and maintenance management of the enterprise-end system. The system cannot be used by the provincial (municipal) energy conservation authorities and the National Development and Reform Commission The energy bureau and other macro-policymaking departments provide effective data support. After an in-depth analysis of data sources, data flows, and key data nodes, this paper proposes a software algorithm for data quality improvement governance at the enterprise end, introduces a comprehensive solution of data quality evaluation indicators on the cloud platform, and achieves the goal of data quality improvement through cloud-side collaborative application technology.
Key words: Data quality; Data governance; Evaluation indicators; Cloudedge collaboration
1 引言
隨著重點用能單位能耗在線監(jiān)測企業(yè)端系統(tǒng)建設數(shù) 量的不斷增加,各省級能耗在線監(jiān)測系統(tǒng)平臺對企業(yè)端 實時上報的企業(yè)能耗數(shù)據(jù)質(zhì)量越來越重視,各地節(jié)能主 管部門相繼發(fā)文要求重點用能單位重視企業(yè)端系統(tǒng)的運 維管理工作并提高能耗數(shù)據(jù)上報質(zhì)量,為國家節(jié)能主管 部門基于數(shù)字化平臺上的重點用能單位能源消費總量數(shù) 據(jù)做宏觀決策分析提供重要的輔助支撐,同時也為我國 碳達峰、碳中和政策的落地實施提供扎實的數(shù)據(jù)依據(jù)。
因此,基于邊緣計算平臺的企業(yè)端數(shù)據(jù)質(zhì)量治理與 提升工作將會是下一階段的工作重點,本文在詳細梳理 了重點用能單位能耗在線監(jiān)測系統(tǒng)的技術(shù)框架和數(shù)據(jù)質(zhì) 量不高的表現(xiàn)形式以及分析了深層次原因后,提出了一 套切實可行的數(shù)據(jù)質(zhì)量治理解決方案。
2 系統(tǒng)概述
重點用能單位能耗在線監(jiān)測系統(tǒng)是國家發(fā)改委和質(zhì) 檢總局聯(lián)合發(fā)文推動的針對年消耗10000噸(部分地市 按5000噸統(tǒng)計)標準煤的約1.6萬家重點用能單位要求 建設的能源消費總量統(tǒng)計上報的信息化系統(tǒng)。文件要求 企業(yè)側(cè)建設能耗數(shù)據(jù)采集與上報的企業(yè)端系統(tǒng),實現(xiàn)企 業(yè)用能主要指標數(shù)據(jù)上傳?。ㄊ校┘壞芎脑诰€監(jiān)測系統(tǒng) 平臺,再由省(市)級平臺將數(shù)據(jù)匯總上報至國家級能 耗在線監(jiān)測平臺。
該系統(tǒng)建成后服務于各級政府節(jié)能主管部門和重點用能單位。通過建設重點用能單位能耗在線監(jiān)測系統(tǒng),健 全能源計量體系,加強能源消費總量和強度“雙控”形勢 分析和預測預警,推動完成能耗“雙控”目標任務。
3 系統(tǒng)架構(gòu)介紹
重點用能單位能耗在線監(jiān)測系統(tǒng)采用“國家平臺+ 省級平臺+重點用能單位企業(yè)端系統(tǒng)”的三層架構(gòu),為 各部委、各級節(jié)能主管部門和質(zhì)監(jiān)部門、重點用能單位 等用戶提供不同層次的服務,其具體架構(gòu)如圖1所示。
圖1 系統(tǒng)架構(gòu)圖
重點用能單位企業(yè)端系統(tǒng)由能耗在線監(jiān)測端設備、 計量器具、工業(yè)控制系統(tǒng)、生產(chǎn)監(jiān)控管理系統(tǒng)、管理信 息系統(tǒng)、通信網(wǎng)絡及相應的管理軟件等組成,部署在重 點用能單位內(nèi)部,由重點用能單位負責建設,主要為用 能單位提供能源管理服務。企業(yè)端系統(tǒng)架構(gòu)如圖2所示。
圖2 企業(yè)端系統(tǒng)架構(gòu)圖
自2018年5月一系列重點用能單位能耗在線監(jiān)測系 統(tǒng)建設標準技術(shù)規(guī)范發(fā)布及全國性標準宣貫培訓活動 啟動后,全國各地掀起了企業(yè)端系統(tǒng)及省級平臺的建設 熱潮。截至2021年底,全國共建成超過1萬家重點用能 單位企業(yè)端系統(tǒng)和26個?。ㄊ校┘壞芎脑诰€監(jiān)測系統(tǒng) 平臺,85%以上企業(yè)端系統(tǒng)實現(xiàn)了數(shù)據(jù)采集與上報至省 (市)級平臺或國家平臺的建設目標。
國家發(fā)改委在《關(guān)于進一步加快推進重點用能單位 能耗在線監(jiān)測系統(tǒng)建設的通知》中明確提出,加快提升 數(shù)據(jù)質(zhì)量,加強數(shù)據(jù)管理,著力提升數(shù)據(jù)傳輸穩(wěn)定性、 連續(xù)性;拓展和鞏固能耗數(shù)據(jù)來源渠道,探索打破信息 孤島和數(shù)據(jù)壁壘,逐步建立跨行業(yè)、跨部門數(shù)據(jù)共享機 制;對系統(tǒng)數(shù)據(jù)質(zhì)量進行核查,及時剔除異常數(shù)據(jù),確 保所傳數(shù)據(jù)真實、準確、有效。
4 數(shù)據(jù)質(zhì)量評價指標
4.1 數(shù)據(jù)質(zhì)量評價指標國家標準
根據(jù)國家標準《信息技術(shù) 數(shù)據(jù)質(zhì)量評價指標》 GB/T 36344-2018中對數(shù)據(jù)質(zhì)量評價指標的定義,通用 性評價指標有6種,如圖3所示。
圖3 數(shù)據(jù)質(zhì)量評價指標框架
(1)規(guī)范性:數(shù)據(jù)符合數(shù)據(jù)標準、數(shù)據(jù)模型、業(yè) 務規(guī)則、元數(shù)據(jù)或權(quán)威參考數(shù)據(jù)的程度。
(2)完整性:按照數(shù)據(jù)規(guī)則要求,數(shù)據(jù)元素被賦 予數(shù)值的程度。
(3)準確性:數(shù)據(jù)準確標識其所描述的真實實體 (實際對象)真實值的程度。
(4)一致性:數(shù)據(jù)與其他特定上下文中使用的數(shù) 據(jù)無矛盾的程度。
(5)時效性:數(shù)據(jù)在時間變化中的正確程度。
(6)可訪問性:數(shù)據(jù)能被訪問的程度。
4.2 企業(yè)實時能耗數(shù)據(jù)質(zhì)量評價標準
做好重點用能單位能耗數(shù)據(jù)質(zhì)量評價,需要理清企業(yè)實時數(shù)據(jù)來源、數(shù)據(jù)流經(jīng)環(huán)節(jié)、數(shù)據(jù)利用方式等基本 信息,再從兩個層面進行深度分析。首先是企業(yè)端側(cè)的 各種數(shù)據(jù)源(各種計量器具、工業(yè)信息化系統(tǒng)、智能傳 感器等)生成的實時數(shù)據(jù)以工業(yè)現(xiàn)場總線、工業(yè)以太網(wǎng) 等傳輸介質(zhì)傳輸至企業(yè)端設備系統(tǒng),企業(yè)端系統(tǒng)對數(shù)據(jù) 進行準確性、完整性、可靠性校驗并根據(jù)數(shù)據(jù)上報要求 對數(shù)據(jù)進行封裝后按上報協(xié)議上傳至?。ㄊ校┘壠脚_; 第二個層面是?。ㄊ校┘壠脚_對所轄區(qū)域內(nèi)的重點用能 單位上報的一定時間內(nèi)的能耗數(shù)據(jù)進行完整性、上報 率、時效性、可用性等指標的量化評價與分析,并生成 數(shù)據(jù)質(zhì)量報告。
圖4 能耗在線監(jiān)測系統(tǒng)數(shù)據(jù)流向圖
常規(guī)的企業(yè)端系統(tǒng)設計模式是將各種數(shù)據(jù)源的高頻 實時數(shù)據(jù),經(jīng)過數(shù)據(jù)采集與實時存儲功能模塊將數(shù)據(jù)錄 入到實時數(shù)據(jù)庫中,再通過能耗數(shù)據(jù)上報軟件對采集數(shù) 據(jù)項進行能耗數(shù)據(jù)編碼匹配設定,然后按照數(shù)據(jù)上報標 準技術(shù)規(guī)范要求完成實時能耗數(shù)據(jù)上報功能。
看似流暢合理的數(shù)據(jù)處理過程,在實際項目運行過 程中會由于多種預期之外的異常情況而產(chǎn)生大量的異常 數(shù)據(jù),主要表現(xiàn)在以下幾個方面:
(1)計量器具自身穩(wěn)定性原因以及受通信網(wǎng)絡信 號干擾導致的數(shù)據(jù)異常擾動;
(2)自動化系統(tǒng)軟件及服務(尤其是OPC Server 服務)間歇性故障導致的數(shù)據(jù)不能穩(wěn)定推送帶來的異 常;
(3)企業(yè)端系統(tǒng)的數(shù)據(jù)采集插件不具備數(shù)據(jù)過濾 與清洗功能導致異常數(shù)據(jù)錄入數(shù)據(jù)庫,給區(qū)間消費量統(tǒng) 計分析工作帶來極大不便,影響數(shù)據(jù)上報的準確性。目 前大部分企業(yè)端系統(tǒng)軟件均不具備數(shù)據(jù)深度處理及數(shù)據(jù) 治理能力;
(4)部分數(shù)據(jù)存儲記錄不連續(xù)導致的部分能耗采 集數(shù)據(jù)項定時上報指標不完整,影響企業(yè)數(shù)據(jù)上報的完 整性;
(5)企業(yè)端系統(tǒng)因操作系統(tǒng)故障、硬件不穩(wěn)定等 因素導致不能持續(xù)穩(wěn)定運行,進而影響企業(yè)能耗數(shù)據(jù)上 報率指標。
以上所列的幾種現(xiàn)象為企業(yè)端系統(tǒng)在實際運行過程 中比較常見的異常情況,還有諸如計量器具更換導致的 數(shù)據(jù)不能步進累加、手工填報數(shù)據(jù)滯后導致的月度消耗 數(shù)據(jù)統(tǒng)計不完整、?。ㄊ校┘壠脚_同時接收多企業(yè)能耗 數(shù)據(jù)時并發(fā)處理能力不足導致的數(shù)據(jù)上報失敗等多種原 因都會對能耗數(shù)據(jù)上報質(zhì)量產(chǎn)生影響。
綜上,重點用能單位能耗數(shù)據(jù)上報的數(shù)據(jù)質(zhì)量評價 根據(jù)其采集與上報的數(shù)據(jù)特征、數(shù)據(jù)獲取方式及數(shù)據(jù)價 值利用規(guī)則,可以采用時效性、完整性、準確性、上報 率這4個關(guān)鍵性指標作為評價企業(yè)實時能耗數(shù)據(jù)質(zhì)量高 低的評價標準。
從數(shù)據(jù)產(chǎn)生到傳遞的過程看,重點用能單位能耗在 線監(jiān)測系統(tǒng)的數(shù)據(jù)質(zhì)量提升的關(guān)鍵點在于企業(yè)端系統(tǒng)的 數(shù)據(jù)治理能力,即在數(shù)據(jù)產(chǎn)生及存儲過程的源頭進行治 理,可以有效提升系統(tǒng)數(shù)據(jù)質(zhì)量。對企業(yè)端系統(tǒng)的數(shù)據(jù) 流向所涉及的各關(guān)鍵環(huán)節(jié)進行節(jié)點分析,可以找到影響 數(shù)據(jù)上報質(zhì)量的關(guān)鍵因子,如圖5所示。
圖5 多維度數(shù)據(jù)質(zhì)量管理
5 數(shù)據(jù)質(zhì)量提升解決方案
能耗在線監(jiān)測企業(yè)端系統(tǒng)的數(shù)據(jù)質(zhì)量提升工作需要 在原有企業(yè)端系統(tǒng)內(nèi)加入數(shù)據(jù)治理軟件包,從數(shù)據(jù)采集 插件送入實時數(shù)據(jù)庫的數(shù)據(jù)開始進行治理,包含數(shù)據(jù)預 處理、數(shù)據(jù)工程處理、數(shù)據(jù)應用處理等幾個業(yè)務模塊, 以鏈式數(shù)據(jù)管道處理模式建立一條主數(shù)據(jù)流水線,以元 數(shù)據(jù)為基礎構(gòu)建數(shù)據(jù)基礎模型,源數(shù)據(jù)經(jīng)過數(shù)據(jù)清洗與 過濾、模式識別與數(shù)據(jù)標識、數(shù)據(jù)分析與運算、數(shù)據(jù)插 值與補償?shù)纫幌盗袛?shù)據(jù)治理策略,再根據(jù)業(yè)務應用模型 需要進行數(shù)據(jù)應用屬性及工程參量定義與關(guān)聯(lián)匹配,經(jīng) 過處理的有效能耗數(shù)據(jù)進入到時序數(shù)據(jù)庫后,再根據(jù)業(yè) 務應用需要由數(shù)據(jù)上報插件完成數(shù)據(jù)上報任務。具備數(shù)據(jù)治理能力的企業(yè)端系統(tǒng)數(shù)據(jù)流向如圖6所示。
圖6 疊加數(shù)據(jù)治理軟件包的企業(yè)端系統(tǒng)數(shù)據(jù)流向圖
為進一步提升能耗在線監(jiān)測系統(tǒng)的數(shù)據(jù)質(zhì)量提升 效力與企業(yè)端系統(tǒng)的運維時效性,有必要借助云邊協(xié)同 應用技術(shù)與基于MQTT協(xié)議的數(shù)據(jù)訂閱與發(fā)布機制,建 立一套能耗實時數(shù)據(jù)上報消息推送系統(tǒng),以實現(xiàn)能耗數(shù) 據(jù)上報成功與否的即時消息推送,方便運維管理單位及 重點用能單位第一時間掌握數(shù)據(jù)上報動態(tài)。同時,該系 統(tǒng)還可增加企業(yè)邊緣側(cè)的各項異常信息推送服務,為故 障診斷分析提供更加有價值的參考信息。該系統(tǒng)架構(gòu)原 理圖如圖7所示。
圖7 基于云邊協(xié)同應用技術(shù)的能耗數(shù)據(jù)上報即時消息推送系統(tǒng)
基于該系統(tǒng),企業(yè)端系統(tǒng)能耗數(shù)據(jù)上報軟件在完成 每日數(shù)據(jù)上報任務后,自行將數(shù)據(jù)上報狀態(tài)、數(shù)據(jù)上報 完整度、數(shù)據(jù)上報異常狀況等消息推送至云服務平臺, 關(guān)注并訂閱了特定企業(yè)端系統(tǒng)的用戶便可以第一時間接 收到平臺推送的消息。系統(tǒng)建設及運維單位的工程技術(shù) 人員可以同時訂閱多個相關(guān)的自建企業(yè)端系統(tǒng)主題消 息,當發(fā)現(xiàn)企業(yè)端系統(tǒng)有數(shù)據(jù)上報異?;蚬收舷⒑螅?可以及時開展遠程故障診斷與數(shù)據(jù)補報操作,提高了企 業(yè)端系統(tǒng)運維管理效率及能耗數(shù)據(jù)上報質(zhì)量。
6 平臺側(cè)數(shù)據(jù)質(zhì)量評價方法
在解決了企業(yè)端的能耗實時數(shù)據(jù)質(zhì)量問題之后,省 (市)級能耗在線監(jiān)測平臺需要一套行之有效的企業(yè)能 耗數(shù)據(jù)質(zhì)量的評價體系及方法,用于評價所轄區(qū)域內(nèi)的 重點用能單位能耗數(shù)據(jù)上報質(zhì)量并公示,進一步督促數(shù) 據(jù)質(zhì)量較差企業(yè)完成數(shù)據(jù)質(zhì)量提升改造工程。
根據(jù)前文所述,以時效性、完整性、準確性、上 報率這4個關(guān)鍵性指標作為評價企業(yè)實時能耗數(shù)據(jù)質(zhì)量 高低的評價標準,在能耗在線監(jiān)測系統(tǒng)從建設初期試運 行階段、驗收后的質(zhì)保服務期、過保后的系統(tǒng)持久運行 期等不同階段,數(shù)據(jù)質(zhì)量評價各項指標的權(quán)重應有所不 同,故需要能耗在線監(jiān)測平臺將指標權(quán)重系數(shù)設計為可 變參量,方便不同階段靈活調(diào)整各指標權(quán)重系數(shù)。系統(tǒng) 初始運行階段參數(shù)設置方法見表1。
表1 評價指標及權(quán)重系數(shù)
(1)完整指標:反映重點用能單位能源消費種類 的指標,采集數(shù)據(jù)項的完整性是最重要的考察指標,該 指標不完整意味著企業(yè)上報的能源消費數(shù)據(jù)不能覆蓋全 部能源品種;
通過實際上報數(shù)據(jù)項個數(shù)與應上報數(shù)據(jù)項個數(shù)的比 值,可以發(fā)現(xiàn)漏報數(shù)據(jù)項指標,查證后通過補報及修正 工程配置的方式進行完整度優(yōu)化。
(2)準確指標:反映重點用能單位實時上報的能源消費數(shù)據(jù)與企業(yè)實際消費情況的一致性程度;
通過計量器具配備率、計量等級、校準及年檢日期 等信息,判定企業(yè)上報的能源消費數(shù)據(jù)是否準確,可以 通過調(diào)優(yōu)或更換更加精準的計量器具實現(xiàn)數(shù)據(jù)準確性指 標提升。
(3)時效指標:反映重點用能單位是否按照標準 技術(shù)規(guī)范要求實時上報數(shù)據(jù)到省(市)級能耗在線監(jiān)測 平臺;
通過該指標可以觀察企業(yè)端系統(tǒng)的運行穩(wěn)定性及系 統(tǒng)運維管理是否得當。
(4)上報率指標:反映企業(yè)在過去一段時間內(nèi) (如30天)成功上報能耗數(shù)據(jù)天數(shù)與實際區(qū)間運行天數(shù) 的比率;
該指標可以真實反映企業(yè)端系統(tǒng)是否處于正常運行 狀況以及企業(yè)端系統(tǒng)與?。ㄊ校┘壠脚_之間的互聯(lián)互通 狀況;持續(xù)的上報率指標過低需要引起重視,大概率表 明該企業(yè)端系統(tǒng)已經(jīng)失去正常運行能力或與?。ㄊ校┘?平臺失聯(lián),需要運維服務單位介入。
7 數(shù)據(jù)利用價值
能耗“雙控”考核是經(jīng)濟規(guī)劃中的約束性指標, 最初出現(xiàn)在“十一五”發(fā)展規(guī)劃綱要中,重點關(guān)注重點 用能單位的能源消費總量和能源消費強度兩項指標。 “十三五”時期,我國正式建立了能耗“雙控”考核制 度,在全國設定能耗強度降低目標和能源消費總量目 標,并將目標分解到各省市自治區(qū),嚴格考核并按季度 進行通報排名。
重點用能單位能耗在線監(jiān)測系統(tǒng)是能耗“雙控”考 核制度中的重要手段,以信息化系統(tǒng)為基礎,以能耗數(shù) 據(jù)上報的高時效性、準確性、完整性為依據(jù),全面落實 能耗“雙控”目標。隨著企業(yè)端系統(tǒng)建設數(shù)量的不斷增 加,企業(yè)端系統(tǒng)上報至各?。ㄊ校┘壠脚_的實時能耗數(shù) 據(jù)量與日俱增,部分?。ㄊ校┕?jié)能主管部門陸續(xù)出臺了 企業(yè)端系統(tǒng)驗收標準技術(shù)規(guī)范(指南)文件,用于指導 企業(yè)端系統(tǒng)項目驗收,希望從源頭把好數(shù)據(jù)質(zhì)量關(guān)。數(shù) 據(jù)質(zhì)量提升已成為當下能耗在線監(jiān)測系統(tǒng)運維管理工作 的重中之重。
8 結(jié)語
在當下互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、萬物互聯(lián)、企業(yè) 數(shù)據(jù)上云業(yè)務應用等新興技術(shù)與應用場景蓬勃發(fā)展的年 代,數(shù)據(jù)治理是數(shù)據(jù)價值變現(xiàn)與數(shù)字化決策的前提,已 成為廣大企業(yè)和政府機構(gòu)的廣泛共識。避免陷入大數(shù)據(jù) 積累演變?yōu)榇蟆袄睌?shù)據(jù)困境,通過數(shù)據(jù)治理策略確 保企業(yè)的數(shù)據(jù)資產(chǎn)得到正確有效及安全地管理,通過對 數(shù)據(jù)源信息資源的有效獲取和科學處理,實現(xiàn)企業(yè)能耗 數(shù)據(jù)有序存儲并上報至?。ㄊ校┘壠脚_,發(fā)揮輔助宏觀 決策分析的應用價值,成為各級節(jié)能主管部門的關(guān)注重 點。
本文中提到的從源頭對數(shù)據(jù)進行數(shù)據(jù)管道式的數(shù) 據(jù)質(zhì)量治理策略,除了適用重點用能單位能耗在線監(jiān) 測系統(tǒng)之外,也適用于工業(yè)互聯(lián)網(wǎng)、數(shù)字化工廠建設 等多種構(gòu)建于云邊協(xié)同技術(shù)架構(gòu)下的應用場景?;?行業(yè)特征數(shù)據(jù)進行數(shù)據(jù)建模與歸類,形成一系列模式 化的數(shù)據(jù)治理規(guī)則引擎,在邊緣側(cè)實現(xiàn)高質(zhì)量的數(shù)據(jù) 流,為大數(shù)據(jù)應用平臺的數(shù)據(jù)分析利用奠定了良好的 數(shù)據(jù)基礎。
作者簡介:
田海濤(1980-),男 ,高級工程師,現(xiàn)任上海華瑞眾 信技術(shù)有限公司總經(jīng)理,研究方向為邊緣計算網(wǎng)關(guān)、 能耗在線監(jiān)測端設備、OT/IT融合應用技術(shù)產(chǎn)品設計與 云邊協(xié)同應用技術(shù)解決方案推廣。
唐 ?。?989-),男,中級工程師,現(xiàn)任上海華瑞眾 信技術(shù)有限公司研發(fā)總監(jiān),研究方向為邊緣計算網(wǎng)關(guān)、 能耗在線監(jiān)測端設備、OT/IT融合應用技術(shù)產(chǎn)品研發(fā)。
摘自《自動化博覽》2023年第2期暨《邊緣計算2023專輯》