★ 上海道客網(wǎng)絡(luò)科技有限公司
1 目標(biāo)和概述
近年來,國家提出“中國制造2025計劃”,期望中國的制造業(yè)能從低端制造往高端制造與智能化生產(chǎn)發(fā)展,因此各企業(yè)爭相利用高科技手段來提升產(chǎn)品質(zhì)量, 改進(jìn)產(chǎn)品研發(fā)與制造。部分企業(yè)嘗試?yán)肐oT+AI技術(shù) 來解決生產(chǎn)過程中的質(zhì)量問題,但目前智能質(zhì)量缺陷檢 測手段往往存在以下問題:
(1)為了提高AI檢測缺陷的準(zhǔn)確率,需要不斷人 工介入提取并標(biāo)記缺陷特征,而人工審片存在誤檢、漏 檢等問題,且人工處理效率低下,增加了企業(yè)人力資源 成本,限制了生產(chǎn)效率及質(zhì)量提升。
(2)產(chǎn)品檢測基于IoT技術(shù),數(shù)據(jù)需要傳送到云 端進(jìn)行推理分析,對網(wǎng)絡(luò)時延要求高,工廠現(xiàn)場容易受 到網(wǎng)絡(luò)影響,從而導(dǎo)致識別延時較高。
(3)產(chǎn)線檢測設(shè)備雖然已經(jīng)連接了網(wǎng)絡(luò),但更新 模型所需的運維工作量巨大,并且存在現(xiàn)場維護(hù)成本較 高、遠(yuǎn)程維護(hù)網(wǎng)絡(luò)限制等問題,無法快速更新訓(xùn)練模 型,提升檢測效率。
企業(yè)亟需一套更為優(yōu)越的智能缺陷檢測平臺解決方案,滿足以下目標(biāo):
(1)先進(jìn)性:采用先進(jìn)的架構(gòu)設(shè)計與成熟的開發(fā) 框架,支撐企業(yè)未來整體架構(gòu)優(yōu)化和升級。
(2)靈活性:部署靈活,不強(qiáng)依賴底層硬件環(huán) 境,實現(xiàn)異構(gòu)設(shè)備的兼容及復(fù)用,幫助企業(yè)有效控制成 本。
(3)開放性:通過標(biāo)準(zhǔn)化的開發(fā)與設(shè)計以及完備 的安全體系,將企業(yè)生產(chǎn)數(shù)據(jù)作為數(shù)字資源進(jìn)行沉淀并 復(fù)用,加速企業(yè)數(shù)字化轉(zhuǎn)型。
(4)實用性:貼合實際應(yīng)用場景,幫助企業(yè)有效 降低人工成本,提高生產(chǎn)效率 。
道客基于工業(yè)互聯(lián)網(wǎng)標(biāo)準(zhǔn)層次架構(gòu),以人工智能 與邊緣計算技術(shù)結(jié)合為基礎(chǔ),研發(fā)一套面向工業(yè)互聯(lián)網(wǎng) 智能工廠質(zhì)量智能分析的云邊協(xié)同智能缺陷檢測平臺, 實現(xiàn)質(zhì)量缺陷檢測模型一站式開發(fā)與運用、提升工作效 率、加速企業(yè)智能化數(shù)字工廠場景落地,促進(jìn)智能邊緣 處理技術(shù)成果轉(zhuǎn)化和產(chǎn)品研發(fā)與推廣。
業(yè)務(wù)流程如圖1所示。
圖1 業(yè)務(wù)流程圖
該方案對比其他以往傳統(tǒng)的智能缺陷檢測系統(tǒng)有三 大改進(jìn)特點:
(1)基于云原生的邊緣計算資源管理技術(shù)。
(2)基于云邊協(xié)同的模型訓(xùn)練及推理的全生命周期 管理技術(shù)。
(3)基于云原生的容器化部署及生產(chǎn)力管理技術(shù)。
2 方案介紹
2.1 系統(tǒng)架構(gòu)
此云邊協(xié)同智能缺陷檢測平臺的系統(tǒng)架構(gòu)如圖2所示。
圖2 系統(tǒng)架構(gòu)圖
以下各軟硬件子系統(tǒng)基于云邊協(xié)同,共同完成智能缺陷檢測的業(yè)務(wù)流程:
(1)終端設(shè)備:采集工廠生產(chǎn)數(shù)據(jù)(圖片、視 頻、時序數(shù)據(jù))。
(2)邊緣節(jié)點:
· 承擔(dān)邊緣算力進(jìn)行AI推理。通過云邊協(xié)同能力,實現(xiàn)邊端數(shù)據(jù)上傳給云端。
· 通過邊緣管理平臺自動化運維能力,實現(xiàn)將模型以容器化方式自動更新到邊緣端,完成AI推理能力的更新。
(3)AI PaaS平臺:迭代訓(xùn)練,提高推理模型的識別精度和準(zhǔn)確度。
(4)業(yè)務(wù)云平臺:實現(xiàn)缺陷檢測分析的服務(wù)化能力。
2.2 云邊協(xié)同平臺功能架構(gòu)
云邊協(xié)同平臺的具體功能架構(gòu)如圖3所示。
圖3 功能架構(gòu)圖
該云邊協(xié)同平臺主要功能包括:
(1)邊緣節(jié)點統(tǒng)一管理:支持批量接入海量的 邊緣節(jié)點,兼容X86、ARM32、ARM64等芯片異構(gòu)硬 件;相同類型的節(jié)點通過預(yù)安裝證書和配置文件,開機(jī) 聯(lián)網(wǎng)后即可完成節(jié)點的納管,提高節(jié)點管理效率并降低 運維成本。
(2)應(yīng)用全生命周期管理:支持云端以鏡像的方 式將模型、應(yīng)用下發(fā)到邊緣節(jié)點;聲明式API配置規(guī)則 策略,自動化批量部署應(yīng)用到邊緣節(jié)點;云端統(tǒng)一對應(yīng) 用進(jìn)行全生命周期管理、監(jiān)控和運維。
(3)邊緣設(shè)備管理:支持MQTT、Modbus協(xié)議 的設(shè)備接入;支持通過孿生屬性對設(shè)備進(jìn)行控制;并可 以監(jiān)控設(shè)備運行狀態(tài)。
(4)邊緣自治:當(dāng)應(yīng)用實例出現(xiàn)異常或節(jié)點故障 時,能夠快速將應(yīng)用實例調(diào)度到節(jié)點組中其它可用的節(jié) 點上運行;即使在節(jié)點處于離線狀態(tài)時仍然能夠自動調(diào) 度,確保應(yīng)用的自主運行,保障業(yè)務(wù)的持續(xù)性;云邊重 連后,支持邊緣側(cè)數(shù)據(jù)斷點續(xù)傳,減輕網(wǎng)絡(luò)傳輸壓力。
(5)邊緣智能管理:通過云端AI PaaS平臺進(jìn)行 迭代訓(xùn)練,提高推理模型的識別精度和準(zhǔn)確度;通過邊 端算力進(jìn)行AI推理,減少對云邊網(wǎng)絡(luò)依賴及云端資源占 用。支持云端監(jiān)控模型驗證情況,通知用戶進(jìn)行模型下 發(fā)部署、增量更新,減少運維工作量。
(6)數(shù)據(jù)協(xié)同管理:邊緣端采集的工廠設(shè)備數(shù)據(jù)可通過云邊數(shù)據(jù)通道,自動同步至云端;邊端數(shù)據(jù)經(jīng)過數(shù) 據(jù)路由組件處理后,可轉(zhuǎn)發(fā)到云端或第三方應(yīng)用,實現(xiàn) 邊端數(shù)據(jù)共享與開放,實現(xiàn)對各業(yè)務(wù)場景的決策支撐。
2.3 技術(shù)設(shè)計方案
(1)數(shù)據(jù)采集(模塊技術(shù)設(shè)計如圖4所示)
· 通過定制化設(shè)備Mapper,實現(xiàn)端設(shè)備與邊緣節(jié) 點的控制/數(shù)據(jù)平面打通。
· 通過邊緣消息組件實現(xiàn)設(shè)備與設(shè)備、設(shè)備與應(yīng)用 的邊-端的控制/數(shù)據(jù)協(xié)同。
圖4 數(shù)據(jù)采集設(shè)計圖
(2)數(shù)據(jù)協(xié)同(模塊技術(shù)設(shè)計如圖5所示)
· 通過云邊數(shù)據(jù)通道,實現(xiàn)云-邊數(shù)據(jù)協(xié)同,將邊端產(chǎn)生的實時數(shù)據(jù)自動同步云端。
· 通過數(shù)據(jù)路由組件,對邊端數(shù)據(jù)在云端共享與開放,實現(xiàn)對各個云端業(yè)務(wù)場景的決策支撐。
圖5 數(shù)據(jù)協(xié)同設(shè)計圖
(3)模型協(xié)同(模塊技術(shù)設(shè)計如圖6所示)
· 對邊端采集的圖片數(shù)據(jù)實時分析,通過難例算法 評估出需回傳云端數(shù)據(jù),減少云端模型標(biāo)注/訓(xùn)練的工 作量。
· 通過云端AI任務(wù)協(xié)調(diào)管理,觸發(fā)云端訓(xùn)練任務(wù), 并監(jiān)控模型驗證情況,通知用戶進(jìn)行模型的部署管理, 實現(xiàn)模型增量更新,減少人工運維工作量。
圖6 模型協(xié)同設(shè)計圖
(4)模型部署(模塊技術(shù)設(shè)計如圖5所示)
· 通過DevOps實現(xiàn)無基礎(chǔ)設(shè)施相關(guān)性的AI模型部署;
· 通過建立云邊消息通道實現(xiàn)邊緣模型的部署控制;
· 通過建立云邊數(shù)據(jù)通道實現(xiàn)模型的下載及增量更新。
圖7 模型部署設(shè)計圖
(5)數(shù)據(jù)安全
· 支持云邊雙向TLS加密通信,實現(xiàn)數(shù)據(jù)加密傳 輸;
· 支持多租戶管理,實現(xiàn)租戶間數(shù)據(jù)隔離;
· 提供審計日志,保障用戶操作可追溯。
3 代表性及推廣價值
幫助電力行業(yè)某大型企業(yè)搭建了一套服務(wù)于集團(tuán)內(nèi) 部的云邊協(xié)同智能缺陷檢測平臺,協(xié)助企業(yè)采集各產(chǎn)線 的生產(chǎn)數(shù)據(jù),通過云邊協(xié)同技術(shù)提升AI模型的精度與準(zhǔn) 確度,沉淀出各類高技術(shù)含量的數(shù)字資產(chǎn),并向云端其 他應(yīng)用開放共享,幫助企業(yè)提高整體生產(chǎn)效率及生產(chǎn)質(zhì) 量,實現(xiàn)降本增效。
3.1 企業(yè)收益
(1)通過邊緣AI推理,提高評片效率與準(zhǔn)確率, 降低企業(yè)成本。
(2)極大地減少人工介入,自動審片效率成倍提 高。
(3)根據(jù)數(shù)據(jù)的難例分析,實現(xiàn)模型的云邊協(xié)同 訓(xùn)練,使得模型不斷迭代更新,提高識別精度。
(4)平臺與其他系統(tǒng)互聯(lián)互通,實現(xiàn)數(shù)據(jù)同享、 信息互通,可以根據(jù)結(jié)論報告進(jìn)行溯源,實現(xiàn)檢測閉環(huán)。
3.2 創(chuàng)新性
(1)基于云原生實現(xiàn)模型DevOps管理:基于云 原生技術(shù)支撐模型的標(biāo)注、訓(xùn)練、構(gòu)建、部署全生命周 期流程,提高模型開發(fā)效率。
(2)基于云邊協(xié)同調(diào)度實現(xiàn)模型的自動化AI增量 學(xué)習(xí):通過云邊協(xié)同框架實現(xiàn)數(shù)據(jù)自動化上傳,從而實 現(xiàn)模型的自動化增量訓(xùn)練學(xué)習(xí),減少AI模型開發(fā)工作 量。
(3)通過邊緣應(yīng)用容器化改造降低AI運行環(huán)境運 維難度:在邊緣端使用容器封裝技術(shù),將AI模型依賴運 行時庫封裝到獨立環(huán)境中,減少每次模型更新部署的運 維難度。
(4)通過邊緣容器管理引擎實現(xiàn)邊端應(yīng)用的高可 用:使用邊緣資源管理引擎,實現(xiàn)邊緣應(yīng)用高可用及離 線自治能力,從而減少邊端業(yè)務(wù)故障發(fā)生概率。
3.3 方案價值
(1)推動技術(shù)或商業(yè)模式創(chuàng)新
依托云原生技術(shù)體系,將企業(yè)數(shù)字化基礎(chǔ)設(shè)施下沉 至生產(chǎn)活動現(xiàn)場,圍繞邊緣節(jié)點自治、應(yīng)用&模型一體 化管理以及生產(chǎn)活動數(shù)據(jù)對接三個核心維度,加強(qiáng)云邊-端的聯(lián)系,消除技術(shù)棧的不一致性。
(2)賦能產(chǎn)業(yè)高質(zhì)量發(fā)展
在工業(yè)視覺、工業(yè)AI檢測等業(yè)務(wù)場景中,能夠為 這些客戶提供與云端技術(shù)棧保持一致的邊緣數(shù)字化基礎(chǔ) 設(shè)施,提高云邊協(xié)同的效率,并且降低運維管理成本。 將數(shù)據(jù)處理、業(yè)務(wù)應(yīng)用、AI模型等下沉到邊緣端執(zhí)行, 解決物聯(lián)網(wǎng)落地時響應(yīng)實時性、數(shù)據(jù)隱私性、維護(hù)便利 性等問題,從而滿足行業(yè)數(shù)字化在敏捷聯(lián)接、實時業(yè) 務(wù)、數(shù)據(jù)優(yōu)化、應(yīng)用智能、安全與隱私保護(hù)等方面的關(guān) 鍵需求。
摘自《自動化博覽》2023年第2期暨《邊緣計算2023專輯》