虹科方案|数据流智能分析软件-数据的转换与协调
工業大數據日漸成為工業發展最寶貴的戰略資源,全球工業大數據的競爭變得愈發激烈。但是工業數據采集過程中面臨的痛點較多,因設備不互聯、通信協議不兼容等問題,造成數據不匹配、不互認,數據孤島現象普遍,降低了數據的使用率。這些問題需要數據轉換和協調技術來解決,虹科流分析解決方案是解決這類問題的最佳工具。
虹科流分析解決方案包括以下兩部分
1 數據轉換
轉換和協調是密切相關的,進行數據協調之前,需要針對不同的數據來源進行數據格式轉換,將它們轉換成一種通用的格式。下面介紹兩種典型的轉換。
轉換可分為結構轉換和內容轉換兩大類。
結構轉換
只處理數據的格式,例如:等級結構,數組,對象,命名約定。
數據結構的轉換形式取決于您的需求,可根據數據的輸入/輸出格式任意轉換。
內容轉換
改變數據的實際內容,例如:縮放值(如更改單位),改變分辨率/采樣率,刪除異常值和缺失值,消除噪音。
下面我們將舉例說明:
我們想得到PLC中寄存器5在每一秒的值,并存儲在數據庫中。來自 PLC 的數據如下:
[
{“Name”: “Reg1”, “Value”: 77},
{“Name”: “Reg2”, “Value”: 935},
{“Name”: “Reg3”, “Value”: “True”},
{“Name”: “Reg4”, “Value”: 18594},
{“Name”: “Reg5”, “Value”: “Good”}
]
每個寄存器得到一個對象數組,每個對象都有相應的“Name”和“Value”屬性。
數據庫需要鍵/值映射,以便在添加新數據行時將值映射到正確的列。我們想要的輸出應該是這樣的:
{
“Temperature”: 25,
“RPM”: 935,
“Running”: true,
“Pressure”: 12.5,
“Quality”: “Good”
}
讓我們看看我們需要做什么來得到這個輸出,從我們采集的輸入數據開始。
1.首先是結構轉換:
· 必須將具有名稱/值屬性的數組更改為具有鍵/值對的對象
· 我們從PLC得到的名稱必須替換為數據庫中正確的列名
2.還需進行內容轉換:
· 從PLC 得到的溫度值需要進行單位轉換。采集到的溫度數據是以華氏度為單位,而數據庫需要攝氏度
· 運行狀態以字符串的形式傳遞,而數據庫需要一個布爾值
· 壓力值作為一個范圍為0-65535的16位整數傳遞,而它實際上表示一個在0-100psi之間的模擬值,因此要進行縮放。
此示例顯示了在處理機器數據時可能遇到的一些基本轉換。通過使用虹科Crosser模塊庫的標準函數的虹科流分析系統,實現這些類型的轉換很容易。上面的轉換將在處理流程中完成,如下:
使用庫中的其他標準模塊,可以將其他轉換添加到上面的流中,例如去除異常值/噪點和改變分辨率(聚合/過濾)。
2 數據協調
當我們擁有不同格式的多個數據源時,數據協調就會發揮作用,我們希望將數據組合起來,以便我們能夠以獨立于原始數據源的相同方式處理數據。為了協調數據,我們通常對每個數據源應用不同的轉換以生成通用格式。
上面的示例還在輸出之前引入了一個轉換。某些情況下,需要將每個輸入轉換為一種優化的格式,以便進行處理,然后在輸出之前再次進行轉換,使數據適應接收系統的要求。每個輸入的轉換類型與上面描述的相同。
在統一來自多個來源的時間序列數據時,可能還有一個必須處理的額外問題: 來自不同來源的數據在不同時間到達或采樣率不同。
根據處理和/或接收系統的要求,我們可能必須按照常用的時間步驟對數據進行校準。這可以通過移動數據(采樣率相同的情況下) ,或者通過插值/聚合數據(采樣率不同的情況下)來實現。
如果數據將與機器學習模型一起使用,這些模型期望每個新樣本都包含來自模型所需要的每個源的數據。當我們在某一時間從一個源丟失數據時,要填充一個值,例如重復最后一個已知值或使用已接收到的數據插值一個值,把數據丟失的影響降到最低。這些功能可以很容易地使用 Crosser 庫中的標準模塊實現。
結論
虹科Crosser提供了實時的數據流分析工具,幫助您增加數據的可用性,提高不同來源的數據匹配度,通過簡單操作,滿足您的處理需求和分析需求,獲得數據優化的洞察力。
附錄
虹科Crosser數據流智能分析軟件是一款能滿足您所有實時需求的平臺。以Crosser云為核心,完成設計和編程過程。Crosser節點配合Crosser云,作為實時引擎,按需安裝在邊緣。虹科數據流智能分析軟件可實現靠近數據源處理數據,解決數據傳輸和延遲問題,并輕松構建節點網絡。
總結
以上是生活随笔為你收集整理的虹科方案|数据流智能分析软件-数据的转换与协调的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: anaconda自带python编辑器_
- 下一篇: 斯坦福大学计算机专业申请要求,美国斯坦福