如今,大數據不僅登上了技術新聞頭條還占領了流行資訊的版面。然而,與大模擬數據相比,大數據也只是小巫見大巫。美國國家儀器公司(NI)TomBradicich稱,從生產線和產品獲取的模擬數據或稱為物聯網(IoT)使大數據相形見絀。
談到數據,就要考慮流量。首先,要從模擬測量中實時或非實時地獲取數據;然后區分動態數據和靜態數據;最后歸檔數據,并按照數據來源或用途進行描述。如果是監控一個即將起火的電機,數據的實時性至關重要。另一方面,如果是要從三年的數據中分析出其發展趨勢,實時性就可以忽略。
“在測試和測量過程中,我們可能會和IT爭論到底哪種數據更大。”Bradicich表示,“這不僅是看數據量,還得看速度。數據離開NI設備時是動態的,然后到達交換機、服務器或工作站,最后在IT服務器中落腳。隨后,IT會接管這些數據,對其進行分析和歸檔。我們面臨的問題是客戶到底想了解哪一步?是更接近儀器還是最終桌面上的文件。數據的四個傳統變量包括流量、速度、多樣性和價值。我們還為那些需要看到分析結果的人增加了第五個變量-可見性。”
作為一家領先的測量公司,NI已經與數家公司合作準備推出大數據解決方案。鑒于NI研發高級副總裁TomBradicich來自IBM,IBM成為NI最親密的合作伙伴一點也不出乎意料。作為IBM大數據平臺的一部分,IBM的InfoSphereStreams產品可以實時處理海量數據,并允許用戶開發的應用快速吸收、分析和關聯來自數千個實時數據源的信息。該解決方案的數據吞吐量極高,每秒可處理數百萬的事件或消息。
NI的另一個合作伙伴PhasorMeasurement已經研發出一個監控電網的解決方案。Bradicich稱,它每月可以產生5TB數據。一個風力渦輪每天可產生10TB數據,一個噴氣式飛機每小時可產生20TB數據。這些快速流動的數據很容易堆疊起來。
DukeEnergy也建成了一個監控和分析化石燃料發電廠數據的系統。傳統方法是將手持數據采集設備的狀態監測專家送到每個站點,這些專家將花費80%的時間收集數據而他們實際分析數據的時間僅有20%。如果部署了大模擬數據解決方案,預防維護專家就可以行程觀看設備和記錄異常指數,如果需要的話就將這些指數與故障指數數據庫中的信息對比,然后更及時地采取糾正操作。
在你深入探究一個流行詞的時候,有時你會發現解決一些棘手問題的方法。因此,不要被各種各樣的大數據弄得不知所措,或許你可以利用它解決一些主要的工程問題。(Shirley譯)