而且這個(gè)訂閱也應(yīng)該是個(gè)性化的,容許應(yīng)用設(shè)置過濾條件,比如只訂閱某個(gè)物理量五分鐘的平均值。7.和歷史數(shù)據(jù)處理合二為一實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù)的處理要合二為一。實(shí)時(shí)數(shù)據(jù)在緩存里,歷史數(shù)據(jù)在持久化存儲(chǔ)介質(zhì)里,而且可能依據(jù)時(shí)長(zhǎng),保留在不同存儲(chǔ)介質(zhì)里。系統(tǒng)應(yīng)該隱藏背后的存儲(chǔ),給用戶和應(yīng)用呈現(xiàn)的是同一個(gè)接口和界面。無(wú)論是訪問新采集的數(shù)據(jù)還是十年前的老數(shù)據(jù),除輸入的時(shí)間參數(shù)不同之外,其余應(yīng)該是一樣的。8.數(shù)據(jù)持續(xù)穩(wěn)定寫入需要保證數(shù)據(jù)能持續(xù)穩(wěn)定寫入。對(duì)于物聯(lián)網(wǎng)系統(tǒng),數(shù)據(jù)流量往往是平穩(wěn)的,因此數(shù)據(jù)寫入所需要的資源往往是可以估算的。但是變化的是查詢、分析,特別是即席查詢,有可能耗費(fèi)很大的系統(tǒng)資源,不可控。因此系統(tǒng)必須保證分配足夠的資源以確保數(shù)據(jù)能夠?qū)懭胂到y(tǒng)而不被丟失。準(zhǔn)確的說(shuō),系統(tǒng)必須是一個(gè)寫優(yōu)先系統(tǒng)。9.數(shù)據(jù)多維度分析需要對(duì)數(shù)據(jù)支持靈活的多維度分析。對(duì)于聯(lián)網(wǎng)設(shè)備產(chǎn)生的數(shù)據(jù),需要進(jìn)行各種維度的統(tǒng)計(jì)分析,比如從設(shè)備所處的地域進(jìn)行分析,從設(shè)備的型號(hào)、供應(yīng)商進(jìn)行分析,從設(shè)備所使用的人員進(jìn)行分析等等。而且這些維度的分析是無(wú)法事先想好的,而是在實(shí)際運(yùn)營(yíng)過程中,根據(jù)業(yè)務(wù)發(fā)展的需求定下來(lái)的。從設(shè)備所處的地域進(jìn)行分析,從設(shè)備的型號(hào)、供應(yīng)商進(jìn)行分析。舟山智慧路燈物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)軟件開發(fā)
9.數(shù)據(jù)多維度分析需要對(duì)數(shù)據(jù)支持靈活的多維度分析。對(duì)于聯(lián)網(wǎng)設(shè)備產(chǎn)生的數(shù)據(jù),需要進(jìn)行各種維度的統(tǒng)計(jì)分析,比如從設(shè)備所處的地域進(jìn)行分析,從設(shè)備的型號(hào)、供應(yīng)商進(jìn)行分析,從設(shè)備所使用的人員進(jìn)行分析等等。而且這些維度的分析是無(wú)法事先想好的,而是在實(shí)際運(yùn)營(yíng)過程中,根據(jù)業(yè)務(wù)發(fā)展的需求定下來(lái)的。因此物聯(lián)網(wǎng)大數(shù)據(jù)系統(tǒng)需要一個(gè)靈活的機(jī)制增加某個(gè)維度的分析。10.支持?jǐn)?shù)據(jù)計(jì)算需要支持?jǐn)?shù)據(jù)降頻、插值、特殊函數(shù)計(jì)算等操作。原始數(shù)據(jù)的采集可能頻次挺高,但具體分析時(shí),往往不需要對(duì)原始收據(jù)進(jìn)行,而是數(shù)據(jù)降頻之后。系統(tǒng)需要提供高效的數(shù)據(jù)降頻操作。設(shè)備是很難同步的,不同設(shè)備采集數(shù)據(jù)的時(shí)間點(diǎn)是很難對(duì)齊的,因此分析一個(gè)特定時(shí)間點(diǎn)的值,往往需要插值才能解決,系統(tǒng)需要提供線性插值、設(shè)置固定值等多種插值策略才行。工業(yè)互聯(lián)網(wǎng)里,除通用的統(tǒng)計(jì)操作之外,往往還需要支持一些特殊函數(shù),比如時(shí)間加權(quán)平均。衢州智慧城市物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)提供商物聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)量巨大,*中國(guó)而言,就有5億多臺(tái)智能電表,每臺(tái)電表每隔15分鐘采集一次數(shù)據(jù)。
7.和歷史數(shù)據(jù)處理合二為一實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù)的處理要合二為一。實(shí)時(shí)數(shù)據(jù)在緩存里,歷史數(shù)據(jù)在持久化存儲(chǔ)介質(zhì)里,而且可能依據(jù)時(shí)長(zhǎng),保留在不同存儲(chǔ)介質(zhì)里。系統(tǒng)應(yīng)該隱藏背后的存儲(chǔ),給用戶和應(yīng)用呈現(xiàn)的是同一個(gè)接口和界面。無(wú)論是訪問新采集的數(shù)據(jù)還是十年前的老數(shù)據(jù),除輸入的時(shí)間參數(shù)不同之外,其余應(yīng)該是一樣的。8.數(shù)據(jù)持續(xù)穩(wěn)定寫入需要保證數(shù)據(jù)能持續(xù)穩(wěn)定寫入。對(duì)于物聯(lián)網(wǎng)系統(tǒng),數(shù)據(jù)流量往往是平穩(wěn)的,因此數(shù)據(jù)寫入所需要的資源往往是可以估算的。但是變化的是查詢、分析,特別是即席查詢,有可能耗費(fèi)很大的系統(tǒng)資源,不可控。因此系統(tǒng)必須保證分配足夠的資源以確保數(shù)據(jù)能夠?qū)懭胂到y(tǒng)而不被丟失。準(zhǔn)確的說(shuō),系統(tǒng)必須是一個(gè)寫優(yōu)先系統(tǒng)。
數(shù)據(jù)處理:數(shù)據(jù)處理包括實(shí)時(shí)計(jì)算和離線計(jì)算兩種。TIZASTAR采用Storm作為實(shí)時(shí)處理引擎,并在它的基礎(chǔ)上包裝了自己的實(shí)時(shí)計(jì)算服務(wù),可以支持應(yīng)用層的調(diào)度和管理?;趯?shí)時(shí)計(jì)算服務(wù)可以很容易實(shí)現(xiàn)對(duì)物聯(lián)網(wǎng)數(shù)據(jù)的清洗、解析、報(bào)警等實(shí)時(shí)的處理。離線計(jì)算支持MapReduce和Hive等,主要用于對(duì)物聯(lián)網(wǎng)數(shù)據(jù)做日/周/月/年等多個(gè)時(shí)間維度做報(bào)表分析和數(shù)據(jù)挖掘,并將結(jié)果輸出到關(guān)系數(shù)據(jù)庫(kù)中。●數(shù)據(jù)交換接口:數(shù)據(jù)交換接口支持SQL、Restful、Thrift和JavaAPI等,用戶可以根據(jù)實(shí)際情況靈活選擇數(shù)據(jù)交換的方式。數(shù)據(jù)交換的內(nèi)容包括物聯(lián)網(wǎng)終端的當(dāng)前狀態(tài)、物聯(lián)網(wǎng)終端的歷史狀態(tài)/軌跡、指令下發(fā)、數(shù)據(jù)訂閱與發(fā)布等等。●平臺(tái)管理:平臺(tái)管理包括監(jiān)控報(bào)警和管理UI。監(jiān)控報(bào)警采用Ganglia和Nagios結(jié)合的形式,包括硬件級(jí)別(服務(wù)器、cpu、內(nèi)存、磁盤等)、進(jìn)程級(jí)別(進(jìn)程不存在、端口***異常等)、關(guān)鍵業(yè)務(wù)指標(biāo)(中間隊(duì)列的元素?cái)?shù)、網(wǎng)關(guān)建立的tcp連接數(shù)等)等三個(gè)級(jí)別。管理UI包括界面化安裝部署、用戶管理、終端管理、集群管理、數(shù)據(jù)接入管理、實(shí)時(shí)和離線計(jì)算任務(wù)界面化管理。系統(tǒng)應(yīng)該隱藏背后的存儲(chǔ),給用戶和應(yīng)用呈現(xiàn)的是同一個(gè)接口和界面。
數(shù)據(jù)接入服務(wù)(DIS):數(shù)據(jù)接入服務(wù)(Data Ingestion Service)為處理或分析流數(shù)據(jù)的自定義應(yīng)用程序構(gòu)建數(shù)據(jù)流管道,主要解決云服務(wù)外的數(shù)據(jù)實(shí)時(shí)傳輸?shù)皆品?wù)內(nèi)的問題。數(shù)據(jù)接入服務(wù)每小時(shí)可從數(shù)十萬(wàn)種數(shù)據(jù)源(如IoT數(shù)據(jù)采集、日志和定位追蹤事件、網(wǎng)站點(diǎn)擊流、社交媒體源等)中連續(xù)捕獲、傳送和存儲(chǔ)數(shù)TB數(shù)據(jù)。實(shí)時(shí)流計(jì)算服務(wù)(CS):實(shí)時(shí)流計(jì)算服務(wù)(Cloud Stream Service),是運(yùn)行在公有云上的實(shí)時(shí)流式大數(shù)據(jù)分析服務(wù),全托管的方式用戶無(wú)需感知計(jì)算集群,只需聚焦于Stream SQL業(yè)務(wù),即時(shí)執(zhí)行作業(yè)。而且這些維度的分析是無(wú)法事先想好的,而是在實(shí)際運(yùn)營(yíng)過程中,根據(jù)業(yè)務(wù)發(fā)展的需求定下來(lái)的。舟山物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)綜合服務(wù)
需要支持邊云協(xié)同。要有一套靈活的機(jī)制將邊緣計(jì)算節(jié)點(diǎn)的數(shù)據(jù)上傳到云端。舟山智慧路燈物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)軟件開發(fā)
趨勢(shì)二:與云計(jì)算的深度結(jié)合大數(shù)據(jù)離不開云處理,云處理為大數(shù)據(jù)提供了彈性可拓展的基礎(chǔ)設(shè)備,是產(chǎn)生大數(shù)據(jù)的平臺(tái)之一。自2013年開始,大數(shù)據(jù)技術(shù)已開始和云計(jì)算技術(shù)緊密結(jié)合,預(yù)計(jì)未來(lái)兩者關(guān)系將更為密切。除此之外,物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新興計(jì)算形態(tài),也將一齊助力大數(shù)據(jù)**,讓大數(shù)據(jù)營(yíng)銷發(fā)揮出更大的影響力。趨勢(shì)三:科學(xué)理論的突破隨著大數(shù)據(jù)的快速發(fā)展,就像計(jì)算機(jī)和互聯(lián)網(wǎng)一樣,大數(shù)據(jù)很有可能是新一輪的技術(shù)**。隨之興起的數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和人工智能等相關(guān)技術(shù),可能會(huì)改變數(shù)據(jù)世界里的很多算法和基礎(chǔ)理論,實(shí)現(xiàn)科學(xué)技術(shù)上的突破。趨勢(shì)四:數(shù)據(jù)科學(xué)和數(shù)據(jù)聯(lián)盟的成立未來(lái),數(shù)據(jù)科學(xué)將成為一門專門的學(xué)科,被越來(lái)越多的人所認(rèn)知。各大高校將設(shè)立專門的數(shù)據(jù)科學(xué)類專業(yè),也會(huì)催生一批與之相關(guān)的新的就業(yè)崗位。與此同時(shí),基于數(shù)據(jù)這個(gè)基礎(chǔ)平臺(tái),也將建立起跨領(lǐng)域的數(shù)據(jù)共享平臺(tái),之后,數(shù)據(jù)共享將擴(kuò)展到企業(yè)層面,并且成為未來(lái)產(chǎn)業(yè)的**一環(huán)。舟山智慧路燈物聯(lián)網(wǎng)大數(shù)據(jù)平臺(tái)軟件開發(fā)