共享平臺作為PAAS層的平臺,提供的是能力和服務,當然也可以基于能力和服務開發(fā)具體的SAAS層產(chǎn)品,但不是主業(yè),從這個意義上說,共享平臺就是能力開放中間件。以下技術可以使共享平臺架構更加合理、安全性更高,兼容性更強,資源分類和提供更加智能化。
1、綜合管理技術
共享平臺集成多種數(shù)據(jù)資源,必然需要用到綜合管理技術。以Activity工作流機制驅動綜合管理,可以根據(jù)現(xiàn)場不同的業(yè)務需求場景自定義工作流模板,表單可以復用,極大地簡化了定制開發(fā)工作量。ProcessEngine對象和Activity工作流引擎是Activiti工作的核心,負責生成流程運行時的各種實例及數(shù)據(jù)、監(jiān)控和管理流程的運行。目前主流的工作流框架還有:JBPM、OSWorkFlow、WorkFlow等,都可以用來改進綜合管理的細節(jié)。
圖 1 Activiti 引擎的系統(tǒng)服務結構圖
2、深度學習和大數(shù)據(jù)技術
目前主流的智能分析產(chǎn)品均已采用了深度學習技術。相較于深度學習,淺度學習(例如adaboost算法)是基于統(tǒng)計模型的機器學習算法。利用BP(反向傳播)算法讓一個人工神經(jīng)網(wǎng)絡模型從大量訓練樣本中學習統(tǒng)計規(guī)律,從而對未知事件做預測。這種基于統(tǒng)計的機器學習方法比起早先基于人工規(guī)則的系統(tǒng),在很多方面顯出優(yōu)越性。這種人工神經(jīng)網(wǎng)絡,雖也被稱作多層感知機(Multi-layer Perception),但實際是種只含有一層隱層節(jié)點的淺層模型。
深度學習的實質,是通過構建具有很多隱層的機器學習模型和海量的訓練數(shù)據(jù),來學習更有用的特征,從而最終提升分類或預測的準確性。因此,“深度模型”是手段,“特征學習”才是目的。
區(qū)別于傳統(tǒng)的淺層學習,深度學習的不同在于:1)強調了模型結構的深度,通常有許多層的隱層節(jié)點;2)明確突出了特征學習的重要性,也就是說,通過逐層特征變換,將樣本在原空間的特征表示變換到一個新特征空間,從而使分類或預測更加容易。與人工規(guī)則構造特征的方法相比,利用大數(shù)據(jù)來學習特征,更能夠刻畫數(shù)據(jù)的豐富內在信息。因此深度學習與大數(shù)據(jù)的結合是共享平臺的重要特征。
3、安全防御技術
針對共享類平臺,尤其是互聯(lián)網(wǎng)平臺的安全防御是非常重要的。安全防御包括網(wǎng)絡安全、web安全、防入侵、防注入、重要信息加密、權限管理等策略。因此共享平臺需要對安全防御做出規(guī)劃。
•針對重要核心信息可以采用加密存儲和傳輸?shù)牟呗?,并且?guī)劃合理的分層級的權限管理策略,尤其是針對流媒體、文件媒體等資源,需要經(jīng)過認證才能申請。
•共享平臺可以采用核心軟件硬件化的策略防止不良模塊注入,并通過對重要系統(tǒng)調用掛鉤的方法監(jiān)控調用參數(shù)和調用行為,將這些參數(shù)和行為匯總到安全監(jiān)控模塊,并通過大數(shù)據(jù)模塊的分析產(chǎn)生常見調用行為和罕見調用行為的分析報表。
•共享平臺也可以采用安裝過濾型驅動的方法監(jiān)控網(wǎng)絡流量。例如基于winpcap方式堆疊在NIC驅動之上,在鏈路層即開始監(jiān)控網(wǎng)絡流量信息,繞過NDIS、TCPIP協(xié)議驅動和AFD。
一般來說,過濾得越底層,防入侵側級別和安全性越高。這些大量的流量信息,包括源端和目的端、報文長度等細節(jié),可以作為重要數(shù)據(jù)源匯聚到大數(shù)據(jù)模塊,作為流量分析、網(wǎng)絡異常監(jiān)控的主要依據(jù)。
圖2 網(wǎng)絡協(xié)議棧驅動結構圖