前言:20世紀50年代,計算機數(shù)據(jù)存儲引來了獨開生面的變革。1951年,磁帶首次被用于計算機上存儲數(shù)據(jù),在UNIVAC計算機上作為主要的I/O設(shè)備,稱為UNIVACO,這是商用計算機史上的第一臺磁帶機。1956年,由IBM公司制造的世界上第一塊硬盤(350RAMAC)誕生。兩者本質(zhì)上都采用電磁感應(yīng)原理,但卻被分為鮮明的兩派,并日后在存儲量、讀寫速度、性價比上展開了角逐,由此展開了一場改變?nèi)祟悮v史的數(shù)據(jù)存儲的大戰(zhàn)。
數(shù)據(jù)被視為21世紀的石油,其蘊含的價值正不斷被人們開采,甚至有人提出,數(shù)據(jù)應(yīng)用水平已經(jīng)成為數(shù)字時代左右企業(yè)成功的勝負手。但遺憾的是,數(shù)據(jù)每天都處在一邊產(chǎn)生一邊流失的狀態(tài),不僅讓數(shù)據(jù)價值挖掘的工作一籌莫展,而且這些損失無法用準確的數(shù)字進行估算。
讓數(shù)據(jù)能夠安全及穩(wěn)定地存儲、備份,在應(yīng)用時能夠被快速調(diào)取、恢復,已經(jīng)成為各行各業(yè)數(shù)字化轉(zhuǎn)型中的共同挑戰(zhàn)。正如70年前一樣,時代正在呼吁數(shù)據(jù)存儲的變革。富士膠片(中國)記錄媒體事業(yè)部總經(jīng)理駱琤表示,轉(zhuǎn)型中的產(chǎn)業(yè)呼喚著技術(shù)創(chuàng)新,打破傳統(tǒng)存儲的枷鎖。
數(shù)字化時代存儲的難題
你也許知道,每年存儲的數(shù)據(jù)正在以30%-40%的速度在增長。
但你可能不知道,存儲硬件容量增長的速度卻不到數(shù)據(jù)的一半。
這意味著,數(shù)據(jù)與存儲之間的矛盾仍然會是懸在各行各業(yè)數(shù)字化轉(zhuǎn)型頭頂上的達摩克利斯之劍。
那么除了硬盤之外,還有其他更完美的選擇嗎?答案是有的,磁帶便是其中之一。在很早之前,磁帶便被用于存儲,包括電影、銀行、保險、國家檔案、石油勘探等重要數(shù)據(jù),隨著這些方案不斷積累,技術(shù)也在不斷的創(chuàng)新中。
富士膠片便是致力于不斷提升磁帶存儲能力的代表性企業(yè)之一,去年對外推出采用鋇鐵氧技術(shù)的 LTO8 數(shù)據(jù)流磁帶,單盤容量達到壓縮后 30TB,并宣稱將在2030年推出400TB的磁帶產(chǎn)品,這些信息在行業(yè)中如同在平靜的水面中投下的重磅炸彈,引發(fā)出前所未有的震動。面對數(shù)字化趨勢,安防行業(yè)亦到了轉(zhuǎn)型的分岔口,不僅面臨著智能技術(shù)升級的壓力,而且還面臨著數(shù)據(jù)存儲方案選擇的難題:
一是安防產(chǎn)業(yè)正在積極推進自身的智能化轉(zhuǎn)型,這意味著如果還是延續(xù)傳統(tǒng)的的方式,將無法真正地進行創(chuàng)新;二是安防數(shù)據(jù)不僅多樣而且海量,對于存儲的性價比的需求日趨強烈;三是國家與用戶對于社會穩(wěn)定、信息安全、網(wǎng)絡(luò)安全的重視程度不斷提升,甚至對有些數(shù)據(jù)提出了永久保留的需求,對于目前的行業(yè)主流存儲介質(zhì)(如硬盤)而言,由于自身的結(jié)構(gòu)束縛,存在著不小的壓力。
“對于安防方案供應(yīng)商而言,如果大家都采用’ HDD+SSD’存儲模式,無疑會減少方案的競爭性。在存儲方面,能給用戶提供更多的存儲方案選擇,以更合適的價格享受安防數(shù)據(jù)服務(wù),才能強化方案的競爭力。因此對于方案供應(yīng)商和用戶而言,磁帶都會是最優(yōu)的選擇?!? 駱琤如此說道。
不「過時」的磁帶存儲技術(shù)
那么,數(shù)據(jù)流磁帶存儲解決方案會是智能存儲需求下的最優(yōu)解嗎?要回答這個問題,首先還是要回到磁帶存儲技術(shù)本身的特征上,總結(jié)起來磁帶存儲有著不同于主流在線存儲介質(zhì)的三大特性:
第一是存儲密度高?,F(xiàn)在最新的數(shù)據(jù)流磁帶產(chǎn)品上涂布的是納米級磁性顆粒,不僅是磁顆粒變小,而且物理性能更加的穩(wěn)定。簡單地說,正是因為單位面積的顆粒變多,使得存儲數(shù)據(jù)的容量變大。從理論上而言,目前單盤容量可達400TB,與硬盤相比,容量的瓶頸幾乎為零;
第二是成本優(yōu)勢。磁帶與硬盤相比,其擴容成本更低。一個磁帶驅(qū)動器可以對應(yīng)大量的磁帶產(chǎn)品,當用戶需要擴展容量時,磁帶方案只需考慮存儲介質(zhì)的成本,但硬盤無法做到這點。同時不少數(shù)據(jù)顯示,在日常使用的功耗上,硬盤存儲的成本遠遠超過磁帶;
第三是長久保存的穩(wěn)定性。磁帶記錄的穩(wěn)定性已經(jīng)多次在極端的環(huán)境下得到驗證,并且磁帶存儲已經(jīng)被證明每讀寫1萬PB數(shù)據(jù)量后才有可能出現(xiàn)一次故障,同時也提供WORM磁帶(一次寫入,多次讀?。┦箶?shù)據(jù)無法被覆寫也無法被修改,這樣的特性讓其在重要的數(shù)據(jù)保存場景中得到用戶的青睞。
其次換個角度看,技術(shù)持續(xù)創(chuàng)新,產(chǎn)品不斷迭代,才能真正促進產(chǎn)業(yè)的升級,如果僅僅是曇花一現(xiàn)的技術(shù),那么只會留下更多的泡沫。作為歷史悠久的技術(shù),磁帶存儲從未停止過對創(chuàng)新的追逐,并在單盤容量,總擁有成本和故障率等多方面取得了令人矚目的成就。
在富士膠片創(chuàng)新性地將磁帶存儲中的鋇鐵氧體(BaFe)進化為鍶鐵氧體(SrFe)后,磁帶將獲得了更高的存儲密度,而且性能屬性也大大提升。之前硬盤磁錄密度每年以40%的速度提升,但在最近幾年受到物理學的限制(在給定區(qū)域存儲的數(shù)據(jù)越多,每一個Bit能調(diào)配的空間就會越小),導致近幾年降到了10-15%。而當前磁帶存儲每年仍保持30%的增長速度,平均2.5年容量即可翻一番。除了介質(zhì)本身的潛質(zhì)外,目前磁帶機與磁帶庫產(chǎn)品基本都是資深I(lǐng)T生產(chǎn)商在生產(chǎn),如IBM等,因此在無論是生態(tài)建設(shè),還是解決方案技術(shù)發(fā)展的推動上,磁帶技術(shù)仍然充滿著不斷向上的生長力。
最后看看實戰(zhàn)效果。 2011年,谷歌因為軟件升級,誤刪了4萬個Gmail帳戶的郵件信息。雖然谷歌當時在硬盤中存儲了數(shù)據(jù),并放在多個數(shù)據(jù)中心中,但還是讓信息丟失了。最后在磁帶中,谷歌才從備份中恢復了數(shù)據(jù)。近期,微軟也對外宣布,Azure Archive Storage系統(tǒng)用到了IBM磁帶存儲裝置……在互聯(lián)網(wǎng)時代,因為軟硬件的漏洞,往往會被黑客所攻擊,導致數(shù)據(jù)泄露與丟失,更安全更穩(wěn)定的存儲保證已經(jīng)迫在眉睫,而磁帶存儲已經(jīng)成為互聯(lián)網(wǎng)巨頭共同的選擇。
綜合起來看,采購成本、擴充成本、運維成本與數(shù)據(jù)安全可靠性均已具備,那么磁帶存儲能否借助這股優(yōu)勢在安防行業(yè)中進行一場“疾如風,侵掠如火”的存儲變革呢?駱琤認為,未來磁帶與硬盤會以共存的方式在行業(yè)中發(fā)展下去?!耙苍S在某些應(yīng)用中兩者依然是競爭的關(guān)系,但是更多的情況兩者是共生的。磁帶作為重要的存儲補充方案,最終的選擇權(quán)都歸屬于用戶,任何的技術(shù)都在不斷的優(yōu)化,很大程度上用戶的推動力是最大的,多樣化的解決方案能讓用戶在存儲方案的選擇上更加靈活。”
雖然目前硬盤主要用于在線存儲,磁帶更多聚焦離線存儲,兩者各有聚焦,但從容量上來看,磁帶目前已經(jīng)可以達到400TB,而硬盤最多僅到20TB,如果硬盤要再往上拓展,必須借助熱輔助技術(shù),這意味在成本下降和技術(shù)突破方面將難以再有優(yōu)勢。
“既然選擇專注B端產(chǎn)品,我們更加聚焦于自身技術(shù)的深耕和創(chuàng)新,確保產(chǎn)品質(zhì)量和性能能夠符合今后的場景需求,用戶自然會認可我們的產(chǎn)品?!? 駱琤在回應(yīng)市場用戶的認可上顯得信心滿滿。
「冷」數(shù)據(jù)市場的「熱」角力
國際數(shù)據(jù)公司IDC曾預測,全球數(shù)據(jù)圈將從2018年的33ZB增至2025年的175ZB,中國屆時將成為全球最大的數(shù)據(jù)圈。2020年,國內(nèi)新基建建設(shè)已經(jīng)按下了加速鍵,5G、AI、大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)等加速發(fā)展將產(chǎn)生海量數(shù)據(jù),數(shù)據(jù)存儲將成為相關(guān)領(lǐng)域重要的基礎(chǔ)性環(huán)節(jié)。
人們習慣將訪問頻次較高的數(shù)據(jù)稱為“熱數(shù)據(jù)”,訪問頻次較低的稱為“冷數(shù)據(jù)”,后者時延要求低,但數(shù)量龐大,約占全球數(shù)據(jù)總量的70%以上。磁帶作為全球冷數(shù)據(jù)存儲的主要介質(zhì),其價值往往被人們所誤判,認為只是進行無用價值的存儲而已。
“業(yè)界認為對于數(shù)據(jù)而言最重要的三個元素是算法、算力、存儲,數(shù)據(jù)存儲是前兩者不斷提升的重要保證?,F(xiàn)在屬于數(shù)據(jù)爆炸的時代,無論是‘無人駕駛’還是‘雙十一’,數(shù)據(jù)都可能在瞬間劇增,達到峰值。一些新的應(yīng)用產(chǎn)生的數(shù)據(jù)的價值可能暫時仍未能清楚該如何使用,雖然會被視為冷數(shù)據(jù)存儲起來,但隨著算力及算法的發(fā)展,它們的價值可能便會被挖掘?!? 駱琤如此說道。
駱琤篤信,任何數(shù)據(jù)都有其獨特的價值?!盁釘?shù)據(jù)需要滿足交互速度快的需求,因此用戶可能能用固態(tài)硬盤,那些不常用的數(shù)據(jù),可以放在冷存儲中,長久保留下去。冷數(shù)據(jù)市場的容量規(guī)模已經(jīng)備受關(guān)注,從而帶動人們了解磁帶的價值,并意識到在某些應(yīng)用場景中其重要性已經(jīng)超越了硬盤。”
目前國內(nèi)外不少知名互聯(lián)網(wǎng)企業(yè)已經(jīng)在開始大量使用磁帶存儲解決方案。這讓磁帶開始走出傳統(tǒng)的金融、電信、電視臺等場景,獲得更高的曝光率。在國內(nèi),駱琤透露,經(jīng)過雙方多次交流探討,百度智能云已經(jīng)選擇磁帶存儲解決方案。以無人駕駛應(yīng)用場景為例,其需要存儲大量的數(shù)據(jù)(每輛車每天能生成的數(shù)據(jù)大于10TB),百度目前擁有300輛這樣的車,如果將這些數(shù)據(jù)全部存儲在硬盤中,成本非常的昂貴。另外一方面,原來百度的數(shù)據(jù)源涌入之后,會先存在硬盤里,再遷移進磁帶庫里,在這個流程中,用戶最大的感受是硬盤的緩存速度很慢,經(jīng)過排查他們發(fā)現(xiàn)硬盤的實測遷移速度為200MB/s,而磁帶的實測傳輸速率為600MB/s,數(shù)據(jù)遷移的瓶頸恰恰在于硬盤。
“百度開始擔心這些數(shù)據(jù)存儲的問題,積極尋找將數(shù)據(jù)快速歸檔到磁帶庫的方法。目前改進方式是將固態(tài)硬盤代替之前的機械硬盤,直接連接磁帶庫,大大提升了效率。這是比較創(chuàng)新的方式,體現(xiàn)了成熟的技術(shù)在新應(yīng)用中能無縫地嵌入。除了百度之外,富士膠片已經(jīng)開始與眾多云服務(wù)商進行合作,讓數(shù)據(jù)量磁帶技術(shù)充分展現(xiàn)出其價值,目前在醫(yī)療、科研、網(wǎng)絡(luò)生活等各種領(lǐng)域都得到了廣泛的應(yīng)用?!? 駱琤補充說道。
百度云的需求僅僅是國內(nèi)產(chǎn)業(yè)數(shù)字化、信息化轉(zhuǎn)型的冰山一角,5G、AI、無人駕駛、新基建等應(yīng)用,將再次引發(fā)數(shù)據(jù)的“爆炸性”增長,在用戶存儲預算受限的前提下,磁帶容量與技術(shù)的不斷提升,對于各行各業(yè)而言都是一個好消息。展望未來,駱琤表示一方面富士膠片將不斷深耕本地,了解中國市場的實際需求,展現(xiàn)產(chǎn)品的價值,另一方面也會積極尋找國內(nèi)高價值的合作伙伴,共同擁抱新基建,推進數(shù)字化解決方案的落地。
野火燒后,新木叢生。在膠卷逐步退出歷史舞臺之時,富士膠片運用著當年積淀的膠卷技術(shù),踐行著二次創(chuàng)業(yè),并迅速在影像存儲、文件處理、醫(yī)療健康&高性能材料等領(lǐng)域占據(jù)了領(lǐng)先的地位。當人們在追捧新興技術(shù)的時候,傳統(tǒng)技術(shù)的潛力往往會被低估。但在新技術(shù)深入行業(yè)應(yīng)用場景腹地之后,因為缺乏行業(yè)的深刻理解,總會遇到難以攻克的關(guān)卡。而傳統(tǒng)的技術(shù)在時光的長河中穩(wěn)健發(fā)展,通過擁抱新的應(yīng)用,得以進化與演變。技術(shù)無新舊之分,只有不斷磨練自身新的思維,保持對社會需求的敏感,才可實現(xiàn)賦能產(chǎn)業(yè)創(chuàng)新最佳實踐。