IDC于2019年2月正式啟動“中國機器學習開發(fā)平臺2019廠商評估”研究,并于2019年8月發(fā)布最終研究結果。IDC將人工智能應用定義為采用了機器學習、深度學習的應用。
從這個角度看,2018年應用機器學習為中國人工智能市場帶來的規(guī)模達100億元人民幣。單就商業(yè)化機器學習開發(fā)平臺而言,2018年包括硬軟服在內的中國機器學習市場達到10億元人民幣,預計2018-2023年五年復合增長率將達到62.0%。在機器學習開始廣泛滲透、應用場景拓展翻新的起步階段,IDC逐步深入開展機器學習開發(fā)平臺廠商評估這一研究。
市場現狀
當前的技術應用現狀:當前的機器學習開發(fā)平臺基本可以提供30種以上的經典機器學習算法;基本已支持TensorFlow, PyTorch,Caffe等主流框架。不僅是機器學習、深度學習,圖算法也開始走向市場,現階段應用最為普及的是經典機器學習。領先的廠商在兼顧機器學習創(chuàng)新應用的同時,還能夠針對機器學習類工作負載對底層硬件做深度優(yōu)化,為用戶提供高效靈活的軟硬一體化產品。
應用落地現狀:目前商業(yè)化機器學習產品已經落地的行業(yè)及應用包括金融行業(yè)反欺詐、信用模型評估,跨行業(yè)的產品推薦、精準營銷,1-2年內正在落地的應用包括能源(尤其是電力)、軍工、制造行業(yè)。
市場格局:
1.以云服務商為代表的平臺級公司主推公有云機器學習,幫助用戶在云上快速搭建機器學習模型,這些云服務商在已有的客戶群體中積累了大量機器學習應用實踐。該類廠商的優(yōu)勢在于有龐大的用戶基數,可以快速轉化為機器學習產品的用戶。
2.以第四范式、探智立方為代表的明星創(chuàng)業(yè)公司以最前沿最創(chuàng)新的技術如聯邦遷移學習、完全自動化的AutoML等引領技術/產品趨勢。該類廠商的優(yōu)勢在于技術的領先性、引領性。
3.大數據平臺公司也在推出機器學習組件以幫助用戶在大數據平臺上實現預測分析能力,例如新華三、東軟、星環(huán)科技等。該類廠商則需要同時在技術和市場方面追趕領先者。
自動化機器學習、機器學習建模工程師、數據資源質量與市場的不確定性:當前算法工程師仍處于稀缺狀態(tài),一定程度上制約了機器學習的推廣落地。面向應用場景的數據資源匱乏,也是影響機器學習推廣的制約因素。自動化機器學習可以緩解對于專業(yè)算法工程師的需求,成功的自動化機器學習產品可以使業(yè)務人員經過培訓即可以建模??傮w來看,企業(yè)用戶對機器學習產品交付方式的偏好、算法工程師的供需關系,都將影響機器學習市場的發(fā)展趨勢。
值得關注的前沿領域:領先的廠商于2019年著力研發(fā)自動化機器學習、智能數據標注、可解釋深度學習、界面可視化、圖算法、批數據處理等。
典型廠商
在本次研究中,IDC中國選擇了最主流的13家廠商進行研究,分別是(排名不分先后,按照首字母排序):阿里云、AWS、百度、東軟、第四范式、金山云、九章云極、美林數據、騰訊云、探智立方、微軟、星環(huán)科技、新華三、IBM。本文僅選取5家典型廠商進行分析。
互聯網平臺級廠商代表:百度
百度在機器學習領域擁有深厚的技術積累,在國內最早推出深度學習開源框架飛槳PaddlePaddle,在最近1-2年內下載量以及活躍用戶量都保持高速增長。百度也是國內較早推出自動化機器學習產品的廠商,其EasyDL產品目前擁有較高的市場認知度。在商業(yè)化方面,依托百度云的客戶積累及市場拓展能力,百度能夠將機器學習能力快速輸出并不斷迭代。
創(chuàng)新創(chuàng)業(yè)公司代表:第四范式
既能專注AI算法開發(fā)又能兼顧軟硬件一體化的高度優(yōu)化;成熟的企業(yè)級產品;快速落地的商業(yè)化能力,成為第四范式從諸多企業(yè)中脫穎而出且快速擴張的重要因素。
數據科學、大數據時代的創(chuàng)新廠商:美林數據、九章云極
西安美林數據在本次評估中處于領導者象限。美林數據擁有數十年的企業(yè)數字化服務經驗,在機器學習市場,其TempoAI產品已在多個行業(yè)中得到實際應用,且深受工業(yè)、能源等行業(yè)用戶認可。成熟穩(wěn)定的產品、廣泛深入的用戶案例,是美林數據位于領導者象限的重要原因。
處于“主要廠商/主要玩家”象限的九章云極當前主要服務金融行業(yè),在特定的應用場景如反欺詐、用戶畫像等領域積累了豐富的實踐,在政府、制造業(yè)等領域,也與客戶共同打造了諸多機器學習的創(chuàng)新應用案例。
值得關注的國際廠商:AWS
AWS在全球機器學習市場取得了令人矚目的成績,根據其內部調研數據,約80%的TensorFlow部署在AWS的云服務上。在中國市場,AWS憑借自動化機器學習Sagemaker快速獲得較高的市場認知度,依托云服務的客戶積累其機器學習產品也得以快速部署。AWS較早推出機器學習推理芯片Inferentia,也參與了ONNX(開放神經網絡模型格式轉換)項目的建設與推廣。在加強自主研發(fā)的同時,AWS也始終以開放的態(tài)度為用戶提供靈活的機器學習選擇。
提供給技術買家的建議
應用場景的成熟度總結:成熟度最高的應用場景包括產品推薦、用戶畫像、反欺詐,簡單的證件識別類光學字符識別技術(OCR)。
正在探索的應用場景:設備預測性維護、基于產品外觀的質量檢測、交通軌道火花分析等。(由于本次的研究對象是面向開發(fā)人員的機器學習開發(fā)平臺,未包括人臉識別、聲紋識別、短語音識別等應用場景)。
合作伙伴的選擇:
1. 首先明確當前的業(yè)務場景是否能用機器學習的方式解決,此問題可與供應商共同探討??紤]企業(yè)現階段是否具備機器學習模型開發(fā)能力,如無模型開發(fā)能力,可以選擇自動化程度較高的機器學習產品。如有充足的開發(fā)能力,也可以嘗試采用開源技術自主搭建機器學習平臺。
2. 產品層面,選擇高度靈活、容易上手的產品,考慮模型的豐富程度的同時考慮提供的模型是否符合企業(yè)內部的應用需求。
3. 考慮采用高度自動化的機器學習產品,培養(yǎng)業(yè)務分析師向數據科學家轉型。
應用機器學習、人工智能,重要的一點在于具備建模所需數據。很多機器學習項目失敗的原因也是因為數據不足導致模型預測準確度不能滿足業(yè)務上線需求。長期來看,企業(yè)需要考慮能夠增強內部數據能力的產品/服務,盡早建設可以輸入人工智能模型的核心智能數據平臺。
IDC倡導在采用機器學習、人工智能解決方案時,企業(yè)不能過度關注硬件和算力平臺而忽視了軟件及應用。為短期內的AI工作負載選擇最適配的底層架構,為中長期的AI工作負載做好算力規(guī)劃。更重要的是,重視將機器學習、深度學習的價值最大化,真正以業(yè)務需求為導向,實現智能化。
IDC中國人工智能高級研究經理盧言霞表示,盡管深度學習算法的創(chuàng)新速度變緩,但我們相信機器學習的應用將穩(wěn)步滲透到各行各業(yè)的生產系統(tǒng)中。純技術的創(chuàng)新速度有所放緩,但從技術到產品到商業(yè)化應用落地的速度在加快。未來,自動化機器學習也將降低行業(yè)用戶采用AI的門檻,加速行業(yè)企業(yè)實現高級別的自動化、智能化。