此屏幕截圖顯示了Scoop中的視頻幀,這是Voxel 51用于按內(nèi)容組織視頻的工具。車輛通過類型,品牌和顏色進行識別。Voxel51的平臺執(zhí)行AI視頻處理,識別視頻中的對象和動作。圖片來源:Voxel51
密歇根大學(xué)創(chuàng)業(yè)公司Voxel51今天推出了其旗艦產(chǎn)品 - 一個軟件平臺,旨在使其更容易,更快速,更經(jīng)濟地獲取未開發(fā)的視頻數(shù)據(jù)潛力。
該軟件面向那些使用視頻但卻難以從中提取所需信息的公司。雖然視頻是一種豐富的數(shù)據(jù)形式,但由于其復(fù)雜性,大文件大小以及缺少定義單位(如單詞),因此很難進行分析和搜索。
Voxel51已著手通過其視頻分析平臺和開源軟件庫克服這些障礙,這些軟件庫共同實現(xiàn)了最先進的視頻識別。它識別并跟蹤每個剪輯中的對象和動作。正如聯(lián)合創(chuàng)始人布萊恩摩爾所說:“我們將視頻轉(zhuǎn)化為價值。”
他們最初的焦點,特別是與無人駕駛汽車相關(guān)的,是關(guān)于道路場景和公共安全的錄像。在這兩種應(yīng)用中,相機都是關(guān)鍵傳感器,但是人類處理數(shù)據(jù)非常耗時,以便計算機可以對其進行分析。更快,更自動化的處理應(yīng)該加速開發(fā)更好的計算機視覺。
“這是第一個也是唯一一個公開可用的道路場景理解平臺,”電氣和計算機工程教授聯(lián)合創(chuàng)始人Jason Corso說?!捌嚬菊诮ㄔ焖鼈?,但是在專有的孤島中。我們的任何人都可以使用和嘗試。
“通過使視頻處理民主化和訪問大型帶注釋的圖書館,我們使年輕的初創(chuàng)公司能夠與資源豐富的團隊競爭,這些團隊致力于無人駕駛汽車和大公司的其他計算機視覺應(yīng)用。”
在今天的無人駕駛車輛中,感知算法是利用機器學(xué)習(xí)技術(shù)產(chǎn)生的,這意味著他們需要接受帶有對象識別和跟蹤注釋的視頻剪輯的訓(xùn)練 - 例如,行人,車輛,燈柱,標(biāo)志和交通燈。
此屏幕截圖顯示了Scoop中的視頻幀,這是Voxel 51用于按內(nèi)容組織視頻的工具。通過夾子標(biāo)記和跟蹤車輛,標(biāo)志和行人。Voxel51的平臺執(zhí)行AI視頻處理,識別視頻中的對象和動作。圖片來源:Voxel51
在對系統(tǒng)進行訓(xùn)練之前,必須對視頻進行注釋 - 通常由人進行注釋。這就是為機器學(xué)習(xí)算法創(chuàng)建訓(xùn)練數(shù)據(jù)耗時且昂貴的原因。
使用Voxel51,用戶可以依靠平臺的AI軟件來加速這一過程。然后,可以搜索非常特定的視頻內(nèi)容 - 例如,狗步行者。使用開源庫,一些用戶可以訪問比他們能夠獲得的更大的數(shù)據(jù)集。
“顯然需要Voxel51在自動化車輛領(lǐng)域開發(fā)的那種尖端AI技術(shù),我們對已經(jīng)取得的進展充滿熱情,”UM Tech Transfer許可總監(jiān)Bryce Pilz說。 。
“目前,Voxel51技術(shù)正在幫助Mcity的自動駕駛汽車了解他們在路上看到的東西,以便他們做出更好的決策,我們毫不懷疑我們最終會看到這些創(chuàng)新進入生產(chǎn)車輛,使它們更安全,更高效,更可靠?!?/p>
除了將強大的AI 視頻分析交付給開發(fā)人員之外,Voxel51的主要引擎差異化因素是它們的處理在幀間的時空體積中運行,它們可以捕捉運動和外觀隨時間的變化。換句話說,他們不是看像素而是看體素。
該公司已籌集了200萬美元的風(fēng)險投資。Corso說,它位于安娜堡,擁有15名員工,并且正在招聘更多人。
“自從現(xiàn)代計算開始以來,人類一直在適應(yīng)計算機。我認(rèn)為這是計算機開始適應(yīng)我們的時間,這涉及對視覺世界的更深入理解,”Corso說。“Voxel51的新平臺是朝著這個方向邁出的重要一步。我們希望新公司能夠輕松,省力地增加視覺感知功能?!?/p>