在醫(yī)療行業(yè),應(yīng)用于安防的視頻監(jiān)控已經(jīng)相當普及,但隨著科技的發(fā)展和醫(yī)院網(wǎng)絡(luò)環(huán)境的大幅改善,各類醫(yī)學應(yīng)用的訴求不斷被提到議事日程。本文所介紹的“網(wǎng)絡(luò)視頻及語音處理系統(tǒng)”就是一個應(yīng)用于醫(yī)院、解決大范圍、大規(guī)模音視頻監(jiān)控聯(lián)網(wǎng)、多層次復(fù)雜管理的系統(tǒng)應(yīng)用實例,并已經(jīng)被應(yīng)用到醫(yī)療業(yè)務(wù)領(lǐng)域,為醫(yī)療行業(yè)客戶解決了多種實際業(yè)務(wù)需求。
系統(tǒng)需求
醫(yī)院擔負著醫(yī)療、教學等多項醫(yī)務(wù)任務(wù)。目前的教學方法主要是通過學生現(xiàn)場觀摩的方法進行學習,即與操作醫(yī)生、病人在同一個場所進行學習。由于病患人員多,現(xiàn)場環(huán)境對組織學習和學習效果都會產(chǎn)生一定的負面影響。
另一方面,過多的學生與病患在同一個診室,會對病患造成情緒上的不安定。因此,從教學和醫(yī)療的要求來看,需要建立一個能改善現(xiàn)有教學和診療狀況的、新的教學環(huán)境。這樣的教學環(huán)境有以下幾個需求:
1、建立集中的學習課室,進行集中教學或分組教學;
2、將診室的現(xiàn)場場景和醫(yī)療結(jié)果傳送到課室,供學習使用;
3、提供語音通道,讓學生與操作醫(yī)生進行通話;
4、支持錄像事后回放;
5、同時可進行多組現(xiàn)場教學(相同或不同內(nèi)容);
6、保持診室安靜,減少對操作醫(yī)生的影響。
系統(tǒng)概述
整個系統(tǒng)主要由三個部分組成,即現(xiàn)場前端信息采集、信息數(shù)據(jù)處理和學習環(huán)境(音視頻終端)。
系統(tǒng)在現(xiàn)場采集場景和語音信息,分別將語音視頻傳送給語音服務(wù)器和視頻服務(wù)器,完成數(shù)據(jù)處理和管理工作。學習環(huán)境完成現(xiàn)場場景和語音環(huán)境的重現(xiàn)工作,并提供語音的交互功能。
該系統(tǒng)結(jié)構(gòu)清晰,通過語音和視頻兩組服務(wù)器分別對采集的音視頻信息進行專業(yè)化的數(shù)據(jù)處理,提高了視頻和語音質(zhì)量。兩組服務(wù)器間通過同步通訊協(xié)議,控制同步,協(xié)同工作。學習者通過網(wǎng)絡(luò)可同時監(jiān)視現(xiàn)場多路(多視角)視頻圖像,并能同步地聽到現(xiàn)場的聲音信息,從而達到現(xiàn)場教學的目的。
系統(tǒng)組成
該系統(tǒng)設(shè)計采用模塊化組合的方法,把系統(tǒng)涉及到的各組成部分按功能分類為各種模塊,系統(tǒng)按功能需求進行設(shè)計和各種模塊組合。這樣設(shè)計的優(yōu)點是: ·由點到面,全面考慮所有角色和場景;
·系統(tǒng)模塊化,使整個系統(tǒng)容易理解;
·優(yōu)化組合設(shè)計,可針對系統(tǒng)的特殊性進行優(yōu)化設(shè)計;
·框架穩(wěn)定,在系統(tǒng)功能和范圍擴充的情況下,保證系統(tǒng)框架不變。 [nextpage]
一、前端診室系統(tǒng)
診室是整個系統(tǒng)的信息源,其包括診療現(xiàn)場的圖像和語音信息,是教學中的主要元素。本方案在診室中安裝攝像機、視頻編碼器和IP電話設(shè)備。現(xiàn)場攝像設(shè)備將診療室中的全部場景,包括病患、醫(yī)生、設(shè)備等的影像全部傳送到學習終端上。網(wǎng)絡(luò)IP攝像機把現(xiàn)場實況影像進行實時編碼,通過網(wǎng)絡(luò)上傳。診療影像是主要的教學內(nèi)容,本方案中利用診療機(B超機)上的標準視頻輸出端口,將診療影像通過視頻編碼器進行數(shù)字化編碼壓縮,并透過網(wǎng)絡(luò)傳送到學習終端機上。
醫(yī)生診療過程中與病患的交流語境也是真實現(xiàn)場再現(xiàn)的重要因素,同時作為教學作用,必須允許學生與教師之間可進行交流。本方案在診室中設(shè)置IP電話終端,用于現(xiàn)場語音傳送以及教學過程的交互。語音終端功能和特性如下:在診室中安裝的硬件設(shè)備,不需要改變醫(yī)生操作規(guī)程,透明實現(xiàn)現(xiàn)場學習功能。
二、網(wǎng)絡(luò)傳輸系統(tǒng)
網(wǎng)絡(luò)系統(tǒng)是整個系統(tǒng)的樞紐,所有視頻、語音、數(shù)據(jù)均通過網(wǎng)絡(luò)設(shè)備實現(xiàn)端到端的傳送。網(wǎng)絡(luò)系統(tǒng)包括兩個部分,即線纜和交換機。交換機完成數(shù)據(jù)的轉(zhuǎn)發(fā)和管理工作。線纜完成傳送數(shù)據(jù)信號,連接終端設(shè)備與交換機。本方案中傳輸線纜采用標準UTP-5雙絞線。網(wǎng)絡(luò)交換采用開放的系統(tǒng)設(shè)備和標準的器材,以保證系統(tǒng)的可維護性和更好的性能價格比。
三、服務(wù)器管理系統(tǒng)
服務(wù)器是整個系統(tǒng)的核心部分,其功能是完成整個系統(tǒng)的管理、數(shù)據(jù)交換、信息轉(zhuǎn)發(fā)、數(shù)據(jù)存儲等工作。
服務(wù)器由兩個部分組成,即語音服務(wù)器和教學(視頻)服務(wù)器。
語音服務(wù)器完成所有語音管理、服務(wù),實現(xiàn)診室的語音終端和學習終端的話音雙向通訊。其功能和性能如下:
1、自動建立教師和學習終端的連接,可完成一個教師多組學習者之間的共同學習過程。
2、控制語音的流動方向,如單向流動,保證在學生討論過程中,不會把學生的聲音傳送到診室,影響醫(yī)生工作。
3、通話質(zhì)量保證,控制話路上的語音質(zhì)量。
4、傳送文字信息,在學習終端和教師終端間傳送文字信息。
教學服務(wù)器完成所有視頻流的管理、分發(fā)、存儲以及教學終端支持功能。所有視頻流均通過它來接收(診室視頻)或發(fā)送(學習終端)。其功能如下:
1、接收和管理視頻流,每臺服務(wù)器可同時接收64路視頻流輸入。
2、視頻流分發(fā),將一個視頻流分發(fā)到一個或多個學習終端上,或?qū)⒍鄠€視頻流轉(zhuǎn)發(fā)到同一個終端上,分發(fā)流數(shù)量受到網(wǎng)絡(luò)帶寬的限制。
3、視頻錄像,根據(jù)要求完成視頻錄像,可同時對多路視頻進行錄像。
4、用戶管理,只有授權(quán)的終端用戶能夠進入學習系統(tǒng),進行操作。
5、學習終端支持B/S結(jié)構(gòu)應(yīng)用程序,應(yīng)用程序存儲在教學服務(wù)器中,終端用戶可利用瀏覽器進行學習。 [nextpage]
服務(wù)器與網(wǎng)絡(luò)交換機間的連接,可根據(jù)帶寬需求、課室或診室數(shù)量,選擇接入方式,以提供最好的服務(wù)質(zhì)量。
四、后端學習系統(tǒng)
后端學習系統(tǒng)包括分組學習系統(tǒng)和會議教學系統(tǒng)兩種:
1、后端分組學習系統(tǒng)。分組學習系統(tǒng)用于小組學習。分組學習系統(tǒng)的主要關(guān)注點是顯示圖像要清晰、雙向語音通訊,以及學習系統(tǒng)軟件。
分組學習系統(tǒng)包括視頻終端和語音終端兩個部分。視頻終端由一臺高性能PC機和一個顯示終端構(gòu)成,運行學習軟件,并解碼視頻圖像,通過顯示設(shè)備顯示出來。視頻終端主要功能和設(shè)備要求包括:
·可同時解碼16路視頻圖像,允許學習者同時觀看多個診室的現(xiàn)場場景和診療影像(根據(jù)有效顯示效果而定);
·通過軟件界面自由選擇診室,控制場景放大或縮??;
·回放教學錄像內(nèi)容;
·高清晰顯示視頻圖像,采用顯示設(shè)備分辨率大于1024X768,對比度大于3000:1,亮度大于1200 cd/m2;
·采用大屏幕顯示,5-8人采用25-35英寸LCD顯示屏,8-10人采用42-55英寸等離子電視;
·視頻終端主機采用標準PC,CPU: Pentium V 2.0GHz以上,1GBM,獨立內(nèi)存顯示卡。
語音終端采用IP電話終端,完成醫(yī)療場景聲音播放和交互教學。其主要功能如下:
·與視頻終端同步,當學習者改變觀看診室時,語音終端自動接通診室中的語音終端,不需要人工操作;
·具有靜音功能,當學習者要向現(xiàn)場醫(yī)生提問時,才發(fā)送學習環(huán)境語音;
·話音質(zhì)量高,維護簡單,操作方便;
·采用網(wǎng)絡(luò)供電,電話終端連接方便;
·允許多方同時加入學習小組。
2、后端會議教學系統(tǒng)。會議教學用于集體學習,其功能與分組學習系統(tǒng)類似。其組成部分包括語音終端、視頻終端和顯示系統(tǒng)。視頻終端運行學習軟件,解碼視頻圖像,由教師操作,功能與分組學習系統(tǒng)相同。語音終端用于診室現(xiàn)場語音環(huán)境再現(xiàn)和與診室醫(yī)生的交互,功能與分組學習系統(tǒng)相同。根據(jù)集體教學人員的多少,可以將語音通過擴音機進行放大。其顯示可選用投影儀將視頻終端的視頻信號顯示到超大面積屏幕上,以適應(yīng)于多人學習的情況。
圖1 系統(tǒng)框架圖
[nextpage]
系統(tǒng)擴展
本方案采用的系統(tǒng)是一個模塊結(jié)構(gòu)的、開放的系統(tǒng),它能夠很容易地接入到醫(yī)院主干網(wǎng)上,共享資源,成為整個醫(yī)院信息化建設(shè)的一部分,不再是一個獨立的系統(tǒng)。
該系統(tǒng)允許將學習功能延伸到診療室醫(yī)生的工作桌面上而不需要改變目前的網(wǎng)絡(luò)環(huán)境。通過這種擴展,可進一步實現(xiàn)多方參與的學習功能,并可實現(xiàn)遠程的工作指導。通過系統(tǒng)的授權(quán)可以允許醫(yī)院其他部門的醫(yī)生進入到該系統(tǒng),觀察或訪問診療現(xiàn)場的狀況。示意圖參見圖2。
圖2 醫(yī)院網(wǎng)絡(luò)示教拓撲圖
該系統(tǒng)方案設(shè)計中已包含了外部網(wǎng)絡(luò)的接口,當需要連接到醫(yī)院主干網(wǎng)絡(luò)時,只需要鏈路連接,并通過配置即可實現(xiàn)。配置的基本原則是:
1、安全性,保護本身系統(tǒng)的網(wǎng)絡(luò)安全。
2、服務(wù)質(zhì)量,保證本系統(tǒng)高碼流應(yīng)用不影響其他網(wǎng)絡(luò)應(yīng)用。
3、透明性,當允許外部網(wǎng)絡(luò)用戶使用本系統(tǒng)時,用戶是透明地跨過網(wǎng)絡(luò)進行訪問。
該系統(tǒng)在應(yīng)用方面具有開放的接口,可與醫(yī)院HIS系統(tǒng)或PACS系統(tǒng)連接。連接接口包括數(shù)據(jù)庫或過程調(diào)用或Web Service。利用該系統(tǒng)到桌面的擴展性,可以方面地實現(xiàn)院內(nèi)協(xié)同會診功能。
系統(tǒng)功能
學習者在視頻終端上進行學習操作,能夠完成以下功能:
1、四分屏分割顯示多路視頻信息和數(shù)據(jù)信息。在學習界面上可同時顯示指定診室中的場景視頻和診療影像。同時可以調(diào)出顯示病患病歷(來自HIS系統(tǒng))和相關(guān)的靜態(tài)圖片,便于教學。根據(jù)需要可同時顯示兩個診室的四組視頻影像。
2、全屏顯示視頻??蛇x擇切換一路視頻影像在全屏顯示,便于觀察。
3、控制場景鏡頭。通過鼠標移動放大局部影像,便于仔細觀察醫(yī)生操作手勢或控制臺操作方法。
4、控制錄像。對診療影像和場景視頻同時進行錄像,用于日后學習。
5、即時拍攝。對教學過程中的關(guān)鍵動作通過拍攝方法記錄下來。拍攝后的圖片以JPG文件保存,可轉(zhuǎn)存后進一步分析。學習者可以將這些圖片下載后學習使用。 [nextpage]
6、診室列表。系統(tǒng)將有效的學習地點以診室名稱列表出來,供學習者選擇。列表采用樹型結(jié)構(gòu),列出每個診室的視頻點信息。
7、錄像存儲。該遠程診療學習系統(tǒng)支持錄像功能。錄像以長文件形式存儲在磁盤系統(tǒng)中。這種存儲方式的優(yōu)點是:長度沒有限制(僅磁盤總?cè)萘康南拗疲?;檢索方便;備份或轉(zhuǎn)存容易。
錄像數(shù)據(jù)量約為每分鐘30MB,每小時約為2GB(包括診療影像和現(xiàn)場影像兩部分)。建議根據(jù)所需要的錄像時長,選擇獨立存儲設(shè)備NAS或磁盤組來保存錄像數(shù)據(jù)。
結(jié)語
醫(yī)療行業(yè)現(xiàn)在已經(jīng)不僅僅局限于安裝傳統(tǒng)的安防監(jiān)控,正如本文所介紹的,網(wǎng)絡(luò)視頻及語音處理系統(tǒng)已經(jīng)深入到醫(yī)療業(yè)務(wù)的各領(lǐng)域,以實現(xiàn)醫(yī)院遠程手術(shù)直播、醫(yī)院網(wǎng)絡(luò)示教、醫(yī)院影像數(shù)據(jù)庫等多種類的應(yīng)用。
通過本案例可以看到基于網(wǎng)絡(luò)的集視頻、音頻、數(shù)據(jù)多媒體流的通信已被應(yīng)用于各行各業(yè)、各個領(lǐng)域,本文僅以醫(yī)療應(yīng)用為實例,供業(yè)內(nèi)同行參考。