圖像識別技術已經普遍應用於各種產品,正在逐步得到普及。
圖像識別是視訊處理引擎所承擔的加快訊息家電高清化進程中最具發展前途的應用程式之一。在CEATEC JAPAN 2008 上,就已經應用於製品中的圖像識別處理及今後的普及範圍規劃進行了采訪。
如外界報道所言,視訊處理引擎雖然適用於高清視訊之高畫質化及編解碼器,但是由於高負荷處理較多,因此圖像識別被認為更有發展前途。
所謂圖像識別,即將輸入的圖像進行修正後找出其特徵,然後將它與標準圖像數據進行對比辨認及識別,然後輸出識別結果。(圖1)在應用圖像識別之技術領域,主要有生物識別(生物認證)、機器視覺、遙感、人機介面、醫療用圖像識別等各種圖像識別技術。
根據應用領域之不同,識別或檢測對象也會有所不同,有人的臉部、手、指紋、靜脈、眼睛之虹彩等,也有打印機基板之配線形狀、產品瑕疵等各種。在圖像識別處理方面,如果僅是對象檢測,那麼運算負荷也不會太高,但如果是進行生物認證等個體識別·認證,那麼運算量將會增大,處理時大多需要更具高性能的硬體方可實施。
在圖像識別技術領域,話題最多的技術之一要屬本次CEATEC上也有許多廠商進行產品展示的臉部檢測技術。臉部檢測在去年的CEATEC上就已經被用於拍攝靜止圖像的數位相機,還成為當時的熱門話題,而今年高清攝影機上的臉部檢測技術再一次引起人們特別的關注。
在索尼展區,該公司展出了今年4月發布的數位高清攝影機“Handycam HDR-TG1”。HDR-TG1無論靜止圖像還是動畫,透過臉部檢測功能最多可以同時檢測8張臉部,還可以自動對焦、曝光、及控制膚色等拍攝鮮艷清晰的動畫圖像,此些功能透過該攝影機在現場向到場者實際演示說明(圖2、3)。
日立製作所展示了於8月份開始發售的對應AVCHD之高清藍光光碟攝影機“Blu-ray cam Wooo DZ-BD10H”,該公司強調,該機搭載了臉部檢測功能“臉部pita”,即使逆光或者拍攝對象未進入畫面中央,也可以拍攝出漂亮的影像(圖4)。
臉部檢測技術除了民生用數位相機及攝影機之外,還可應用於視訊會議系統等,應用範圍在逐步擴大,而高附加價值化正在廠商之間引起異常有關產品差異化之交鋒。此外,比臉部檢測技術更加帶來運算負荷的臉部識別技術也已經開始逐步被導入和應用於監視器、安全系統、出入國管理系統等,無論是硬體還是軟體之研究開發都將成為最熱門的領域。
對於圖像識別技術,人們翹首以待的是能夠在人機介面上的應用。隨著個人電腦及移動電話、DVD錄影機等訊息家電等的高性能化、多功能化,其操作也越來越複雜,產品功能中常用功能其實並不多。這種狀況似乎在“數位落差”之問題上也得到反映,常有人說,雖然消費者實際需要的是任何人都能夠輕鬆操作的訊息機器,但操作的複雜化依然成為導致訊息落差的原因之一。
對於上述人機介面之課題,各大企業紛紛采取新對策,例如,東芝即在今年開始發售的該公司製AV 筆記型電腦“Qosmio”上裝載了“手勢遙控”,正在逐步步入實用化進程。
今年東芝半導體公司展區內進行手勢遙控演示的是去年版本之DVD播放機,該機一改往日風格,將“新感覺療愈系應用程式 Touch Sweet palachan**2”透過展區內之參考出展及講壇、討論會向大家公布。(圖5)
圖5:東芝半導體公司用於SpursEngine的手勢遙控識別中介軟體之“Touch Sweet palachan”演示現場 |
||
據悉,“Touch Sweet palacha”是東芝工程師為了本次的CEATEC出展而在短時間內開發的簡易遊戲應用程式,該機裝載了對應東芝視訊處理引擎“SpursEngine”之手勢遙控識別中介軟體。東芝在展區內精心策劃,引導會場到場者在展區講壇上之手勢遙控介面體驗遊戲,透過手勢遙控對palachan進行操作贏取積分等。(圖6)
個人電腦上應用手勢遙控介面的還有運行於美國蘋果公司Mac OS系統上的開放原始碼之軟體“touche”一例。(美國Google網站正在透過“Google Code”對外提供。)touche是奧地利的Georg KaindI先生開發的程式庫,美國Intel公司開發後又作為開放原始碼公開的跨平臺圖像識別程式庫“OpenCV”也投入實際應用。
日本國內也不甘示弱,其中專業致力于“Cell/B.E.”軟體開發之創業型企業Fixstars Corporation發布了將OpenCV應用於Cell處理器上的高速化模塊“CVCell”,相信未來CVCell技術在SpursEngine上的應用等將會達到一個更高的境界。
*1: ^ HD Processing Forum 編輯部根據專利局主頁、1.4 圖像識別技術之要素技術 1.4.1 圖像識別系統之基本形態的內容製作
*2: ^ “palachan”是東芝PC&網路公司之形象代言人,作為台式個人電腦之附屬軟體或促銷紀念品等使用。