生成對抗網路,以欺騙提高辨識度
「目前,自駕技術除需仰賴大量人力做標註,更得限定在高精密地圖覆蓋範圍內,才能精準定位車道、交通號誌及各種道路周邊的細節。但在運用生成對抗網路後,透過欺騙判別網絡,讓兩個網絡相互對抗、不斷調整參數,反而能加速原有自駕技術在不同環境下的辨識率。」臺大電機工程系教授王鈺強說道。

透過欺騙判別網絡,反而能提高辨識度?王鈺強以街景中的房子為例,說明美國在郊區的獨棟洋房,就與城市的大樓不同,到了地狹人稠的亞洲,招牌林立的住商混合大樓,更可能造成既有系統的困擾。這時,生成對抗網路(Generative Adversarial Network,簡稱GAN)就可讓電腦快速學習房子的定義,而不被太多細節所干擾。
王鈺強進一步比喻,生成對抗網路就像「印鈔機」與「驗鈔機」,前者努力生成新的資料,後者則負責破解,在相互對抗、不斷調整參數後,除了可取代以往大量靠專家標註的工作,更可克服影像資料來自不同廠牌、白天或夜晚,及因遠近造成的解析度問題。
就因運用生成對抗網路技術,也讓王鈺強團隊在「行人重辨識(Person Re-Identification)」的跨場域及跨影像解析度兩項應用上,都有領先全球現有技術約5%的成果。在上述自駕車跨城市街景辨識應用,王鈺強與清大孫民教授的團隊共同合作下,更超越現有技術10%以上的突破。
在虛擬世界訓練,快速優化AI效能
要在自駕技術領域後來居上,快速取得資料無疑是重中之重,除了利用傳統的方式蒐集來自感測器的資料,解方之一,也包含源自於虛擬世界中的模擬合成 資料,以截長補短,透過AI模型生成人類難以分辨或標示的資訊,例如速度、深度、遮蔽物,以填補真實世界中的資料落差。
「無論是自駕車,或眾多擁有重大商業價值的AI系統,未來需要處理的工作變異度將會越來越大,過去蒐集人工標註的訓練資料,再運用監督式學習的方法已不敷使用。」在清華大學電機工程系任教,同時也是Appier首席人工智慧科學家的孫民指出,為了訓練出精準度更好的AI系統,就需將真實世界訓練資料得出的模型,透過虛擬世界的自主學習、增強學習,大量且規模化的累積和精進資料的質量。

這項技術聽來困難,但當孫民以電玩GTA(Grand Theft Auto)等開放世界或沙盒式遊戲為例,說明在電玩中,已可讓玩家體驗以不同人物視角,在不同的城市探險,甚至讓玩家對設定進行修改,創造自己的遊戲方式。「為了豐富玩家遊戲體驗的電玩採取的模式,是自駕技術很好的借鏡對象,也可改善過去需依靠雷達和光達感測器的重資本投入問題。」
除了透過虛擬世界,進行規模化訓練,孫民和Google研究員所發表的一系列「自動化機器學習(AutoML)」研究,包含”Dpp-net: Device-aware progressive search for pareto-optimal neural architectures”、”QoS-aware Neural Architecture Search”及” Instanas: Instance-aware neural architecture search”,都是利用AI自動去學習在不同裝置上如何達到最佳的準確度,以便讓系統即時作出更趨近於真實情況的決策建議 。
人機協作,縮短學習曲線
從生成對抗網絡的應用,到在虛擬世界中快速訓練,看似讓AI取代人類的疑慮更深。但身為臺大資工系教授及NVIDIA AI Lab計畫主持人的徐宏民卻認為,「人與機器不是對立的,而是可以共同協作的。」

徐宏民以團隊在2021年未來科技展獲獎發表的「基於互動感知的自動化物件偵測學習」技術為例,說明以往機器手臂要針對全新產線加以設定時,至少要兩個禮拜的時間,但這項技術因透過「人機協作」,讓重新設定的時間大幅縮短到一小時。
「而且不同於以往,要透過專家來設定,這套系統只要有經驗豐富的現場作業員,就可進行重新設定。」徐宏民強調。
透過「人機協作」,除可應用在機械手臂,加速智慧工廠的轉型,更是眾多傳統車廠有別於自駕新創公司採「一步登天(Moonshot Solution)」路線,堅持從輔助駕駛系統逐步(Step by Step)往L4、L5發展的理論基礎。
而當AI結合這些深度學習的核心技術,得以攻克高安全性、低容錯率的汽車產業後,不僅有助於讓相關技術延伸到電商、服務業,乃至醫療、照護等領域,更讓機器人不再只是機器,而是能帶有溫度,並提供豐富體驗。
天下總主筆陳良榕專欄。半導體狂熱、科技巨頭謀略的最犀利解讀
看懂科技大勢,獨家解讀
請查看您的信箱,我們將寄送驗證信給您,確保未來信件會送到您的信箱