華為公司自2019年以來發起的「天才少年」計劃長期受到輿論關注。
澎湃新聞(www.thepaper.cn)記者注意到,華為心聲社區7月25日發佈的一篇文章《26歲從計算機視覺界「黃埔軍校」博士畢業,他想為車打造一雙慧眼》介紹了2020年入選華為「天才少年」計劃的黃青虯從新員工迅速成長為帶領近50人團隊leader的故事。
過去的28年,黃青虯的頭上總是環繞著很多的光環:從小一路是學霸,以692分、全省40名的成績考入清華大學自動化系;作為隊長,帶領清華大學「火神機器人戰隊」,拿下RoboCup(機器人足球世界杯)的第四名;26歲從被譽為計算機視覺界的「黃埔軍校」——香港中文大學多媒體實驗室博士畢業,發表十多篇頂級會議論文;2020年入選華為「天才少年」計劃,加入智能汽車解決方案BU不到兩年,從新員工迅速成長為帶領近50人團隊的leader。
對於自己入選「天才少年」計劃的過程,黃青虯介紹:從香港中文大學多媒體實驗室博士畢業后,一個偶然的機會,剛成立不久的華為車BU聯繫上我。經過了幾輪面試,我成功拿到了天才少年的offer。當時我非常糾結:到底是去我熟悉的視頻分析領域繼續深耕,還是轉到自動駕駛這個方向上?經過了一番思考,我最終還是決定加入車BU。我覺得,文娛產業雖然也在豐富精神生活上起到非常重要的作用,但遠不如智能汽車這樣的「硬科技」是國家社會的基石產業。而且汽車產業正處於一個變革時代,就類似於手機從功能機到智能機的演進,而自動駕駛又是這個變革中的核心之一,它極大可能會改變整個人類社會。
「能夠入選我很榮幸。後來看到很多相關的熱搜,才意識到這是一個自帶熱度的話題。但我是個實用主義者,我並不會把『天才少年』當成一個光環或者一個包袱,而是會盡量忘掉它,只在有需要用到的時候把它拿出來,比如需要這個title去吸引應屆生的時候,哈哈。就像任總說的,進入華為公司,就沒有『天才少年』這個名詞了,也沒有博士、學士之分,也沒有年輕專家、老專家之分,大家都是在一個起跑線上的,都要踏踏實實做好本職工作。」黃青虯說道。
談及自己對「計算機視覺」感興趣的開始,黃青虯回憶:高中的時候看《黑客帝國》《變形金剛》,就被機器人控制人類、機器人和人類戰鬥這樣的場景震撼到了,對機器人產生了濃厚的興趣。上大學后我成為清華大學「火神機器人戰隊」的一員,開始搗鼓起了機器人……對人來說,我們習慣了有一雙強大的眼睛,「所見即所得」對我們來說是非常自然的事情,但是在計算機系統里,從圖像到機器可感知的三維信息,轉化過程其實非常複雜。而我要做的就是為機器人打造一雙強大的眼睛,這是一件很有挑戰但也很酷的事情。
說到自己在計算機視覺界的「黃埔軍校」所經歷的「魔鬼」訓練,一段看了100遍電影《泰坦尼克》的往事讓黃青虯記憶猶新。
「我博士期間研究的課題非常有意思,是利用AI技術對電影進行結構化解析,也就是讓機器去理解電影,從一部電影中解析出人物關係、故事情節等。因為這個研究課題在計算機視覺研究領域算比較冷門,前人研究很少,一切要從頭開始。但我還是決定去試試,因為我覺得電影本身是一種比較藝術、人文的東西,用科技去解析藝術,理性和感性的碰撞也許會有不同的火花。」黃青虯介紹道。
「我和幾個小夥伴從零開始,通過電影、劇本、影評各種渠道,收集了學術界第一個、也是當時最大最豐富的電影研究數據集,叫MovieNet,大概有十幾萬部電影。基於這個數據集,我們做了很多有意思的課題研究,包括演員的識別、精彩片段的自動化剪輯、用文字搜索電影片段等。」黃青虯還介紹道。
黃青虯稱,這些課題的研究成果非常具有應用價值,比如演員識別和人物關係識別,就是現在很多視頻網站上會看到「只看他」「只看某個CP」功能的核心技術,再比如視頻自動剪輯,就可以用到現在很多視頻剪輯軟體中,幫助用戶自動剪輯出短視頻。但同時這些課題也是非常挑戰的,比如演員的識別,雖然人臉識別已經是一個比較成熟的技術了,但是在一部電影裡,一個演員清晰正臉的鏡頭往往不到30%,更多的場景下,人物的識別都是不能靠臉的,比如打鬥的時候人臉是糊的,比如晚上光線非常暗的時候臉常常看不全,比如有時候只能看到背影。我們也是在做的過程中,才看到了這些難點,並且通過引入衣著、環境、人物關係等信息,再加上一個漸進式的推理模型,解決了其中大部分的問題。
「讀博的前兩年,由於研究方向比較冷門,我的論文投稿頻頻碰壁,我發出第一篇論文的時間其實晚於實驗室的大部分同學。但經歷了一輪又一輪反覆打磨后,我們最終也慢慢得到了學術界的認可。在整個博士期間,我發表了十多篇頂級會議論文。我還記得每篇論文我們都是用《泰坦尼克》做demo,整個博士期間我把這部電影估計看了100遍以上,台詞都快能背下來了。」黃青虯說道。
加入華為之後,黃青虯智能駕駛的視覺感知小組目標就是:通過相機,讓車感知周圍的物理世界,包括檢測路上的車輛、行人,判斷他們的運動狀態等。此後,黃青虯成為激光感知團隊的leader,開始帶領團隊在這個領域衝鋒陷陣。激光雷達作為一個非常新的感測器,雖然能提供更精準的測量,讓我們對環境的測量更加精準,但是同時也會帶來非常多的問題,就像武俠小說里的絕世武器,想要駕馭好並不容易,只有在內力深厚的人手上才能發揮出巨大的威力。
黃青虯舉例:下雨天別的車從你旁邊開過,會濺起很多水花,在激光的視角里,它看到的是無數個點,有些會橫跨兩個車道跑到你的前方,從激光的視角看就會誤以為面前有一個巨大的障礙物,需要剎車,但此時,攝像頭捕捉的又是另外的畫面,在這種情況下,就需要制定很多複雜的規則,什麼時候應該相信激光雷達,什麼時候應該相信攝像頭,這會嚴重影響自動駕駛在雨天的性能表現。為此,我們設計了前融合演算法,把攝像頭捕捉到的圖像和激光雷達捕捉到的點雲,一起輸入神經網路去做融合感知,得出更準確的結果。
一年以來,黃青虯團隊苦練內力,做了一個又一個實驗,設計了一版又一版的方案,終於把激光感知演算法的性能做到了穩定高效,讓激光雷達在自動駕駛系統中發揮出了巨大的威力。伴隨著極狐的量產,黃青虯團隊終於可以自豪地講,他們是業界第一個把激光雷達以感測器的身份,而不是裝飾品的身份,安裝到一台量產乘用車上的團隊。
對於下一步的目標,黃青虯透露:一方面,他們會持續打磨現在的激光感知和毫米波感知演算法,去解決大規模商用之後客戶遇到的各種問題,目標是讓客戶體驗不斷提升,讓客戶越來越喜歡用他們的自動駕駛功能。另一方面,在經過幾年的迭代之後,他們當前的感知系統也走到了一個瓶頸期,遇到了一些系統性的難題。比如當前系統的時延還是偏高。所謂時延,就是指從感測器接收到數據到車做出決策的時間差,類似於人的反應時間,是越短越好。所以他們也正在開發下一代感知系統,希望解決之前遇到的很多系統性問題。
看了100遍《泰坦尼克》:這名華為「天才少年」透露魔鬼訓練細節-財經新聞 - 新浪台灣
Read More
No comments:
Post a Comment