資源描述:
《曠視科技聯(lián)合創(chuàng)始人兼CTO唐文斌個人簡歷.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、曠視科技聯(lián)合創(chuàng)始人兼CTO唐文斌個人簡歷曠視科技聯(lián)合創(chuàng)始人兼CTO唐文斌個人簡歷 新智元:曠視的核心優(yōu)勢是什么? 唐文斌:深度學習有三個核心要素,算法、數(shù)據(jù)和系統(tǒng),這三者是相乘關(guān)系——你有一個好的算法,用有很多數(shù)據(jù)去催它,當數(shù)據(jù)變多、算法變復雜后,還需要有一套很好的底層架構(gòu)和引擎來支撐。 從算法的角度講,我們請來了孫劍老師,希望孫劍老師帶著同學們在現(xiàn)有算法基礎上找到新的東西。算法就像人的智商,數(shù)據(jù)就像人的見識,見識決定了你能走到多高,而智商決定了你能走多遠,兩件事情都非常重要。我們的研究團隊其實就在智商這個方向上探索。而數(shù)據(jù)是一個更產(chǎn)品或者更工程的
2、事情,我們需要在產(chǎn)品中設計一個好的方式,形成數(shù)據(jù)的循環(huán),讓產(chǎn)品中的數(shù)據(jù)回來,不斷加深算法的訓練,讓它變成更強的算法?! ∥覀円卜浅V匾曄到y(tǒng)的建設,我們有自己研發(fā)的MegBrain深度學習引擎和Brain++平臺。如果說研究的價值在于去探索邊界之外的東西,那邊界之內(nèi)的,比如網(wǎng)絡結(jié)構(gòu)的搜索,都應該用機器來完成。我們的產(chǎn)品中常常會有的定制算法的需求,很多時候大框架都差不多,數(shù)據(jù)工程師把數(shù)據(jù)整理和準備好以后,就直接用系統(tǒng)把各種類型的模型都嘗試一遍,最后挑選出一個不錯的?! ⌒轮窃耗闾岬搅藬?shù)據(jù)工程師,現(xiàn)在曠視在數(shù)據(jù)方面投入多少?有多少人標注數(shù)據(jù)? 唐文斌:全職
3、標注的大約有300人,不算在600多人的團隊里面。我們還有很多工作是外包完成。我們內(nèi)部有標注的數(shù)據(jù)庫是PB級別?! ⌒轮窃耗阍谇迦A擔任科協(xié)主席,也帶過中國奧林匹克信息學競賽團隊,可以說你是曠視最開始的首席人才官。你認為目前人工智能人才應該有什么樣的特點?曠視在選擇的時候看重什么特質(zhì)? 唐文斌:我覺得人才的類型是很多樣的,每一種類型的人才都是人才,光會寫paper的人才也是人才,雖然價值沒有那么大。在現(xiàn)在的人工智能發(fā)展態(tài)勢下,我們最需要的是復合型人才。做產(chǎn)品的時候會有產(chǎn)品經(jīng)理,但人工智能場景下的產(chǎn)品經(jīng)理需要更加復合。 我們團隊最早的一位同學,員工工
4、號No.5的“卿爺”,我們現(xiàn)在提供給小米、VIVO人臉解鎖的產(chǎn)品線都是他帶著團隊來做的,他需要有什么樣的能力?第一,懂算法,不一定要懂算法具體是怎么做的,但一定要懂算法的邊界在哪里——堅信這件事情一定能做到,但同時也要了解現(xiàn)在的算法有些東西是真的做不到。第二,有很好的工程判斷力,用算法的方式是從本質(zhì)去解決問題,而有些東西你會通過工程的方法去“不本質(zhì)的解決”,倒推出一個一個設計。第三,也是更為重要的,需要不斷從用戶的需求、用戶的場景、用戶的價值角度出發(fā)思考問題。這樣一個產(chǎn)品經(jīng)理,他需要比以往的產(chǎn)品經(jīng)理有更多工程上sense,更多算法上的sense?! 墓?/p>
5、程師的角度來講,我們有一個詞,叫“全棧AI工程師”,我們希望這位同學不僅數(shù)學好,懂算法,編程很強,還非常懂系統(tǒng);算法編程都很懂才能做引擎,懂體系結(jié)構(gòu)你的引擎才能在不同的平臺上都跑得很好很快。這樣的人非常難找,但也是最強的。比如說我們做Brain++平臺的那幫人,他們提供的是訓練平臺,給到研究人員使用,他們知道Research是怎么使用這些東西,他們自己也隨時都能轉(zhuǎn)變?yōu)镽esearcher。同時,他們考慮Researcher做的哪些事情是沒有價值的,要把它工程化、系統(tǒng)化,最終的目標是消滅Researcher——所有在邊界范圍內(nèi)的Research都由系統(tǒng)來完
6、成,而Research真正要做的事情是突破邊界,探索邊界之外的東西?! 缫曉谶x擇人才的時候也是按照這個標準。如果有這樣的人,我們特別特別希望你能夠加入我們,我們團隊里有很多這樣的人,你跟他們在一起一定會非常愉快。其次,我們也很看重學習能力,現(xiàn)在領(lǐng)域發(fā)展很快,你需要非??焖俚馗瞎?jié)奏去嘗試你的新想法,所以學習能力和動手速度非常重要。我們也有實習生項目,總之歡迎你來,孫劍老師帶你飛對吧(笑)。算法與硬件結(jié)合,從源頭抓起控制成像質(zhì)量 新智元:曠視的算法、軟件如何與硬件相結(jié)合? 唐文斌:我們有自己的深度學習引擎MegBrain,這個引擎在不同的品牌上做了非
7、常多的底層優(yōu)化,能夠跑得非??臁N覀冏罱龅囊豢钪悄芟鄼C產(chǎn)品,這個相機是業(yè)界第一款全幀率、全畫幅(1080P)智能人像抓拍機。 全幀率的意思就是說,每秒30幀,每幀都去抓取,在業(yè)界這個指標是最高的。有的嫌疑人員有很強的反偵察意識,一看到攝像頭會馬上低頭,如果相機不能以非??斓乃俣茸龀鼋厝?,可能只有100毫秒,一兩幀之后這人就消失了。同時,每一幀都檢測,也能確??偸悄茏サ劫|(zhì)量最好的一幀,為后續(xù)應用服務。以往的相機在畫面中抓拍做檢測,基本上最多只能抓拍畫面中10到20個人,再多就抓不到了,因為計算量不行。我們可以做到128張人臉,很大的人流也能跟蹤得很好。
8、 我們用的是自己設計的FPGA芯片,在算法層面也做了很大升級。硬件也好,算法也