http://blog.sina.com.cn/s/blog_cfa68e330102zg2l.html
創(chuàng)新互聯(lián)是專業(yè)的萬州網(wǎng)站建設(shè)公司,萬州接單;提供網(wǎng)站建設(shè)、網(wǎng)站制作,網(wǎng)頁設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行萬州網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來合作!2018-11-16 12:02:32
11 月 23 ~ 24 日,GIAC 全球互聯(lián)網(wǎng)架構(gòu)大會將于上海舉行。GIAC 是高可用架構(gòu)技術(shù)社區(qū)推出的面向架構(gòu)師、技術(shù)負(fù)責(zé)人及高端技術(shù)從業(yè)人員的技術(shù)架構(gòu)大會。今年的 GIAC 已經(jīng)有英特爾 、 騰訊、阿里巴巴、百度 、 螞蟻金服 、 華為 、 科大訊飛、新浪微博、京東、七牛、美團(tuán)點(diǎn)評、餓了么 、 才云 、 格靈深瞳 、 Databricks 等公司專家出席。 本周購買可享門票88折優(yōu)惠,高可用架構(gòu)會員低至6折 。
在大會前夕,高可用架構(gòu)采訪了2018年 GIAC大數(shù)據(jù)&AI分論壇 出品人鄧亞峰, 就目前大家廣泛關(guān)注的大數(shù)據(jù)&AI方面的問題進(jìn)行了訪談。
鄧亞峰,現(xiàn)任格靈深瞳信息技術(shù)有限公司首席技術(shù)官,畢業(yè)于清華大學(xué),具有16年的計(jì)算機(jī)視覺和人工智能方向的研發(fā)經(jīng)驗(yàn)。在過去的工作中,他發(fā)表過論文十余篇,申請中國專利超過100項(xiàng),其中已經(jīng)授權(quán)的有95項(xiàng)。他曾任職百度深度學(xué)習(xí)研究院,負(fù)責(zé)人臉識別方向,曾經(jīng)多次帶領(lǐng)團(tuán)隊(duì)在主流的人臉檢測、人臉識別競賽上取得過優(yōu)異成績。其主要的興趣是關(guān)注人工智能特別是計(jì)算機(jī)視覺技術(shù)如何從技術(shù)、產(chǎn)品和商業(yè)角度在真實(shí)世界中大規(guī)模落地。
高可用架構(gòu):很高興采訪到您。您是AI領(lǐng)域的老兵了,能否簡單介紹一下您以及您選擇深耕AI領(lǐng)域的初心是什么?為什么看中了AI的發(fā)展方向?
鄧亞峰: 2002年,我本科畢業(yè)到清華讀研究生,當(dāng)時很多同學(xué)選擇的是通信這些當(dāng)年比較熱門的方向,我自己選擇AI本身有偶然因素,但后來回想確實(shí)是因?yàn)樽约汉芟矚g這個方向,感覺讓計(jì)算機(jī)能看懂圖像視頻中的內(nèi)容或能識別語音中說話的內(nèi)容都是非常有趣、很酷的事情,于是就選擇了這個方向。
開始做這個方向,主要是出于興趣和對技術(shù)的熱愛,感覺做AI是很有挑戰(zhàn)很有趣的事情,就進(jìn)來了。在2012年前的時候,AI因?yàn)槁涞睾苌?,一直都是一個在工業(yè)界很冷門的方向,當(dāng)時做這塊的公司很少。我自己能夠堅(jiān)持下來,一方面是興趣和熱愛起了很大的作用,另外一方面,我從一開始就相信AI技術(shù)的價值和對我們未來生活的巨大影響。AI可以看作是工業(yè)自動化的延申,幫助人從簡單重復(fù)的工作中解放出來,增強(qiáng)人的能力,提高人的效率,從而讓我們過上更好的生活,讓我們擁有更好的世界。
高可用架構(gòu):格靈深瞳在計(jì)算機(jī)視覺等領(lǐng)域有非常高的知名度,您覺得計(jì)算機(jī)視覺大的難點(diǎn)是什么?在落地的過程中,遇到大的困難又是什么?
鄧亞峰: 計(jì)算機(jī)視覺雖然取得了巨大進(jìn)步,但依然難以真正產(chǎn)品化,往往需要針對場景調(diào)整和適配,目前的主要挑戰(zhàn)是如何研發(fā)出性能指標(biāo)、成本、支持規(guī)模都能夠大規(guī)模復(fù)制的標(biāo)準(zhǔn)化產(chǎn)品。而落地過程中,和其它人工智能技術(shù)一樣,大的難點(diǎn)是技術(shù)能達(dá)到的水平和大家的需求之間沒辦法百分之百匹配。比如,在過去很多年中,人臉識別需求一直都存在,但技術(shù)無法充分滿足,也就無法落地。即使在今天,技術(shù)依然不是完美的,但我們不能等待技術(shù)完全成熟才去落地。所以,當(dāng)前階段的主要挑戰(zhàn)在于,基于現(xiàn)有不完美的技術(shù),如何綜合市場、產(chǎn)品、技術(shù)各方面的因素,盡快讓技術(shù)變成產(chǎn)品、服務(wù)落地產(chǎn)生價值,并利用落地產(chǎn)生的營收、數(shù)據(jù),幫助人才、技術(shù)、產(chǎn)品和市場形成良性循環(huán)。
高可用架構(gòu):數(shù)據(jù)在AI領(lǐng)域扮演很重要的角色,模型訓(xùn)練通常需要很多的數(shù)據(jù),業(yè)內(nèi)一般采用什么方式做數(shù)據(jù)標(biāo)注?人肉標(biāo)記嗎?格靈深瞳是怎么做的?
鄧亞峰: 由于深度學(xué)習(xí)模型的特點(diǎn),現(xiàn)在的模型訓(xùn)練往往需要大量數(shù)據(jù),以人臉識別為例,往往需要幾億幾十億的數(shù)據(jù)。用暴力方式標(biāo)注這么多的數(shù)據(jù),一方面成本非常高(一般標(biāo)注一張圖需要幾毛錢),另外一方面,很多數(shù)據(jù)標(biāo)注任務(wù)難度超出了人的能力。我們一般采用了半自動方式進(jìn)行處理,利用現(xiàn)有算法模型把數(shù)據(jù)進(jìn)行預(yù)處理,然后將其中機(jī)器無法做好而人可以做好的部分采用人工標(biāo)注,通過數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián)來大大減少標(biāo)注工作量,并提升標(biāo)準(zhǔn)質(zhì)量。
高可用架構(gòu):數(shù)學(xué)是人工智能的基礎(chǔ),需要學(xué)習(xí)哪些數(shù)學(xué)知識才能進(jìn)入該領(lǐng)域?不同的人工智能方向是否需要掌握不同的算法?人臉檢測、人臉識別一般包含哪些算法?
鄧亞峰: 數(shù)學(xué)知識對從事人工智能的同學(xué)而言非常重要,當(dāng)前的人工智能主要是基于統(tǒng)計(jì)的,同時神經(jīng)網(wǎng)絡(luò)中有很多關(guān)于求導(dǎo)、矩陣相關(guān)的運(yùn)算,所以,如果可以掌握高等數(shù)學(xué)、概率統(tǒng)計(jì)、隨機(jī)過程、線性代數(shù)或矩陣論相關(guān)的知識將會很有幫助。當(dāng)然,如果已經(jīng)掌握了機(jī)器學(xué)習(xí)的各種知識,上述的數(shù)學(xué)知識并不是必需的。而且人工智能是一門需要動手親歷才能掌握的學(xué)科,所以,并不一定要先學(xué)好上述課程才可以開始人工智能的學(xué)習(xí)。
不同的人工智能方向,因?yàn)橛胁煌娜蝿?wù),有不同的領(lǐng)域知識,所以需要有不同的模型或者方法來表示,算法上自然會有所區(qū)別。比如視覺里面的檢測任務(wù)就是其它領(lǐng)域較少用到的,而語音識別和語義理解里面會用到很多序列相關(guān)的模型,視覺領(lǐng)域用到的會少一些。但現(xiàn)在,語音識別、自然語言理解的方法和機(jī)器視覺在方法上越來越統(tǒng)一,不同領(lǐng)域的方法也會相互借鑒,所以,作為算法工程師,最好可以都掌握一些。
人臉檢測在早期有相對獨(dú)立的算法,比如boosting等,但在深度學(xué)習(xí)時代,人臉檢測算法和物體檢測的算法基本上趨同,目前使用較多的包括SSD、R-FCN等通用物體檢測框架。而人臉識別的整個過程分為檢測、特征點(diǎn)定位和特征表示幾個模塊,其中最重要的特征表示模塊,需要利用訓(xùn)練數(shù)據(jù)的身份信息學(xué)習(xí)得到普適的人臉表示,除了網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì),最重要的是設(shè)計(jì)損失函數(shù),早期的特征表示在損失函數(shù)上有softmax、contrastive-loss、triplet-loss等方法,近期,softmax的很多改進(jìn)算法慢慢成為主流。
高可用架構(gòu):對于想掌握或者提升AI技能的人,能否給他們總結(jié)一下快速上手的學(xué)習(xí)路線?
鄧亞峰: 對于沒有基礎(chǔ)的同學(xué),我建議的學(xué)習(xí)步驟是:
Step1,閱讀相關(guān)深度學(xué)習(xí)的基礎(chǔ)知識,了解神經(jīng)網(wǎng)絡(luò)、SGD優(yōu)化方法、損失函數(shù)等基本概念;
Step2,花一點(diǎn)時間熟悉一個訓(xùn)練框架,tensorflow、pytorch、mxnet任何一個;
Step3,找一個任務(wù)上手做,哪怕是MNIST的簡單分類任務(wù),遇到問題,自己查資料解決或者找人請教解決,總之,在做中學(xué)是效率最高的;完成這個任務(wù)后,再找一個更難的任務(wù)去完成。
對于想提升的同學(xué),一方面是找一個對自己能力而言更有挑戰(zhàn)的任務(wù)來完成,另外一方面非常重要的捷徑是一定要加入一個很厲害的團(tuán)隊(duì),在團(tuán)隊(duì)中學(xué)習(xí)提高要遠(yuǎn)遠(yuǎn)好過自己摸索。
高可用架構(gòu):高水平的人工智能人才應(yīng)該具備哪些專業(yè)能力?您覺得普通的人工智能工程師要想成為專家通常需要提升哪些方面的能力?
鄧亞峰: 在工業(yè)界,高水平的人工智能人才,需要在算法能力、工程能力以及對行業(yè)和產(chǎn)品的理解能力上都非常強(qiáng),既要看到大的趨勢,和技術(shù)的價值,也知道如何將技術(shù)通過算法和工程打磨產(chǎn)品化。普通的人工智能工程師如果想提升為專家,先需要在本職工作中,提升算法和工程能力,并擴(kuò)展自己的視野和技術(shù)領(lǐng)域,并慢慢提升在行業(yè)和產(chǎn)品上的理解能力。
高可用架構(gòu):深度學(xué)習(xí)對于計(jì)算機(jī)視覺的意義不言而喻,現(xiàn)在前者基本上也成為了后者的標(biāo)配,然而一方面,深度學(xué)習(xí)對于大規(guī)模數(shù)據(jù)具有非常強(qiáng)的依賴性;另一方面,在很多現(xiàn)實(shí)應(yīng)用場景中又往往難以獲得大規(guī)模的數(shù)據(jù),在您看來,該怎樣在深度學(xué)習(xí)和數(shù)據(jù)的規(guī)模間找到平衡?
鄧亞峰: 深度學(xué)習(xí)對數(shù)據(jù)的依賴是由于其模型學(xué)習(xí)過程中的優(yōu)化方式?jīng)Q定的,如果想根本上改變,需要優(yōu)化方式有非常巨大的突破,短期看是比較難的。在實(shí)踐中,有一些減少數(shù)據(jù)依賴的方式,比如利用遷移學(xué)習(xí)思路,利用其它領(lǐng)域的數(shù)據(jù)訓(xùn)練模型的基底,再用少量領(lǐng)域數(shù)據(jù)去學(xué)習(xí),還比如利用半監(jiān)督或非監(jiān)督方法,將大量的未標(biāo)注數(shù)據(jù)利用起來。除此之外,還可以考慮利用問題的約束條件,加強(qiáng)對模型的約束,提升泛化能力,減少對數(shù)據(jù)的依賴。當(dāng)然,數(shù)據(jù)增廣也是非常重要的提升數(shù)據(jù)量的方法。在目前的技術(shù)條件下,在工業(yè)界,如何低成本獲取大量標(biāo)注數(shù)據(jù)依然應(yīng)該是最先被想到的方法。
高可用架構(gòu): 作為 GIAC 的聯(lián)席主席、AI 專場的出品人兼講師,本次演講您將主要從算法、數(shù)據(jù)、計(jì)算等角度來分析打造大規(guī)模計(jì)算系統(tǒng)上的經(jīng)驗(yàn),那在您看來,現(xiàn)在的大規(guī)模計(jì)算系統(tǒng)的打造存在哪些難點(diǎn)?關(guān)鍵點(diǎn)在哪?以及大規(guī)模計(jì)算系統(tǒng)有哪些方面的現(xiàn)實(shí)意義呢?
鄧亞峰: 機(jī)器視覺的終極目標(biāo)是希望讓各種視覺傳感器擁有智能,理解物理世界中人、車、物的特征、身份、行為、關(guān)系,將物理世界數(shù)字化。目前為止,還沒有產(chǎn)生真正的大規(guī)模視覺計(jì)算系統(tǒng)。打造大規(guī)模視覺計(jì)算系統(tǒng)的難點(diǎn)和關(guān)鍵在于,一方面需要不斷提升算法的準(zhǔn)確性和場景適應(yīng)性,才能在海量數(shù)據(jù)中,產(chǎn)生可以接受的錯誤,另外一方面需要不斷提升算法的效率并降低成本,使得對于海量數(shù)據(jù)的處理時間和成本可以承受,第三則是需要配合大數(shù)據(jù)技術(shù)挖掘跨傳感器目標(biāo)間的關(guān)系。一旦能夠真正打造出成本可接受的大規(guī)模視覺計(jì)算系統(tǒng),那么將會在智慧城市、智慧商業(yè)等很多領(lǐng)域中對安全、管理和商業(yè)運(yùn)營都會產(chǎn)生巨大的影響,使得線下世界將可以用更加智能、數(shù)字化的方式運(yùn)營,線下世界和線上世界將融合打通,產(chǎn)生更多的商業(yè)模式和價值。
涉及到很多技術(shù)相關(guān)的內(nèi)容,我會在23日的GIAC上再詳細(xì)的展開。 希望我講解的內(nèi)容能幫助大家了解機(jī)器視覺方向的前沿技術(shù)、關(guān)鍵因素以及應(yīng)用方向,希望大家能夠少走彎路。
高可用架構(gòu): 作為 GIAC 的聯(lián)席主席、重磅嘉賓,您對大會有什么樣的寄語?
鄧亞峰: 希望GIAC成為技術(shù)人員深度交流、碰撞思想的舞臺,為參會者真正帶來收獲和價值。
新聞標(biāo)題:格靈深瞳CTO鄧亞峰:AI學(xué)習(xí)的三種路線-創(chuàng)新互聯(lián)
當(dāng)前地址:http://aaarwkj.com/article42/ccojec.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)網(wǎng)站制作、外貿(mào)網(wǎng)站建設(shè)、網(wǎng)站導(dǎo)航、關(guān)鍵詞優(yōu)化、App設(shè)計(jì)、自適應(yīng)網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容