從歲月飛向未來:京東AI的國慶跨欄

國慶長假,看閱兵自然是重頭戲。而在另一個舞臺上,科技公司的“閱兵”也在如火如荼上演著。

國慶長假,看閱兵自然是重頭戲。而在另一個舞臺上,科技公司的“閱兵”也在如火如荼上演著。

各大媒體與科技公司合作,進行國慶獻禮的方式,主要是與國慶熱點以各種方式結合,在融媒體渠道進行創意傳播。而在這場傳播熱浪中,AI技術則變成了當之無愧的主角。在各家紛紛亮出自己的AI+國慶創意后,我們也可以借由這個機會,審視不同企業對AI技術的差異化理解與應用。

比如說,京東牽手《人民日報》,在國慶檔帶來了一個名為“70年,我是主角”的創意H5。這個H5采用了目前火熱的AI換臉技術。用戶只需要輸入照片,就可以隨機生成6段微視頻。這些視頻是共和國誕生至今的一系列大事件。借由AI,用戶可以穿過歲月,回到歷史抉擇的舞臺中央,發現自己與共和國休戚與共的因緣瞬間,感受祖國70年的宏偉變遷。

在H5的創意和內容之外,我們還會發現,用AI技術完成的“跨時空光影”,背后是一系列機器視覺技術的躍遷與突破。這些技術已經系統性、大規模、全流程地部署在京東的零售、市政服務、融媒體等場景中,變成共和國真正的生產力。

或許我們可以把這個H5以及背后代表的京東AI技術、AI戰略想象為一次跨欄。從起跳到落地,這背后還能讀出更多關于京東AI的故事。

起跳:從京東AI戰略到“跨越時空”

提到越來越火熱的AI技術,或許每個人都會想起一些相關的公司。但可能很少有人會第一時間想到京東。把京東和AI聯系到一起時,我們可能也更多會想到京東APP中的一些AI應用,以及物流領域的AI加持。

但如果我們品味一下“70年,我是主角”所展現出的AI技術,會發現它指向著機器視覺的深度應用與高可用性。一次生成6段視頻的特征,一張圖片數據匹配大量視頻資源的深度交互模式,以及國慶熱點中海量并發數據的處理,都讓這份國慶獻禮顯示出莊重與激昂。

把邏輯倒回一點,如果我們將這次H5視作一次跨欄,那么,起跳其實是京東持續積累的AI戰略與AI技術能力。事實上,京東已經在AI之路上,投注了相當可觀的時間與資源。

2018年4月,京東發布了AI開放平臺NeuHub。NeuHub的特色,是基于京東豐富的場景和海量數據,在實際應用中發展而出的,面向零售與零售基礎設施領域的AI開放平臺。

目前,NeuHub平臺包含開發平臺、應用平臺和創新應用,以平臺級的服務鏈接人工智能的供需兩側,提供能力、工具、SaaS等一站式人工智能服務和應用,以及面向不同場景的端到端集成創新產品和解決方案,以多層次的人工智能產品和應用,滿足多維度人工智能需求。

依托于NeuHub對數據、算法,以及應用場景的結合,京東踏出了以業務場景為軸心的AI之路。2019年8月,在上海2019 WAIC世界人工智能大會開幕式上,科技部公布了最新一批國家人工智能開放創新平臺名單,宣布依托京東集團建設智能供應鏈國家新一代人工智能開放創新平臺,領銜智能供應鏈國家戰略發展。入選“國家隊”的京東,確定了NeuHub為核心載體,零售、物流、供應鏈為廣泛應用場景,依托京東零售、物流、金融、云計算、IoT、大數據等能力和資源,全面向業界開放的AI戰略體系。

京東集團副總裁、京東人工智能事業部總裁、京東人工智能研究院院長周伯文博士認為,京東智能供應鏈國家新一代人工智能開放創新平臺將從基礎資源、能力支撐、應用生態三個層面進行平臺架構設計,形成“三三三”總體框架和任務。

即夯實算力、數據、算法三大基礎資源;集成京東開發經驗和開發組件、京東AI算法庫及定制化模型工具三大核心能力;平臺從工具、服務和組件三個方面,在智能生產、智能流通、智能消費三大應用場景支持和構建生態。

從夯實平臺基礎能力做起,面向零售產業與供應鏈實際場景提供可用性服務,強調技術與工具、服務的融合。這些特點構筑了京東AI的三大差異化特征。而這些特征,某種程度上非常生動的展現于這次“跨越時空”的H5當中。

厚積薄發的京東人工智能,決定在國慶舞臺上展示一下身手。

空中:視頻換臉技術的三層飛躍

讓我們回到“70年,我是主角”的傳播創意當中。

事實上,如今AI換臉類的玩法大多數讀者已經并不陌生。視頻換臉雖然火熱,但最初的驚奇顯然已經過去。然而正是在這樣的時刻,我們可以更準備品讀出換臉技術背后的差異化優勢,從而透視技術提供者的產業供給能力。

從京東AI戰略的起跳點出發,可以看到這次H5本身在技術上實現了3層技術跨越。這些技術應用帶給了我們獨特的國慶慶祝方式,也帶我們看到了未來京東將要輸出給產業的AI技術特征:

1、跨越運動:人臉檢測算法ISRN

這次H5的一大特征,就是生成的電影片段里有大量奔跑鏡頭和頻繁的姿態變化。我們知道,一般視頻變臉模型,是很難處理快節奏運動的,高頻運動基本意味著丟幀和算法捕捉失靈。

為了解決這個問題,讓用戶真正體會在歷史大事件中奔跑的感覺,京東AI提出了全新的人臉檢測算法“Improved Selective Refinement Network(ISRN)”。

ISRN在業界頂級人臉檢測榜單“WIDER FACE”中的“Easy”、“Medium”和“Hard”三項評測集中,以96.3%AP,95.4%AP,90.3%AP的優異性能全部獲得排名第一。在遠景、動態以及快速姿態變化中保證了AI依舊能夠高效準確工作。

2、跨越空間:人臉3d關鍵點檢測

AI換臉的另一個關鍵問題在于,人臉是會進行空間運動的。也就是側臉、轉動頭部、低頭抬頭等動作,都會讓人臉識別和替換的空間關系發生變化。這經常會導致瞬時的模型失靈,降低視頻換臉的體驗。為了應對空間障礙,京東利用3D關鍵點檢測技術,定位了人臉區域的5萬多個關鍵點,并基于這些關鍵點對人臉進行重構。這一努力是這次“跨越時空”得以實現的關鍵。

由于3D數據難以獲取且很難修正,京東提出了一種基于2D關鍵點輔助的3D關鍵點檢測方法,性能超越了當前業界主流3D關鍵點檢測算法,這使得完全側臉的數據也可以準確進行3D檢測。

3、跨越光影:紋理圖像的融合處理

在視頻換臉中,還有一個難點就是對光線的處理。由于電影中的光線明暗變化非常復雜,這給換臉的自然度帶來了非常大的挑戰,尤其是人臉關鍵點檢測將非常困難。面對這樣的問題,京東AI采用了在紋理圖上進行融合處理的方式,使紋理生成獨立于頭部姿態變化,增強了換臉效果的魯棒性,讓用戶的面孔,和時代的光影融合為一。

這三層跨越,可以總結為這樣一個技術特征:在復雜場景中應用,與現實視頻數據深度耦合的人臉識別與圖像處理能力。藏在一個H5背后的三個飛躍,體現出了京東AI技術在商業落地方面的廣闊可能。

落地:新商業,新AI

跨越技術難題,挑戰極速準確電影換臉的京東AI,實際上正在廣泛完成從AI起跳、技術飛躍,到商業落地的三部曲進化。

讓我們回想一下前文講述的三層技術跨越,不難發現這三個挑戰,都是現實場景中人臉識別與圖像處理工作里普遍面臨的難題。比如零售場景中,要應對大量側臉和低頭的識別情況;安防場景中,快速運動其實是最需要準確識別的場景,但往往會成為困擾AI的難題。

如果把“70年,我是主角”視為一次技術閱兵。那么其背后展現出的,實際上是京東AI在人臉識別、視頻分析與圖像處理能力在現實場景中的深層應用。人臉識別與精準處理,將可以快速動態在復雜、高速、多角度的視頻當中發揮識別和處理功能,這就將單一平面化的人臉技術,提升到了現實中的人臉識別+多元處理紀元。

把實驗中看上去不錯的懸空AI,變為到現實場景中的實戰AI,這是京東AI的核心特征。事實上,H5中應用的機器視覺技術,已經廣泛應用于京東在零售、安防等領域的產業布局。

比如在零售領域,京東AI的視聯網各項產品中已經廣泛應用人臉相關技術來提升用戶體驗和服務效率,比如增進拍照購精準度,在京東門店體系中進行人流與分析,在物流體系中進行配送分揀行為識別等等。

而在安防領域,京東AI的人臉技術已經與公共安全、交通城市、智能樓宇等場景廣泛結合,形成了京東新的產業合作空間。

深度技術融合、面向現實問題、安全可信賴,這些關鍵詞構成了京東AI的戰略結構。“70年,我是主角”中,真正的主角其實是AI技術系統性、大規模、全流程的商業落地。這一通道,正在為京東和產業智能化的未來提供一個全新舞臺。

新商業,新AI,京東正在觸發一段新的科技旅程。

本文來自腦極體投稿,不代表錦鯉財經立場,如若轉載,請注明出處:http://www.lqkqwgz.cn/news/79910.html

發表評論

登錄后才能評論

聯系我們

?合作微信:youbigger

在線咨詢:點擊這里給我發消息

郵件:[email protected]

工作時間:周一至周五,9:30-18:30,節假日休息

麻将技巧快速提高法 紫金矿业股票行情 平特肖的简单公式算法 星悦福州麻将 大发快3走势图 重庆快乐10分 江苏快3开奖结果今 黑龙江22选5官网 广东十一选五精选 广东快乐十分官方下 临汾期货配资 11先5开奖走势图安微 中国开奖结果查询 股票涨跌的影响 急速赛车计划app下载 捕鱼达人3内购破解版下载 九游棋牌官网?