機器也有情商?微軟對話(huà)式人工智能

可以看到,很多從微軟亞洲研究院走出去的人才都涌向人臉識別領(lǐng)域,而現在微軟研究院似乎并沒(méi)有沿著(zhù)這個(gè)方向走,他們最為人熟知的是對話(huà)式人工智能。在微軟看來(lái),計算機在對話(huà)能力和情感理解能力方面仍然遠遠落后于人類(lèi),因此在2014年開(kāi)始就研發(fā)微軟小冰,是一款基于情感計算框架、以情商為主要方向的對話(huà)式人工智能。那么,目前微軟的對話(huà)式人工智能到底進(jìn)展到哪一步了呢?微軟中國區首席技術(shù)顧問(wèn)管震近日在一個(gè)人工智能論壇上做出精彩分享,表示機器開(kāi)始學(xué)習人的情緒,來(lái)滿(mǎn)足各種需求。微軟小冰在全球范圍內,與數億人類(lèi)進(jìn)行了旨在建立情感連接的對話(huà),總計對話(huà)量已超過(guò)300億輪。

1

此外,基于人工智能的深度學(xué)習和大量數據,微軟小冰還能勝任主持人,甚至是創(chuàng )作文學(xué)作品。目前小冰已經(jīng)創(chuàng )作出200首詩(shī),部分作品發(fā)表在詩(shī)集《陽(yáng)光失了玻璃窗》中。這也是人類(lèi)史上第一部完全由人工智能創(chuàng )作的詩(shī)集。

微軟在對話(huà)式人工智能這方向深入研究,已經(jīng)走了很遠的距離。但是對于創(chuàng )業(yè)型的機器人公司而言,千萬(wàn)不要一上來(lái)就想研發(fā)另一個(gè)微軟小冰。管震表示,小冰是面向消費者的對話(huà)式人工智能,微軟花費了大量的人力財力,并與很多企業(yè)合作,灌輸了大量的數據之后才有了目前的成績(jì)。創(chuàng )業(yè)型機器人公司應該將有限的人力財力投入到特定情景的服務(wù)型機器人當中,訓練對應情景的知識地圖。例如在醫院負責掛號導流的服務(wù)型機器人,其服務(wù)對象是病人,只需具備理解病人的病癥并導流到指定科室的能力,查詢(xún)天氣、娛樂(lè )、生活百科式的問(wèn)答是不必要的。

服務(wù)型對話(huà)機器人可以快速響應用戶(hù),提供24小時(shí)服務(wù);標準化的話(huà)術(shù)減少了前臺的服務(wù)培訓時(shí)間。那么如何從零開(kāi)啟創(chuàng )建一個(gè)對話(huà)機器人呢?管震表示,對話(huà)機器人大致分為用戶(hù)交互入口、用戶(hù)意圖理解、調用響應服務(wù)三個(gè)步驟。

其中用戶(hù)意圖理解涉及到到自然語(yǔ)言的理解,例如在復雜的上下文語(yǔ)境下,要連貫起來(lái)理解用戶(hù)表達的意思。據說(shuō)微軟小冰最多能聯(lián)系23句上下文的意思,但是水平還需大大提高。微軟可提供Congnitive Services(LUIS)技術(shù)幫助開(kāi)發(fā)者實(shí)現自然語(yǔ)言的理解。

管震指出,微軟只是提供一個(gè)標準的對話(huà)式機器人框架,開(kāi)發(fā)者需要訓練特定情景的知識地圖。盡管微軟語(yǔ)言識別的錯誤率已經(jīng)非常低了,2016年微軟宣布英語(yǔ)的語(yǔ)音識別轉錄詞錯率僅 5.9%,達到了專(zhuān)業(yè)速錄員水平超越了人類(lèi)。但是在特定的情景下,如面向3-6歲兒童的陪伴型機器人,兒童的表述能力不強,語(yǔ)音識別錯誤率必然會(huì )升高。因此,開(kāi)發(fā)者不能照搬微軟的標準化平臺,而是要訓練兒童對話(huà)場(chǎng)景下的知識地圖和認知能力。

驍龍845移動(dòng)平臺,主導終端側人工智能

智能語(yǔ)音的應用也越來(lái)越多,過(guò)往移動(dòng)設備的AI由于大數據的需要較多依賴(lài)云端,例如微軟的對話(huà)式人工智能更多的是基于云端的大數據、大運算能力。但目前有一個(gè)趨勢是云端的運算能力開(kāi)始往端上遷移,以進(jìn)一步提升效率,同時(shí)可靠性和用戶(hù)隱私數據也得到更高保障。

高通是踐行終端側人工智能的先行者之一,近日推出最新的驍龍845移動(dòng)平臺,終端側智能是高通反復強調的認知。高通在與華為的麒麟970芯片不同,驍龍845并沒(méi)有內置單獨的NPU(神經(jīng)單元),而是綜合部署,將AI處理功能分散在845平臺的異構架構中。高通也在這方面強調,通過(guò)模塊內之間的調用,可以達到更有針對性的AI操作。

高通產(chǎn)品市場(chǎng)總監Dennis Liu在“人工智能解決方案”的主題演講中表示,終端側的人工智能得以發(fā)展取決于三個(gè)關(guān)鍵的技術(shù)。一是高效硬件(處理器的運算能力);二是算法改進(jìn)(在終端運算的資源有限的前提下,想要保證精度必須使算法更簡(jiǎn)潔);三個(gè)軟件工具(嵌入式設備接口很多,如何在復雜的編程環(huán)境下快速部署算法,軟件工具是關(guān)鍵)。

Dennis Liu透露,OPPO R11、VIVO 20、小米6、一加5等手機都用到了高通的人工智能功能。 驍龍神經(jīng)處理引擎通過(guò)軟件來(lái)加速終端側執行的深度學(xué)習網(wǎng)絡(luò ),支持智能手機實(shí)現流暢的解鎖和面部識別體驗,并支持在照片上增添人像模式或實(shí)現實(shí)時(shí)背景虛化。

2

據了解,驍龍神經(jīng)處理引擎(SNPE)SDK除了已支持Google TensorFlow和Facebook Caffe / Caffe2框架之外,現在還支持Tensorflow Lite和新的ONNX,幫助開(kāi)發(fā)者輕松使用他們所選擇的框架,包括Caffe2、CNTK和MxNet。驍龍845還支持Google Android NN API。

除了高通最擅長(cháng)的智能手機領(lǐng)域,驍龍845在VR/AR等產(chǎn)品也頗有建樹(shù)。驍龍845是首款支持室內空間定位(room-scale)六自由度(6DoF)和即時(shí)定位與地圖構建(SLAM)的移動(dòng)平臺。簡(jiǎn)單來(lái)說(shuō),在使用驍龍845處理器玩虛擬顯示產(chǎn)品時(shí)通過(guò)攝像頭可以檢測到周邊的環(huán)境,包括對手實(shí)時(shí)跟蹤,并識別前方障礙物提醒用戶(hù),提升VR沉浸式用戶(hù)體驗。

3

你了解你的膚質(zhì)嗎?基于圖像的膚質(zhì)檢測技術(shù)

皮膚是人的第二張臉,越來(lái)越多的人對自己的膚質(zhì)情況密切關(guān)注。但目前的人工識別技術(shù)大多應用在安防、手機解鎖、支付上面,主要任務(wù)是將人臉識別出來(lái),沒(méi)有將人臉上的膚質(zhì)進(jìn)行進(jìn)一步的分析。和而泰的數據與人工智能實(shí)驗室就在研究基于圖像的膚質(zhì)檢測技術(shù),是人臉識別技術(shù)相對是垂直的研究方向。和而泰副總裁王宏表示,目前可以提供豐富、精細的檢測維度,包括臉型、眉型、膚色、黑頭/毛孔、皺紋等等。

4

和而泰已經(jīng)在京東眾籌上發(fā)布了一款智能膚質(zhì)檢測儀,不過(guò)王宏表示,目前智能硬件的市場(chǎng)接受度比較低,因此主要通過(guò)手機攝像頭這個(gè)超級傳感器去開(kāi)拓市場(chǎng)。

通過(guò)手機拍攝的人臉圖片,手機APP可快速精準的檢測出眼周、臉部、手部等區域的皮膚水分、油分等肌膚參數,并且針對數據進(jìn)行智能分析,提供針對每個(gè)人膚質(zhì)不一樣的定制化改善方案,包括護膚建議、飲食建議、保養建議等。

5

膚質(zhì)檢測減技術(shù)的檢測流程包括圖像采集-圖像預處理-圖像模型(傳統模型、深度模型)-識別結果。王宏表示,膚質(zhì)檢測技術(shù)目前還處于研究階段,并分享了兩個(gè)技術(shù)難點(diǎn)。

一是在圖像采集階段,如何得到一張高質(zhì)量的圖片,亮度和距離都要合適。為了保證圖像的亮度,以及人臉可識別區域的面積,需要在圖像采集時(shí)在前端做亮度和距離的檢測,判斷拍照姿勢、角度、距離正不正確,指導用戶(hù)拍照得到高質(zhì)量的照片。此外在圖像預處理階段也要調節圖像的亮度,從而捕捉到臉部更多的細節。

二是數據標注階段,分為定義數據類(lèi)別、數據標注、數據檢測三個(gè)步驟。對于非專(zhuān)業(yè)人員可以輕易辨識的數據,采取抽樣交叉標注的方式;對于毛孔、黑頭等皮膚問(wèn)題的數據,需要與專(zhuān)業(yè)人員(醫生)合作,花費大量的時(shí)間去標注數據。此外,人臉膚質(zhì)情況屬于個(gè)人隱私,如何得到大量的膚質(zhì)數據也是個(gè)難題。

其實(shí),在深圳地鐵站的面膜智能售賣(mài)機上,已經(jīng)有免費膚質(zhì)檢測的功能。機器會(huì )檢測并顯示出用戶(hù)的膚質(zhì)情況,并建議用戶(hù)買(mǎi)哪一款面膜。這種商業(yè)模式其實(shí)相當不錯,但問(wèn)題在于膚質(zhì)檢測的結果并不準確,多次檢測的結果甚至大相徑庭。當檢測結果不精準沒(méi)有權威性的時(shí)候,自然不會(huì )有太多消費者買(mǎi)單。希望能更多像和而泰這樣的企業(yè)研究膚質(zhì)檢測技術(shù),協(xié)同傳感器、AI芯片、算法公司、方案商、終端企業(yè)等產(chǎn)業(yè)鏈上下游共同推進(jìn)該技術(shù)的發(fā)展。