今天給大家介紹下人工只能發(fā)展的幾個關(guān)鍵技術(shù)。從語音識別到智能家居,從人機大戰(zhàn)到?jīng)]人駕駛,人工智能的“演化”給我們社會上的一些生活細(xì)節(jié),帶來了一次又一次的驚喜,前景更多智能產(chǎn)品依托的人工智能技術(shù)會開展成什么樣呢?讓我們來看看人工智能規(guī)范化白皮書里面,對人工智能重要關(guān)鍵技術(shù)的定義。
人工智能技術(shù)關(guān)系到人工智能產(chǎn)品是否能夠順利應(yīng)用到我們的生活場景中。在人工智能領(lǐng)域,它普遍包括了機器進(jìn)修、知識圖譜、自然語言處理、人機交互、計算機視覺、生物特征識別、AR/VR七個重要關(guān)鍵技術(shù)。
一、機器進(jìn)修
機器進(jìn)修(Machine Learning)是一門波及統(tǒng)計學(xué)、系統(tǒng)辨識、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計算機科學(xué)、腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科,鉆研計算機怎樣模擬或達(dá)到人類的進(jìn)修行為,以獲取新的知識或技能,重新組織已有的知識構(gòu)造使之不斷改善自身的性能,是人工智能技術(shù)的核心?;跀?shù)據(jù)的機器進(jìn)修是現(xiàn)代智能技術(shù)中的重要方法之一,鉆研從觀測數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,利用這些規(guī)律對前景數(shù)據(jù)或沒法觀測的數(shù)據(jù)進(jìn)行預(yù)測。依據(jù)進(jìn)修模式、進(jìn)修方法以及算法的不同,機器進(jìn)修存在不同的分類方法。
依據(jù)進(jìn)修模式將機器進(jìn)修分類為監(jiān)督進(jìn)修、沒監(jiān)督進(jìn)修和強化進(jìn)修等。
依據(jù)進(jìn)修方法能夠?qū)C器進(jìn)修分為傳統(tǒng)機器進(jìn)修和深度進(jìn)修。
二、知識圖譜
知識圖譜本質(zhì)上是構(gòu)造化的語義知識庫,是一種由節(jié)點和邊組成的圖數(shù)據(jù)構(gòu)造,以符號形式描述物理世界中的概念及其互有關(guān)系,其根本組成單位是“實體—關(guān)系—實體”三元組,以及實體及其有關(guān)“屬性—值”對。不同實體之間通過關(guān)系互相聯(lián)結(jié),構(gòu)成網(wǎng)狀的知識構(gòu)造。在知識圖譜中,每個節(jié)點表示現(xiàn)實世界的“實體”,每條邊為實體與實體之間的“關(guān)系”。通俗地講,知識圖譜就是把所有不同品種的信息連接在一起而得到的一個關(guān)系網(wǎng)絡(luò),提供了從“關(guān)系”的角度去分析問題的才能。
知識圖譜可用于反欺詐、不一致性驗證、組團(tuán)欺詐等公共安全保障領(lǐng)域,須要用到異常分析、靜態(tài)分析、動態(tài)分析等數(shù)據(jù)挖掘方法。特別地,知識圖譜在搜索引擎、可視化展現(xiàn)和精準(zhǔn)營銷方面有很大的優(yōu)勢,已成為業(yè)界的熱門工具。但是,知識圖譜的開展還有很大的挑戰(zhàn),如數(shù)據(jù)的噪聲問題,即數(shù)據(jù)自身有錯誤或者數(shù)據(jù)存在冗余。隨著知識圖譜應(yīng)用的不斷深層,還有一系列重要關(guān)鍵技術(shù)須要突破。
三、自然語言處理
自然語言處理是計算機科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向,鉆研能達(dá)到人與計算機之間用自然語言進(jìn)行有效通信的各種理論和方法,波及的領(lǐng)域較多,主要包含機器翻譯、機器瀏覽了解和問答系統(tǒng)等。
機器翻譯
機器翻譯技術(shù)是指利用計算機技術(shù)達(dá)到從一種自然語言到另外一種自然語言的翻譯過程。基于統(tǒng)計的機器翻譯方法突破了之前基于規(guī)則和實例翻譯方法的局限性,翻譯性能取得宏大提升?;谏疃壬窠?jīng)網(wǎng)絡(luò)的機器翻譯在日??谡Z等一些場景的成功應(yīng)用已經(jīng)顯現(xiàn)出了宏大的潛力。隨著高低文的語境表征和知識邏輯推理才能的開展,自然語言知識圖譜不斷擴(kuò)充,機器翻譯將會在多輪對話翻譯及篇章翻譯等領(lǐng)域取得更大進(jìn)展。
語義了解
語義了解技術(shù)是指利用計算機技術(shù)達(dá)到對文本篇章的了解,并且答復(fù)與篇章有關(guān)問題的過程。語義了解更注重于對高低文的了解以及對答案精準(zhǔn)程度的把控。隨著 MCTest 數(shù)據(jù)集的發(fā)布,語義了解受到更多關(guān)注,取得了快捷開展,有關(guān)數(shù)據(jù)集和對應(yīng)的神經(jīng)網(wǎng)絡(luò)模型層出不窮。語義了解技術(shù)將在智能客服、產(chǎn)品自動問答等有關(guān)領(lǐng)域發(fā)揮重要作用,進(jìn)一步提高問答與對話系統(tǒng)的精度。
問答系統(tǒng)
問答系統(tǒng)分為開放領(lǐng)域的對話系統(tǒng)和特定領(lǐng)域的問答系統(tǒng)。問答系統(tǒng)技術(shù)是指讓計算機像人類一樣用自然語言與人交流的技術(shù)。人們能夠向問答系統(tǒng)提交用自然語言表達(dá)的問題,系統(tǒng)會返回關(guān)聯(lián)性較高的答案。只管問答系統(tǒng)目前已經(jīng)有了不少應(yīng)用產(chǎn)品出現(xiàn),但大多是在現(xiàn)實中信息效勞系統(tǒng)和智能手機助手等領(lǐng)域中的應(yīng)用,在問答系統(tǒng)魯棒性方面依然存在著問題和挑戰(zhàn)。
自然語言處理面臨四大挑戰(zhàn):
一是在詞法、句法、語義、語用和語音等不同層面存在不確定性;
二是新的詞匯、術(shù)語、語義和語法導(dǎo)致未知語言現(xiàn)象的不可預(yù)測性;
三是數(shù)據(jù)資源的不充分使其難以籠罩復(fù)雜的語言現(xiàn)象;
四是語義知識的含糊性和撲朔迷離的關(guān)聯(lián)性難以用簡略的數(shù)學(xué)模型描述,語義計算須要參數(shù)龐大的非線性計算
四、人機交互
人機交互主要研究人和計算機之間的信息交換,主要包括人到計算機和計算機到人的兩部分信息交換,是人工智能領(lǐng)域的重要的外圍技術(shù)。人機交互是與認(rèn)知心理學(xué)、人機工程學(xué)、多媒體技術(shù)、虛擬現(xiàn)實技術(shù)等密切相關(guān)的綜合學(xué)科。傳統(tǒng)的人與計算機之間的信息交換主要依靠交互設(shè)備進(jìn)行,主要包括鍵盤、鼠標(biāo)、操縱桿、數(shù)據(jù)服裝、眼動跟蹤器、位置跟蹤器、數(shù)據(jù)手套、壓力筆等輸入設(shè)備,以及打印機、繪圖儀、顯示器、頭盔式顯示器、音箱等輸出設(shè)備。人機交互技術(shù)除了傳統(tǒng)的基本交互和圖形交互外,還包括語音交互、情感交互、體感交互及腦機交互等技術(shù)。
五、計算機視覺
計算機視覺是運用計算機模仿人類視覺系統(tǒng)的科學(xué),讓計算機擁有類似人類提取、處理、了解和分析圖像以及圖像序列的才能。自動駕駛、機器人、智能醫(yī)療等領(lǐng)域均須要通過計算機視覺技術(shù)從視覺信號中提取并處理信息。近來隨著深度進(jìn)修的開展,預(yù)處理、特征提取與算法處理慢慢融合,構(gòu)成端到端的人工智能算法技術(shù)。依據(jù)攻克的問題,計算機視覺可分為計算成像學(xué)、圖像了解、三維視覺、動態(tài)視覺和視頻編解碼五大類。
目前,計算機視覺技術(shù)開展迅速,已具備初步的產(chǎn)業(yè)規(guī)模。前景計算機視覺技術(shù)的開展主要面臨以下挑戰(zhàn):
一是怎么樣在不同的應(yīng)用領(lǐng)域和其他技術(shù)更好的聯(lián)合,計算機視覺在攻克某些問題時能夠廣泛利用大數(shù)據(jù),已經(jīng)漸漸成熟并且能夠超過人類,而在某些問題上卻沒法到達(dá)很高的精度;
二是怎么樣降低計算機視覺算法的開發(fā)時長和人力老本,目前計算機視覺算法須要大量的數(shù)據(jù)與人工標(biāo)注,須要較長的研發(fā)周期以到達(dá)應(yīng)用領(lǐng)域所要求的精度與耗時;
三是怎么樣加快新型算法的設(shè)計開發(fā),隨著新的成像硬件與人工智能芯片的出現(xiàn),針對不同芯片與數(shù)據(jù)采集設(shè)備的計算機視覺算法的設(shè)計與開發(fā)也是挑戰(zhàn)之一。
六、生物特征識別
生物特征識別技術(shù)是指通過個體生理特征或行為特征對個體身份進(jìn)行識別認(rèn)證的技術(shù)。從應(yīng)用流程看,生物特征識別通常分為注冊和識別兩個階段。注冊階段通過傳感器對人體的生物表征信息進(jìn)行采集,如利用圖像傳感器對指紋和人臉等光學(xué)信息、麥克風(fēng)對說話聲等聲學(xué)信息進(jìn)行采集,利用數(shù)據(jù)預(yù)處理以及特征提取技術(shù)對采集的數(shù)據(jù)進(jìn)行處理,得到相應(yīng)的特征進(jìn)行存儲。
識別過程采用與注冊過程一致的信息采集方式對待識他人進(jìn)行信息采集、數(shù)據(jù)預(yù)處理和特征提取,其次將提取的特征與存儲的特征進(jìn)行比對分析,完成識別。從應(yīng)用任務(wù)看,生物特征識別一般分為辨認(rèn)與確認(rèn)兩種任務(wù),辨認(rèn)是指從存儲庫中確定待識他人身份的過程,是一對多的問題;確認(rèn)是指將待識他人信息與存儲庫中特定單人信息進(jìn)行比對,確定身份的過程,是一對一的問題。
生物特征識別技術(shù)波及的內(nèi)容十分廣泛,包含指紋、掌紋、人臉、虹膜、指靜脈、聲紋、步態(tài)等多種生物特征,其識別過程波及到圖像處理、計算機視覺、語音識別、機器進(jìn)修等多項技術(shù)。目前生物特征識別作為重要的智能化身份認(rèn)證技術(shù),在金融、公共安全、教育、交通等領(lǐng)域得到廣泛的應(yīng)用。
七、VR/AR
虛擬現(xiàn)實(VR)/增強現(xiàn)實(AR)是以計算機為核心的新型視聽技術(shù)。聯(lián)合有關(guān)科學(xué)技術(shù),在一定范圍內(nèi)生成與真實環(huán)境在視覺、聽覺、觸感等方面高度近似的數(shù)字化環(huán)境。用戶借助必要的裝備與數(shù)字化環(huán)境中的對象進(jìn)行交互,互相影響,獲得近似真實環(huán)境的感受和體驗,通過顯示設(shè)備、跟蹤定位設(shè)備、觸力覺交互設(shè)備、數(shù)據(jù)獲取設(shè)備、專用芯片等達(dá)到。
虛擬現(xiàn)實/增強現(xiàn)實從技術(shù)特征角度,依照不同處理階段,能夠分為獲取與建模技術(shù)、分析與利用技術(shù)、替換與分發(fā)技術(shù)、展現(xiàn)與交互技術(shù)以及技術(shù)規(guī)范與評價體系五個方面。獲取與建模技術(shù)鉆研怎么樣把物理世界或者人類的創(chuàng)意進(jìn)行數(shù)字化和模型化,難點是三維物理世界的數(shù)字化和模型化技術(shù);分析與利用技術(shù)重點鉆研對數(shù)字內(nèi)容進(jìn)行分析、了解、搜索和知識化方法,其難點是在于內(nèi)容的語義表示和分析;替換與分發(fā)技術(shù)主要強調(diào)各種網(wǎng)絡(luò)環(huán)境下大規(guī)模的數(shù)字化內(nèi)容流通、轉(zhuǎn)換、集成和面向不同終端用戶的個性化效勞等,其核心是開放的內(nèi)容替換和版權(quán)管理技術(shù);展現(xiàn)與替換技術(shù)重點鉆研合乎人類習(xí)慣數(shù)字內(nèi)容的各種顯示技術(shù)及交互方法,以期提高人對復(fù)雜信息的認(rèn)知才能,其難點在于建設(shè)自然和諧的人機交互環(huán)境;規(guī)范與評價體系重點鉆研虛擬現(xiàn)實/增強現(xiàn)實根底資源、內(nèi)容編目、信源編碼等的規(guī)范規(guī)范以及相應(yīng)的評估技術(shù)。
目前虛擬現(xiàn)實/增強現(xiàn)實面臨的挑戰(zhàn)主要體此時智能獲取、普適設(shè)備、自由交互和感知融合四個方面。在硬件平臺與裝置、核心芯片與器件、軟件平臺與工具、有關(guān)規(guī)范與規(guī)范等方面存在一系列科學(xué)技術(shù)問題??傮w來說虛擬現(xiàn)實/增強現(xiàn)實呈現(xiàn)虛擬現(xiàn)實系統(tǒng)智能化、虛實環(huán)境對象沒縫融合、自然交互全方位與溫馨化的開展趨勢。