導讀:我國《人工智能標準化白皮書(2018年)》中也給出了人工智能的定義:“人工智能是利用數(shù)字計算機或者由數(shù)字計算機控制的機器,模擬、延伸和擴展人類的智能,感知環(huán)境、獲取知識并使用知識獲得最佳結(jié)果的理論、方法、技術和應用系統(tǒng)?!?/p>
人工智能的核心思想在于構(gòu)造智能的人工系統(tǒng)。人工智能是一項知識工程,利用機器模仿人類完成一系列的動作。根據(jù)是否能夠?qū)崿F(xiàn)理解、思考、推理、解決問題等高級行為。
在未來,人工智能應用主要會體現(xiàn)如下幾大核心技術特點。
01 機器人流程自動化(Robotic Process Automation,RPA)
RPA(Robotic Process Automation,機器人流程自動化)的定義:通過特定的、可模擬人類在計算機界面上進行操作的技術,按規(guī)則自動執(zhí)行相應的流程任務,代替或輔助人類完成相關的計算機操作。
與大家通常所認為的具備機械實體的“機器人”不同,RPA本質(zhì)上是一種能按特定指令完成工作的軟件,這種軟件安裝在個人計算機或大型服務器上,通過模擬鍵盤、鼠標等人工操作來實現(xiàn)辦公操作的自動化。
▲圖1-1 RPA是未來辦公創(chuàng)新和發(fā)展的趨勢
RPA也被形象地稱為數(shù)字化勞動力(Digital Labor),是因為其綜合運用了大數(shù)據(jù)、人工智能、云計算等技術,通過操縱用戶圖形界面(GUI)中的元素,模擬并增強人與計算機的交互過程,從而能夠輔助執(zhí)行以往只有人類才能完成的工作,或者作為人類高強度工作的勞動力補充。
自2015年以來,人工智能技術和RPA在同一時間大幅度發(fā)展和進步,恰好相輔相成,匯合在了一起。自然而然地,RPA和AI兩者的結(jié)合運用,帶來了一股非常獨特的智能化應用的發(fā)展潮流,我們稱之為智能RPA技術,或者IPA技術(Intelligent Processing Automation),即智能流程自動化技術(如圖1-2所示)。
▲圖1-2 智能RPA的構(gòu)成:RPA+AI=IPA
換句話說就是,RPA是基礎,需要與其他技術手段整合在一起,方能實現(xiàn)IPA及其優(yōu)勢。
商業(yè)社會對流程自動化的功能的期望將與日俱增,將機器學習等AI技術運用到RPA中,將人工智能功能集成到產(chǎn)品套件中,以提供更多類型的自動化功能,已經(jīng)成為未來RPA發(fā)展的主流趨勢。
02 光學字符識別(Optical Character Recognition,OCR)
OCR技術是指利用電子設備(例如掃描儀或數(shù)碼相機)將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進一步編輯加工的技術。通俗地說就是,對文本資料進行掃描,然后對圖像文件進行分析處理,以獲取文字及版面信息的技術。
OCR技術一般可分為如圖3-1所示的5個階段。
▲圖3-1 OCR技術的5個階段
下面具體說明OCR的識別流程。
1. 圖像處理
針對圖像的成像問題進行修正。常見的圖像預處理過程包括:幾何變換(透視、扭曲、旋轉(zhuǎn)等)、畸變校正、去除模糊、圖像增強和光線校正、二值化處理等。
2. 文字檢測
檢測文本所在位置、范圍及其布局,通常還包括版面分析和文字行檢測等。文字檢測解決的主要問題是哪里有文字,文字的范圍有多大。
文字檢測采用的處理算法一般包括:Faster-RCNN、Mask-RCNN、FPN、PANet、Unet、IoUNet、YOLO、SSD。
3. 文字識別
在文本檢測的基礎上,對文本內(nèi)容進行識別,將圖像中的文本信息轉(zhuǎn)化為計算機可識別和處理的文本信息。文字識別主要解決的問題是每個文字是什么。
文字識別常采用的處理算法包括:CRNN、Attention OCR、RNNLM、BERT。
4. 文本抽取
從文字識別結(jié)果中抽取出需要的字段或要素。
文本抽取常采用的處理算法包括:CRF、HMM、HAN、DPCNN、BiLSTM+CRF、BERT+CRF、Regex。
5. 輸出
輸出最終的文字識別結(jié)果或者文本抽取結(jié)果。
03 機器學習/大數(shù)據(jù)分析
機器學習/大數(shù)據(jù)分析是一種用于設計復雜模型和算法并以此實現(xiàn)預測功能的方法,即計算機有能力去學習,而不是依靠預先編寫的代碼。它能夠基于對現(xiàn)有結(jié)構(gòu)化數(shù)據(jù)的觀察,自行識別結(jié)構(gòu)化數(shù)據(jù)中的模型,并以此來輸出對未來結(jié)果的預測。
機器學習是一種通過“監(jiān)督”和“無監(jiān)督”學習來識別結(jié)構(gòu)化數(shù)據(jù)中的模式(例如日常性能數(shù)據(jù))的算法。監(jiān)督算法是指在根據(jù)自己的輸入做出預測之前,會從輸入和輸出的結(jié)構(gòu)化數(shù)據(jù)集來進行學習。無監(jiān)督算法是指觀察結(jié)構(gòu)化數(shù)據(jù),并對已識別的模式提供相關見解。
機器學習和高級分析可能會改變保險公司的游戲規(guī)則,例如,在提高合規(guī)性、降低成本結(jié)構(gòu),以及從新的見解中獲得競爭優(yōu)勢。高級分析已經(jīng)在領先的人力資源部門中得到了廣泛應用,主要用于確定和評估領導者和管理者的核心品質(zhì),以便更好地預測行為、規(guī)劃職業(yè)發(fā)展道路和下一任領導崗位歸屬。
04 自然語言生成(Natural Language Generation,NLG)
計算機具有與人一樣的表達能力和寫作能力,它遵循某種規(guī)則,將從數(shù)據(jù)中觀察到的信息轉(zhuǎn)換成高質(zhì)量的自然語言文本。例如,自動識別會議郵件中的主題、數(shù)字地名、人名地址并生成行程表備忘錄,或者識別出合同條款的關鍵內(nèi)容并將摘要的重點生成列表。
關于自然語言生成及自然語言處理的詳細介紹,請閱讀《詳解自然語言處理5大語義分析技術及14類應用(建議收藏)》
05 智能工作流(Smart Workflow)
智能工作流是一種用于流程管理的軟件工具,其中集成了由人和機器共同執(zhí)行的工作,允許用戶實時啟動和跟蹤端到端流程的狀態(tài),以便于管理不同組之間的切換,包括機器人與人類用戶之間的切換,同時還能提供瓶頸階段的統(tǒng)計數(shù)據(jù)。
隨著社會和科技的不斷進步,各個領域都開始逐步朝著自動化、智能化的方向快速發(fā)展。工作流相關技術的研究也越來越受重視,并廣泛地應用于制造業(yè)、軟件開發(fā)、銀行金融、生物醫(yī)學等不同領域。
工作流不但能夠自動化地處理相關的活動和任務,減少人機交互處理過程中帶來的潛在錯誤,而且能夠精確化每一個處理步驟,最大化地提高生成效率,并且將工作流應用到動態(tài)、可變且靈活的應用場景當中。
近年來,在大數(shù)據(jù)、人工智能的背景下,工作流中的業(yè)務流程日趨復雜,所面臨的環(huán)境和數(shù)據(jù)也日趨復雜,由需求分析引起的業(yè)務過程重新建?;蛴删S護升級引起的過程模式變更和改進也變得越來越頻繁。
在這種動態(tài)多變的復雜環(huán)境下,如何快速識別出任務,然后快速高效并有針對性地處理工作流問題,已成為目前工作流任務研究的關鍵問題。
RPA軟件機器人在工作過程中,也會遇到很多類似的情況。工作流的復雜多變,會導致RPA作業(yè)流程的復雜多變,使其無法做到自適應,這將會大大影響RPA軟件機器人的作業(yè)效率。
因此,需要通過智能工作流的技術,實現(xiàn)動態(tài)地調(diào)整RPA里的任務設定,以及RPA業(yè)務流程的自動變更和自動升級,在智能工作流的指導下實現(xiàn)自適應作業(yè)模式。
實現(xiàn)智能工作流的方法有很多,比如,美國J.H.Holland教授提出的基于遺傳算法的工作流調(diào)度,Pandey S等提出的基于粒子群優(yōu)化算法的啟發(fā)式算法(PSO)可用于不同資源的智能調(diào)度。除此之外,還有很多基于自然界和仿生學的智能算法,比如,混合蛙跳算法、布谷鳥搜索算法、蝙蝠算法、人工蜂群算法等。
目前比較常見的方法是實現(xiàn)一種基于智能規(guī)劃的工作流處理模式,該模式不再是單純地將不同的活動當作對彼此沒有影響的單獨事件,而是有針對性地考慮多個事件的共同影響。
該模式充分考慮了工作流和智能規(guī)劃之間的相似之處,通過智能規(guī)劃推導出不同工作流任務之間的內(nèi)在邏輯關系,并從其他的渠道和外部信息中充分挖掘潛在的關系。
逐步改進傳統(tǒng)工作流中的問題,使用全新的智能規(guī)劃的手段,從表面動作中挖掘出潛在的信息,過濾噪聲數(shù)據(jù),進而實現(xiàn)流程的自動修正,最后,通過前面得出的結(jié)論,有針對性地修改之前的RPA作業(yè)流程,實現(xiàn)自適應性的作業(yè)模式和作業(yè)過程。
06 認知智能體(Cognitive Agent)
認知智能體是一種結(jié)合了機器學習和自然語言生成的技術,并在此基礎上加入情感檢測功能以做出判斷和分析,使其能夠執(zhí)行任務,交流溝通,從數(shù)據(jù)集中學習,甚至根據(jù)情感檢測結(jié)果作出決策。換句話說,機器會像人一樣產(chǎn)生“情感共鳴、精神共振”,真正成為一個完全虛擬的勞動力(或者智能體)。
在客服領域,英國某汽車保險公司通過使用認知智能體技術,將客戶轉(zhuǎn)化率提高了22%,驗證錯誤率降低了40%,整體投資回報率達到了330%。
當然,德勤、安永等咨詢公司也坦然表示,就現(xiàn)階段許多企業(yè)的流程管理與系統(tǒng)的基礎能力來看,仍存在著大量的基礎建設工作有待開展。而打造智能流程自動化所需的部分核心技術(例如認知智能體等)也還停留在雛形階段。
智能包含三個方面,分別是計算智能、感知智能和認知智能。
在計算智能方面,計算機的速度早已遠遠超過人工的效率。
在感知智能方面,隨著OCR、NLP等技術的發(fā)展,目前也已經(jīng)能夠?qū)崿F(xiàn)很多的效果。
但是在認知智能方面,即使在某些特定領域,自然語言的處理也已經(jīng)可以得到比人工更好的成績,但是在某些領域,特別是知識理解、知識推理、知識判斷等方面,還有很多需要逐步積累、逐步完善的地方。
按照機器能否產(chǎn)生自我認知和機器人的適用范圍,人工智能分為弱人工智能和強人工智能,其中弱人工智能里的機器沒有自我意識,不具備真正的推理和獨立解決問題的能力,通常只適用于解決特定條件下的某種問題。當前人工智能的研究主要在弱人工智能領域。
而在強人工智能方面,機器具有一定的自我意識,能夠通過學習拓展功能。對于當前不具備的功能或者當前不了解的知識,能通過自行學習獲得。
當前條件下,全面的強人工智能還面臨技術能力、社會倫理等多方面的挑戰(zhàn),但是在某些領域的特定場景下,具備認知智能能力和學習能力的人工智能軟件,不僅能夠優(yōu)化作業(yè)流程、快速響應、覆蓋更多不同的情況,同時還能夠最大限度地避免技術風險和應用風險,是一個非常有價值的研究方向。
認知智能有很多種定義,其中,復旦大學肖仰華教授曾經(jīng)提到過,所謂讓機器具備認知智能是指讓機器能夠像人一樣思考,而這種思考能力具體體現(xiàn)在如下幾個方面。
第一,機器具備能夠理解數(shù)據(jù)、理解語言進而理解現(xiàn)實世界的能力。
第二,機器具備能夠解釋數(shù)據(jù)、解釋過程進而解釋現(xiàn)象的能力。
第三,機器具備推理、規(guī)劃等一系列人類所獨有的認知能力,也就是說認知智能需要解決推理、規(guī)劃、聯(lián)想、創(chuàng)作等一系列復雜任務。
智能體是指駐留在某一環(huán)境下,能夠持續(xù)自主地發(fā)揮作用,具備駐留性、反應性、社會性、主動性特征的計算實體。根據(jù)著名人工智能學者,美國斯坦福大學Hayes-Roth教授的理論“智能體能夠持續(xù)執(zhí)行三項功能:感知環(huán)境中的動態(tài)條件、執(zhí)行動作影響環(huán)境、進行推理以解釋感知信息、求解問題和決定動作”。
從前面的定義我們可以看出,認知智能體能夠感知到環(huán)境中的動態(tài)條件,然后根據(jù)這些條件執(zhí)行相應的動作來影響現(xiàn)有的環(huán)境,同時其還能夠用推理來解釋感知信息,求解相關問題,決定后續(xù)動作。
將認知智能體與RPA相結(jié)合,我們能夠得到一個具備認知智能的機器人,它可以根據(jù)所涉及的應用系統(tǒng)和其他環(huán)境的變化動態(tài)感知下一步需要做的事情,同時執(zhí)行相應的動作來影響對應的環(huán)境信息,實現(xiàn)智能錄入、智能監(jiān)控、智能文檔處理和輔助判定。
與此同時,認知智能體通過RPA技術在處理業(yè)務的同時,還能夠?qū)W習到相關的經(jīng)驗和知識,逐步掌握識別重點的能力。
認知智能體的研究包含了多種不同的方法,近年來,隨著分布式人工智能、信息科學和網(wǎng)絡科學的不斷發(fā)展,面向動態(tài)環(huán)境下的分布式協(xié)同決策已經(jīng)成為認知智能體的一個重要的研究方式。這種方式在以多無人機系統(tǒng)、多機器人系統(tǒng)為代表的典型無中心式多智能體系統(tǒng)中得到了廣泛的應用。
與此同時,受限于自身設計,智能體對所在環(huán)境和系統(tǒng)常呈現(xiàn)出信息的部分可觀測特征,而有限的智能體之間的交互和外部的約束也使得獲得全局信息需要付出極高的代價。
同時,無中心式的多智能體系統(tǒng)在應用中呈現(xiàn)出了與社會網(wǎng)絡相類似的自組結(jié)構(gòu)和相應的復雜網(wǎng)絡特征,即網(wǎng)絡中單個智能體通常僅能連接/交互所在局部網(wǎng)絡中的小部分智能體,傳統(tǒng)的集中式協(xié)同模型則不再適用。
此外,類似于社會網(wǎng)絡中人與人之間的有限信息交換便可大大提升個體的決策效率,同樣的方法能否應用到相應的研究當中,也處于不斷的嘗試過程中。
關于作者:達觀數(shù)據(jù),中國智能RPA領域的龍頭企業(yè),獨立開發(fā)了全套“RPA+AI”系統(tǒng),擁有核心知識產(chǎn)權。達觀智能RPA產(chǎn)品是業(yè)界不依賴微軟底層開發(fā)框架、未使用第三方開源框架的RPA產(chǎn)品。
本文摘編自《智能RPA實戰(zhàn)》,經(jīng)出版方授權發(fā)布。
聯(lián)系客服