近年來(lái),深度學(xué)習(xí)在圖像和語(yǔ)音處理領(lǐng)域已經(jīng)取得顯著進(jìn)展,但是在同屬人類(lèi)認(rèn)知范疇的自然語(yǔ)言處理任務(wù)中,研究還未取得重大突破.本文通過(guò)分析目前國(guó)內(nèi)外部分專(zhuān)家學(xué)者對(duì)面向自然語(yǔ)言處理的深度學(xué)習(xí)研究的總體概況,梳理、總結(jié)了相關(guān)文獻(xiàn),介紹深度學(xué)習(xí)的基本概念;分析討論了當(dāng)前面向自然語(yǔ)言處理的深度學(xué)習(xí)研究進(jìn)展及應(yīng)用策略和深度學(xué)習(xí)的平臺(tái)和工具;對(duì)深度學(xué)習(xí)在自然語(yǔ)言處理處理領(lǐng)域的發(fā)展趨勢(shì)和有待深入研究的難點(diǎn)進(jìn)行了展望。
自然語(yǔ)言處理中深度學(xué)習(xí)通過(guò)建立深層神經(jīng)網(wǎng)絡(luò),模擬人腦的機(jī)制進(jìn)行解釋并分析學(xué)習(xí)圖像、語(yǔ)音及文本等數(shù)據(jù),是目前機(jī)器學(xué)習(xí)研究中的一個(gè)熱點(diǎn)領(lǐng)域.傳統(tǒng)機(jī)器學(xué)習(xí)工作的有效性,很大程度上依賴于人工設(shè)計(jì)的數(shù)據(jù)表示和輸入特征的有效性;機(jī)器學(xué)習(xí)方法在這個(gè)過(guò)程中的作用僅僅是優(yōu)化學(xué)習(xí)權(quán)重以便最終輸出最優(yōu)的學(xué)習(xí)結(jié)果.與傳統(tǒng)機(jī)器學(xué)習(xí)方法不同的是,深度學(xué)習(xí)試圖自動(dòng)完成數(shù)據(jù)表示和特征提取工作;并且深度學(xué)習(xí)更強(qiáng)調(diào),通過(guò)學(xué)習(xí)過(guò)程提取出不同水平、不同維度的有效表示,以便提高不同抽象層次上對(duì)數(shù)據(jù)的解釋能力.從認(rèn)知科學(xué)角度來(lái)看,這個(gè)思路與人類(lèi)學(xué)習(xí)機(jī)理非常吻合。
文本要素智能抽取 :基于自然語(yǔ)言處理技術(shù),對(duì)案件卷宗、審訊筆錄、簡(jiǎn)要案情等公安情報(bào)文本信息進(jìn)行文本分析挖掘,高效抽取文本要素,如作案時(shí)間、作案地點(diǎn)、涉案人員(涉案人員特征、涉案人員關(guān)系等)、作案手段、作案工具、損失物品、損失金額等信息。公安情報(bào)文本,經(jīng)過(guò)要素智能抽取后,與公安其他的情報(bào)數(shù)據(jù)進(jìn)行融合,如人員信息、道路卡口、車(chē)輛軌跡等信息,可提升非結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用,增強(qiáng)情報(bào)信息維度,支撐情報(bào)綜合分析與研判。
情報(bào)文本智能分類(lèi)、聚類(lèi):情報(bào)文本智能聚類(lèi)是基于相似性算法的聚類(lèi)技術(shù),自動(dòng)對(duì)大量無(wú)類(lèi)別的警情、案件等進(jìn)行歸類(lèi),把內(nèi)容相近的文檔歸為一類(lèi),并可自動(dòng)為該類(lèi)生成主題詞,從而提供文本類(lèi)別名稱。 按照現(xiàn)有的警情、案件標(biāo)準(zhǔn)化標(biāo)簽體系,采用文本分類(lèi)算法對(duì)警情文本、案件文本信息實(shí)現(xiàn)自動(dòng)分類(lèi)打標(biāo)簽,可實(shí)現(xiàn)多維標(biāo)簽的案件綜合檢索、區(qū)域治安形勢(shì)、區(qū)域態(tài)勢(shì)分析等。同時(shí),采用文本聚類(lèi)算法找到情報(bào)文本之間的相似度和潛在的主題要素,探索案件文本的潛在關(guān)聯(lián)要素和相關(guān)關(guān)系,為案件的串并案、類(lèi)案刑偵等提供輔助支撐。
智能化文本信息搜索 :基于自然語(yǔ)言處理技術(shù)的文本挖掘,一方面可以對(duì)已經(jīng)提取的情報(bào)文本要素進(jìn)行關(guān)鍵字檢索;另一方面通過(guò)計(jì)算情報(bào)文本之間的相似度來(lái)搜索相似或關(guān)聯(lián)的情報(bào),達(dá)到“以案搜人”、“以人搜案”、“以人搜人”、“以案搜案”等效果,有利于公安業(yè)務(wù)人員快速定位有用的案情,提升公安快速響應(yīng)能力與作戰(zhàn)能力。
助力智慧警務(wù):昆侖自然語(yǔ)言處理,對(duì)海量的非結(jié)構(gòu)化情報(bào)文本信息,進(jìn)行深度挖掘和綜合關(guān)聯(lián)分析,極大提升了警察人員日常情報(bào)數(shù)據(jù)分析與應(yīng)用能力,為偵查破案、維穩(wěn)處突、服務(wù)民生等公安事務(wù)活動(dòng)提供強(qiáng)大的技術(shù)支撐。
智能化:基于ImageQ優(yōu)勢(shì)的自然語(yǔ)義理解技術(shù),幫助公安行業(yè)高效激活大量沉睡的非結(jié)構(gòu)性數(shù)據(jù),并由點(diǎn)連線、由線成面,最大化的挖掘數(shù)據(jù)價(jià)值,輔助提升警務(wù)各模塊的工作效率。
可視化:根據(jù)不同場(chǎng)景、不同終端的應(yīng)用需求,定制人性化、交互程度高的可視化界面,讓辦案人員“無(wú)摩擦的”與案件線索相連接。
定制化:可根據(jù)業(yè)務(wù)進(jìn)行定制化建模,模型可以本地化部署,并且根據(jù)需要在此基礎(chǔ)上進(jìn)行二次開(kāi)發(fā)。從而可靈活應(yīng)對(duì)需求方基于各種業(yè)務(wù)、場(chǎng)景的具體要求,形成符合行業(yè)特色的業(yè)務(wù)平臺(tái)體系。
一站式服務(wù):專(zhuān)有技術(shù)團(tuán)隊(duì)幫助解決前期數(shù)據(jù)接入、平臺(tái)搭建,中期系統(tǒng)功能拓展、性能優(yōu)化提升、個(gè)性化配置,后期運(yùn)營(yíng)維護(hù)、數(shù)據(jù)監(jiān)控與安全等一系列問(wèn)題
監(jiān)獄、戒毒所、公安監(jiān)所、社區(qū)、學(xué)校、園區(qū)、銀行