售前電話
135-3656-7657
售前電話 : 135-3656-7657
外部法律數(shù)據(jù)庫的建設(shè),設(shè)有專門的法律編輯及技術(shù)團(tuán)隊,需要安排專門的時間、地點(diǎn)進(jìn)行工作,對于絕大多數(shù)律所而言,這并不經(jīng)濟(jì)。
新三板上市文件可以堆積1.5米之高,律師團(tuán)隊積攢7年的郵件也會超過10w+;前者人工整理1人至少需要3天,后者則需要3人整理2個月。
▲ 自動為郵箱中的文件打上標(biāo)簽
而這些或許都可以借助AI技術(shù),以效率更高,成本更少,成果更優(yōu)的方式來實現(xiàn)。
整理的第一步是分類醫(yī)療智能問答系統(tǒng)的作用,分類是從文件資料中識別不同的特征進(jìn)行標(biāo)簽,而后進(jìn)行區(qū)分整理。
利用NLP算法訓(xùn)練出標(biāo)簽分類模型,提取出關(guān)鍵知識維度,比如行業(yè)分類(醫(yī)療、房地產(chǎn)…)、文檔類型(訴狀、意見書…)、專業(yè)分類(民法、刑法…),自動進(jìn)行標(biāo)簽分組。實踐證明用該算法整理前述郵件,只用了2天。
▲ 構(gòu)建標(biāo)簽體系
這類標(biāo)簽應(yīng)用于律所內(nèi)部數(shù)據(jù),即形成一套律所專屬標(biāo)簽體系,如同鑰匙碼,串聯(lián)起不同維度的律所知識成果,進(jìn)行有效整理和應(yīng)用。
3 搜索引擎:更好地應(yīng)用數(shù)據(jù)
標(biāo)簽建立的目的在于數(shù)據(jù)的有效應(yīng)用,其有效提升的,是檢索效率。而檢索本身也有自己的技術(shù)突破,比如語義檢索。
《著作權(quán)法》、《專利法》和《商標(biāo)法》統(tǒng)稱為“知識產(chǎn)權(quán)相關(guān)法律”。
在關(guān)鍵詞檢索下,輸入“知識產(chǎn)權(quán)”,結(jié)果多為《中華人民共和國知識產(chǎn)權(quán)海關(guān)保護(hù)條例》這樣明確帶有“知識產(chǎn)權(quán)”字符的行政法規(guī);
▲ 知識產(chǎn)權(quán)關(guān)鍵詞檢索結(jié)果(左) 知識產(chǎn)權(quán)語義檢索結(jié)果(右)
而語義理解檢索,則能基于法律體系理解上位法與下位法之間的關(guān)系,在“知識產(chǎn)權(quán)”的檢索條件下,可以檢索出《著作權(quán)法》、《專利法》和《商標(biāo)法》等知識產(chǎn)權(quán)相關(guān)法律文件。
語義檢索也是NLP技術(shù)的應(yīng)用場景之一,其需要構(gòu)建大量專業(yè)領(lǐng)域的數(shù)據(jù)集,并訓(xùn)練出算法模型。
目前清華大學(xué)人工智能研究院自然語言處理與社會人文計算研究中心推出的多領(lǐng)域中文預(yù)訓(xùn)練模型倉庫。
其中民事文書BERT(預(yù)訓(xùn)練的語言表征模型)在超過2千萬篇法律民事文書上進(jìn)行訓(xùn)練,在民事文書相關(guān)任務(wù)領(lǐng)域,相比于世界搜索引擎巨頭中文BERT,其學(xué)習(xí)速度更快,詳見下圖。
▲ 民事文書BERT在訓(xùn)練集上的學(xué)習(xí)速度
刑事文書領(lǐng)域亦如是。
該算法模型不僅可以用于公開領(lǐng)域的數(shù)據(jù)檢索,亦可用于律所內(nèi)部數(shù)據(jù)的檢索,可以有效提高知識的檢索效率,結(jié)合標(biāo)簽體系,形成律師個人或團(tuán)隊的獨(dú)有知識庫。
未來:從知識管理到知識發(fā)現(xiàn)
智能引擎已經(jīng)逐漸從搜索引擎走向推薦引擎,律所知識庫建設(shè)也從管理走向發(fā)現(xiàn),未來的知識世界,將從人去找知識進(jìn)化為知識來找人。
1 知識的主動推薦
當(dāng)律師在寫作X公司專利侵權(quán)相關(guān)法律文件時,系統(tǒng)將會主動推薦相應(yīng)信息。
比如:X公司相關(guān)知識產(chǎn)權(quán)、訴訟案件、企業(yè)信用等信息;與案件相關(guān)的判例、研究報告等;主審法官的歷審案例醫(yī)療智能問答系統(tǒng)的作用,對手律師的相關(guān)案例等;以及本所律師相關(guān)案件、知識成果等。
主動推薦不僅可以有效提高律師的信息獲取效率,也能起到查漏補(bǔ)缺的效用。
機(jī)器將從幫助人更具效率地完成工作轉(zhuǎn)變?yōu)閹椭税l(fā)現(xiàn)其原本發(fā)現(xiàn)不了的機(jī)會點(diǎn)。
▲ 知識的智能推薦
同時,也會根據(jù)律師個人或常聯(lián)系人員近期的關(guān)注領(lǐng)域、在辦案件等,主動推薦相關(guān)行業(yè)熱點(diǎn)、公開報告等,進(jìn)行個性化推薦,提高律師專業(yè)領(lǐng)域的信息嗅覺。
對于律所而言,則有利于共享社區(qū)建設(shè),類似于知乎、豆瓣等社區(qū)推薦引擎,聚合同專業(yè)、同領(lǐng)域或相同關(guān)注點(diǎn)的律所成員,強(qiáng)化專業(yè)領(lǐng)域的交流,交流信息沉淀下來亦是一重知識成果,有利于律師協(xié)同,助力法律服務(wù)產(chǎn)品的研發(fā)。