據悉,曾多次報道過的達觀數據獲得1.6億元B輪融資,由寬帶旗下基金晨山資本領投,元禾重元、聯想之星、鐘鼎資本及老股東等跟投。
達觀數據CEO陳運文表示,此輪融資將幫助達觀數據進一步擴大在文本大數據分析領域的領先優勢,提升語義分析核心技術研發能力和團隊建設,并推動文本智能化軟件系統在金融、法律、傳媒、政府、軍工等行業的落地應用,提升企業的運營效率。
據悉,達觀數據曾于2015年獲真格基金領投,眾麟資本和掌門科技跟投的1000萬元天使輪融資;2017年獲軟銀賽富和方廣資本5000萬元A輪融資。
達觀數據為企業、政府等各大機構提供文本自動抽取、審核、糾錯、搜索、推薦、寫作等智能軟件系統,主要利用先進的文字語義自動分析技術即自然語言處理技術,讓計算機代替人工實現業務流程自動化,大幅度提高運營效率。
陳運文強調,達觀數據做的事情是讓計算機像人一樣“閱讀理解”。根據不同的應用場景以及語義理解的基礎上,進行個性化推薦、垂直搜索、文檔智能審閱等,這些都是自然語言處理技術衍生出的產品。
目前達觀數據自主研發了一款集文檔關鍵信息抽取、文檔比對、風險審核及智能糾錯于一體的文字語義分析系統,且支持多種形式的文檔處理(財報、合同、征信報告等)。例如,可自動從企業合同中抽取出關鍵信息,并將合同信息結構化,便于后期管理;該系統還可以審閱信貸中凈利潤、主營業務收入等主要信息并提取出來,以便企業進行后續評估。系統目前已經在金融機構和軍工企業成功落地。
“文檔智能審閱它的關鍵在于讓計算機具備理解字里行間含義的能力。”陳運文表示。
根據一份來自whatech的預測報告顯示,到2020年,全球自然語言處理市場將達到134億美元。隨著深度學習時代的來臨,神經網絡成為一種強大的機器學習工具,自然語言處理取得了許多突破性發展,情感分析、智能問答、閱讀理解等領域都飛速發展。
成立三年多的時間,達觀數據服務過近千家企業,同時也發現了企業在數據收集上普遍存在的問題。陳運文表示:“中國多數企業客戶的大數據積累不夠,不論是基礎性的文檔分析審閱,還是在知識搜索和信息推薦等應用層面的底子,都較為薄弱。如何讓技術理解文本語義,并結合行業的知識圖譜,形成自動化的處理系統,同時無縫嫁接到不同企業的業務場景中去,幫助企業提高效率,是達觀數據一直在探索和努力的方向。”
在億歐看來,最容易被人工智能和自然語言處理顛覆的三個行業是法律、金融和客服。對此,陳運文也表示:“目前針對約定俗成的文檔資料,計算機閱讀能力已經超過人類,但對于相對感性的文字及互聯網用語等,達觀數據還需和行業內專家一同去克服和解決。”
陳運文表示:“人工智能的落地應用不是一蹴而就的事情,從理論到應用有很多的困難要克服,而語義分析又是其中挑戰特別大的方向,它是人類智慧的高度抽象和濃縮,讓計算機去理解文字語義需要日積月累。”
未來,達觀將在語義理解、智能個性化推薦等方面進行努力,還將研究讓計算機寫作、修改文章等,對文章進行潤色,讓達觀數據的產品適應更多垂直行業。