国内a级毛片-国内不卡1区2区-国内福利写真片视频在线观看-国内高清久久久久久久久-日本高清无吗-日本高清午夜色wwwσ

咨詢熱線:021-80392549

獨家 | 創新工場首席科學家周明:NLP 與金融「聯姻」,從經濟實惠的小模型開始

放大字體  縮小字體 發布日期:2022-06-07     來源:雷鋒網     瀏覽次數:605
核心提示:獨家 | 創新工場首席科學家周明:NLP 與金融「聯姻」,從經濟實惠的小模型開始 6月6日,創新工場首席科學家、瀾舟科技創始人周明
獨家 | 創新工場首席科學家周明:NLP 與金融「聯姻」,從經濟實惠的小模型開始
6月6日,創新工場首席科學家、瀾舟科技創始人周明博士代表瀾舟科技,在北京與華夏基金簽署戰略合作協議,宣告成立「金融NLP聯合實驗室」。

這是繼周明在2020年12月離開微軟亞洲研究院后的又一個重大動向。

周明博士是我國研究自然語言處理(NLP)的先驅者之一:

他是中國第一個中英翻譯系統CEMT-I(哈工大1989年)、日本最有名的中日機器翻譯產品J-北京(日本高電社1998年)的研制者,曾擔任2019年國際計算語言學協會(ACL)主席,中國計算機學會理事、中文信息技術專委會主任、術語工作委員會主任、中國中文信息學會常務理事,谷歌學術引用數超過32000次。

1999年,周明加入微軟亞洲研究院,隨后擔任自然語言研究組的負責人、微軟亞研副院長。2020年12月,他從微軟離職,隨后加入創新工場擔任首席科學家,2021年6月孵化出瀾舟科技,7月就推出輕量化模型——「孟子」,在中文語言理解評測CLUE榜單的多項指標上登頂第一,引起不少關注。

如今,不到一年,瀾舟科技便與華夏基金成立「金融NLP聯合實驗室」,致力于在金融場景中實現NLP技術的落地,成長著實迅速。而據AI科技評論與周明博士的對話,在此次與金融的「聯姻」中,輕量化模型「孟子」將扮演重要角色。
科技
獨家 | 創新工場首席科學家周明:NLP 與金融「聯姻」,從經濟實惠的小模型開始

根據華夏基金首席數據官陳一昕的介紹,在以往的「金融+NLP」建設中,他們往往面臨模型與行業場景適配性差、訓練代價大、中文理解能力不足等問題。面對金融領域文本專業性強、應用場景多變的情況,構建落地快、易迭代、可適配金融垂直領域的中文NLP模型是一個亟待實現的目標。

而此時,「孟子」的輕量化優勢便發揮了出來。

周明告訴AI科技評論,諸如「孟子」的輕量化模型部署成本低,能夠快速迭代,用戶壓力小,且適配性強。此外,通過知識融合、數據增強,能力上或并不遜于大模型,十分適合金融場景的需求,更容易落地。

以下是雷峰網(公眾號:雷峰網)-AI科技評論與周明博士的對話:

AI科技評論:能否簡單介紹一下瀾舟科技跟華夏基金共同成立金融NLP聯合實驗室的背景?

周明:我在2020年年底從微軟亞洲研究院離開,到創新工場擔任首席科學家,去年6月孵化了瀾舟科技。瀾舟科技的核心技術是自然語言理解,可以用于實現文本的智能理解、搜索、問答、摘要、翻譯以及知識圖譜等等。但具體落地,要找一個場景。

剛創立瀾舟科技時,我就首先想到金融。那時候我就想,要進入金融領域,不能隔靴瘙癢,而是要有更緊密的合作。我們要了解金融的需求,金融方也要知道我們的技術長板和短板,所以我就開始尋找能夠緊密合作的金融伙伴。

恰好在去年10月,我應邀參加一個在上海舉行的智能投研大會,做了一個特邀報告,其中介紹了瀾舟科技的自然語言處理技術,包括「孟子」預訓練模型。華夏基金的楊思成在臺下,對我們很感興趣,就介紹我和華夏基金的首席數據官陳一昕認識,雙方一拍即合。

我們共同認為,過去科技企業與金融公司的項目合作模式不夠密切。項目制是甲方與乙方,對方擬好一個需求,我圍繞需求提供技術、按時間交付,但技術的不斷迭代需要科技與場景的緊密結合,所以我和陳一昕最終決定采用「聯合實驗室」的方式,把大家放在一個籃子里,AI 可以隨著市場變化快速迭代,業務也可以更了解 AI。

AI科技評論:項目制是目前 AI/NLP 與其他領域結合的主流合作形式嗎?聯合實驗室是不是相對比較少?

周明:是的。在這里我要解釋一下,金融是一個特殊的領域,不像有的領域可以實現相對標準化的服務,「AI+金融」或「金融+AI」在當前還沒有定論。

金融的需求沒有那么明確,而且場景多樣化,同時 AI 技術也在不停地迭代,例如,大模型約每三個月就要迭代一次。

因此,金融行業的人士對 AI 是既渴望、又覺得太繁復,跟不上 AI 的節奏。在這種方式下,項目制就會產生一些問題,而聯合實驗室則能更靈活地應付這種快速多變的局面,把雙方的優勢與長處發揮出來。

AI科技評論:據您觀察,目前國內做 NLP 落地、或憑借 NLP 技術進軍金融領域的公司多嗎?

周明:兩者都不多。由于技術的局限性,NLP落地很難,因此全世界的NLP公司都比較少,但像百度、微軟、谷歌等背后都有 NLP 團隊,主要是服務于它們自身的業務和產品,作為一個部件,例如拼寫檢查、文檔分析、索引等等,但極少有公司專門以 NLP 技術立足。

近兩年大模型出現后,NLP 的能力大幅度提升,開始有人嘗試基于 NLP 技術創業,但受疫情影響無法推行,很多科研者還在等待機會。也有將 NLP 當應用的公司,例如客服公司,但并非專門研究NLP。

AI科技評論:金融業務有哪些特征?在金融場景中,NLP能夠解決什么樣的問題?

周明:首先說NLP(自然語言處理)技術。目前 NLP 領域有許多基于互聯網的海量數據訓練出來的大規模預訓練模型,過去幾年也在全世界引起了廣泛關注。但瀾舟科技做的是「孟子」輕量化模型,模型不大、容易落地,同時又具備分析、搜索、翻譯、生成等能力。

NLP的這些能力在金融領域有很多用處,比如智能信息抽取。幾乎所有金融單位都要處理很多無結構、有結構或半結構的文檔,如網頁有表格、有字段。舉個例子,基金的變化,昨天的價格多少、今天的價格多少、基金數量、購買人數、交易量、上升與下降幅度等等,有可能寫在年報里,也有可能寫在網頁里,我們就可以使用智能文檔分析技術,將其重要信息抽取出來形成數據庫。

再聯想其他能力,NLP 幾乎貫穿金融業務的所有環節,所以金融機構都重視 NLP 技術。但如何將NLP能力開發好、部署好,成本極低又能快速便捷地用起來,卻是不容易做到的。

AI科技評論:在這次NLP與金融的聯合中,「孟子」模型的落地如何體現?

周明:「孟子」在瀾舟公司的所有技術體系中都會體現,包括智能文檔、信息抽取、知識圖譜、搜索問答,還有文本生成等,這些核心技術均會進入到跟華夏一同成立的聯合實驗室中。「孟子」會基于一些金融數據做訓練,從而獲得處理金融數據的能力。

基于「孟子」,我們希望可以在金融領域中做文檔智能信息抽取、OCR、輿情分析、暴雷事件分析、報警、風控,也可以做國內外金融信息的抽取匯總和檢索、年報的自動生成和和行情預判等等,還有金融行業需要的客服、獲客、客戶推薦優秀產品、客戶跟蹤、用戶畫像等。

AI科技評論:「孟子」強調的是小模型,小模型對于處理金融領域的問題是否有獨特的優勢?

周明:在一定的情況下,模型越大、參數越多,泛化能力就越強、水平就越高,這是共識。但訓練一個巨大的模型需要巨大算力,在使用大模型時,推理也需要很大的計算集群,需要買成百上千張卡來支持運行,一般的公司(包括金融機構)都負擔不起,性價比也拉低。

而輕量化模型對用戶的壓力非常小,一般情況下只用少量GPU,甚至有些任務只用CPU也可以,部署成本可以大幅降低,又快又準。即便性能也許比大模型差了一點,但在大部分用戶看來是劃算的。也是基于這樣的市場,我們在成立瀾舟科技時就決定做輕量化模型。

瀾舟科技是國內最早研究輕量化模型的公司之一。在研究「孟子」時,我們以為模型的能力會大幅削弱,但后來發現,如果輕量化模型的算法過關,加上知識的融入、數據的增強,輕量化模型有可能不輸給大模型。這是非常了不起的一件事。 
工博士工業品商城聲明:凡資訊來源注明為其他媒體來源的信息,均為轉載自其他媒體,并不代表本網站贊同其觀點,也不代表本網站對其真實性負責。您若對該文章內容有任何疑問或質疑,請立即與商城(www.cacpa.com.cn)聯系,本網站將迅速給您回應并做處理。
聯系電話:021-31666777
新聞、技術文章投稿QQ:3267146135  投稿郵箱:syy@gongboshi.com
主站蜘蛛池模板: 日韩欧美亚洲国产精品字幕久久久| 青青草国产| 亚洲成a人片在线观看导航| 日韩区在线观看| 亚洲欧洲中文| 亚洲αv久久久噜噜噜噜噜| 亚洲国产精品成| 四虎论坛| 日韩一级视频在线观看播放| 啪啪91视频| 色综合免费视频| 四虎黄色网| 亚洲国内精品久久| 一级毛片牲交大片| 亚洲综合图片区| 一级国产精品一级国产精品片| 日本免费久久| 亚洲色视频在线播放网站| 欧美成性色| 亚洲激色| 青青青手机在线视频| 四虎美女| 天天爱综合| 亚洲精品在线免费观看视频| 人妖videos人妖xxxx| 欧美一级片网站| 日韩专区亚洲精品欧美专区| 亚洲一级片免费看| 日本免费一区尤物| 三a级毛片| 亚洲视频在线一区二区| 奇米影视亚洲狠狠色777不卡| 亚洲欧美一区二区三区图片 | 全国最大色| 手机免费看a| 亚洲九九精品| 亚洲图色在线| 日韩欧美在线观看成人| 欧美性a欧美在线| 外国毛片视频| 人人爱国产|