來源:中國電商物流網 發布時間:2019-5-30 9:9
5月26日,由百度與中國計算機學會中文信息技術專委會、中國中文信息學會青工委聯合舉辦的“2019自然語言處理前沿論壇”在北京召開。圍繞本次論壇主題 “機器之‘讀、寫、說、譯’—— 探尋NLP未來之路”,來自自然語言處理領域的多位青年學者在大會上作了相關報告。
作為“人工智能皇冠上的明珠”、備受關注的研究方向之一,自然語言處理(NLP)技術的進展與未來之路非常值得探討。論壇對話環節,來自學術界、工業界的6位嘉賓就這一主題展開討論,觀點碰撞、見解深刻。參與圓桌討論的嘉賓分別是哈爾濱工業大學計算機科學與技術學院教授車萬翔、復旦大學計算機科學技術學院副教授邱錫鵬、清華大學計算機科學與技術系副研究員黃民烈、清華大學計算機科學與技術系長聘副教授劉洋、百度高級科學家呂雅娟、百度PaddlePaddle總架構師于佃海,主持人為百度人工智能技術委員會主席何中軍。
(由左至右:何中軍、車萬翔、邱錫鵬、黃民烈、劉洋、呂雅娟、于佃海)
在場嘉賓首先回顧了過去5年NLP領域取得的重要進展。過去5年,是深度學習和自然語言處理“深度”結合的5年,NLP的研究方法、模型框架均發生巨大變化,研究和應用上取得了一系列重大突破。黃民烈在發言中表示,關鍵是思路的轉變,從之前的特征工程到現在神經網絡模型,研究思路和方法發生了很大變化。NLP領域的節奏變化十分迅速,需要不斷有新的思想,促進發展。呂雅娟結合自身的研究經歷也談到了過去5年,思路轉變及擁抱深度學習后帶來的巨變。她表示自然語言處理在整個人工智能發展大背景下,結合深度學習與大數據、大算力,在機器翻譯、自動問答、智能寫作、人機對話等不同領域都取得了系統級應用的巨大突破。車萬翔從模型、數據、任務三個方面總結了NLP的進展。模型方面,大部分的NLP研究都基于深度學習模型展開;數據方面,可以利用更多的弱標注甚至無標注數據進行訓練;任務方面,閱讀理解、文本生成等很多過去比較難的任務,取得了較大突破。
同時,嘉賓們一致認為我國的NLP研究與工業化應用處于國際領先水平。國家政策的支持、巨大的市場需求、高技術人才儲備為NLP發展提供了有利條件。在研究方面,劉洋認為中國NLP在學術界的研究相當靠前,近年來入選該領域頂級會議的論文數量急劇增加,論文質量也在不斷上升。在工業應用方面,呂雅娟認為,我國人口基數大,NLP需求場景豐富,國家將人工智能作為發展戰略,為NLP提供了健康的發展環境。在深度學習方面,我國也走出了自主研發的道路。于佃海認為,深度學習的興起對NLP領域產生了巨大的影響。我國NLP工業化應用的領先地位,與中國企業對深度學習技術的研發投入有很大的關系。以百度為例,深度學習底層框架技術的研發建設對百度NLP技術和應用的快速發展起到了重要的支撐和推動作用。依托自主研發的開源深度學習框架PaddlePaddle,百度將NLP積累的算法工作進行整合、優化,進一步建設并開放了PaddleNLP工具包,為開發者提供更多便利。嘉賓們也同時指出,需要進一步加強產學研的結合,聯合高校的人才培養、企業的數據資源、算力資源和框架平臺資源,做出更多原創性、有影響力的工作。
在NLP的長期發展趨勢上,融合知識和多模信息、新的學習機制等方面將是重要的技術方向。劉洋認為,NLP獲取知識的方式會在未來發生巨大變化,它將會和更多領域相結合,解決數據缺乏問題,將更多不同的信息融合在一起。呂雅娟表示,目前的語言理解大部分是基于文本的理解,處于比較淺層的理解,未來需要結合多模態和更多的知識。黃民烈指出,需要探索更類人的學習機制和學習方法,同時研究更高效、更經濟的計算模型和方法。邱錫鵬從兩方面闡述了NLP的發展趨勢,一方面需要融入更多與AI相關的內容,結合跨學科的知識;另一方面是通過知識遷移、少量標注數據的學習,推動NLP在細分領域應用方面的發展。
近期來看,未來5至10年,嘉賓們認為在計算范式、跨模態通用表示、利用知識及行業應用、對話系統上會有突破性的進展。人工智能的迅速發展為NLP提供了更多可能,相信在眾多專家學者的共同助力下,NLP技術將不斷精進,促進產業智能化發展,以科技的力量改變人們的生活。