「生成詞庫理論」對於語言學界、AI 人工智慧學界,帶來震撼與深遠的影響。
美國布蘭黛斯大學(Brandeis University)資訊科學系─普士德耀夫斯基教授於《國際計算語言學期刊》首度發表「生成詞庫理論」並集結成書。
科技部經典譯著計畫(繁體中文版)由國立臺灣大學語言學研究所謝舒凱教授,挹注大量心力完成翻譯、註釋與學術導讀。
J. Terry Nutter(《國際計算語言學期刊》,麻省理工學院出版社):非常值得一讀的書……對於不熟悉詞彙語意學新發展的讀者,本書提供了一個有趣的入口。對於詞彙語意領域已熟悉的讀者,本書涵蓋了一系列嚴肅卻又有趣的問題,並能與其他不同觀點和方法產生有效的互動。
「生成詞庫理論」是一個嶄新且令人期待的詞彙語意理論,說明了我們是如何透過有限的方式來表達詞彙的無限多義。是目前第一個以生成理論取徑為主的形式詞彙理論,並且在計算語意和組合語意之間找到連結的基礎。
靜態的詞彙理論認為每一個詞彙都是先由預定好的一組詞義所組成。但是這種觀點卻造成了自然語言處理系統在處理語意成效的瓶頸。相對的,普士德耀夫斯基主張詞庫在語言表徵與處理上扮演著動態與核心的角色。他提出的詞庫是以生成的方式運作。首先,提供了一組可以用來呈現豐富訊息的詞彙集,再透過發展一個架構得以區辨出在這組詞彙之間的細緻差異,最後設計出一組組合運算與生成機制,使詞彙在不同的新語境下產生的新延伸詞義可以依生成理論而理解。
本書的主題涵蓋了名詞的語意學(前後景名詞、關係名詞、時間名詞等);致使關係的語意(特別是致使/非賓格、時貌動詞、情態致使等經詞彙化的致使關係);語意類型對於句法表達的限制(例如類型轉移和誘迫運算);事件與子事件的形式語意學,以及多義行為的處理等。
作者:詹姆斯‧普士德耀夫斯基
詹姆斯‧普士德耀夫斯基(James Pustejovsky)教授於麻省理工學院在著名語言學家喬姆斯基(Chomsky)之指導下主修語言學與數學。取得學士學位之後前往德國馬堡大學修習德國古典文獻學,在1984年於美國麻州大學Amherst分校完成語言學之博士學位。旋後一直任教於美國布蘭黛斯(Brandeis)大學資訊科學系,並擔任該校Volen複雜系統研究中心研究員。普士德耀夫斯基教授之專長在於語言的理論與計算模式。其晚近的研究領域涵蓋了計算語言學、詞彙語意學、知識表徵與自然語言中空間與時間訊息的自動推理、標記與萃取等整合性領域。《生成詞庫理論》是普士德耀夫斯基教授的研究中最為重要的貢獻之一。該理論核心首先在1991年發表於國際計算語言學期刊,其後於1995年集結成書。該理論之提出,深刻地影響了詞彙語意學、計算語意學與人工智能學界。
譯者:謝舒凱
德國杜賓根大學(Universitat Tubingen)計算語言學博士。曾任中央研究院語言學研究所博士後研究員、國立宜蘭大學、國立臺灣師範大學英語學系助理教授,並在歐盟科研架構計畫獎助下在義大利比薩大學計算語言學實驗室擔任訪問學人。目前是國立臺灣大學語言學研究所副教授兼任所長。謝舒凱教授的研究專長是計算語言學與語意學,近年來發表超過八十多篇的國際會議與期刊論文。目前並擔任國際語言學奧林匹克競賽台灣隊領隊教練與亞太語奧委員會職務等工作。
譯者序 謝舒凱
第一章 譯者導論 謝舒凱
一、詞彙語意理論文獻
二、理論概述
三、理論評述
四、漢語例證
五、語意生成機制之中文例證
六、漢字意符與中文複合詞之經驗知識結構
七、未來展望
八、參考文獻
九、延伸閱讀
第二章 作者導論
第三章 詞彙知識之本質
一、語意類別與範疇交替
二、詞彙的相互關係
第四章 一詞多義的邏輯問題
一、詞意延伸的種類
二、對比歧義
三、互補性多義
四、一個基本的詞彙語意學理論
第五章 詞意列舉式詞庫的限制
一、詞彙語意學理論的目標
二、字詞的新用法
三、字詞意義的滲透性
四、句法形式中的差異
五、語意表達性
六、生成詞彙模式
七、強態與弱態組合
第六章 語意類型系統
一、表徵層次
二、論元結構
三、延伸的事件結構
四、物性結構
五、語意層次之互動
第七章 物性結構
一、解釋模式
二、名詞的物性結構
第八章 語意學中的生成機制
一、誘迫與類型轉移
二、共同組合
三、選擇約束
四、語意選擇
第九章 名詞的語意學
一、基本議題
二、聯併類型的名詞
三、帶複雜類型的名詞
四、命題與事件描述
五、名物化的不同種類變化
六、詞彙化與詞彙概念範式
第十章 致使結構的詞彙語意學
一、語言如何實現致使性
二、致使性與非賓格性
三、體貌使役與誘迫機制
四、感事述語
五、情態使役
六、結論
第十一章 生成詞庫的啟示
一、共同組合與動詞語意學
二、瞬時層次述詞
三、誘迫的進一步應用
四、語言知識與常識
五、詞彙推論與修辭
六、總摘要
附錄一:參考文獻
附錄二:引用作者索引
附錄三:中文關鍵詞索引
譯者序
AI 的發展已然成為一股驅動當今社會與知識發展的重要力量。智慧運算與應用不僅席捲學界,同時也引發了產業結構的基本革命。在邁向強 AI 的路途中,語意運算與理解可以說是最為核心的難題之一。不斷發展的深度學習神經網路模型在自然語言處理的一些領域已經開始取得了前所未有的重大突破。目前在深度學習導向的自然語言處理技術下扮演關鍵角色的分佈向量語意表徵,在一些可以轉換為向量計算推導的任務上也已經有了令人驚艷的表現。在大數據與高效計算的加持下,利用神經網路的架構實作出能夠因應不同語境而動態更新的適應性語言處理模式也指日可待。然而,目前 AI 語意模式對於在言談或文脈中的詞彙語意推論 (Lexical Inference) 與組合 (Composition) 的運作機制,卻難以提供清楚與透明的解釋,在科學立論與應用倫理上難以令人滿足與安心。生成詞庫理論在此脈絡下可以提供一個絕佳的詞彙語意理論參考架構。一方面它嘗試要形式地解釋與表徵詞彙語意內容,試圖把詞彙語意、句法、語用與世界知識連結起來,二方面它的形式架構也容許認知與計算上的模擬實作。
不同於大部分的語意學家,本書作者相當重視理論建模與經驗檢證的互動關係,近年來積極地在計算語言學領域投入生成詞庫理論與其他語意資源的整合建構。譯者曾在 2011年邀請 Pustejovsky 教授來臺大演講他的最新的理論進程。之後這幾年來他仍然積極的在計算語意語用理論上有不間斷的突破發展,包括方興未艾的語言中的事件與時間結構標記與標準化、計算語用學中的事實性 (Factuality) 標記與自動判斷、因脈絡而異的情緒與語意理解機制、甚至到人機之間的多模態互動 (Multimodal Interaction) 與評測架構等等,都反應了一位卓越的跨領域科學研究工作的典範。展望未來,對於自然語言中活潑呈現的種種語意現象,我們所需要的不只是在語言工程上取得成就,而是一個兼具解釋力與應用性的科學理論架構。這本經典譯作雖然涉及了許多複雜難解的語意研究術語與背景知識,譯者的翻譯功力也不夠成熟,但是仍然希望帶給有興趣自然語言理解的讀者一窺世界一流的計算與語意理論的面貌。最後譯者要感 謝家人的支持,與協助本書校正工作的朋友們。這本書從開始到最後一版斷斷續續地歷經了十年,期間獲得許多人的協助與校正,包括科技部的審查委員、聯經出版公司李芃編輯與她邀請的許展嘉、陳怡靜、王建邦、高宏達,以及我的學生張瑜芸、施孟賢、江琼玉等等,表達我十二萬分的謝意。在 2019年出版前因為排版細節找不到時間處理時而束手無策時,我的博班學生 ChristianSchmidt 熱心的出面一手包辦,他的鼓勵與完全的投入激勵了我,也是這本書可以完成的最後推手,但本書中所有的可能的錯誤譯者要負唯一的責任。
作者導論
本書要探討的是自然語言的語意學,特別是詞彙的語意,不論是孤立的詞彙,還是詞彙的組合。也就是說,我們要處理語意組合 (Semantic Compositionality) 的問題。詞彙語意學 (Lexical Semantics) 的研究任務,是探究詞彙的指稱及其指稱方式。計算與理論語言學向 來把詞庫 (Lexicon) 當成是一組靜態的詞彙集合,並且將之標註以不同的句法、構詞與語意訊息。在這個觀點之下,不同的詞項就有不同之詞意。但是自然語言的形式語意理論,對於以下兩個重要的議題卻甚少著墨:
1. 語詞在新語境下的新用法;
2. 基於語意組合原則的詞彙語意模式評測。
在上述旨趣下,本研究考察了詞意與語意組合原則的互動。我將主張透過對於新詞意問題之解釋,我們可以直接了當地處理語意組 合的議題。我們所討論的詞彙語意理論,在許多方面都會影響到一般 語意理論的設計。如果我們將語意理論的目標設定在能夠去遞迴地 (Recursively) 分派意義給表達式,用來解釋諸如同義、反義、多義與轉喻等不同的現象,那麼語意組合終將取決於語言中的詞彙基本範疇所指涉的東西。傳統觀點向來認為,語詞要不以主動的函項 (Actor Functors),要不就以被動的論元 (Passive Arguments) 表現出來。但是我們將看到,倘若我們改變了看待詞彙基本範疇所指稱的方式,那麼語 意組合形式本身也會改變。因此若徹底研究下來,詞彙語意學可以視為一個是重估語意組合運作本質的工具,用以達成語意理論的目標。本書一開始將回顧詞彙表達的基本議題,並檢視當前的理論與計算模式處理詞彙歧義所持的觀點。這個觀點接納了詞意列舉技術 (Sense Enumerative Techniques),其主張在有限的特徵基礎上區分詞意。然而就如同我在第四章第一節要論證的,這樣的研究進路並無法區分 Weinreich(1964) 所提出的對比與互補性歧義。前者是基本的同形異義(關係)(Homonymy) 現象,指一個詞項出於巧合地,承載著許多可區分但又不相關的詞意。而後者指的則是同一個詞項在邏輯上相關的詞意。我將在第四章提出詞意列舉的進一步之問題,主張當前理論所假定的表達式並不適用於闡明自然語言語意學的豐富性。第三章與第四章中將呈現出,大多數周密的詞彙表達研究都聚焦在動詞類別上(如:Levin, 1993)。的確,向來不管以詞彙或組合觀點來看,語意份量的期待總是落在動詞上。這點我們可以明顯地從處理詞彙歧義的作法上看得出來。在第五章我會討論許多可簡化語意描述、且截然不同於詞意列舉概念的解釋機制。更進一步地去看待這些機制之後,我們會注意到它們領向我們到一個非常不同的詞彙語意及詞意組合的觀點上。在討論完這些章節之後,接下來的詞彙語意系統的概念就會浮現出來。在這樣的理論之下,一組核心的詞意—通常比先前理論所假定的擁有更多的內在結構—,當個別詞項間被組合成詞組與子句時,可以用來派生更大的一組詞意。我將把這樣的詞彙組織方式稱作生成詞庫,而將那些生成這些「擴充詞意」之運算稱作生成手段 (Generative Devices),這包括了類型誘迫 (Type Coercion) 與共同組合 (Co-Composition)。我將討論這些觀點如何支持一個較具解釋力的語意模型,接著檢視一般語言學理論與詞彙語意學的目標。我所要論證的是對於詞項的知識架構,我們除了關心句法合法性 (Grammaticality),也要關心語意合法性 (Semanticality)。
我們所建構的語意解釋模型應該要能反映出自然語言的特殊與難處, 而不是僅僅將現成的邏輯式套用到新的語料上。我將把自然語言錨定在語意描述的階層上,由其底層多型的 (Polymorphic) 生成能力來刻劃其特徵。我主張自然語言應被歸於弱態多型語言 (Weakly Polymorphic Languages) ,這比單型 (Monomorphic) 更具表達力,但在無限制多型 (Unrestricted Polymorphic) 語言之下。不過這種特殊性,已經足夠用來解釋語義邏輯多義性及共同組合(Co-Compositionality)。 接著在第六章我將簡述本書所主張的語意類型系統。詞庫的生成理論包含了一個表達不同類型詞彙訊息的多維層次表徵式。這些不同的層次包含了論元結構—為表達函項所需之價資訊 (AdicityInformation)、事件結構 (EventStructure) —為了表達 Vendler 及相關研究定義下的動相 (Aktionsart) 與事件類型相關訊息、物性結構 (QualiaStructure) —為 了表達定義一個物件之關鍵屬性,例如它的組合成分、目的與功能、被創造的方式等等,以及承繼結構 (InheritanceStructure) —為了表達詞庫中詞項與其他成分之關係。第七章會較詳盡說明物性結構及其在分派語詞謂語功能上的角色。第八章將討論我們在第六、七章描述的機制,在語言的多型 (Polymorphic) 行為上的應用。我將討論一些多型類型,並思索哪些運算機 制才能適當地描述語意類型的語法表達。我會特別檢視語法中誘迫扮演的角色,以及其他諸如選擇約束(Selective Binding)、共同組合 (CoComposition) 的生成機制需求。多型 (Polymorphism) 並無單一形式;毋寧說,ㄧ詞多義與類型歧義是諸多語意現象在特殊互動下的結果。第九章簡述了物性結構用於分析名詞語意的結果。名詞在形式分析上可以透過論元結構、事件類型、以及物性結構三種面向。我利用先前章節之類型系統分析了名詞的多義,並詳述了一致性類型與點物件 (Dot Object) 之區別。在接下來的兩章我將概述,如果我們用第六章討論之生成機制與類型系統並應用生成詞庫分析之原則,那麼我們就可以簡化關於一些文法現象的解釋便。特別是我把論元選擇視為是由語意類型所驅動的,是由透過加諸限制於誘迫規則、選擇約束、與共同組合運算所模製 (Modulated) 出來的。這樣的研究進路,使得我們可以解釋那些具備多重句法類型行為的動詞之多型本質。在第十章我將討論物性與事件結構在描述語言中的使役關係 (Causal Relation) 詞彙化中所扮演的角色。特別是我分析了致使/始動性動詞 (Causative/Inchoative) ,體貌述詞 (Aspectual Predicate),當事述詞 (Experiencer Predicate),以及情態使役詞 (ModalCausatives),例如‘risk’(風險)。假設某人或某物造成某一事件的發生,可以透過特殊的句構、動詞或詞綴來加以表達。主語可由定語+主語構成;謂語部分則可由狀語+述語+補語+賓語部分所構成。最後我將討論這種詞彙組織的觀點如何關聯到當前的隱喻與語用誘發的轉喻研究。儘管這是一個涉及經驗的議題,但是在方法論的層次上我主張常識 (Commonsense Knowledge) 與詞彙結構要作嚴格的區別。本書中所檢視的新的一詞多義的類型,展示了跨語言的規律與系統性,這是語用詞意延伸模式或隱喻模式所欠缺的。