本文定量考察漢語常見篇章銜接標記在書面話語中的連貫用法。首先根據(jù)修辭結(jié)構(gòu)理論(Rhetorical Structure Theory,RST),設(shè)立了漢語修辭關(guān)系集以及關(guān)系優(yōu)選協(xié)議,按標注流程開發(fā)出漢語財經(jīng)評論修辭結(jié)構(gòu)樹庫。接著為各類銜接標記在該篇章語料庫中的分布和用法設(shè)立多個特征變量,展開形式、句法、語義和語用標注。隨后利用樹庫和標注語料,對特定銜接標記展開深入的個案分析,探討其篇章分布與語用連貫作用之間的相關(guān)性。最后嘗試利用銜接標記及其所在篇章單元的形式特征,通過機器學(xué)習(xí)方法來自動判定所在篇章單元間的修辭連貫關(guān)系,測試結(jié)果較令人滿意。本文最后也討論了對人工標注質(zhì)量的理解,以及數(shù)據(jù)挖掘技術(shù)在語言學(xué)研究中的應(yīng)用前景。 樂明,浙江大學(xué)副教授、“求是青年學(xué)者”。曾師從馮志偉研究員,于2006年獲中國傳媒大學(xué)語言學(xué)及應(yīng)用語言學(xué)博士,研究方向為計算語言學(xué)。2011年在美國新墨西哥大學(xué)語言學(xué)系訪問,師從Joan Bybee教授,研究方向為語法化理論。已發(fā)表多篇AHCI/CSSCI/SCI/SSCI語言學(xué)論文,負責(zé)完成國家社科基金青年項目一項及省部級項目兩項。 目前主要的研究方向是語言資源的開發(fā)和利用,重點關(guān)注關(guān)聯(lián)詞語和人稱代詞在各類自然語篇中的分布和功能,通過制定詳細的工作手冊和標注規(guī)范,指導(dǎo)篇章語料庫的構(gòu)建以及目標詞語在,語料庫中的多維度標注,在此基礎(chǔ)上用進行量化的語言學(xué)本體研究。
|