

語(yǔ)言分類(lèi)系統的設計
- 期刊名字:電子科技
- 文件大?。?80kb
- 論文作者:邵澤國
- 作者單位:上海師范大學(xué)人文傳播學(xué)院
- 更新時(shí)間:2020-11-03
- 下載次數:次
電子科技2012 年第25卷第12期圖像.編碼與軟件Electronic Sci. & Tech. /Dec. 15, 2012語(yǔ)言分類(lèi)系統的設計邵澤國',2(1. 上海師范大學(xué)人文傳播學(xué)院,上海200234; 2.上海電子信息職業(yè)技術(shù)學(xué)院院長(cháng)辦公室,上海201411)摘要在語(yǔ)言研究過(guò)程中,依據語(yǔ)言的某一或某些屬性和特征對其進(jìn)行分類(lèi)、歸納,是觀(guān)測和捕獲語(yǔ)言現象及規律的必要環(huán)節和有效方法。對語(yǔ)言進(jìn)行分類(lèi)也是將其在語(yǔ)言地圖上渲染與描繪的前提步驟。語(yǔ)言特征分類(lèi)系統是漢語(yǔ)方言地理信息系統的一個(gè)子系統,適用于語(yǔ)音及詞匯分類(lèi)。文中以漢語(yǔ)方言字音分類(lèi)為例,介紹了語(yǔ)言分類(lèi)系統的設計思想和方法,以及如何把語(yǔ)言規律、語(yǔ)言特性等語(yǔ)言學(xué)知識同計算機技術(shù)相融合,系統可以幫助語(yǔ)言研究者對語(yǔ)言進(jìn)行有效、快速的分類(lèi)。關(guān)鍵詞語(yǔ)言分類(lèi); 方言特征;分配項中圖分類(lèi)號TP391.1 文獻標識碼 A文章編號1007-7820(2012)12-130 -04Design of a Language Classification SystemSHAO Zeguo',2(1. College of Humanities and Communication,Shanghai Normal University ,Shanghai 20034,China;2. Dean's Office, Shanghai Technical Institute of Electronics & Information, Shanghai 201411, China)Abstract In the process of language research, language classification and induction ( according to one or moreattributes or characteristics of a language) is a necessary part of and an effective method for observing and capturingthe phenomenon and rules of language. To classify a language is also a precious step to render and portray itself inthe GIS system. The classification system designed by the author is a sub-module of Chinese dialeet geography infor-mation system, which has a general adaptability to various follow up classifications. This paper, on the basis of theChinese dialect phonetic system, discusses how to shift the computer technology into a powerful tool on the languageresearch in terms of language features and language rules. The system helps language researchers in classifying lan-guages fast and eficiently.Keywords language classification; dialect feature; allocation term“漢語(yǔ)方言地理信息系統平臺建設"是由潘悟云.兩個(gè)個(gè)體。因此,要研究、認識事物,必須對所研究的先生主持的一項教育部哲學(xué)社會(huì )科學(xué)研究重大課題攻事物進(jìn)行分類(lèi),沒(méi)有分類(lèi)就沒(méi)有科學(xué)[”。關(guān)項目,該系統“以地理空間數據庫(Geographical對語(yǔ)言的研究、分析、比較,特別是要將語(yǔ)言特征Database )和方言數據庫( Dialectical Database)為基礎,在電子地圖上直觀(guān)地描繪出來(lái),往往要按照一定規則通過(guò)程序對方言數據庫進(jìn)行處理,真正實(shí)現自動(dòng)提取方對語(yǔ)言進(jìn)行分類(lèi)。而文中所要討論的語(yǔ)言分類(lèi)系統是言特征,自動(dòng)繪制語(yǔ)言地圖,真正成為方言地理研究和漢語(yǔ)方言地理信息系統的-一個(gè)子系統,它可以幫助語(yǔ)語(yǔ)言政策制定服務(wù)的方言地理信息系統(Geographical言研究者對語(yǔ)言進(jìn)行有效、快速的分類(lèi)。Informnation System of Dialect)[1-6)"。眾所周知,分類(lèi)是人類(lèi)認識客觀(guān)世界的一種基本1系統結構與功能介紹的方法。人類(lèi)最初對事物的命名就是一種分類(lèi)活動(dòng)。在漢語(yǔ)方言地理信息系統中,語(yǔ)言特征提取子系統從科學(xué)研究的角度說(shuō),之所以要研究一種事物, 目的是按照用戶(hù)設置的條件自動(dòng)提取出各個(gè)語(yǔ)言點(diǎn)的語(yǔ)言特為了認識這種事物,以便可以能動(dòng)地駕馭和利用這種征數據。此時(shí)的語(yǔ)言特征數據往往是一個(gè)個(gè)數據集。事物,使之為人類(lèi)服務(wù)。而所要認識、研究的事物往往一般來(lái)講,不會(huì )用原始的數據集來(lái)作為待分配項,而是是紛繁復雜的,群體中的個(gè)體從外形到屬性,千差萬(wàn)將數據集交給特征主體層提取子系統,得到的主體層數別,各不相同??梢赃@樣說(shuō),世界上找不到完全相同的據歸并后作為待分配項。分類(lèi)系統通過(guò)系統預設的分類(lèi)規則或中國煤化I)完成對待分配項進(jìn)收稿日期: 2012-06-25 .行分類(lèi)。YHCNMHG,再加上語(yǔ)言點(diǎn)的地作者簡(jiǎn)介:邵澤國(1978-),男,博士,講師。研究方向:理坐標值一開(kāi)提父給地埋信息系玩( Geographic Informa-計算語(yǔ)言。tion System,GIS),以供GIS處理后畫(huà)出語(yǔ)言分類(lèi)地圖。130www. dianzikeji. org.邵澤國:語(yǔ)言分類(lèi)系統的設計圖像.編碼與軟件|語(yǔ)言特征提取系統|特征數據丈藝主體特征歸并,形成待分配項列表第一級分類(lèi)(頗色選擇)|用戶(hù)自由分配|機器自動(dòng)分配特 征規則表][人機交互調整- I第一級分類(lèi),進(jìn)入第二級待分配列表第二級分類(lèi)(圖例選捅)用戶(hù)自由分配機器自動(dòng)分配-特 征規則表人機交互調整地理空間數據庫第二級類(lèi)[分類(lèi)結果顯示回歸語(yǔ)盲點(diǎn)、匹配空間信息一. 分類(lèi)數據CIS系統圖1分類(lèi)系統功能流程圖第一級分類(lèi),用顏色來(lái)標記,操作是即為待分配項據庫設計,所以這里的DB設計只是涉及到與分類(lèi)系指定顏色,未指定的待分配項系統將分配其默認顏色,統相關(guān)的幾個(gè)數據表設計。這樣就形成了第-級分類(lèi)的結果。在指定顏色時(shí),提2.1.1主體層特征表 If mf供了兩種方式。--是用戶(hù)自由分配,用戶(hù)可以自由單該表用來(lái)存儲主體層提取的結果。在該表上歸并mf選或多選待分配項指定到某一顏色;二是機器 自動(dòng)分指段,取唯一值作為待分配項 ,寫(xiě)人表tb _clas的ef字段。配,用戶(hù)只要在特征規則表中選擇符合要求的特征規表1 If_mf 表結構則,系統將會(huì )把符合規則條件的待分配項自動(dòng)指定到字段pb_jfnamem用戶(hù)選擇的顏色下。無(wú)論用戶(hù)選用哪種方式,如果對類(lèi)型bigintnvarchar說(shuō)明方言點(diǎn)編號方言點(diǎn)名稱(chēng)主體層特征值此時(shí)的分類(lèi)結果不滿(mǎn)意,可以進(jìn)行人機交互調整。身-級分類(lèi)的結果可以作為第二級分類(lèi)的待分配項,第2.1.2分類(lèi)數據表 lf. _clas .二級分類(lèi)的操作方法同- -級分類(lèi),第二級分類(lèi)的結果該表中id字段由“0”開(kāi)始每寫(xiě)人一個(gè)cf的值自用圖例來(lái)標記。用戶(hù)可以在完成第- -級分類(lèi)后就結束動(dòng)加1,字段clid、c2id的所有值在分類(lèi)操作前初始化分類(lèi)工作,此時(shí)每個(gè)類(lèi)別里的特征項對應的圖例與圖為“00”。 字段ph_ .type 存儲分類(lèi)的結果,其值形如標由系統默認。分類(lèi)操作過(guò)程中,每個(gè)操作的結果都“02 -01 -01”圖標編號。會(huì )在結果顯示框里同步顯示。最后的分類(lèi)結果數據通表2 If_clas 表結構過(guò)匹配重新回到各自的語(yǔ)言點(diǎn),類(lèi)別內的不同語(yǔ)言點(diǎn)icclidc2idph. _typenvarchara用不同的圖標來(lái)標記。然后從地理空間數據庫中取得語(yǔ)言點(diǎn)地理空間坐標值,這些信息一并傳給 GIS系統。說(shuō)明待分配項編 待分配項大類(lèi)編號小類(lèi)編號 類(lèi) 別標識其功能流程如圖1所示。本分類(lèi)系統通用于語(yǔ)音特2.1.3特征規則表If ftype征、義項特征以及語(yǔ)法特征的分類(lèi)。在自定義分類(lèi)時(shí)系統提供了“條件分類(lèi)”的快捷方法,即對待分配項按條件自動(dòng)選擇。過(guò)濾條件存儲2設計與實(shí)現在特征規則表Iffype中。特征類(lèi)型指的是語(yǔ)音的發(fā)系統前臺使用Microsoft Visual Studio 2008 C#語(yǔ)音方法、發(fā)音部中國煤化工征類(lèi)型有:鼻言,后臺使用Microsoft SQL Server2008系統。音、邊近音、邊閃YHCNMH G歐清、次濁、近2.1DB設計與實(shí)現音、清音、全清、全濁、塞擦音、墨音、閃音、送氣、響音、由于之前已經(jīng)完成了漢語(yǔ)方言地理信息系統的數濁音、阻音。sql 字段中的SQL語(yǔ)句是生成對應的特征www. dianzikeji. org131.圖像.編碼與軟件邵澤國:語(yǔ)言分類(lèi)系統的設計類(lèi)型在元數據表中對應的標記。配項從Ib3(對應控件C)移入到lb2(C或A)。如果該分表3 If ftype表結構類(lèi)名下有子類(lèi),同時(shí)刪除子類(lèi)名(嵌套調用delname)。一字段id_typeql個(gè)Ibl的項的value對應- -個(gè)cid,這時(shí)將數據表If clas類(lèi)型bigintnvarchar中值為cid的clid(或c2id)初始化為“00”。說(shuō)明特征規則編號特征類(lèi)型生 成規則的SQL語(yǔ)句2.3.3添加分 類(lèi)項函數2.2用戶(hù)界 面設計控件G調用,用戶(hù)先選中lb1中的某- -項( 對應控通過(guò)用戶(hù)界面用戶(hù)可以對待分配項劃分為兩級3件B),再選擇lb2(對應控件A或C)中的一些項,系層,即對待分配項可分為兩個(gè)級別,大類(lèi)和小類(lèi);同時(shí)統將Ib2中選中的分配項移入lb3(對應控件C或C2)為繪制地圖提供顏色圖例、圖標3層標識信息。中,這些分配項歸為-類(lèi),用lbl的選中項命名。同時(shí)對數據表If _clas 的操作是將ef與lb2選中項匹配的記漢語(yǔ)方言特征分類(lèi)系統錄的clid(或c2id)字段值改為lb1的選中項的值。2.3.4移出 分類(lèi)項函數控件H調用,用戶(hù)選擇lb1 (對應控件C)中的某些項,系統將選中項移人到lb2中(對應控件C或A)。如選中項中包含-一個(gè)類(lèi)下的所有項,則調用函數delname:將這個(gè)類(lèi)名刪除。對數據表If_ clas 的操作是將cf與lbl選中項匹配的記錄的c1id(或c2id)字段初始化。圖2用戶(hù)界面2.3.5條件分 類(lèi)函數AB、C為L(cháng)istBox控件;A用于接收和顯示待分配用戶(hù)選擇lb1 (對應控件J)中的某- -項,其值與數項數據;B(從左向右分別稱(chēng)為B B2 )用來(lái)接收和顯示據表Ifftype中的type字段匹配,得到相應的SQL字分類(lèi)命名數據;B,用顏色表示;B2用圖例表示;C(從.段的值,即一一個(gè)SQL語(yǔ)句,系統執行SQL得到一個(gè)數左向右分別稱(chēng)為C、C2)用來(lái)接收和顯示對應類(lèi)別下?lián)?讓后經(jīng)Ib2(對應控件A或C.)中出現在這個(gè)數據集中的項標志為選中狀態(tài)。的已分配項數據。D為T(mén)extBox控件,用于接收和顯示分類(lèi)結果數據。3結束語(yǔ)E、F、G、H為Button 控件;E為添加分類(lèi)名;F為從系統的處理機制看,除了系統開(kāi)始運行時(shí)要裝刪除分類(lèi)名;G為添加分配項;H為移除已分配項。I、J為DropDownList控件。I( 從左向右分別稱(chēng)為1、載待分配項數據和分類(lèi)完成后要輸出分類(lèi)結果,這兩12)靜態(tài)獲取Items ,第~ -個(gè)為顏色選擇序列:褐色、藍色、個(gè)動(dòng)作要訪(fǎng)問(wèn)數據庫,其中間運行過(guò)程可以避免系統紅色綠色、粉色黑色;第二個(gè)為圖例選擇序列:實(shí)心空對數據庫的寫(xiě)操作。所以用一個(gè)DataTable實(shí)例來(lái)存心、上實(shí)下空、上空下實(shí)、左實(shí)右空、左空右實(shí)、中心實(shí)點(diǎn)。儲據表If_clas,同時(shí)該系統與其他系統間數據集的傳K均為Button控件,“取消”為取消之前所有分類(lèi)送借助session實(shí)現。操作,并清空控件B、C、D的顯示信息,同時(shí)改寫(xiě)表lf_參考文獻clas?!按_定”將分類(lèi)結果數據寫(xiě)人到表lf_ _clas ,并傳值[1] JOHN C. Introducing speech and langwage processing [ M].給GIS系統?!胺祷亍睘榉祷氐健胺窖蕴卣魈崛 表?yè)面。北京:北京大學(xué)出版社,2010.2] 曹志耘漢語(yǔ)方言地圖集[M].上海:商務(wù)印書(shū)館,2008.2.3功能實(shí)現[3] CHRISTIAN N. Peoessional C# ( programmer to program-這里僅介紹功能實(shí)現的幾個(gè)核心函數。mer) [M]. 北京:清華大學(xué)出版社,2010.4]郭鄭州. SQL Server 2008完全學(xué)習手冊[ M].北京:清華2.3.1分類(lèi)命名 函數大學(xué)出版社,2011控件E調用。其功能是將用戶(hù)選擇的drl中的項[5]陸儉明.現代漢語(yǔ)語(yǔ)法研究教程[M].北京:北京大學(xué)出,2003.(text)寫(xiě)入lb2,清除當前l(fā)b1的所有項。如做- -級分[6]潘悟云. 教育部哲學(xué)社會(huì )科學(xué)研究重大課題攻關(guān)項目投類(lèi)時(shí),將用戶(hù)選中的控件1中的項(褐色、藍色、紅色、標評審書(shū)[ R].上海:上海師范大學(xué),2009.林燾.語(yǔ)音學(xué)教程[ M].北京:北京大學(xué)出版社, 1992.綠色粉色黑色之- -)寫(xiě)人B,,清除C,的內容。[8] PETER L.語(yǔ)音學(xué)教程( A course in phonetics)[M].張維佳,譯.北京:北京大學(xué)出版社.2011.2.3.2刪除分類(lèi) 名函數[9] 朱曉中國煤化工書(shū)館.2010.控件F調用,其功能是刪除一個(gè)已 經(jīng)分配的類(lèi)(大[10][據庫設計二階分析模式[ JYHC N M H G2003,28(1);:98 -101.類(lèi)或小類(lèi))。用戶(hù)選擇Ibl (對應控件B)一些項,系統將[11] 雷特. SQL Server 2008 DBA人門(mén)經(jīng)典[M].張德群,譯.北lb1中選中的項清除,并將清除項(作為類(lèi)名)下的所有分京:清華大學(xué)出版社,2010.132www. dianzikeji. org.
-
C4烯烴制丙烯催化劑 2020-11-03
-
煤基聚乙醇酸技術(shù)進(jìn)展 2020-11-03
-
生物質(zhì)能的應用工程 2020-11-03
-
我國甲醇工業(yè)現狀 2020-11-03
-
JB/T 11699-2013 高處作業(yè)吊籃安裝、拆卸、使用技術(shù)規程 2020-11-03
-
石油化工設備腐蝕與防護參考書(shū)十本免費下載,絕版珍藏 2020-11-03
-
四噴嘴水煤漿氣化爐工業(yè)應用情況簡(jiǎn)介 2020-11-03
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-11-03
-
甲醇制芳烴研究進(jìn)展 2020-11-03
-
精甲醇及MTO級甲醇精餾工藝技術(shù)進(jìn)展 2020-11-03