客家語拼音存取技術之研究

許義淵

客家語拼音存取技術之研究

dc.contributor	謝建成	zh_TW
dc.contributor.author	許義淵	zh_TW
dc.date.accessioned	2019-08-28T08:06:02Z
dc.date.available	2012-9-5
dc.date.available	2019-08-28T08:06:02Z
dc.date.issued	2007
dc.description.abstract	拼音存取技術依賴的是一套能夠快速將聲母、韻母、聲調等關鍵字集快速轉換到相對應字元的方法，目前最快速的搜尋方法是赫序(Hash)法則，只要透過相關的數學函數運算，馬上可以找到相對字元的位址。本文以客家語拼音做為研究對象，對其關鍵字集做前置的比較分析，然後以植於中國餘數定理建構出最佳完美的赫序函數。將中國餘數定理應用到赫序法則內的好處，就是可以避免碰撞(collision)的問題，然而關鍵字集數量大的時候，也會產生常數C值太大的問題，本研究嘗試將關鍵字集做適當分組，控制關鍵字集內的C值大小，所多付出的記憶空間是額外的C值分組參數表，對於負載係數(Loading Factor)稍稍有影響，卻可降低C值之大小。最後，本文將國語、台語、客家語等台灣三大語系之羅馬拼音統合匯整，建立一個共同的赫序函數，如此就不需要個別建構某語系的赫序函數，但是，國台語三語係合併會讓關鍵字集增多，必須做更多的分組方能使C值成長受到控制，然而關鍵字集如果分組太多會造成記憶空間之利用效率降低。對此，本文對於負載係數、C值、最大C值所用到的質數數量做迴歸分析，可以知道負載係數與C值的關係圖，而不會僅於追求記憶空間效能而忽略C值的大小。	zh_TW
dc.description.sponsorship	圖書資訊學研究所	zh_TW
dc.identifier	GN0595151103
dc.identifier.uri	http://etds.lib.ntnu.edu.tw/cgi-bin/gs32/gsweb.cgi?o=dstdcdr&s=id=%22GN0595151103%22.&%22.id.&
dc.identifier.uri	http://rportal.lib.ntnu.edu.tw:80/handle/20.500.12235/89154
dc.language	中文
dc.subject	中國餘數定理	zh_TW
dc.subject	赫序	zh_TW
dc.subject	負載係數	zh_TW
dc.subject	客家語	zh_TW
dc.subject	Chinese remainder theorem	en_US
dc.subject	hash	en_US
dc.subject	loading factor	en_US
dc.subject	Hakka dialect	en_US
dc.title	客家語拼音存取技術之研究	zh_TW

Files

Original bundle

Now showing 1 - 5 of 5

Name:: n059515110301.pdf
Size:: 85 KB
Format:: Adobe Portable Document Format

Download

Name:: n059515110302.pdf
Size:: 227.08 KB
Format:: Adobe Portable Document Format

Download

Name:: n059515110303.pdf
Size:: 323.88 KB
Format:: Adobe Portable Document Format

Download

Name:: n059515110304.pdf
Size:: 63.84 KB
Format:: Adobe Portable Document Format

Download

Name:: n059515110305.pdf
Size:: 366.08 KB
Format:: Adobe Portable Document Format

Download

Collections

學位論文