客家語拼音存取技術之研究
dc.contributor | 謝建成 | zh_TW |
dc.contributor.author | 許義淵 | zh_TW |
dc.date.accessioned | 2019-08-28T08:06:02Z | |
dc.date.available | 2012-9-5 | |
dc.date.available | 2019-08-28T08:06:02Z | |
dc.date.issued | 2007 | |
dc.description.abstract | 拼音存取技術依賴的是一套能夠快速將聲母、韻母、聲調等關鍵字集快速轉換到相對應字元的方法,目前最快速的搜尋方法是赫序(Hash)法則,只要透過相關的數學函數運算,馬上可以找到相對字元的位址。本文以客家語拼音做為研究對象,對其關鍵字集做前置的比較分析,然後以植於中國餘數定理建構出最佳完美的赫序函數。 將中國餘數定理應用到赫序法則內的好處,就是可以避免碰撞(collision)的問題,然而關鍵字集數量大的時候,也會產生常數C值太大的問題,本研究嘗試將關鍵字集做適當分組,控制關鍵字集內的C值大小,所多付出的記憶空間是額外的C值分組參數表,對於負載係數(Loading Factor)稍稍有影響,卻可降低C值之大小。 最後,本文將國語、台語、客家語等台灣三大語系之羅馬拼音統合匯整,建立一個共同的赫序函數,如此就不需要個別建構某語系的赫序函數,但是,國台語三語係合併會讓關鍵字集增多,必須做更多的分組方能使C值成長受到控制,然而關鍵字集如果分組太多會造成記憶空間之利用效率降低。對此,本文對於負載係數、C值、最大C值所用到的質數數量做迴歸分析,可以知道負載係數與C值的關係圖,而不會僅於追求記憶空間效能而忽略C值的大小。 | zh_TW |
dc.description.sponsorship | 圖書資訊學研究所 | zh_TW |
dc.identifier | GN0595151103 | |
dc.identifier.uri | http://etds.lib.ntnu.edu.tw/cgi-bin/gs32/gsweb.cgi?o=dstdcdr&s=id=%22GN0595151103%22.&%22.id.& | |
dc.identifier.uri | http://rportal.lib.ntnu.edu.tw:80/handle/20.500.12235/89154 | |
dc.language | 中文 | |
dc.subject | 中國餘數定理 | zh_TW |
dc.subject | 赫序 | zh_TW |
dc.subject | 負載係數 | zh_TW |
dc.subject | 客家語 | zh_TW |
dc.subject | Chinese remainder theorem | en_US |
dc.subject | hash | en_US |
dc.subject | loading factor | en_US |
dc.subject | Hakka dialect | en_US |
dc.title | 客家語拼音存取技術之研究 | zh_TW |
Files
Original bundle
1 - 5 of 5
No Thumbnail Available
- Name:
- n059515110301.pdf
- Size:
- 85 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- n059515110302.pdf
- Size:
- 227.08 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- n059515110303.pdf
- Size:
- 323.88 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- n059515110304.pdf
- Size:
- 63.84 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- n059515110305.pdf
- Size:
- 366.08 KB
- Format:
- Adobe Portable Document Format