closer wrote:
不過 OV 的許氏注音有個問題:它有 6 萬多個項目!
也許 Mac 上的字庫真的能秀出這麼多唸得出來的中文字,不過絕大部份的字在 Windows/Android 上是顯示不出來的。
把這些字留在字表中也是浪費空間。
我在想應該要把這些多餘的字拿掉才是.....
小的從 closer 的回應得到一點靈感,由於是資源有限的裝置,過大的表格只是浪費時間空間。
也有人提到會有一點頓頓的。像前面 sa22 大分享的嘸蝦米表格,有22662個按鍵定義,可打
出13075不同的字與符號。加上作者有提到一分鐘大約可匯入 1500 筆定義,所以最快也要匯
15 分鐘 (不過我都要花上近半小時 Orz...)
所以過大的萊姆表格一來要花很多時間匯入,二來表格也佔記憶體,將來查表也會多少造成負擔,
想大膽地把表格的字大量刪去,保留符號(如注音、日文、標點等),去除不常用的字。目前的想法
是從 unihan database 取出 kfrequency 裡面 5089 字來作取捨。因為不會在magic上頭作大量的輸
入動作,也許缺點字打不出來應該不會太令人抓狂 (而且說真的我也不識得這麼多字 :P)
下面是 unihan.txt 裡面對這個 tag 的說明:
Tag: kFrequency
Status: Provisional
Category: Dictionary-like Data
Separator: space
Syntax: [1-5]
Description: A rough frequency measurement for the character based on analysis of traditional Chinese USENET postings; characters with a kFrequency of 1 are the most common, those with a kFrequency of 2 are less common, and so on, through a kFrequency of 5.
待小弟把表格生出來測看看夠不夠用,其他輸入法使用者如果有興趣的話,小的也會製作這種縮水版表格分享一下。