嘸蝦米指南


關於嘸蝦米指南

嘸蝦米因字根著作權及專利權問題,在字根表未公開授權免費自由使用之前,僅有合法版權的使用者可自行利用,不能以任何型式散佈,因此嘸蝦米的使用者需自行提供字根表格來做轉換,並僅其本人使用。

如果您需要在 zhim! 中使用嘸蝦米 而又不知道如何轉換字典檔,那就來對地方了,請依您的狀況進行指南,若仍有疑問,再歡迎來信詢問。

什麼是字根表

字根表或稱表格檔,是所有文字與其字根的對照列表表格。

嘸蝦米範例

a  對  
aa  寸  
aaa 鑫  
ab  鎮  
ab  鎭  

什麼是 CIN 格式

cin 是中文輸入引擎所支援的輸入法表格常見的格式之一,為純文字文件,內容排版類似 csv 格式,除了字根表格還多了輸入法相關的資訊,如輸入法名稱、鍵盤按鍵配置等等。

行列30的表格範例

%ename array30  
%cname 行列30  
%encoding UTF-8  
%selkey 1234567890  
%keyname begin  
a 1-  
b 5⇣  
c 3⇣  
.... (略)  
; 0-  
, 8⇣  
? ?  
* *  
%keyname end  
%chardef begin  
a   一  
aa  二  
aaa 三  
aaax    貳  
aac 示  
..... (略)  
%chardef end  

什麼是 UTF-8 編碼

純文字文件依所使用的語系不同,會使用不同的編碼儲存,例如早期繁體中文會以 Big5 編碼儲存,簡體多半以 GB2321 編碼等等。當使用了錯誤的編碼開啟文件,或是軟體尚不支援的該編碼時,無法正確解讀,就會產生常說的亂碼問題。

隨著國際化時代來臨,單一的編碼不再適用於多語系的環境,因此有了 Unicode 來做為字元編碼的標準,UTF-8 便是其一最廣泛的應用。

維基百科: Unicode
維基百科: UTF-8

how to convert to utf8

指南開始

要能夠使用嘸蝦米,首先需要將嘸蝦米字根轉換為 zhim! 可使用的字典檔,cin 是比較廣泛使用也比較有標準可尋的格式,因此需準備 cin 格式,並且以 UTF-8 編碼儲存的字根表。

都準備好了

若已持有嘸蝦米字根表,可直接前往字典檔轉換工具。

選擇字根表來源

關於第三方的嘸蝦米字根表並不難取得,以"偽蝦米"、"香草輸入法"、"香草蝦"、"嘸啥味"、"noseeing" 等關鍵字搜尋,即可找到相當多的資訊,請自行解決。

在此僅提供比較正式的管道:

將 tab 表格轉換成 cin 表格

若電腦已安裝了行易嘸蝦米輸入法,則已經有 tab 表格存在,但 tab 表格並非純文字格式,需要使用 uni2txt.exe 轉換為純文字檔,uni2txt.exe 可至蝦米族樂園下載。

tab 表格,Windows 平台下檔案位於 C:\Windows\System\liu-uni*.tab
Mac 平台以 Boshiamy X1 版本為例,檔案在 /Library/Input Methods/Boshiamy.app/Contents/Resources/Modules/IMBoshiamy.bundle/Contents/Resources/liu-uni*.tab

其中 liu-uni.tab 為繁體中文,liu-uni2.tab 為簡體中文,liu-uni3.tab 台式簡體,liu-uni4.tab 為日文表格。將上述 tab 檔案複製到 uni2txt.exe 相同資料夾中,接下來的動作需要在 Windows 中命令列模式執行。

首先直接執行一次 uni2txt.exe 可以查看一下說明及語法

E:\uni2txt>uni2txt.exe  
Usage: uni2txt [source file] [dest file]  
  
這個程式可以將嘸蝦米 for WinNT 的字碼對應檔轉換成純文字檔格式。  
(標準存放位置為 C:\WINNT\system32\liu-uni.tab)  
[source file]: 要轉換的來源檔,通常是上面講的 liu-uni.tab  
[ dest file ]: 轉換完輸出的目的檔,檔名隨便你取 :)  
如果目的檔已存在,請先自行刪除,程式不會覆寫檔案。  

接著以轉換 liu-uni.tab 為例,輸出 liu-uni.txt

E:\uni2txt>uni2txt.exe liu-uni.tab liu-uni.txt  
There are 7b44 words, 0 duplicates, and 31556 lines actually outputed  

完成後會產生純文字格式的字根表格 liu-uni.txt,但此時還不是正確的 cin 格式,以及可能 uni2txt.exe 已年代久遠,還會產生一些錯誤的字根。雖然如此,但此時已經足夠丟丟到 zhim! converter 進行轉檔了。

行易官方網站 IBus 輸入法表格

行易官方網站有提供會員數種平台可使用的嘸蝦米輸入法,雖然沒有直接使用 cin 表格的版本,但其中 IBus 使用的表格為 SQLite 格式,並且字根含有 rsvf 選字字根,因此是相當適合使用在不用的輸入法架構下。

行易官方網站的下載僅提供給已註策的會員使用。

IBus 輸入法表格轉方式說明請參考 Export cin table from IBus-Boshiamy using ibus2cin

關於無啥味

選擇使用無啥味表格的同時,我希望您能夠閱讀完李果正先生所表達的幾篇相關文章。但以 Email 來信以及其他網路討論區的一些狀況來看,大部份的使用者完全不願意花個一分鐘看一下說明,因此直接節錄部份內容(僅因排板需求調整,未更改任何文字),最終還是希望使用者能夠花點時間看一下原始的文章。

給 gcin 使用是私下放出來的,不是「公開釋放」,你下載後有看到任何版權及 license 聲明嗎?公開釋放(release)的要件是有版權聲明及 license。

會針對給 gcin/linux 使用,這是當初劉重次先生口頭答應的,當時接洽了兩次。當時是答應給 xcin 使用,xcin 也就是 gcin 的前身。所以,我無法答應(也沒有權力答應)任何人在其他輸入法平台或作業系統使用。

請移除「無啥味」 LGJ

智財權(著作權、專利權、商標權),視性質,他們之間可能會有重疊的模糊地帶。例如輸入方法得為專利權的標的,同時也部分為著作權的標的,但此時著作權法不足以保護他的智財權,所以要用專利權及商標權來保護。

請注意,是不足以保護,不是不保護。所以,他的著作權還是有的,只是不容易在現行法規中提起訴訟。輸入法表格,我們可以自行製作,那麼,自行製作的依據又是什麼呢?所以,自行整理表格者,只有部分的著作權,並不完整,因為整理者並不是原創者。在這種情形下,整理者並沒有完整的著作權,他無法依據 copyright holder 的地位來聲稱自己有全部的著作權,也無法訂定 license,因為要完整著作權的 copyright holder 才有權限去訂定 license。

gcin noseeing-12 LGJ

本公司授權合法持有嘸蝦米輸入法 7.0 非試用版之使用者自行利用,惟使用者不得任意更改此表格中每個字的編碼規則以及本套件之任何內容,亦不得以轉換格式或片段節錄等任何方法重新散佈!此表格授權使用範圍與使用者持有之授權合約書所載範圍相同,其他未載明之事項,一律依原授權合約書內容辦理之。

嘸蝦米輸入法 7.0 字根檔頭說明 行易

無啥味 - 嘸蝦米字根相容表

連結皆來自網路蒐集,不能保證所有連結都有效,或請自行 Google

下載解壓縮後,請使用 noseeing-12.cin 或其他 .cin 的檔案。

http://hyperrate.com/topic-files-dir/99/24799-nw1mZy2r9M/noseeing-12.tar.gz
http://edt1023.sayya.org/gcin/noseeing-12.tar.gz
http://cle.linux.org.tw/~edt1023/gcin-bk/noseeing-12.tar.gz
https://www.google.com.tw/search?q=noseeing-12

6 comments, 0 pingback