《生活e5台语,台语e5生活》

| | | 转寄

台文输入法应俱备的条件

  或许有人会觉得一个台语都讲不流畅的人去学台语输入法做啥?不过对我来说有台文才是台语能否存活的关键。当初改用 firefox 就是为了数位化读写有调号的台文,在许多补充的 Unicode 都还没字体前,我已尝试过各种台文输入法。不论是教罗、TLPA、POJ、普实台文(到现在还不了解普实在哪)、台语注音等,各种输入法我都试过,但是都用不顺手。

  主要的原因是许多输入法以打入台语罗马字、输出汉字为为重心。对像我这种会打汉字拆字输入法(我学的是呒虾米),加上台语本来就讲不好,台文更是婴儿学步的人而言,用罗马字打出汉字的功能意义不大。反而是能让我打出带调号的罗马字才是我最需要的台语输入法功能。

  民进党执政下的教育部对台湾各种国语的保存花了很多心思,除了订定台罗外,也开发出了教育部台湾罗马字拼音输入法。这个输入法好用是好用,但是存有两个问题。第一、在我的 Windows XP 上不知为何其慢无比。第二、政府用了人民的税金开发出来的成品,虽然免费供人民下载,但是却不是当初开发前所说的 Open Source Software,顶多算个 Freeware 而已。其实就算不想公开程式码,至少也可以公开输入法字表的 .cin 档。对此人有至信教育部,但是被官腔打了回来。

  教育部的输入法如果电脑高级的话,在 Windows 和 Mac 版跑起来不会有太大问题。但是如果你电脑记忆体不大就得忍受每次切到该输入法就 lag 的情况。若你用的是 Linux 类的系统,而又不喜欢 SCIM ,是台湾人自行开发的 gcin 用户的时候,教育部附的「Linux版」也是毫无用处。

  如果你是 Windows 用户,网路上已经有近乎完美的台文输入法。那就是信望爱的FHL台语文输入法(Faith Hope Love,怎么不用SBA?)。在 Windows 下该输入法不但是任意切换为教罗或是台罗出字,其汉罗版本甚至可以即时改变先出罗马字或是先出汉字。

  这么完整的台文输入法,真的台文使用者的福音。台湾这些基督教与天主教对保存台湾各种母语的用心往往让人动容。但是…… Linux 的档呢?在信望爱台语文输入法的「汉罗说明书」中偷夹带了一个 cin 档。不过也是以输出汉字的功能为主。
     于是乎 Linux gcin 上就只剩下 xcin 时代留下来的 TLPA 输入法 、台语注音文、普实台文、KKS台罗汉罗台语输入法(另有教罗版)、KSS台罗客语输入法(另有教罗版)。绝大多数不是非主流的台语拼音,就是以输出汉字为主。

  最后我找到了「也轻松」YKS教罗汉罗输入法、YKS台罗汉罗输入法。两个档也是在信望爱的网站找到的。不过不知道是谁撰写的,但是多少和信望爱的输入法有点关系的样子。这一个输入法的 cin 档里就很明显有支援直接输出带调号罗马字。

  不过在用 gcin2tab 转档成 gcin 可以使用的档案时,我遇上了一个困难。YKS里有些字词的编码超过了 gcin 限制的 10 码(不知道 gcin 限制这个干么)。所以我只剩两种选择,一是勉为其难改用中国的 SCIM。另外就是把 YKS 超过十码字词删除。除非直接把两字以上的词全删,不然两者都是很大的工程。于是我想不如自己动手编 cin 档算了。

  既然要写自己的台文输入法,就要先思考「台文输入法应俱备的条件」。究竟要俱足哪些功能才能称上是一个好用,值得大家去学习的台文输入法?我个人的看法如下:

  一、兼容现有罗马字方案:
  这点很重要。许多台语能力较佳,应该站在前头带领台文复兴的人反而视学台文为畏途。原因就是台文罗马字迟迟没有共识。想学之前光是比较各种罗马字的优缺就眼花撩乱,加上输入法通常都选边站,学了又有可能找不到自己适用的输入法,难免让人裹足不前。
        一个好的台文输入法应该兼容多种罗马字拼法。比如教育部的输入法会将所输入的 POJ 与 TLPA 自动转换成台罗。当输入 góa 时,出字是 guá。输入 chhiáⁿ 时,出字是 tshiánn 或是 tshiáⁿ。理想的台文输入法应该能在设定中可以选以何种罗马字规格输入,甚至可以自订以另一种罗马字输出。如此一来大家可以放心的选一种罗马字学习,以后若需要另外学习一种罗马字,配合输入法的这项功能也会变得容易许多。
       这点在 Windows 上较容易实现。gcin 目前仅有注音、词音有较多自订功能。其它输入法只是改自很阳春的 cin 档。如呒虾米原本有四种模式,并可同音查字、注音查字、Wild Card查字等功能,最后 gcin 里的虾米只能把四种模式全挤进一个 cin 档中再转档。希望 gcin 能向逼进 Mac OS X 的输入法的功能发展下去。

  二、兼容「怎么念就怎么打」:
  不论是用哪一种罗马字,一个理想的台文输入法都应该支援怎么念就怎么输入。比如「自然」每字单独念为自chū、然jiân。但是当成一个词的时候,就会出现台语特有的变调,而念成chù-jiân。该如何输入应给用户自行选择。选项有四:
a、输入口语的chù-jiân,出字台文的chū-jiân。
b、输入口语的chù-jiân,出字口语的chù-jiân。
c、输入台文的chū-jiân,出字台文的chū-jiân。
d、输入台文的chū-jiân,出字口语的chù-jiân。


  事实上简化一下就是,一个选项不论怎么打都出台文正写,另一个选项不论怎么打都出口语音。

  三、兼容调号输入习惯与顺序:
  多数台湾人学电脑后的输入法初体验通常都是微软的注音或新注音。因此大部份的人很习惯先打念法再打调号。比如输入 jiân ,就出「jiân」字。不过台文输入法另有许多不同的习惯。一种是顺序上的不同。

  如教育部的输入法就支援 ji5an 或 jia5n 的打法。另一种是符号上的不同,有的人认为应该选长得和调号比较像的键来输入。因此jiân可能是打成 jian^,或者是打成 ji^an 或是 jia^n。其它如 á 调号就直接打 ' , ō 调号就直接打 = , a̍ 的调号直接打 | 等。结果又有人觉得 ^ 和 | 要多按一次 shift ,不如直接打成 6 和 。

  总之理想的台文输入法就把选择留给用户就好了。

  四、台罗汉罗两宜:
  虽然我需要的是有调号的台罗输入法,一个台文输入法不能直接输入有调号的台罗对我而言就像被砍掉一只手。但是以台罗打出汉罗绝对有其必要性。而且可以让使用者一面学习到台语传统用词。最好能像FHL输入法那样可以即时切换选字时是台罗在前还是汉罗在前。

  除此之外,台罗如何转为汉罗就是各家台文输入法可以展现个人设计的地方。目前有几种方法:

  一、像注音一样,一个字一个字完整把台文+调号打出来,并且逐一选字。这种输入法以「字」为最大单位。

  二、直接输入不带调的整个词,比如直接打入 lomaji 再按空白键,就出现「罗马字」。这种输入法以「词」为最大单位。

  三、只输入一个词中每字的第一字母。比如输入 lmj 再按空白键,即出现「罗马字」。这也是以「词」为最大单位。

  四、像新注音与自然输入法一样,用户连续以完整台文+调号,一字一字的上字,再让智慧型台文输入法选词,最后再用标点断句。这种输入法式是以「句子」当最大单位。比如输入Lô 这时候选栏先出「劳」,使用者再输入má 候选自动变成「罗马」等。

  五、开放台语原本没有的音也能出字:
  其实台文字母订定后,没有必要限制只能打出什么。比如英文如果打 teh ,就会直接上 teh,并不会因为没有这个英文字就不帮用户出字。如果是错字,顶多是用户写错字而已。

  如果今天用台文的人想写 Phát 这种不但台语里没有,而且不合理的音,就让人打又有什么关系?顶多是打错字而已。开放了之后说不定日后这些不存在的音会有他们自己的发展。语言是活的,可以规范它,不用限制它。

  六、兼容客家话与各原住民语:
  在设定里应该也可以选择做为客家话或是各原住民语的输入法。台罗当初设计就是为了兼容台湾所有的国语用的。并不是台语专用的罗马字。不过现阶段要做到这点可能比较困难,也较没有那么迫切,如果各语音分别成一个输入法也没什么不好。只是能做到这点更加完美就是了。

  以上就是我试着编辑 hlim 的起原和理念。hlim 是 hō-ló input method 的缩写。当然名字已经叫 hō-ló input method ,自然不是上面形容的「理想台文输入法」。其实目前的想法只是写一个在 Linux 系统里的台罗输入法给自己用而已。剩下的就等写好再聊吧。

  注:这是个人第一篇以 ScribeFire 撰写的部落格文章。感觉 so so... 最后还出现 javascript 之类的错误,不过文章是正常上了。不过编写的时候会挡住浏览器视窗倒是满讨厌的。

  注2:后来还是用 Windows Live Writer 改过了… 难道写 blog 都要回来开 Windows????