简体中文输入法用户指导手册


目录:

I. 介绍

II. 输入窗口区域

预编辑区
状态区
候选词查找区
辅助窗口


III. 输入法基本功能

1. 开启/关闭输入法
2. 选择输入法
3. 循环切换输入法
4. 切换全角/半角模式
5. 切换中/英文标点模式
IV. 输入法辅助工具
1. 选择工具菜单
2. 输入法状态设置工具
3. 输入法属性设置工具
4. 虚拟键盘
PC键盘
常用符号键盘
希腊字符键盘
俄文字符键盘
注音字符键盘
中文标点符号键盘
数字符号键盘
数学符号键盘
制表符键盘
特殊符号键盘
5. 输入法帮助


V. 输入法功能描述

1. Sun拼音输入法
2. 新全拼/新双拼输入法
3. 全拼输入法
4. 双拼输入法
5. 英汉输入法
6. 内码输入法
7. 五笔输入法


VI. 码表输入法接口

1. 接口简介
2. 创建码表
3. 码表转换成二进制格式
4. 码表转换成文本格式
5. 创建新的码表输入法

 
 

I. 介绍

IIIMF 为中文用户(包括大陆、台湾、香港等地用户)提供了可扩展的输入法架构, 以及界面更加友好的各种常用输入法,另外还开发了辅助窗口以提供更加强大的输入法管理工具。 整个简体中文输入法系统支持以下功能: 支持两种类型的输入法: 支持以下所有简体中文环境:
支持以下输入法:
[ 回到目录 ]

II.  输入窗口区域

输入字符时涉及应用窗口的四个单独区域:

预编辑区:     高亮度(如反显或下划线)显示输入区。
状态区:       指示当前输入状态的区域。
候选词查找区: 显示可供选择的选项的区域。
辅助窗口:     用于输入法管理的辅助窗口。


预编辑区:

预编辑区高亮度(如反显或下划线)显示用户输入或转换的字符。

状态区:

状态区显示当前的输入状态。 在上面的例图中, 位于窗口的左下角。

候选词查找区:

候选词查找区显示匹配预编辑区输入字符的多个简体中文字符或特殊字符。在上面的例图中,即弹出的窗口。

辅助窗口:

辅助窗口提供一些工具来管理输入法或简化某些特殊字符的输入。
 
[ 回到目录 ]

 

III. 输入法基本功能

1. 开启/关闭输入法

在英文状态下, 键入 [Control+Spacebar] , 中文输入法被激活, 辅助条弹出:

Input bar
 

再次键入 [Control+Spacebar] ,中文输入法关闭, 回到英文状态, 辅助条关闭。
 
 

2. 选择输入法

在中文状态下,用鼠标点击辅助条上的输入法选择按钮, 输入法菜单将弹出, 示意图如下:

Input method list menu

然后从菜单中选择您想要使用的输入法。
 
 

3.  循环切换输入法

在中文状态下,键入[Control+Shift] 来循环地切换输入法。
 
 

4. 切换全角/半角模式

在中文状态下,键入[Shift+Spacebar] 或用鼠标点击辅助条上的全/半角按钮来切换全角/半角字符模式

FullWidth Mode  表示输入系统处于全角字符状态。

HalfWidth Mode表示输入系统处于半角字符状态。

当系统处于全角字符状态时, 输入键的全角字符将被提交给应用系统。

例如: 全角状态下输入'a', 其全角字符将被提交给应用系统。 如下:

Commit Fullwidth Character
 
 

5.  切换中/英文标点模式

在中文状态下,键入[Control+. ] 或用鼠标点击辅助条上的中/英文标点按钮来切换中/英文标点模式。

Chinese Punctuation Mode表示输入系统处于中文标点模式。

English Punctuation Mode表示输入系统处于英文标点模式。

当系统处于中文标点模式时, 并且输入一个英文标点键时,其相应的中文标点将被提交给应用系统。

例如: 中文标点模式下输入'$', 简体中文货币符号“¥”将被提交给应用系统。 如下:

Chinese Punctuation Mode
 

英文标点键包括: . / <> :;'"\$!^&_-

英文标点键与中文标点符号的对应表如下:

    !     ->      !
    "     ->      “
    $     ->      ¥
    &     ->      ─
    '     ->      ‘
    (     ->      (
    )     ->      )
    ,     ->      ,
    .     ->      。
    :     ->      :
    ;     ->      ;
    >     ->      》
    <     ->      《
    ?     ->      ?
    @     ->      @
    \     ->      、
    ^     ->      …
    _     ->      __

 

[ 回到目录 ]

IV. 输入法辅助工具

IIIM 提供了一些辅助工具来帮助用户管理输入法、设置输入法属性、以及简化某些特殊字符的输,等等。

这些辅助工具包括:


1. 选择工具菜单

用鼠标点击辅助条上的工具按钮 utilities menu button 来显示工具菜单如下:

Utilities Menu

然后从菜单中选择一项您想使用的输入法工具。 


[ 回到目录 ]

2. 输入法状态设置工具

输入法选择工具允许用户选择他/她常用的输入法, 并且可以设定缺省的输入法及输入法的次序。

用鼠标从工具菜单中选中“首选项”项, 输入法状态设置工具显示如下:

input method selection


选定某些输入法后,点击“确定” 或“应用”按钮, 输入法选择设定将被系统置为有效。 选定的第一个输入法即为用户的缺省输入法。

这时, 在应用系统窗口中键入 [Control+Spacebar] 开启输入法,缺省输入法将被置为当前输入法;
 
 

[ 回到目录 ]

3. 输入法属性设置工具

用鼠标从工具菜单中选中“首选项”项, 并点击输入法, 输入法属性设置工具显示如下:

codetable im properties


使用这个选项设置工具, 您可以设置输入法的属性。 设置完后, 点击“确定” 或“应用”按钮, 输入法选项设定将被系统置为有效。

对于基于码表的输入法, 有以下四个选项可以设置:

       这个选项能够帮助用户学习这个输入法, 如告诉用户某个汉字在该输入法中对应什么外码。
 

[ 回到目录 ]


4. 虚拟键盘

虚拟键盘工具能够被用来简化一些特殊符号的输入、 也可以用来显示某些基于字根的输入法的键盘映射表, 如五笔输入法, 五笔输入法是一种典型的基于字根的输入法。
 

简体中文环境支持以下的虚拟键盘:

用户可以点击虚拟键盘上的按钮来输入该按钮上的字符。 PC键盘图示如下:

pc keyboard
 

常用符号键盘图示如下:

common symbols keyboard

用户可以点击辅助条上键盘按钮并选择键盘列表菜单中“希腊字母”项, 希腊字符键盘弹出并显示如下:

greek keyboard
 

用户可以点击辅助条上键盘按钮并选择键盘列表菜单中“俄文字母”项,俄文字符键盘弹出并显示如下:

russia symbols keyboard
 

用户可以点击辅助条上键盘按钮并选择键盘列表菜单中“注音符号”项, 注音字符键盘弹出并显示如下:

zhuyin symbols keyboard
 

用户可以点击辅助条上键盘按钮并选择键盘列表菜单中“标点字符”项, 中文标点符号键盘弹出并显示如下:

punctuation symbols keyboard
 

用户可以点击辅助条上键盘按钮并选择键盘列表菜单中“数字序号”项, 数字符号键盘弹出并显示如下:

number symbols keyboard
 

用户可以点击辅助条上键盘按钮并选择键盘列表菜单中“数学符号”项, 数学符号键盘弹出并显示如下:

math symbols keyboard
 

用户可以点击辅助条上键盘按钮并选择键盘列表菜单中“制表符”项,制表符键盘弹出并显示如下:

tab symbols keyboard
 

用户可以点击辅助条上键盘按钮并选择键盘列表菜单中“特殊符号”项, 特殊符号键盘弹出并显示如下:

special symbols keyboard
 
 

[ 回到目录 ]

5. 输入法帮助

用鼠标从工具菜单中选中“帮助”项, 一个浏览器如 Mozilla 将弹出并显示输入法帮助信息。
 
[ 回到目录 ]

 

V. 输入法功能描述

在简体中文环境中可使用的输入法包括:在 zh_CN.GB18030/zh_CN.UTF-8 中文环境(locale)下:


键入 [Control+spcaebar] 开启或关闭中文输入法。
键入 [Control+Shift] 循环地切换中文输入法。
 
 

[ 回到目录 ]


1. Sun 拼音输入法

Sun拼音输入法是新一代可以整句输入的输入法。它的特点是拼音到汉字的转换准确率高,界面方便易用。

范例:

sunpinyin input


候选/编辑窗各组成部分



输入拼音

输入拼音a-z,拼音将出现在预编辑区。在连续输入拼音的时候,系统将 自动进行音节切分。并基于音节切分的结果 提供候选。此时,第1个候选是全部输入的拼音所对应的汉字串,第2个候选将是第一个候选中的第一个词,剩下的候选是从候选起点开始向后任意长度的拼音串可 能匹配上的词,按照(1)长度从长到短;(2)适合上下文的优先;的顺序排列。见上图。其中的空格是自动音节切分的产物。用户不用输入。

选择候选

使用数字键1-6可以选择相应的候选,空格键和1作用相同。选择完毕之后,在预编辑区上与之对应的部分将显示成所选择的汉字, 同时新的候选起始点将相应的后移。如果新的选择起点到达输入串的尾部,选择结果将被提交!下图是前例按下2键之后候选起点变化情况。

修改拼音

新输入的拼音将插入插字符后面,用“左、右”键可以一个字符一个字符的移动插字符,用CTRL+“左、右”键可以一个音节一个音节地移动插字 符。可以用Del键删除插字符右侧的字符/拼音字母,用Backspace键可以删除插字符左侧的字符/拼音字母。当插字符移动到候选起点左边的时候,插 字符所在位置已经被转换成汉字的部分将被还原成拼音音节。

修改音节切分

可以人工输入'符号来强制分割音节。例如,输入"xian"缺省将得到一个音节 "xian",而输入"xi'an"将会得到"xi'an"两个音节。

提交

出了用空格或数字键1来提交转换后的汉字串外,还可以用Enter键提交用户原有的 ASCII输入串。例如输入"www.sun.com"后再回车,将可以得到"www.sun.com"。

选项与配置

下图是Sun拼音的配置窗口:

其中输入风格出了上述的经典输入风格外,还可以选择“即时转换”的风格。该风格下,每 当一个确定的音节被识别出来,其相应的最佳汉字将被转换出来。通过移动插字符将获得候选词列表并进行选择。按下`键将可以对某个已经转换成汉字的拼音串进 行修改。

字符集:缺省是GBK字符集,也可以仅仅使用包含较少字符的GB2312字符集。

候选翻页控制:使用PgUp/PgDn键可以对候选列表翻页,同时可以设定-/=  [/]   ,/.  等翻页控制。


sunpinyin properties



[ 回到目录 ]


2. 新全拼/新双拼输入法

本段描述新全拼及新双拼输入法的功能, 以及在zh_CN.GB18030/zh_CN.UTF-8 中文环境下如何使用这些功能。

基于拼音的输入法在中国大陆非常流行,目前有很多基于拼音的输入法, 其中就有新全拼和新双拼。

新全拼及新双拼输入法有以下功能:

  

新双拼特性

双拼是全拼的一种简化形式, 比全拼复杂, 但输入比全拼快。 新双拼支持新全拼的所有特性、键盘定义 以及字典文件。

下表是新双拼输入法支持的键盘映射:
 
 键位  定义
i ch
u sh
v zh
a a
b ou
c iao
d uang, iang
e e
f en
g eng
h ang
i i
j an
k ao
l ai
m ian
n in
o o, uo
p un
q iu
r uan, er
d iong, ong
t ue
u u
v v, ui
w ua, ia
x ie
y uai, ing
z ei

 
 

[ 回到目录 ]

3. 全拼输入法

全拼输入法键入汉字的所有拼音字符来输入该字,最大码长为12。

一个拼音字串对应多个汉字,候选词查找区显示所有匹配该拼音字串的汉字。 用户可以键入点号(.) 或 [PageDown] 键来显示下页候选字, 键入逗号(,) 或 [PageUp] 键来显示上页候选字; 然后键入某候选字前的数字标号键来输入该候选字。
 

[ 回到目录 ]

4. 双拼输入法

双拼输入法简化了全拼输入法的编码规则, 即只用两个拼音字母表示一个汉字, 声母和韵母各用一个字母, 因而只需两次击键就可输入一个汉字的读音。 双拼最大码长为12, 码元集为a ~ z  和 ;。

例如:对于汉字 “张”  ,其全拼为"zhang",而双拼为 "vh"。

双拼输入法中键位与声母/韵母的关系如下:
 
键位 声母/韵母定义
i ch
u sh
v zh
a a
b b
c iao
d uang, iang
e e
f en
g eng
h ang
i i
j an
k ao
l ai
m ian
n in
o o, uo
p un
q iu
r uan, er
s iong, ong
t ue
u u
v v, ui, ue
w ua, ia
x ie
y uai
z ei
; ing

一个双拼字串对应多个汉字,候选词查找区显示所有匹配该双拼字串的汉字。 用户可以键入点号(.) 或 [PageDown ] 键来显示下页候选字, 键入逗号(,) 或 [PageUp] 键来显示上页候选字; 然后键入某候选字前的数字标号键来输入该候选字。

 
 

[ 回到目录 ]

5. 英汉输入法

英汉输入法最大码长为15,一个英文单词对应多个表示该英文单词意思的中文词组。

如果一个英文单词对应多个中文词组,候选词查找区显示所有匹配该英文单词的中文词组。 用户可以键入点号(.) 或 [PageDown] 键来显示下页候选词, 键入逗号(,) 或 [PageUp] 键来显示上页候选词; 然后键入某候选字前的数字标号键来输入该候选词。



[ 回到目录 ]

6. 内码输入法

在 zh_CN.GB18030/zh_CN.UTF-8 中文环境中, 可用的内码输入法是 GB18030 内码输入法。

内码输入法就是使用汉字的内码来输入汉字。每个汉字或符号的内码都由4个或8个十六进制数表示。

[ 回到目录 ]

7. 王码五笔输入法

“五笔字型”是一种重码少的汉字输入法,它只使用25个字母键,在键盘上以汉字的笔画、字根为单位,纯字形编码的汉字输入方法。

五笔输入法的最大特点就是用户可以快速输入汉字, 因为一个五笔码很少对应多个汉字; 而且由于五笔输入法是基于字形编码的汉字输入方法, 所以几乎所有中文字,日文字,韩文字都可以用五笔来编码, 而基于拼音的输入法则不行。

关于五笔编码规则, 可参考 王码公司网站

王码五笔输入法支持如下功能:

  •  支持GB18030字符集。
  •  支持简码。
  •  支持容错码。
  •  支持步进式识别码三级输入法。
  •  支持 “z/Z”作为帮助键。
  •  支持词组输入及可选专业词库。
  •  支持字词联想。
  •  支持属性设置。

  • (1) 支持GB18030字符集。

        GB18030汉字集是国家2000年颁布的一个强制性汉字编码标准, 其编码长度为1~4个字节。其中包括:

        现有GB18030汉字集包括27533个汉字, 其中21003个双字节汉字, 6530个四字节汉字。五笔输入法能够输入所有这些汉字。

        另外, 五笔输入法同时也支持GB2312, GBK字符集。 用户可以以“拉杆天线”式来切换字集。

        王码五笔输入法将GB18030分为若干个字集: GB2312,  GBK,  GB18030。 其中GB2312字集包括6763个常用汉字, GBK字集包括21003个汉字, GB18030字集包括27533个汉字。

        用户在输入过程中,可以象“拉杆天线”一样,任意切换字集。 如:

       例如: 输入“gjgg”, 并翻页来选择GB18030字集中的四字节字:“㐀”。

     
    (2) 支持简码。

         常用的汉字,除可以按它的全码输入外,多数都还可以只取其最前边的一至三个字根,再加空格键输入。也就是只取其全码的最前边的一个、二个或三个码,再加打 空格键(表示输入结束),形成所谓一、二、三级简码,从而提高了输入速度。

        例如: 输入“di”, 再敲一下空格,“耗”字将被输入, 其二级简码就是“di”。
     

    (3) 支持容错码。

       “容错码”的涵义是:“容易”编错,但“容许”编错的码。

        容错码的设置,是为了照顾不同的取码习惯,使他们用容易编错的码,照样可以打出所要的字来。

       例如: “长”字的标准五笔码为: “tayi”。 但用户也可以输入“atyi”来输入该字。 “atyi”即为该字的容错码。
     

    (4) 支持步进式识别码三级输入法。

    王码五笔字型的关键技术之一就是“末笔字型识别码”。 为帮助初学者尽快掌握这一技术, 五笔输入法支持“步进式C,B,A三级学习法”。 C级指不带识别码即可输入, B级指只有左右型的汉字带识别码, A级则指三种字型(凡不足4码的字)都带识别码。 “三级学习法” 为初学者从“初级阶段”向“高级阶段”步进式提高提供了极大的便利。

    例如: 在C级状态下, 输入: “tkg”, 再打一下空格键, 汉字:“和”、“程”, 将被列出。但在A级状态下,输入“tkg", 则汉字“和”被直接提交给系统。
     

    (5) 支持 “z/Z”作为帮助键。

    当输入汉字时, 如果不知道其五笔编码, 或不知道某个字根在哪个键上时, 或不知道“识别码”时, 都可以用“万能学习键Z”来代替你不知道的那个输入码。

    例如: 输入“azzd”, 则所有五笔编码中以“a”开头并以“d”结尾的字将被列出。

     

    (6) 支持词组输入及可选专业词库。

      王码五笔输入法支持词组输入,其中包括9万多条基本词汇,另外还为用户配有11个专业词库。用户可以根据自己的专业领域来选择相应的专业词库。

      专业词库如下(各有3000 - 20000条词):

  • 交通运输
  • 电脑家电
  • 经济金融
  • 农业机械
  • 医药卫生
  • 矿业冶金
  • 外贸旅游
  • 军事国防
  • 法律美学
  • 地名库
  • 成语库
  •   例如: 当用户选择“医药卫生”专业词库时, 输入:“mino”, 一些医学词组将被列出以供选择。 如图:

    wubi input
     

    (7) 支持字词联想。

      当用户输入一个汉字或词时, 以该字或词开头的词组将被列出以供选择。

      例如: 用户输入: “iuxx”, 汉字“滋”自动被提交给应用程序, 并且以“滋”开头的词组将被列出以供选择。
     

    (8) 支持属性设置。

      王码五笔输入法可以设置如下属性:

      输入法属性设置界面如下:

    all wubi properties
     

    例如: 设置汉字字集, 如图:

    wubi charset setting
     

    例如: 设置专业词库, 如图:

    wubi phrase setting
     

    例如: 设置识别码模式, 如图:

    wubi identify code setting
     
     

    [ 回到目录 ]

    VI. 码表输入法接口

    1. 接口简介

    提供了一个码表输入法接口,这样允许用户增加基于码表的新输入法。
     
     

    2. 创建码表

    文本格式的码表文件包含一些功能描述段以及一列外码__词组对应列表。

    下面例图就是一个码表文件的例子:

    [ Description ]
    UUID:           english-chinese-7e7186dc-8327-4d06-a73b-8e8f7341366b
    Version:        10
    Author:         Ervin Yan <Ervin.Yan@Sun.Com>
    Copyright:      Copyright (c) 2005 Sun Microsystems
    IconPath:       EnCh.xpm
    Name:           英汉
    Encode:         UTF-8
    UsedCodes:      -ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz
    WildChar:       *?
    MaxCodes:       15

    [ Function_Key ]
    PageUp:         ,<
    PageDown:       .>

    [ Options ]
    KeyByKey_Mode:          ON
    HelpInfo_Mode:          ON
    AutoSelect_Mode:        OFF
    KeyPrompt_Mode:         ON
    SelectKey_Mode:         Number

    [ Phrase ]
    about   关于 周围

    一个码表文件包含以下几个功能描述段:

    每个段的描述如下: 该段描述码表的基本特征, 如: 编码、码表中文名、 合法码元、 最长码元, 以及匹配符。

    因此该段包含以下几项:
    (1). "Name:",    描述码表的中文名。
    (2). "Encode:",  描述码表使用的编码,该值可以是UTF-8, GB, GB2312, GBK, GB18030, EUC_TW, BIG5, BIG5HK.
    (3). "WildChar:",  描述输入码元的匹配符, 缺省值是 '*' 和 '?'。
    (4). "UsedCodes:",  描述合法的输入码元。
    (5). "MaxCodes:" ,  描述最长码元。
     

    该段用以描述码表的解释信息。
      该段描述输入键值的提示字符串。该提示字符串将被显示在应用系统的预编辑区。
      该段描述一些功能键的键定义。 例如: 哪些键定义为 PageUp 键用于显示上一页候选词; 哪些键定义为 PageDown 键用于显示下一页候选词; 哪些键定义为 BackSpace 键用于删除一个输入码元;哪些键定义为 ClearAll 键用于取消所有输入。

    因此该段包含以下几项:
    (1). "PageUp:"
    (2). "PageDown:"
    (3). "BackSpace:"
    (4). "ClearAll:"

    注意:  '^' 代表 [ Control ] 键, 例如: '^N' 代表 '[Control+N ]' 键.
     

    该段描述码表输入法的缺省属性, 如: 是否即打即现、 是否外码提示、 是否键对应提示、是否单项自选、 以及选择键的模式(包括数字键模式、小写字母模式、及大写字母模式〕。

    因此该段包含以下几项:

    (1). "HelpInfo_Mode:"       可选值: "ON" 或 "OFF"
    (2). "KeyByKey_Mode:"   可选值: "ON" 或 "OFF"
    (3). "KeyPrompt_Mode:"   可选值: "ON" 或 "OFF"
    (4). "AutoSelect_Mode:"    可选值: "ON" 或 "OFF"
    (5). "SelectKey_Mode:"     可选值: "Number", "Lower" 或 "Upper"
     

    该段描述输入码元及其对应的中文单字列表。 注意中文单字之间不能有空格。

    每行格式如下:

    键元序列   汉字序列

    注意:  "汉字序列" 表示一串没有空格隔开的汉字列表。
     

    该段描述输入码元及其对应的中文词组列表。 注意中文词组之间必须用空格隔开。

    每行格式如下:

    键元序列   词组1    词组2    词组3  ...
     
     

    3. 码表转换成二进制格式

    用户可以使用工具 "txt2bin" 把一个文本格式的码表转换成码表输入法接口能够识别的二进制格式。

    该工具 "txt2bin" 位于目录: " /usr/lib/iiim/le/cle/utils"

    命令语法为:

    # /usr/lib/iiim/le/cle/utils/txt2bin source_codetable_file binary_codetable_file
     
     

    4. 码表转换成文本格式

    用户可以使用工具 "bin2txt" 把一个二进制格式 的码表转换成文本格式。

    该工具 "bin2txt" 位于目录: " /usr/lib/iiim/le/cle/utils/"

    命令语法为:

    # /usr/lib/iiim/le/cle/utils/bin2txt binary_codetable_file source_codetable_file
     
     

    5.  创建新的码表输入法

    (1).  创建并编辑一个码表源文件。

    按照上面所描述的码表格式准备一个码表源文件。

    (2).  将该码表源文件转换成二进制格式。

    使用工具 "txt2bin" 将该码表源文件转换成二进制格式。

    命令语法为:
    # /usr/lib/iiim/le/cle/utils/txt2bin source_codetable_file binary_codetable_file

    (3).  将该二进制格式的码表文件拷备到目录: " /usr/lib/iiiim/le/cle/input_methods/data "。

    (4).  将该码表信息加入到输入法配置文件中。 输入法配置文件为:" /usr/lib/iiim/le/cle/le_config.xml ".

    (5).  重新启动输入法服务器 (iiimd), 然后重新登录。
    重新启动输入法服务器 (iiimd), 需要以 root 身份运行如下命令:

    # /etc/init.d/iiimd restart

    然后, 新输入法就可以使用了。

    [ 回到目录 ]