當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

郑码输入法初学

發(fā)布時(shí)間：2023/12/14 编程问答 31 豆豆

生活随笔收集整理的這篇文章主要介紹了郑码输入法初学小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

? ? ? ?我們經(jīng)常使用拼音輸入漢字等，對(duì)打字要求較高的會(huì)使用五筆輸入，而很少聽說過鄭碼輸入法，雖然可能在平時(shí)生活中應(yīng)用不是很廣泛，但鄭碼輸入法有嚴(yán)格的規(guī)范，在漢字編碼字符集范圍、詞庫容量、字詞平均碼長、動(dòng)態(tài)字重碼率及符合語言文字規(guī)范等方面都取得了突出的成績。

? ? ? ?“鄭碼”把漢字字典檢索與計(jì)算機(jī)漢字輸入統(tǒng)一了起來，使它們具有統(tǒng)一的編碼和統(tǒng)一的排序，這與鄭易里教授多年對(duì)字典的研究有關(guān)，也比較符合漢字的教學(xué)規(guī)律；鄭碼的編碼方法對(duì)各種字符集有較強(qiáng)的適應(yīng)性，它不但可以用來處理國標(biāo)漢字字符集，也能用于處理港、臺(tái)通用的字符集，還可以用于中、日、韓的漢字編碼，1994年初鄭碼完成了電腦大漢字庫6萬個(gè)漢字輸入技術(shù)的編碼。

? ? ? ?隨著鄭碼的普及，它擁有了較多的用戶，尤其在處理大字符集方面它具有較強(qiáng)的適應(yīng)性，它的輸入速度也比較快，是一種較好的形碼輸入方法。

本文主要參考了如下鏈接：https://wenku.baidu.com/view/7f0180e3524de518964b7dd8.html

? ? ? ?微軟的Windows 95中文版中就裝有“鄭碼”輸入法。它是一種形碼，與常見的形碼有許多相似之處：比如它也是從漢字的結(jié)構(gòu)入手；也要將漢字分解成若干部件；也要按某種規(guī)律安排鍵位；也要建立某種漢字的拆分規(guī)則等等。

? ? ? ? 漢字由字根和筆畫組成。漢字的字根有 560余個(gè)，為便于記憶，我們從諸多的字根中優(yōu)選出 170個(gè)組字能力強(qiáng)的字根，按一定的方式用英文字母給它們命名代碼，這些有代碼的字根就成為《鄭碼》編碼的基本字根，簡(jiǎn)稱：基根。

? ? ? 《鄭碼》的基根 90 % 是大家熟悉的部首，如"土木工蟲口日?魚言（讠）女辶己馬阝纟鳥頁酉皮艮戶母礻車衤身隹虍牙食"等，其余10 % 是約定俗成的部件，如"甘其甫不而非"等。

? ? ? 《鄭碼》的基根用26個(gè)英文字母命名代碼，每一個(gè)字母形成一個(gè)根區(qū)。每個(gè)根區(qū)里都有幾個(gè)基根，它們共用本根區(qū)的同一個(gè)英文字母作代碼，這一代碼就叫做基根的區(qū)碼。

? ? ? ?漢字的基本筆形有：橫(一)、豎(丨)、撇(丿)、點(diǎn)(丶)、折(乛) ?5 類，于是我們依據(jù)基根第一筆的筆形把170個(gè)基根分成"橫起筆、豎起筆、撇起筆、點(diǎn)起筆和折起筆" 5大類，然后按照英文字母的自然順序劃分每一類的根區(qū)范圍。

? ? ? ? 橫起筆類基根如: 一土王扌艸木石匸占有 ABCDEFGH ?8個(gè)根區(qū)。豎起筆類基根如: 蟲口日目，占有 IJKL ?4個(gè)根區(qū)。撇起筆類基根如: ?亻八金月魚，占有 MNOPQR ?6個(gè)根區(qū)。點(diǎn)起筆類基根如:言病之，占有STUVW 5個(gè)根區(qū)。折起筆類基根如:馬鄉(xiāng)，占有XYZ?3個(gè)根區(qū)。

? ? ? ? 以下內(nèi)容來自百度百科：

? ? ? ? 按使用功能將基本字根分為主根和副根，再按起筆筆形將主根和副根分為上述的五個(gè)大類（橫起筆、豎起筆等）。主根的鍵位確定之后，副根按自身的筆形從屬相應(yīng)的主根。

? ? ? ? 而主根又被分為第一主根和第二主根兩類，第一主根是組字能力最強(qiáng)的基根，共26個(gè)，如基根（第一主根）“一、土、王”的代碼就是A、B、C等等，他們的代碼就是一代表根區(qū)的英文字母作為代碼；并不是每個(gè)根區(qū)都有第二主根的，在鄭碼的標(biāo)準(zhǔn)方案中，為每個(gè)第二主根又規(guī)定了一個(gè)位碼D，這樣第二主根就有兩個(gè)字母作為代碼，（叫做2碼根，而相對(duì)來說第一主根就叫做1碼根）。避免了諸多基根共用一個(gè)根區(qū)代碼而造成重碼率高的現(xiàn)象，例如基根（第二主根）“二”的代碼就是BD，基根“三”的代碼就是CD等。第一主根和第二主根共同提供了本區(qū)字根的筆形特征。

? ? ? ?副根中大多數(shù)都是大家熟悉的規(guī)范的部首。在標(biāo)準(zhǔn)型中也為每個(gè)副根規(guī)定了一個(gè)位碼，這樣副根也是2碼根。例如副根“丁”的代碼是AI，“氣”的代碼是MY，“穴”的代碼是WO等。

? ? ? ?副根的第一個(gè)代碼是區(qū)碼，第二個(gè)代碼（位碼）的確定共有四種情況，分別按如下規(guī)則執(zhí)行：

按副根構(gòu)形中含有的主根成分確定，例如前述的“穴”中含有O區(qū)主根“八”的成分，因此他的位碼為O，這是副根位碼確定的主要方式。

? ? ? ?按副根構(gòu)形中還有的筆畫成分確定，如前述的“丁”中含有一筆豎鉤，因此位碼定為代表一筆豎的區(qū)碼I。

? ? ? ?按副根構(gòu)形中含有的其他副根成分確定，如“示”的構(gòu)形中含有K區(qū)副根“小”的成分因此位碼定為K，整個(gè)菜碼為BK。幾個(gè)特殊副根的位碼需要強(qiáng)行記憶，如“山LL”、“匕RR”和“已YY”。

? ? ? ?基根采用了雙符代碼后可以及大地減少重碼，而且基根代碼的排序非常有規(guī)律，使鄭碼具備了字典的查字碼功能，為識(shí)字教學(xué)與計(jì)算機(jī)輸入的結(jié)合創(chuàng)造了條件。

取碼方法：

? ? ? ?單字首根（即第一個(gè)基根）的代碼要按照實(shí)際碼數(shù)取，不能有所省略。就是說，首根是1碼根就取1碼；首根是2碼根就取2碼（區(qū)碼和位碼都要取）。

? ? ? 為保證單字編碼不超過4個(gè)字母，首根之后的其余基根代碼要根據(jù)不同情況決定取舍。一般是先舍位碼，只取區(qū)碼的1碼。

? ? ? 例如：櫻--木F貝LO貝LO女ZM--FLLZ

? ? ? 醒--酉FD曰K生MC--FDKM

? ? ? 但是，對(duì)于四基根和多基根字，還要將中間一些基根的代碼全部舍棄，只取前兩碼和最末2個(gè)基根各1碼。就是說，取兩頭舍中間。

? ? ? 例如：縮--纟Z宀WD(亻)一A白NK--ZWAN

? ? ? 糖--米UF(廣)肀XB口J--UFXJ

? ? ? 詞語取碼方式

? ? ? 為使詞語的代碼不超過 4 個(gè)字母，編碼時(shí)要根據(jù)詞語中單字?jǐn)?shù)的多少?zèng)Q定基根代碼的取舍。

? ? ? 給詞語編碼時(shí)，只需取用基根的區(qū)碼。

? ? ? 二字詞

? ? ? 取每個(gè)字的首根和次根的區(qū)碼各1碼，表述為：2 - 2

? ? ?舉例：數(shù)量 ---- 米/U 女/Z 曰/K 一/A ---- UZKA

? ? ?第一主根作為單字參與構(gòu)詞，在需取 2 碼時(shí)要在其代碼后加“A”(與作為單字用的規(guī)則一致)。高頻字參與構(gòu)詞時(shí)，要在其代碼后加“V”。

? ? ?舉例：土地 ---- 土/B 地/B ---- BABV

? ? ?三字詞

? ? ?取第一字首根的1碼，取第二字首根和次根各1碼；取第三字首根1碼組成，表述為：1 - 2 - 1。

? ? ?舉例：科技館 ---- 禾/M 扌/D 十/E 饣/O ---- MDEO

? ? ?四字詞和多字詞

? ? ?取前四字的首根各1碼組成，表述為：1 - 1 - 1 - 1

? ? ?舉例：

? ? ?輕描淡寫 ---- 車/H 扌/D 氵/V 冖/W ---- HDVW

? ? ?出污泥而不染--- 凵/Z 氵/V 氵/V 而/G (不氵) --- ZVVG

? ? ?簡(jiǎn)碼的取碼方式，對(duì)一些常用字或詞，按一定的規(guī)則，取其常規(guī)碼中的 1－3 個(gè)字符作為簡(jiǎn)略編碼，稱為簡(jiǎn)碼。簡(jiǎn)碼對(duì)專職操作員提高輸入速度大有好處，非專職操作員不必特別去記憶。

? ? 一級(jí)簡(jiǎn)碼：對(duì)應(yīng)于 26 個(gè)高頻字。

? ? 二級(jí)簡(jiǎn)碼用該字首根和次根各 1 碼組成。

? ? 舉例：

? ? 把 -- DY 找 -- DH 管 -- MW

? ? 需 -- FG 取 -- CX

? ? 個(gè)別常用詞也有二級(jí)簡(jiǎn)碼，就是取每字第一個(gè)基根的區(qū)碼。

? ? 舉例：

? ? 中國--JJ 國家--JW 一定--AW 我們--MN 政府--AT 開展--AX

? ? ?北京--TS 上海--IV 天津--AV 合作--ON 各種--RM 采取--PC

? ? ?三級(jí)簡(jiǎn)碼

? ? ?二基根字：取第一個(gè)基根的區(qū)碼和第二個(gè)基根的區(qū)位碼，如：處 -- RID。

? ? ?三基根和多基根字：依次取第一、第二和第三個(gè)基根的區(qū)碼，如：散 -- EQM。

總結(jié)

以上是生活随笔為你收集整理的郑码输入法初学的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

输入法

上一篇： xcode armv6 armv7 ar
下一篇： ssm基于Java web的校园滴滴代驾