全國最多中醫師線上諮詢網站-台灣中醫網
發文 回覆 瀏覽次數:1409
推到 Plurk!
推到 Facebook!

Untitled Document

 
jackkcg
站務副站長


發表:891
回覆:1050
積分:848
註冊:2002-03-23

發送簡訊給我
#1 引用回覆 回覆 發表時間:2003-08-08 16:08:10 IP:61.221.xxx.xxx 未訂閱
此為轉貼資料 http://freebsd.sinica.edu.tw/~statue/hanzi/doc1.htm 這份文章是從 tw.bbs.comp.chinese 轉貼進來的, 提供給對目前中文字碼標準化有興趣的人看看, 也順便想想目前 Linux 的中文化該怎麼走....... 另外對 CJK 有興趣的也可以看看 ftp://nctuccca.nctu.edu.tw/Chinese/ifcss/software/info/cjk-codes/index.html =========================================================================== 發信人: rux@cis_nctu (亦驢), 信區: 'Chinfost' 標 題: 國內中文字碼之發展 發信站: 交大資科_BBS (Wed May 28 20:55:57 1997) 來 源: 140.116.253.216 我國最早之中文字碼為民國六十九年提出之「中文資訊交換碼」 (Chinese Character Code for Information Interchange, CCCII)。訂定此碼的原動力是 美國急需使用電腦處理東亞語文資料,因此派遣負責人赴東亞考察。當時只有日 本訂定資訊碼標準 JIS C 6226 。在「只此一家,別無分號」的情況下,美方初 步決定採用此標準。我華裔美國亞東圖書館代表與我國代表極力反對,說明日本 漢字無法代表中國文字的理由,並允諾四個月之後提出我方之標準。 我方代表返國之後,上書政務委員李國鼎及國科會、中美會等單位,集合國 內一批文字學家、圖書館學家、以及電腦學者,組成臨時性質之任務編組──國 字整理小組。經過謹慎考察、研究,一套涵蓋中日韓各國語文、以及繁體、簡體 、異體等等之「中文資訊交換碼」出爐了。此碼終為美方接受為處理中日韓資料 之正規標準。至今仍有許多圖書館系統採用,因為只有此碼才能擔當這個重任。 CCCII 在國外受到歡迎,在國內卻遭受排擠。有心人士或是想在歷史留名; 或是自認官大學問大。用盡各種方法打擊 CCCII,並玩起編碼遊戲。這個遊戲, 為咱們中文字碼的悲劇「萬碼奔騰」揭開了序幕。我想這個編碼遊戲,至少讓國 內的資訊工業停滯五年。 下列兩本書,詳細記載了這一段歷史,以及 CCCII 的技術資料。在本文之 後,我從第二本書抄錄一個章節,供無法借到這兩本書的網友參考。打這篇文章 的目的,一方面是前一陣子有許多網友詢問到 CCCII;另一方面,讓網友瞭解現 在我們使用的中文內碼的訂定過程是如何草率。 一、書名:中文字碼:萬碼奔騰,一碼當先 作者:黃大一 出版:永麒科技 二、書名:國字整理小組十年 作者:謝清俊、黃克東 出版:資訊應用國字整理小組 ======================================================================== 以下文章摘錄自「國字整理小組十年」p15-p18 ======================================================================== 四、國內外局勢之發展 (一)國內中文字碼之發展 國內有識之士早在民國六十六年起,就多次提起制訂中文字碼的事情。可惜 當時由於國內沒有標準字形而受阻。此事在六十七年、六十八年之國建會及近代 工程討論會中,亦曾討論,甚至有決議作成。然而終究因字形整理的問題而拖延 著。至六十八年,教育部公佈了 4808 個常用字的標準字形後,編字碼的是才有 一線希望。 中文資訊交換碼之所以能在六十九年三月發表,實拜教育部公佈標準常用字 形之賜。然而,在當時,除上述之標準字形外,餘無標準字形。於是國字小組只 得負擔起後續的工作,以期能在七十年將 CCCII 擴充到可實用的字數,並能符 合國際上日益迫切之需求,來維護我們的傳統文字。 當民國六十九年三月中文資訊交換碼發表之事傳到國內以後,並未受到應有 的重視和獎勵,反而引起了杯葛、謾罵、和各種侮辱的情形,此誠始料未及。 引起這種情況的主要原因是:在六十八年國建會的建議中,曾建議我國編中 文字碼,而行政院將此案交主計處電子處理資料中心研究。因此,該單位獲知 CCCII 發表後,赫然震怒。認為國字小組破壞政府體制,此事應該由他們做才是 。於是在民國六十九年五月,召開會議決定要另做一碼。當時國字小組有人出席 該次會議,曾即席說明編制 CCCII 之原委,並說明 CCCII 發表時沒有作者, 這純是為了國家,為了維護文字和文化先鋒。同時表示願和主計處電子處理資料 中心合作或甚至交給他們繼續未完之工作,大家戮力一致對外。非常可惜的是此 建議並未為主計處電子處理資料中心接受,反而一意孤行,非另做一碼不可。 為協調此爭執,有該年九月間在溪頭開的會議。在溪頭開的會議中,國字小 組代表對編碼的作業有詳細的報告。在當時,國內翠於 ISO 資訊交換的相關標 準之了解實在貧乏的可憐,與會人員不明白 ISO 646 及 ISO 2022 是做什麼的 ,因此對 CCCII 之編碼技術無法體認。當然也就不明白 CCCII 的長處了。國 字小組之成員雖然全力說明,然而在主事人以政治手段解決技術問題的作法之下 ,以為再編一碼亦非難事,而且還可以平息爭端,斷然宣佈要再設計一碼作為解 決之道,由此開啟了中文字碼十年混亂之情,迄今仍然遺禍社會無法解決。 經溪頭會議後,主計處電子處理資料中心邀王金土根據決議所編之碼為「中 文資訊標準碼」,並於民國七十年發表 (記錄上是二月,而事實上到六月才完稿) 。此碼完全不理會 ISO 之相關標準,獨斷專行,在碼的結構上主觀幼稚,在文 字上則由個人任意挑選。當然,這種碼是不能用的,然而主事者並不相信,反而 行文各單位要求採用。經過日本 NEC 及 FACOM 之技術人員在警政署強烈抗議之 下,才明白此碼真不可用,只得偃旗息鼓自行收回。然而其耗費之公帑,即以印 刷而言,上千本二吋厚之巨著就此報廢,更遑論其人力、物力,和時間之投入, 合法之浪費莫以此為甚。 事實上,由此事件之教訓,主事者應該明白溪頭會議之錯誤,以及編碼是涉 及計算機技術與我固有文字學之事,不是無知之輩想得那麼簡單。若是就此收兵 ,也就罷了。可嘆的是,在此過程中,主辦單位應用各報章媒體,造成許多打擊 國字小組,對 CCCII 之技術成就惡意曲解,似是而非的謬論,一意認定他們自 己是對的。當發現所編的王金土碼不能時,竟惱羞成怒,執意非再做一個碼不可 。至此情形,已非理性之爭,而是以一己之私,一念之差,置國家社會利益不顧 地孤行到底了。 於是主事者另起一灶,又行設計第二套碼,在民國七十一年七月發表,這碼 名為「中文資訊標準交換碼」。然而,此碼並未完全做完,同年九月又補充附冊 。這些碼雖然號稱採用 ISO 646 及 ISO 2022 標準,然而,又不真正認真執行 ,所以徒具虛名,且七月發表和九月補充的字碼均不同, (詳情請月表一) 。當 然此碼依然不能用! 雖然又失敗了,可是主事者巧言隱瞞事實,暗地裡再整旗鼓,又做一碼: 「 通用漢字標準交換碼」並於民國七十二年十月發表。經過以前這許多失敗之經驗 ,又從 CCCII 學到不少技術,這一次充滿信心竟以國家標準為支柱,以行政命 令強行推銷此碼,此舉已干犯到國家標準不是強制性質的原則了。雖然此碼修正 了許多過去之缺失,也越來越神似 CCCII,可是主事者所堅持的: 以一萬三千字 為限的錯誤決定,仍然使得此碼窒礙難行。許多廠商為應付採購程序上非要用國 家標準的箝制,在電腦中安置了此碼,然而實際上又不用。形成了可笑亦復可悲 的瞞天過海的情形。這種情形不知造成了多少電腦資源上的浪費,對政府形象之 傷害更是無以言喻! 之後,由於大家心裡明白此碼不可不用又不得不用的情況下,只好再造一碼 ,即「五大專案碼」之誕生。爾後,至民國七十五年「通用漢字標準交換碼」又 更新一次版本,字碼又換一次,從民國七十年至七十五年之五年中,六次變易, 世界上找不出這樣子做的「國家標準」。不僅這個過程無法統一字碼,為工業界 造福,反而造成天下大亂,國內中文碼之亂,此實為罪魁禍首。 到今天,這個碼除了在個人電腦中可用以外,稍微大一些的系統都不夠用, 它仍然是採購上必要而又無用的一個設備罷了。無論在台電,自來水、瓦斯、電 信局、警政署、海關、外貿會、出版社、報社、財稅... 此碼的字均不夠用,更 不必談到國家級的系統,像戶政、地政、財稅、圖書館等等系統了。 這麼多年來,主持通用中文標準交換碼的人員對中文資訊交換碼之攻擊和打 擊不遺餘力,凡有中文資訊交換碼之廠商竟不敢明言,以免遭排擠。對通用中文 標準碼以行政命令強制推行,若任何中文系統無此碼者則禁止公家機構採購。在 標準法中明白說明國家標準無強制性,然而有關單位竟一意孤行。在這麼惡劣的 環境下,通用碼無法取得使用上之優勢,實在是該碼設計上缺陷累累 (見經建會 民國七十七年九月製版之 "中共電腦業之發展及其對我之影響 P.173) ,否則以 國家政令之力,豈有中文資訊交換碼活命之空間? 表一 中文標準碼自民國70年至75年歷年變遷簡表 -- -------- ---------- ------------ ---------- -------- ---------- |名|中文資訊|中文資訊 |中文資訊標準|通用漢字 | 五大 |通用漢字 | |稱|標準碼 |標準交換碼|交換碼(附冊)|標準交換碼| 專案碼 |標準交換碼| -- -------- ---------- ------------ ---------- -------- ---------- |發| | | | | | | |表| 70年 | 71年 | 71年 | 72年 | 73年 | 75年 | |時| 二月 | 七月 | 九月 | 十月 | 三月 | 三月 | |間| | | | | | | -- -------- ---------- ------------ ---------- -------- ---------- |發| | 國科會 | | | | 國科會 | |表| 主計處 | 教育部 | 同左 | 同左 | 資策會 | 教育部 | |單| | 標準局 | | | 工業局 | 標準局 | |位| | 主計處 | | | | 主計處 | -- -------- ---------- ------------ ---------- -------- ---------- |主| 李 | 何 | 何 | 何 | 果 | 何 | |持| 克 | 宜 | 宜 | 宜 | | 宜 | |人| 昌 | 慈 | 慈 | 慈 | 芸 | 慈 | -- -------- ---------- ------------ ---------- -------- ---------- |承| 行政院 | | | | (十三 | 行政院 | |辦| 主計處 | 同左 | 同左 | 同左 | 家業 | 主計處 | |單|電子資料| | | | 者) | 電子資料 | |位|處理中心| | | | 不詳 | 處理中心 | -- -------- ---------- ------------ ---------- -------- ---------- |結|2 8-bits| | | | | | | | bytes | 同左 | 同左 | 同左 | 同左 | 同左 | | | 16 bits| | | | | | |構| 二元碼 | | | | | | -- -------- ---------- ------------ ---------- -------- ---------- |字| 32,768 | 35,344 | 35,344 | 35,344 | 35,344 | | |位|(奇數碼)| | | | | | -- -------- ---------- ------------ ---------- -------- ---------- |字|16,000字| | |5,401 ( | 5,401 |5,401 ( | | |王金土由| 4,808 | 4,808 |4421-7D4B)| 常用字 |4421-7D4B)| | |"辭海"中| (常用字) | (常用字) |13,053 ( | 7,652 |7,650 ( | |構|任意選出| | |30A1-FBE2)| 次常用 |2121-7244)| -- -------- ---------- ------------ ---------- -------- ---------- |字|1.總筆劃|1.總筆劃 |1.部首 |1.總筆劃 |1.總筆劃|1.總筆劃 | |序|2.部首 |2.部首 |2.總筆劃 |2.部首 |2.部首 |2.部首 | -- -------- ---------- ------------ ---------- -------- ---------- |I| |合 ISO 646| | | | | |S|完全不合|部份合 | 同左 | 同左 | 同左 | 同左 | |O| | ISO 2022 | | | | | -- -------- ---------- ------------ ---------- -------- ---------- |獨| | | | 不合 | | | |一| 合 | 同左 | 同左 | 常用字一 | 合 | 合 | |性| | | | | | | -- -------- ---------- ------------ ---------- -------- ---------- |涵| 不合僅 | 不合 | | 不合 | | 不合 | |蓋| 32768 | 總字 | 同左 | 總字 | 同左 | 總字 | |性| 字位 | 4,808 | | 13,053 | | 13,053 | -- -------- ---------- ------------ ---------- -------- ---------- |擴| 不合 | 不合 | | 不合 | 不合 | | |充| 無法 | 總字數 | 同左 | 無法 | 總字數 | | |性| 擴充 | 35,344 | | 擴充 | 35,344 | | -- -------- ---------- ------------ ---------- -------- ---------- |試|不能使用| 無人試用 | |無業者採用|多家採用| | | |主計處 | 業者字數 | 同左 | 75年三月 |外來程式| | |用|自行收回| 超過8000 | | 宣佈放棄 |有問題 | | -- -------- ---------- ------------ ---------- -------- ---------- |中| 031F | 4C50 | 4C26 |4463 32F6 | A4A4 | 4463 | |華| 36AB | 6675 | 712B |615E B1AE | B5D8 | 615E | |民| 05C1 | 4E4A | 623B |4661 39EF | A5C1 | 4661 | |國| 2730 | 5F54 | 535E |594F A138 | B0EA | 594F | -- -------- ---------- ------------ ---------- -------- ---------- 亦驢註:想知道主計處編出來的第一套碼有多荒誕,可以看看上表最後一項。 「中」的內碼為 031F 。在 ASCII 標準中 03、1F 都是控制碼。在 以 ASCII 為主的電腦世界,這個字碼不是非常荒謬嗎? -- 亦驢人驢名亦驢(不可再驢下去) 成大電研計算機 rux@eembox.ncku.edu.tw -- * Origin: ★ 交通大學資訊科學系 BBS ★ -- * Origin: ★ 交通大學資訊科學系 BBS ★ > -------------------------------------------------------------------------- < 發信人: Mephisto.bbs@bbs.ee.ncu.edu.tw (Segmentation fault), 看板: Linux 標 題: Re: [轉貼] 國內中文字碼之發展 發信站: 中央大學松濤風情資訊站 (Wed Apr 8 15:30:24 1998) 轉信站: Maxwell!bbs.ee.ntu!freebsd.ntu!news.cis.nctu!news.csie.nctu!news.nctu! >==>發信人: MyID.bbs@cis.nctu.edu.tw (...沈思中...), 信區: Linux > 這份文章是從 tw.bbs.comp.chinese 轉貼進來的, > 提供給對中文字碼標準化有興趣的人看看, 也順便想想目前 > Linux 的中文化該怎麼走....... > 另外對 CJK 有興趣的也可以看看 > ftp://nctuccca.nctu.edu.tw/Chinese/ifcss/software/info/cjk-codes/index.html BIG5 碼, 事實上也不盡理想, 有經驗的 programmer 都應該知道: BIG5 code 與一些程式語言的 delimiter, quote.. 之衝碼問題. 前幾年好像有一個叫 "中推會" 的單位推行 "CMEX" 碼. CMEX 其實蠻不錯的, 可自它的 "編碼", "字序"... CMEX 自前人的錯誤中吸取不少經驗, 很可惜, CMEX 無法在市場中替代 BIG5, 所以我們至今仍然得忍受 BIG5 的缺點. BIG5 可能已成為無解的問題了, 這也再次說明: ( like M$-win ) 東西好不好是其次, 只有市場佔有率才能主導標準. /usr/mephis -- [0m[1;32m ◎ Origin: 中央松濤站□bbs.ee.ncu.edu.tw From: liang.ttinet.com.tw[0m > -------------------------------------------------------------------------- < 發信人: matt.bbs@csie.nctu.edu.tw (您現在可以放心當機), 看板: Linux 標 題: Re: [轉貼] 國內中文字碼之發展 發信站: 交大資工鳳凰城資訊站 (Wed Apr 8 17:24:26 1998) 轉信站: Maxwell!bbs.ee.ntu!freebsd.ntu!news.cs.nthu!news.csie.nctu!phoenix ==> 在 MyID.bbs@cis.nctu.edu.tw (...沈思中...) 的文章中提到: : ==> 在 Mephisto.bbs@bbs.ee.ncu.edu.tw (Segmentation 的文章中提到: : > BIG5 碼, 事實上也不盡理想, 有經驗的 programmer 都應該知道: : > BIG5 code 與一些程式語言的 delimiter, quote.. 之衝碼問題. : 這還好吧, 這種小範圍的衝碼問題, 應該是無法避免的, : 更何況中文在程式裡主要是拿來當註解和訊息, 並不是拿 : 來當語言的主體, 而事實上只要 compiler 對字串做一下 : 檢查這種衝碼也是可以避免的...... 我記得好像是low-byte只用字母部分 所以 \ ! @ # $ % ^ & * ( ) 等符號是不在字碼範圍內的 意思是compiler完全不用注意到這種惱人的事 : > 前幾年好像有一個叫 "中推會" 的單位推行 "CMEX" 碼. CMEX 其實蠻不錯的, : > 可自它的 "編碼", "字序"... CMEX 自前人的錯誤中吸取不少經驗, : > 很可惜, CMEX 無法在市場中替代 BIG5, 所以我們至今仍然得忍受 BIG5 的缺點 : 呵~~~~~雖然沒看過你說的 CMEX 碼, 但我滿好奇它真的 : 沒有 BIG5 的缺點嗎? : 另外, 對 CMEX 的網頁除了會議內容外, 沒有什麼技術文件, 也沒有做 : 更新, 實在很讓人懷疑, 這個組織到底能有做多少事?? 是說公會碼嗎? TCA和CMEX好像不太一樣 -- ^D > -------------------------------------------------------------------------- < 發信人: matt.bbs@csie.nctu.edu.tw (您現在可以放心當機), 看板: Linux 標 題: Re: [轉貼] 國內中文字碼之發展 發信站: 交大資工鳳凰城資訊站 (Wed Apr 8 22:31:59 1998) 轉信站: Maxwell!bbs.ee.ntu!freebsd.ntu!news.cs.nthu!news.csie.nctu!phoenix ==> 在 yorkwu@ms4.hinet.net () 的文章中提到: : 您現在可以放心當機 (matt.bbs@csie.nctu.edu.tw) wrote: : : 我記得好像是low-byte只用字母部分 : : 所以 \ ! @ # $ % ^ & * ( ) 等符號是不在字碼範圍內的 : : 意思是compiler完全不用注意到這種惱人的事 : 不幸的是, \ 在衝碼範圍... 對不起 沒說清楚 我指的是公會碼 -- ^D > -------------------------------------------------------------------------- < 發信人: MyID.bbs@cis.nctu.edu.tw (...沈思中...), 看板: Linux 標 題: Re: [轉貼] 國內中文字碼之發展 發信站: 交大資科_BBS (Thu Apr 9 14:48:47 1998) 轉信站: Maxwell!bbs.ee.ntu!freebsd.ntu!news.cs.nthu!news.csie.nctu!news.cis.nc ==> 在 PA@freebsd.ee.ntu.edu.tw (PA) 的文章中提到: > ※ 引述《matt.bbs@csie.nctu.edu.tw (您現在可以放心當機)》之銘言: > : 對不起 沒說清楚 > : 我指的是公會碼 > 貼份公會碼的範圍 取自倚天系統手冊 > 附錄 5-4 公會碼 > 簡介: > 為了使用公會推薦中文內碼系統能符合大多數使用者 > 的需求,及與政府公佈的通用滿字..... (自己去看) > 高位元組 (*125) > 81H-FDH > 低位元組 (*188) > 30H-39H > 41H-5AH > 61H-7AH > 80H-FDH > 不幸的是 \的ASCII碼是 5CH > 跟BIG5.... 一堆衝到! faint 這樣也不見好到那去.... 80 ~ 9F 這個範圍在 iso_8859_1 是控制碼, 另外有些系統, 會擋第 8 個位元 (ch & 0x7F) 這樣一來, 這些公會碼很多很 多字都會出問題....真要定那就 30-39 41-5A 61-7A 再把 80-FD 改成 B0-B9 C1-DA E1-FA , 不過這樣一來, 總字數就太少了... 總之這種用兩個 byte 兜起來的方法, 衝碼是正常的, 但不和控 制碼相衝是第一個要求.... -- * Origin: ★ 交通大學資訊科學系 BBS ★ > -------------------------------------------------------------------------- < 發信人: bearscorp.bbs@bbs.life.nthu.edu.tw (無責任學長), 看板: Linux 標 題: Re: [轉貼] 國內中文字碼之發展 發信站: 清華生命科學 BBS (Thu Apr 9 17:24:09 1998) 轉信站: Maxwell!bbs.ee.ntu!freebsd.ntu!news.cs.nthu!news.nthu!nthuls ==> mihs.bbs@bbs.ee.ncu.edu.tw (PA) wrote: : 其實用ISO-2022的規定好像就不太會有什麼問題了, 不過還在看當中! ISO-2022 (-jp, -cn, -kr) 其實概念上不難. 因為各 encoding 之間有可能會有衝突發生, 因此要同時用到如 euc/jis/gb/cns 是不太可能 的. ISO-2022 解決這個問題的方法就是在文章 中標明某部份的文字編碼為何. 例如: 1b 24 29 41 0e 3d 3b 3b 3b 1b 24 29 47 47 28 5f 50 0f 上面這段十六進位碼代表 GB 碼和 CNS11643 的"交換". 1b 24 29 41 說:在下一個 1b 24 blah 出現以前, 都是 GB 編碼(也可能是 ASCII). 0e 代表後面的字元不再是 ASCII 編碼, 因為前面的 1b 24 29 41, 所以是 GB 編碼. 3d 3b 3b 3b 是 GB 碼的"交換", 1b 24 29 47 是說, 後面 的字是 ASCII 或 CNS-11643 plane 1(CNS 11643 有十多個 字面 plane), 因為前面有 0e 出現, 所以不是 ASCII, 47 28 5f 50 是 CNS-11643 的"交換", 最後面的 0f 是說, 接下來又是 ASCII 啦... 這個例子是從 rfc1922 來的. 如果說, 我們想將 gb 和 cns 的"交換"放在一行, 中間 並夾入 "interchange" 要怎樣做呢? Ans: 1b 24 29 41 0e 3d 3b 3b 3b 0f 69 6e 74 65 72 63 68 61 6e 67 65 1b 24 29 47 0e 47 28 5f 50 0f 69 6e 74 65 72 63 68 61 6e 67 65 是 interchange 的 ASCII 碼. 除此之外, 你看得出和原來的差別在那裡嗎? checkout rfc1468, rfc1554, rfc1557 and rfc1922 > -------------------------------------------------------------------------- < 發信人: bearscorp.bbs@bbs.life.nthu.edu.tw (無責任學長), 看板: Linux 標 題: Re: [轉貼] 國內中文字碼之發展 發信站: 清華生命科學 BBS (Thu Apr 9 17:28:20 1998) 轉信站: Maxwell!bbs.ee.ntu!freebsd.ntu!news.cs.nthu!newsfeed.nthu!news.nthu!nt ==> bearscorp (無責任學長) wrote: : ISO-2022 (-jp, -cn, -kr) 其實概念上不難. : 因為各 encoding 之間有可能會有衝突發生, : 因此要同時用到如 euc/jis/gb/cns 是不太可能 : 的. ISO-2022 解決這個問題的方法就是在文章 : 中標明某部份的文字編碼為何. : 例如: : 1b 24 29 41 0e 3d 3b 3b 3b 1b 24 29 47 47 28 5f 50 0f : 上面這段十六進位碼代表 GB 碼和 CNS11643 的"交換". : 1b 24 29 41 說:在下一個 1b 24 blah 出現以前, 都是 GB 1b 24 29 41 和 1b 24 29 47 都是所謂的 SOdesigation, 0e 是 SO (Shift Out), 0f 是 SI(Shift In), 另外還有 SS2, SS3 等等.. > -------------------------------------------------------------------------- < 發信人: PA@freebsd.ee.ntu.edu.tw (PA), 看板: Linux 標 題: Re: [轉貼] 國內中文字碼之發展 發信站: 從零開始 (Thu Apr 9 19:00:56 1998) 轉信站: Maxwell!bbs.ee.ntu!freebsd.ntu!fromzero ※ 引述《MyID.bbs@cis.nctu.edu.tw (...沈思中...)》之銘言: : ==> 在 mihs.bbs@bbs.ee.ncu.edu.tw (PA) 的文章中提到: : > 其實用ISO-2022的規定好像就不太會有什麼問題了, 不過還在看當中! : 真的說有問題的話大概就是每次要用不同國的語言時, : 就要用一些 header 來做不同的切換, 不過在這個標準 : 之下應該可以實現 multilingual 理想, X 之中的 : Compound Text 便是以 iso 2022 為藍本做出來的, 另 : 外在一些編輯器也可使用 iso-2022, 例 emacs 就是一 : 個例子, 總之 iso-2022 是個國際標準, 跟著它走不太 : 可能出問題.... : 但是話又說回來了, 要用 iso-2022 那就要用 CNS, 那 big5 呢? : 1. 連合各大 bbs 站, 用 CNS 做輸出, 強迫使用者要用 CNS 來讀 : 文章 用來著啦,基本上CNS->BIG5不會很難, 在寫程式時多掛一,二個轉碼表就行了! : 2. 下一版的 xcin 中用 CNS , 不要用 big5 呵..... 有可能啦.... 你要試試看嗎? 說不定是用ISO-2022,CJK,不只CNS哦, 但一切等我K完那一堆文件再說! ^o^ : 3. 說服 Microsoft 支援 CNS 算了吧.... 那有的等, 不如把XWindow改成支援ISO-2022 TTF字型! : 這樣或許就會像日本這樣兩碼同時併存的情況了..... 呵呵... 誰管Microsoft呀,其實Microsoft要做早做了,那怕沒人! -- [1;31;40m ╭─────╮[1;32;40m─── [1;31m國立中[1;33m央大學[1;32m資訊工[1;34m程學系[1;33;40m ─────[1;33;40m╭─────╮ [1;31;40m │ ╭─╮[1;32m╭───╮[m ID:Pa 系統:FreeBSD 2.2.6-RELEASE [1;33;40m│[1;34m╭────╮ [1;31;40m │ ╰─╯[1;32m│ ╭╮ │[m 主機: Unicorn.pine.NCU.Edu.Tw [1;33;40m [m │[1;34m│ ︿ ∠ │ [1;31;40m │ ╭──[1;32m│ ╰╯ ╰╮[mEMail: pa@FreeBSD.EE.NTU.Edu.Tw[1;33;40m │[1;34m│ - │ [1;31;40m ╰─╯ [1;32m╰────┴[1;33m─────────────────╯[1;34m╰────╯[0;37;40m -- Origin: 從零開始 freebsd.ee.ntu.edu.tw (140.112.19.123) > -------------------------------------------------------------------------- < 發信人: mihs.bbs@bbs.ee.ncu.edu.tw (PA), 看板: Linux 標 題: Re: [轉貼] 國內中文字碼之發展 發信站: 中央大學松濤風情資訊站 (Thu Apr 9 20:44:24 1998) 轉信站: Maxwell!bbs.ee.ntu!freebsd.ntu!news.cs.nthu!news.cis.nctu!news.nctu!ne >==>發信人: MyID.bbs@cis.nctu.edu.tw (...沈思中...), 信區: Linux >==> 在 PA@freebsd.ee.ntu.edu.tw (PA) 的文章中提到: >> ※ 引述《MyID.bbs@cis.nctu.edu.tw (...沈思中...)》之銘言: >> : 真的說有問題的話大概就是每次要用不同國的語言時, >> : 就要用一些 header 來做不同的切換, 不過在這個標準 >> : 之下應該可以實現 multilingual 理想, X 之中的 >> : Compound Text 便是以 iso 2022 為藍本做出來的, 另 >> : 外在一些編輯器也可使用 iso-2022, 例 emacs 就是一 >> : 個例子, 總之 iso-2022 是個國際標準, 跟著它走不太 >> : 可能出問題.... >> : 但是話又說回來了, 要用 iso-2022 那就要用 CNS, 那 big5 呢? >> : 1. 連合各大 bbs 站, 用 CNS 做輸出, 強迫使用者要用 CNS 來讀 >> : 文章 >> 用來著啦,基本上CNS->BIG5不會很難, 在寫程式時多掛一,二個轉碼表就行了! > 直接在 bbs 站上下手腳, 目的是要 "全面性的強迫" 大家使用它...... > 不然人家只要不用你的 client 來讀, 那還是回到 big5 的世界裡.... 不過就算這樣做, 很多麻煩的事會發生, 像國內的BBS 可能就會分裂為二 部份, 用BIG5的, 和用ISO-2022的, 當然實際上用ISO-2022會比較好, 但大多 使用Microsoft Windows 95/NT的人都是用BIG5, 這樣變成要再特別做Client 端, 不然會造成Windows 95/NT不能上線, 其實這算是台灣最有本錢的東西吧, BBS, 幾乎所有用過電腦人都上過的東西. 但那也要等大多數的平台都支援後 再說吧! 現在BIG5還是比較盛行. -- [1;32m ╭─────╮─── 國立中央大學資訊工程學系 ─────╮ │ ╭─╮╭───╮ ID:PA 系統:FreeBSD 2.2.6-Release │ │ ╰─╯│ ╭╮ │ 主機: Unicorn.pine.ncu.edu.tw │ │ ╭──│ ╰╯ ╰╮EMail: PA@FreeBSD.EE.NTU.Edu.Tw │ ╰─╯ ╰────┴─────────────────╯ -- [0m[1;35m ◎ Origin: 中央松濤站□bbs.ee.ncu.edu.tw From: Unicorn.pine.ncu.edu.tw[0m > -------------------------------------------------------------------------- < 發信人: PA@freebsd.ee.ntu.edu.tw (PA), 看板: Linux 標 題: Re: [轉貼] 國內中文字碼之發展 發信站: 從零開始 (Fri Apr 10 01:00:51 1998) 轉信站: Maxwell!bbs.ee.ntu!freebsd.ntu!fromzero ※ 引述《Doggie.bbs@cowhouse.csie.nctu.edu.tw (我是狗狗)》之銘言: : ※ 引述《mihs.bbs@bbs.ee.ncu.edu.tw (PA)》之銘言: : : 不過就算這樣做, 很多麻煩的事會發生, 像國內的BBS 可能就會分裂為二 : : 部份, 用BIG5的, 和用ISO-2022的, 當然實際上用ISO-2022會比較好, 但大多 : : 使用Microsoft Windows 95/NT的人都是用BIG5, 這樣變成要再特別做Client : : 端, 不然會造成Windows 95/NT不能上線, 其實這算是台灣最有本錢的東西吧, : : BBS, 幾乎所有用過電腦人都上過的東西. 但那也要等大多數的平台都支援後 : : 再說吧! 現在BIG5還是比較盛行. : 這樣像是是個雞生蛋,蛋生雞的問題 : 若現在不努力鼓吹ISO-2022,甚至讓BBS使用ISO-2022的話 : 那是不會有client端支援ISO-2022的 : 其實我倒覺得這是一個不錯的方向 : 只要能使得大部分BBS站改用或加入ISO-2022編碼的功能(這是件困難的事) : 自然越來越多的client會支援,並且使大家開始認知到除了BIG5外還有別的選擇 其實說困難倒也是還好啦..... 把Maple 3.0弄成支援ISO-2022, 再去找Opus放Maple 3.0..... 再去協助各BBS的站長把BBS弄成 ISO-2022相容就行了,只是時間性的問題而己, 這個大概算是台灣 Unix界最大的資源了, 但一切還是要等Client端做出來再說, 少說 也要先讓幾個重要的Client有支援, 像Windows 95, XWindow.... 等, 不然可能會造成很大的反彈, 其實也可以在這次機會中加入 BBS的安全系統[ RSA編碼? 最近不是放出來了, 其實可以做的事很 多,但時間是一個最大的問題 ] -- [1;31;40m ╭─────╮[1;32;40m─── [1;31m國立中[1;33m央大學[1;32m資訊工[1;34m程學系[1;33;40m ─────[1;33;40m╭─────╮ [1;31;40m │ ╭─╮[1;32m╭───╮[m ID:Pa 系統:FreeBSD 2.2.6-RELEASE [1;33;40m│[1;34m╭────╮ [1;31;40m │ ╰─╯[1;32m│ ╭╮ │[m 主機: Unicorn.pine.NCU.Edu.Tw [1;33;40m [m │[1;34m│ ︿ ∠ │ [1;31;40m │ ╭──[1;32m│ ╰╯ ╰╮[mEMail: pa@FreeBSD.EE.NTU.Edu.Tw[1;33;40m │[1;34m│ - │ [1;31;40m ╰─╯ [1;32m╰────┴[1;33m─────────────────╯[1;34m╰────╯[0;37;40m -- Origin: 從零開始 freebsd.ee.ntu.edu.tw (140.112.19.123) > -------------------------------------------------------------------------- < 發信人: is84002@cis.nctu.edu.tw (Chou Yeh-Jyi), 看板: Linux 標 題: Re: [轉貼] 國內中文字碼之發展 發信站: Dept. of Computer & Information Science, NC (Mon Apr 13 10:11:21 1998) 轉信站: Maxwell!bbs.ee.ntu!freebsd.ntu!news.cs.nthu!news.cis.nctu!is84002 落魄的失敗者 (allex.bbs@csie.nctu.edu.tw) 提到: : 請問一下 哪可拿得到 iso-2022 與 iso-10646 的文件 : 因為好奇 想拿一份看看說!!! ISO 10646: rfc2044, rfc2279 ISO 2022: rfc1468, rfc1554, rfc1557 and rfc1922 -- 周 業 及 (Chou Yeh-Jyi) ======================= 交 大 資 科 is84002@cis.nctu.edu.tw > -------------------------------------------------------------------------- < 發信人: bearscorp.bbs@bbs.life.nthu.edu.tw (無責任學長), 看板: Linux 標 題: Re: [轉貼] 國內中文字碼之發展 發信站: 清華生命科學 BBS (Mon Apr 13 12:06:29 1998) 轉信站: Maxwell!bbs.ee.ntu!freebsd.ntu!news.cs.nthu!news.nthu!nthuls ==> is84002@cis.nctu.edu.tw (Chou Yeh-Jyi) wrote: : 落魄的失敗者 (allex.bbs@csie.nctu.edu.tw) 提到: : : 這要到哪抓啊 ????? : 聽說有一個叫做 archie 的程式... http://sunsite.auc.dk/RFC/ 可以根據編號快速的查到.. 還有 cross refreence 喔 ********************************************************* 哈哈&兵燹 最會的2大絕招 這個不會與那個也不會 哈哈哈 粉好 Delphi K.Top的K.Top分兩個字解釋Top代表尖端的意思,希望本討論區能提供Delphi的尖端新知 K.表Knowlege 知識,就是本站的標語:Open our mind to make knowledge together! 希望能大家敞開心胸,將知識寶庫結合一起
------
**********************************************************
哈哈&兵燹
最會的2大絕招 這個不會與那個也不會 哈哈哈 粉好

Delphi K.Top的K.Top分兩個字解釋Top代表尖端的意思,希望本討論區能提供Delphi的尖端新知
K.表Knowlege 知識,就是本站的標語:Open our mind
系統時間:2024-04-27 0:57:44
聯絡我們 | Delphi K.Top討論版
本站聲明
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。
2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。
3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇!