線上訂房服務-台灣趴趴狗聯合訂房中心
發文 回覆 瀏覽次數:8359
推到 Plurk!
推到 Facebook!

UTF8 的繁體簡體互轉

答題得分者是:aftcast
sailxia
一般會員


發表:2
回覆:3
積分:1
註冊:2006-07-10

發送簡訊給我
#1 引用回覆 回覆 發表時間:2006-09-22 16:55:35 IP:219.136.xxx.xxx 訂閱
各位先進好:
小弟現在寫一支程式,需要讀取 UTF8 編碼文本, 讀取後文本後需要進一步處理:
具體為:
1. 如果 文本檔案為 UTF8 繁體,則直接顯示;
2. 如果 文本檔案為 UTF8 簡體,則需要轉換處理為 UTF8 繁體來顯示;
至於資料方面,小弟已經查找了本站的很多資料,都沒有這方面的顯示,多是 ANSI 和 UNICODE 的之間的轉換,哪位大大可以提供一個方向以供小弟參考?小弟正在查找這方面的 function.
謝謝.
編輯記錄
Coffee 重新編輯於 2007-10-12 10:13:39, 註解 分類為問題‧
pcplayer99
尊榮會員


發表:142
回覆:738
積分:591
註冊:2003-01-21

發送簡訊給我
#2 引用回覆 回覆 發表時間:2006-09-23 00:07:59 IP:219.134.xxx.xxx 未訂閱
Delphi 自己已经带了有关 UTF8 处理的 function, 你在 delphi 自己带的 help 里输入 UTF8,自然就能找到。

另外,类似的转换 function, jedi 的 jcl 也带有。

===================引 用 文 章===================
各位先進好:
小弟現在寫一支程式,需要讀取 UTF8 編碼文本, 讀取後文本後需要進一步處理:
具體為:
1. 如果 文本檔案為 UTF8 繁體,則直接顯示;
2. 如果 文本檔案為 UTF8 簡體,則需要轉換處理為 UTF8 繁體來顯示;
至於資料方面,小弟已經查找了本站的很多資料,都沒有這方面的顯示,多是 ANSI 和 UNICODE 的之間的轉換,哪位大大可以提供一個方向以供小弟參考?小弟正在查找這方面的 function.
謝謝.
aftcast
站務副站長


發表:81
回覆:1482
積分:1762
註冊:2002-11-21

發送簡訊給我
#3 引用回覆 回覆 發表時間:2006-09-23 07:41:24 IP:61.229.xxx.xxx 未訂閱

你好,請參考下面的做法:

0/ 約定說詞: GB2312 簡稱GB碼 (ANSI)

1/ 主流程 GB-UTF8 --> GB-UTF16-->GB-->GBK-->GBK-UTF16-->GBK-UTF8

2/ UTF8 <--> UTF16 換轉請用UTF8Encode <---> codeUTF8Decode

3/ GB --> GBK 請用win32api之LCMapString的來做

4 UTF16 <---> ANSI 請用win32api之WideCharToMultiByte<--->MultiByteToWideChar

其他api的細節應該很容易查!

其中也可以查我的blog,不過是BCB版的參考資料。

蕭沖 qs.xiao@gmail.com
http://aftcast.blogspot.com/
生有涯而知無涯,以有涯隨無涯,殆矣


===================引 用 文 章===================
各位先進好:
小弟現在寫一支程式,需要讀取 UTF8 編碼文本, 讀取後文本後需要進一步處理:
具體為:
1. 如果 文本檔案為 UTF8 繁體,則直接顯示;
2. 如果 文本檔案為 UTF8 簡體,則需要轉換處理為 UTF8 繁體來顯示;
至於資料方面,小弟已經查找了本站的很多資料,都沒有這方面的顯示,多是 ANSI 和 UNICODE 的之間的轉換,哪位大大可以提供一個方向以供小弟參考?小弟正在查找這方面的 function.
謝謝.

------



蕭沖
--All ideas are worthless unless implemented--

C++ Builder Delphi Taiwan G+ 社群
http://bit.ly/cbtaiwan
pcboy
版主


發表:177
回覆:1838
積分:1463
註冊:2004-01-13

發送簡訊給我
#4 引用回覆 回覆 發表時間:2006-12-07 13:02:46 IP:219.87.xxx.xxx 未訂閱
請問一下, 樓主最後目的不是要轉成為 繁體 嗎 ? 下面好像是各種 GB 間轉換 ? ( GBK 是 Big5 ? )

===================引 用 文 章===================

> 1/ 主流程 GB-UTF8 --> GB-UTF16-->GB-->GBK-->GBK-UTF16-->GBK-UTF8
請問一下, 為何要在這麼多種 GB 間轉換 ?

2/ UTF8 <--> UTF16 換轉請用UTF8Encode <---> codeUTF8Decode

3/ GB --> GBK 請用win32api之LCMapString的來做

4 UTF16 <---> ANSI 請用win32api之WideCharToMultiByte<--->MultiByteToWideChar

其他api的細節應該很容易查!

其中也可以查我的blog,不過是BCB版的參考資料。

蕭沖 qs.xiao@gmail.com
http://aftcast.blogspot.com/
生有涯而知無涯,以有涯隨無涯,殆矣


===================引 用 文 章===================
各位先進好:
小弟現在寫一支程式,需要讀取 UTF8 編碼文本, 讀取後文本後需要進一步處理:
具體為:
1. 如果 文本檔案為 UTF8 繁體,則直接顯示;
2. 如果 文本檔案為 UTF8 簡體,則需要轉換處理為 UTF8 繁體來顯示;
至於資料方面,小弟已經查找了本站的很多資料,都沒有這方面的顯示,多是 ANSI 和 UNICODE 的之間的轉換,哪位大大可以提供一個方向以供小弟參考?小弟正在查找這方面的 function.
謝謝.
------
能力不足,求助於人;有能力時,幫幫別人;如果您滿意答覆,請適時結案!

子曰:問有三種,不懂則問,雖懂有疑則問,雖懂而想知更多則問!
John Wong
初階會員


發表:1
回覆:35
積分:32
註冊:2004-09-18

發送簡訊給我
#5 引用回覆 回覆 發表時間:2007-01-28 17:44:39 IP:219.77.xxx.xxx 未訂閱
GBK不是Big5, 它是一個同時包含了簡體字及繁體字的編碼.
yckuo
高階會員


發表:55
回覆:389
積分:238
註冊:2003-03-07

發送簡訊給我
#6 引用回覆 回覆 發表時間:2007-03-23 05:08:44 IP:220.132.xxx.xxx 未訂閱
UTF-8 簡體先轉為 GB , GB 再轉為 BIG5 (詞彙互換), BIG5 再轉為 UTF-8 繁體.
或者直接建個表, UTF-8簡繁對照表,直接替換.
------
yckuo
系統時間:2017-10-23 17:44:10
聯絡我們 | Delphi K.Top討論版
本站聲明
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。
2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。
3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇!