線上訂房服務-台灣趴趴狗聯合訂房中心
發文 回覆 瀏覽次數:2457
推到 Plurk!
推到 Facebook!

別人解決server side java中文問題的方法

 
conundrum
尊榮會員


發表:893
回覆:1272
積分:643
註冊:2004-01-06

發送簡訊給我
#1 引用回覆 回覆 發表時間:2004-04-17 12:13:24 IP:61.221.xxx.xxx 未訂閱
http://freebsd.sinica.edu.tw/pipermail/freebsd-taiwan-chinese/2002-July/000255.html    [轉錄][轉錄]別人解決server side java中文問題的方法 
statue freebsd-taiwan-chinese@freebsd.sinica.edu.tw 
28 Jul 2002 15:05:43 GMT     Previous message: [轉錄]Re: [問題]DocBook SGML 無法轉成 HTML 檔 
Next message: [轉錄]Asklinux 自助式中文文件連結 
Messages sorted by: [ date ] [ thread ] [ subject ] [ author ]     --------------------------------------------------------------------------------    ※ 本文轉錄自 [statue] 信箱    作者: statue.bbs@bbs.cse.yzu.edu.tw
標題: [轉錄]別人解決server side java中文問題的方法
時間: Sun Jul 28 22:55:35 2002    作者: koji (blur ~cool~) 站內: KOJI
標題: [轉錄]別人解決server side java中文問題的方法
時間: Sun Jul 28 21:57:16 2002    Java Server Side 中文解決方案
gerrykuo    在這個網站上看了很多文章關於在Java裡面使用中文的方法,只有嘆氣搖頭。
為什麼要用getBytes然後再轉BIG5呢?這種解決方法從一開始根本就錯了。    最好的解決方法是從資料進來的時候就要正確的抓到資料。    我這一兩個月利用下班時間寫了一個用Java Servlet以及XML/XSL來作的留言
板,同時支援簡體、繁體,甚至日文的輸入與顯示,這是怎麼做到的呢?很
簡單,利用Unicode。    我的servlet處理中文只要兩個指令:
response.setContentType("text/html;charset=UTF-8");
request.setCharacterEncoding("UTF-8");  (此功能j2ee 1.3就有了)    之後不管你要getParameter或是printWriter.write都可以把所有的String直接
拿來用,不用再做什麼轉換。存到database裡面的資料也是直接儲存unicode。
我用的資料庫是PostgreSQL因為它是唯一支援Unicode的開放軟體資料庫(唯一
要注意的是PostgreSQL在initdb要用SQL-ASCII或是UNICODE,不能用
mule-internal,如果你用過PostgreSQL應該知道我在講什麼)。你如
果用的是Oracle或SQLserver, DB2他們的新版應該都是支援Unicode的。mySQL
雖然很快,但是它的功能實在不足(也沒有支援unicode),尤其JDBC的driver
還沒有官方版,不用也罷。
我本來想移植到mySQL上,但是它竟然連resultSet.isBeforeFirst()都沒有
實作,那我怎麼判斷結果有沒有資料啊?    你會說,但是user輸入的是BIG5啊?別擔心,browser早就幫你解決這個問題了。
只要你用response.setContentType("text/html;charset=UTF-8");接下來雖然
你輸入的是big5,但是當browser送出來的時候,它就會根據charset來作編碼轉換。
這樣我們再設request.setCharacterEncoding("UTF-8");然後你用getParameter
時它就會把UTF-8轉成真正的unicode。    這個就是系統的美妙之處了,當你在簡體的系統上看同樣的page時,因為文件的
內容Java已經幫你從unicode轉成UTF-8了,所以你還是可以看到繁體字,而你在
reply這篇文章時雖然用的是GB,但是當從browser送出來的時候,它又轉成UTF-8
了,然後我們的程式一樣處理,當你回到繁體系統來看,又可以看到剛剛發的
簡體的reply。    如果你在英文的系統下,想要copy一篇中文文章進來,絕對不能用BIG5直接貼,
因為這時系統的default encoding不對,轉碼會錯。這時你要先用browser先把
文章讀出來,把"中文字"(不是BIG5碼)copy,貼進來。因為當你在browser裡面
看到中文字時,這個中文字已經是用unicode在顯示了。    所以這個解決方案才能真正做到: "所見即所得"。也就是說,只要你看得到你
輸入的東西,你就可以看到你想要的輸出結果。這也就是你在英文環境下,貼
BIG5的"亂碼",這個程式也會回big5的"亂碼"給你的原因。    Unicode是Java一個對國際化/本土化很好的支援,我們要好好利用這個優點,
做出以前想都沒辦法想的軟體。LinuxFab雖然可以顯示繁體與簡體,但我若是
大陸的使用者,沒看到"簡繁"那小小的兩個字,而在繁體的網頁輸入了簡體呢?
會有問題。除了用unicode,其他解決的方法都會很複雜,現在Java對server
side的國際化支援算是完整了(1.3之前沒有request.setCharaterEncoding(),
總是礙手礙腳),希望大家不要在把unicode當成是不如php, perl的缺點,東
拼西湊的湊到可以顯示中文;把精力放在程式本身,而不是轉碼上。    台灣用Java的人還是不多,尤其是企業;理由不外是performance, 穩定性。
但是你如果知道美國的嘉信理財(我工作的公司),擁有全世界最強大的商用
超級電腦,我們的程式已經有大約20-30%轉換成Java,轉換的工作還在繼續
中,那你會怎麼想?Server side的Java有絕大多數CGI無法比擬的優點:Thread
執行序,在只比較一個request的時候,CGI會佔優勢,但是當成百上千個
request來的時候,Thread的優勢就會出來。我們公司也是在比較過兩者的
表現之後,才決定進行CGI到Java的轉換的。    我的工作是把這些Java的功能加以中文化來提供給住在美國的華裔,對於Java
中文化的問題已經研究了快兩年了,期間碰過不少問題,幸而跟我們合作的IBM
對於我們提出的問題都能迅速改進,所以我還能保住我的工作。其實這些問題,
在apache, tomcat等等的開放原始碼都已經解決了,我真的不得不佩服這些熱
心的人。所以每次我的問題提出來之後,都還會附加:Tomcat不會有這個問題。
我想這多少也刺激他們迅速的改進。     
系統時間:2024-05-09 9:22:02
聯絡我們 | Delphi K.Top討論版
本站聲明
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。
2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。
3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇!