別人解決server side java中文問題的方法 |
|
conundrum
尊榮會員 發表:893 回覆:1272 積分:643 註冊:2004-01-06 發送簡訊給我 |
http://freebsd.sinica.edu.tw/pipermail/freebsd-taiwan-chinese/2002-July/000255.html [轉錄][轉錄]別人解決server side java中文問題的方法 statue freebsd-taiwan-chinese@freebsd.sinica.edu.tw 28 Jul 2002 15:05:43 GMT Previous message: [轉錄]Re: [問題]DocBook SGML 無法轉成 HTML 檔 Next message: [轉錄]Asklinux 自助式中文文件連結 Messages sorted by: [ date ] [ thread ] [ subject ] [ author ] -------------------------------------------------------------------------------- ※ 本文轉錄自 [statue] 信箱 作者: statue.bbs@bbs.cse.yzu.edu.tw 標題: [轉錄]別人解決server side java中文問題的方法 時間: Sun Jul 28 22:55:35 2002 作者: koji (blur ~cool~) 站內: KOJI 標題: [轉錄]別人解決server side java中文問題的方法 時間: Sun Jul 28 21:57:16 2002 Java Server Side 中文解決方案 gerrykuo 在這個網站上看了很多文章關於在Java裡面使用中文的方法,只有嘆氣搖頭。 為什麼要用getBytes然後再轉BIG5呢?這種解決方法從一開始根本就錯了。 最好的解決方法是從資料進來的時候就要正確的抓到資料。 我這一兩個月利用下班時間寫了一個用Java Servlet以及XML/XSL來作的留言 板,同時支援簡體、繁體,甚至日文的輸入與顯示,這是怎麼做到的呢?很 簡單,利用Unicode。 我的servlet處理中文只要兩個指令: response.setContentType("text/html;charset=UTF-8"); request.setCharacterEncoding("UTF-8"); (此功能j2ee 1.3就有了) 之後不管你要getParameter或是printWriter.write都可以把所有的String直接 拿來用,不用再做什麼轉換。存到database裡面的資料也是直接儲存unicode。 我用的資料庫是PostgreSQL因為它是唯一支援Unicode的開放軟體資料庫(唯一 要注意的是PostgreSQL在initdb要用SQL-ASCII或是UNICODE,不能用 mule-internal,如果你用過PostgreSQL應該知道我在講什麼)。你如 果用的是Oracle或SQLserver, DB2他們的新版應該都是支援Unicode的。mySQL 雖然很快,但是它的功能實在不足(也沒有支援unicode),尤其JDBC的driver 還沒有官方版,不用也罷。 我本來想移植到mySQL上,但是它竟然連resultSet.isBeforeFirst()都沒有 實作,那我怎麼判斷結果有沒有資料啊? 你會說,但是user輸入的是BIG5啊?別擔心,browser早就幫你解決這個問題了。 只要你用response.setContentType("text/html;charset=UTF-8");接下來雖然 你輸入的是big5,但是當browser送出來的時候,它就會根據charset來作編碼轉換。 這樣我們再設request.setCharacterEncoding("UTF-8");然後你用getParameter 時它就會把UTF-8轉成真正的unicode。 這個就是系統的美妙之處了,當你在簡體的系統上看同樣的page時,因為文件的 內容Java已經幫你從unicode轉成UTF-8了,所以你還是可以看到繁體字,而你在 reply這篇文章時雖然用的是GB,但是當從browser送出來的時候,它又轉成UTF-8 了,然後我們的程式一樣處理,當你回到繁體系統來看,又可以看到剛剛發的 簡體的reply。 如果你在英文的系統下,想要copy一篇中文文章進來,絕對不能用BIG5直接貼, 因為這時系統的default encoding不對,轉碼會錯。這時你要先用browser先把 文章讀出來,把"中文字"(不是BIG5碼)copy,貼進來。因為當你在browser裡面 看到中文字時,這個中文字已經是用unicode在顯示了。 所以這個解決方案才能真正做到: "所見即所得"。也就是說,只要你看得到你 輸入的東西,你就可以看到你想要的輸出結果。這也就是你在英文環境下,貼 BIG5的"亂碼",這個程式也會回big5的"亂碼"給你的原因。 Unicode是Java一個對國際化/本土化很好的支援,我們要好好利用這個優點, 做出以前想都沒辦法想的軟體。LinuxFab雖然可以顯示繁體與簡體,但我若是 大陸的使用者,沒看到"簡繁"那小小的兩個字,而在繁體的網頁輸入了簡體呢? 會有問題。除了用unicode,其他解決的方法都會很複雜,現在Java對server side的國際化支援算是完整了(1.3之前沒有request.setCharaterEncoding(), 總是礙手礙腳),希望大家不要在把unicode當成是不如php, perl的缺點,東 拼西湊的湊到可以顯示中文;把精力放在程式本身,而不是轉碼上。 台灣用Java的人還是不多,尤其是企業;理由不外是performance, 穩定性。 但是你如果知道美國的嘉信理財(我工作的公司),擁有全世界最強大的商用 超級電腦,我們的程式已經有大約20-30%轉換成Java,轉換的工作還在繼續 中,那你會怎麼想?Server side的Java有絕大多數CGI無法比擬的優點:Thread 執行序,在只比較一個request的時候,CGI會佔優勢,但是當成百上千個 request來的時候,Thread的優勢就會出來。我們公司也是在比較過兩者的 表現之後,才決定進行CGI到Java的轉換的。 我的工作是把這些Java的功能加以中文化來提供給住在美國的華裔,對於Java 中文化的問題已經研究了快兩年了,期間碰過不少問題,幸而跟我們合作的IBM 對於我們提出的問題都能迅速改進,所以我還能保住我的工作。其實這些問題, 在apache, tomcat等等的開放原始碼都已經解決了,我真的不得不佩服這些熱 心的人。所以每次我的問題提出來之後,都還會附加:Tomcat不會有這個問題。 我想這多少也刺激他們迅速的改進。 |
本站聲明 |
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。 2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。 3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇! |