處理全形標點符號時發生問題 |
尚未結案
|
ENIX007
高階會員 發表:28 回覆:274 積分:185 註冊:2003-11-27 發送簡訊給我 |
首先感謝ddy小青蛙副站
< href="http://delphi.ktop.com.tw/topic.php?topic_id=39006">http://delphi.ktop.com.tw/topic.php?topic_id=39006
最近寫了一個處理字串的小工具,能讀進任意文章,將其製成字庫檔
所謂字庫定義為每一個字只出現一次,因此重複字需刪除,標點符號也須刪除
小弟已完成,不過製作過程中發現了一個問題
小弟測試時,總是從網路任意抓取片段文字(含標點)下來,將其作成字庫,
利用ddy小青蛙副站將標點寫成集合的方法如下:
AnsiString point; point = "\/,。:﹔;?!「」『』-.”’、"; //列舉可能出現的標點符號請注意底線部份,為什麼需要定義2個分號呢? 由於這段Source Code是我Keyin來的,我是使用微軟新注音全形 Key出來的是前面那個分號(請注意以全形字來說(2bytes)它比較偏左) 結果從網路取得的文章,執行完程式後,發現分號沒消除!! 因此我只好從該文章複製其分號,再貼上我的Source Code,形成第2個分號, 這樣才抓取成功 因此想請教各位看官,如 >,之前都是使用 > 麻煩有研究的大大解惑囉~~謝謝< > 程式迷人之處,在於邏輯思考,然而卻也是惱人之處~~
------
程式迷人之處,在於邏輯思考,然而卻也是惱人之處~~ |
本站聲明 |
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。 2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。 3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇! |