全國最多中醫師線上諮詢網站-台灣中醫網
發文 回覆 瀏覽次數:1904
推到 Plurk!
推到 Facebook!

如何用IdHTTP下載原始檔~IHTMLDocument去接在來做處理

尚未結案
ddtddt55
一般會員


發表:7
回覆:3
積分:2
註冊:2004-05-20

發送簡訊給我
#1 引用回覆 回覆 發表時間:2004-12-25 04:29:54 IP:218.162.xxx.xxx 未訂閱
如題~~ 我原本是利用CppWebBrowser去下載的,但事實上我需要的只是網頁原始檔的文字而已,但是利用CppWebBrowse下的話,還圖片、廣告..等等都要下,因為我要很多網頁,所以CPU Load很重,寫成Thread幫助也不是很大 所以想請問一下如何用IdHTTP下載原始檔~IHTMLDocument去接在來做處理 謝謝
rogan321
高階會員


發表:21
回覆:307
積分:200
註冊:2003-05-15

發送簡訊給我
#2 引用回覆 回覆 發表時間:2004-12-25 05:24:35 IP:203.204.xxx.xxx 未訂閱
砍網頁是吧~ 建議你可抓UNIX環境下的一隻砍網頁的程式叫"wget"含Sourse code用google找吧~將他重新compile成win版本,你去看他的help,你就會發現他的好用,程式都不用寫了,他可幫你自動filter不要的副檔名又可設定砍網站的深層~你要做的就是利用ShellExecute(..wget...)執行它及設定它的參數以及處理抓下來的網頁!
ddtddt55
一般會員


發表:7
回覆:3
積分:2
註冊:2004-05-20

發送簡訊給我
#3 引用回覆 回覆 發表時間:2004-12-26 19:54:14 IP:218.162.xxx.xxx 未訂閱
To rogan321: 抱歉,可能是我表達的不夠好,所以讓你誤解了我的意思,我並不是要做砍網頁,而是我希望只下載原始檔,關於一些廣告所做的Falsh或其他的..我都不要 例如:PChome新聞,裡面有很多廣告的連結(Falsh、Java Applet..等),這些我都不要,我只要新聞的標題就好了,而這些標題文字就在原始檔裡,所以沒有沒辦法只要原始檔在交給IHTMLDocument處理的辦法,謝謝^^ 很感謝你的回應,讓我又知道了一個工具,雖然這不是我目前要的,但還是很謝謝你^^
Ktop_Robot
站務副站長


發表:0
回覆:3511
積分:0
註冊:2007-04-17

發送簡訊給我
#4 引用回覆 回覆 發表時間:2007-04-18 17:33:23 IP:000.000.xxx.xxx 未訂閱
提問者您好:


以上回應是否已得到滿意的答覆?


若已得到滿意的答覆,請在一週內結案,否則請在一週內回覆還有什麼未盡事宜,不然,
將由版主(尚無版主之區域將由副站長或站長)自由心證,選擇較合適之解答予以結案處理,
被選上之答題者同樣會有加分獎勵同時發問者將受到扣 1 分的處分。不便之處,請見諒。


有問有答有結案,才能有良性的互動,良好的討論環境需要大家共同維護,感謝您的配合。

------
我是機器人,我不接受簡訊.
系統時間:2024-05-16 16:19:49
聯絡我們 | Delphi K.Top討論版
本站聲明
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。
2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。
3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇!