大小:10.3M 語言(yán): 中文
類型:小說閱讀 係統:macOS





本軟件屬於網絡類應(yīng)用軟件,在Windows平台使用的網絡圖片(piàn)爬取工具,主要功能為根據提供的網站地址,分析網頁源碼獲取網站的圖片資源,能夠實現(xiàn)簡單(dān)分類並存儲到數據庫和硬盤中。
(1)本技術需配合SQLServer數據庫使(shǐ)用,請參考附錄安裝SQLServer2008。足球大小球
(2)獲取圖片
在(zài)獲取圖片時,需要用戶自己輸入要抓取的根網址,這裏的根網址需要保證其真實存在,如果不存(cún)在則(zé)會提(tí)示網頁源代(dài)碼獲取失(shī)敗,從而(ér)導致任務啟動失敗。
(3)搜索參數設置(zhì)
在搜索參數設置(zhì)的時候,需要慎重考慮其(qí)各個參數之間的製約關係,有以下幾種情況需(xū)要說明(míng)。
如果搜索深度設置過(guò)大,那麽就需要將抓(zhuā)取數據(jù)容量設置的大一些(xiē),否則任務會因為抓取容量不足而被迫停止抓取工作。
如果能夠保證自己的網絡連接正常,則選(xuǎn)擇不使用代理服務器。因為使用(yòng)代理服務器,在任務執(zhí)行過程中,如果代理服務器失效或者停止活動,則需要重新選擇代理服務器,這(zhè)中間會耗費大量時間來更換代理服務器。
在選擇開始執行時間時,不易將執行時間設置的過長,因為設置(zhì)的過長會使(shǐ)任務長期(qī)處(chù)於等待狀態,建議隻有在任務較少的情況下這樣設(shè)置。
(4)關鍵字管理
在關鍵(jiàn)字管理中,需要注意的是在添加主關鍵字的時候,要同時添加一個與主(zhǔ)關鍵字名字相同的(de)子關鍵字(zì),因為(wéi)在圖片進行分類(lèi)的時(shí)候,首先比對(duì)的是子關(guān)鍵字,隻(zhī)有(yǒu)子關(guān)鍵(jiàn)字匹配之後才能確定其分類歸屬。
另(lìng)外需要注意的是,刪除主關鍵字時會將與其相關的(de)所有子關鍵字一同刪除。
(5)多任務(wù)
鑒於對(duì)任務耗費資源的考慮,同時執行(háng)的任務個數設定為5個(gè),超過5個的任務隻能處於等待狀態(tài),隻有5個(gè)被執行任務中有結束的,處於等待的任務才(cái)能(néng)被(bèi)執行。
万博教务网 aba体育直播 双色球开奖连线 双色球彩币 高飞双色球预测
熱門評論(lùn)
最(zuì)新評論