
火車(chē)采集器
v9.8內(nèi)容介紹下載地址相關(guān)文章網(wǎng)友評(píng)論
火車(chē)采集器(LocoySpider) 是一個(gè)供各大主流文章系統(tǒng),論壇系統(tǒng)等使用的多線(xiàn)程內(nèi)容采集發(fā)布程序,使用火車(chē)采集器,你可以瞬間建立一個(gè)擁有龐大內(nèi)容的網(wǎng)站,
火車(chē)采集器(LocoySpider)是一款功能強(qiáng)大且易于上手的專(zhuān)業(yè)采集軟件,強(qiáng)大的內(nèi)容采集和數(shù)據(jù)導(dǎo)入功能能將您采集的任何網(wǎng)頁(yè)數(shù)據(jù)發(fā)布到遠(yuǎn)程服務(wù)器,自定義用戶(hù)cms系統(tǒng)模塊,不管你的網(wǎng)站是什么系統(tǒng),都有可能使用上火車(chē)采集器,系統(tǒng)自帶的模塊文件支持:風(fēng)訊文章,動(dòng)易文章,動(dòng)網(wǎng)論壇,PHPWIND論壇,Discuz論壇,phpcms文章,phparticle文章,LeadBBS論壇,魔力論壇,Dedecms文章,Xydw文章,驚云文章等的模塊文件。更多cms模塊請(qǐng)自己參照制作修改,也可到官方網(wǎng)站與大家交流制作。 同時(shí)您也可以使用系統(tǒng)的數(shù)據(jù)導(dǎo)出功能,利用系統(tǒng)內(nèi)置標(biāo)簽,將采集到的數(shù)據(jù)對(duì)應(yīng)表的字段導(dǎo)出到本地任何一款A(yù)ccess,SQLite,MySql,MS SqlServer內(nèi)。
軟件功能強(qiáng)大且易于上手的專(zhuān)業(yè)的互聯(lián)網(wǎng)數(shù)據(jù)抓取、處理、分析,挖掘軟件,強(qiáng)大的內(nèi)容采集和數(shù)據(jù)導(dǎo)入功能能將您采集的任何網(wǎng)頁(yè)數(shù)據(jù)發(fā)布到遠(yuǎn)程服務(wù)器?;疖?chē)頭采集器可以靈活迅速地抓取網(wǎng)頁(yè)上散亂分布的數(shù)據(jù)信息,并通過(guò)一系列的分析處理,準(zhǔn)確挖掘出所需數(shù)據(jù)。火車(chē)采集器歷經(jīng)十年的升級(jí)更新,積累了大量用戶(hù)和良好口碑,是目前最受歡迎的網(wǎng)頁(yè)數(shù)據(jù)采集軟件。采集不限網(wǎng)頁(yè),不限內(nèi)容,支持多種擴(kuò)展,打破操作局限。采什么,如何采,都由您決定!
軟件對(duì)比
火車(chē)頭采集器和八爪魚(yú)采集器哪個(gè)好用?
1.火車(chē)頭采集器是一款互聯(lián)網(wǎng)數(shù)據(jù)抓取、處理、分析,挖掘軟件,可以抓取網(wǎng)頁(yè)上散亂分布的數(shù)據(jù)信息,并通過(guò)一系列的分析處理,準(zhǔn)確挖掘出所需數(shù)據(jù)。火車(chē)頭采集器特點(diǎn)是采集不限網(wǎng)頁(yè),不限內(nèi)容,采用分布式采集系統(tǒng),效率較高?;疖?chē)頭采集器支持PHP和C#插件擴(kuò)展,方便修改處理數(shù)據(jù)。
2.八爪魚(yú)采集器是一款網(wǎng)頁(yè)采集軟件,可以從不同的網(wǎng)站獲取規(guī)范化數(shù)據(jù),幫助客戶(hù)實(shí)現(xiàn)數(shù)據(jù)自動(dòng)化采集,編輯規(guī)范化,從而降低成本,提高效率。八爪魚(yú)采集器的特點(diǎn)是容易上手,完全可視化圖形操作。八爪魚(yú)內(nèi)置可擴(kuò)展的OCR接口,支持解析圖片中的文字。八爪魚(yú)采集任務(wù)可以自動(dòng)運(yùn)行,可以按照指定的周期自動(dòng)采集。
綜上兩款采集器都有其各自?xún)?yōu)點(diǎn),用戶(hù)可根據(jù)自身使用習(xí)慣進(jìn)行選擇下載。
軟件功能
1、Web發(fā)布配置管理
2、任務(wù)運(yùn)行日志查看器
3、任務(wù)設(shè)置批量復(fù)制
4、數(shù)據(jù)庫(kù)入庫(kù)配置管理
5、簡(jiǎn)易驗(yàn)證碼識(shí)別系統(tǒng)
6、獲取源代碼、http模擬提交工具
安裝方法
1、在本站下載火車(chē)頭采集器后,在電腦本地得到一個(gè)壓縮包,解壓后,雙擊.exe文件進(jìn)入軟件安裝界面,點(diǎn)擊【下一步】繼續(xù)。
2、進(jìn)入火車(chē)頭采集器安裝協(xié)議界面,您可以先閱讀軟件安裝協(xié)議中的條款,閱讀完成后點(diǎn)擊【我接受】然后點(diǎn)擊【下一步】繼續(xù)。
3、選擇火車(chē)頭采集器安裝位置,您可以點(diǎn)擊【安裝】,軟件會(huì)默認(rèn)安裝,或者您可以點(diǎn)擊【瀏覽】在打開(kāi)的安裝位置界面中,您可以自行選擇軟件安裝位置,選擇完成后點(diǎn)擊【安裝】。
4、火車(chē)頭采集器正在安裝中,您需要耐心等待軟件安裝完成就可以了。
5、火車(chē)頭采集器安裝完成,點(diǎn)擊【完成】退出軟件安裝。
使用方法
1.在程序主界面中,點(diǎn)擊“新建”下拉箭頭,從中選擇“任務(wù)”項(xiàng)。
2.在彈出的窗口中,輸入“任務(wù)名”,同時(shí)點(diǎn)擊“起始網(wǎng)址”欄目右側(cè)的“添加”按鈕。
3.接下來(lái)就極為重要的一步,就是對(duì)要進(jìn)行采集的網(wǎng)站進(jìn)行分板,對(duì)所采取的網(wǎng)站中各片文章的URL進(jìn)行綜合分析并找出規(guī)律,最后按如圖進(jìn)行填寫(xiě)。
4.然后切換至“第二步:采集內(nèi)容規(guī)則”選項(xiàng)卡中,我們需要對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行分板。在此以“搜狗瀏覽器”為例,右擊要進(jìn)行分析的網(wǎng)頁(yè),從彈出的菜單中選擇“審查元素”項(xiàng)。
5.在“開(kāi)發(fā)式模式”界面中,點(diǎn)擊“選擇頁(yè)面中的一個(gè)元素去透,視”按鈕,接著點(diǎn)擊“標(biāo)題”內(nèi)容,此時(shí)就可以在“開(kāi)發(fā)者”窗口中顯示標(biāo)題所對(duì)應(yīng)的標(biāo)簽,此例為“h2"。
6.接下來(lái)在”采集內(nèi)容規(guī)則“界面中,點(diǎn)擊“添加”按鈕來(lái)添加“標(biāo)題”項(xiàng),或者直接雙擊“標(biāo)題”項(xiàng)進(jìn)行修改。在彈出的界面中,勾選”前后截取“,將設(shè)置前后輟分別為"“、”".
7.利用同樣的方法添加其它采集內(nèi)容的規(guī)則。切換至“第三步:發(fā)布內(nèi)容設(shè)置”選項(xiàng)卡,勾選“啟用 方式二”,并進(jìn)行設(shè)置。
8.最后從任務(wù)列表中,勾選要采集的內(nèi)容,點(diǎn)擊“開(kāi)始”按鈕就可以按規(guī)則采集網(wǎng)站中的網(wǎng)頁(yè)內(nèi)容啦。
常見(jiàn)問(wèn)題
火車(chē)頭采集器怎么采集圖片?
1.我們現(xiàn)在以采集同順商城http://www.tongshun88.com的圖片為例,首先復(fù)制網(wǎng)址打開(kāi)同順商城。選擇一類(lèi)你要采集的圖片,你可以選擇下面任意你喜歡的一類(lèi)圖片作為圖片采集對(duì)象(我就以同順商城的衣帽服飾欄為例)
2.新建任務(wù),編輯采集網(wǎng)址規(guī)則。
3.【同順商城】的【衣帽服飾】商品產(chǎn)品頁(yè)一共2421頁(yè),由于時(shí)間關(guān)系,我現(xiàn)在只采集前5頁(yè)的圖片。在火車(chē)頭批量添加前5也的起始網(wǎng)頁(yè)網(wǎng)址:
4.打開(kāi)剛剛添加的5個(gè)起始網(wǎng)頁(yè)網(wǎng)址,右鍵,查看源代碼。在源代碼中找到能標(biāo)示商品鏈接的首和尾,確定好采集網(wǎng)址規(guī)則。
5.保存所有的采集規(guī)則,測(cè)試采集,確定采集網(wǎng)址無(wú)誤,進(jìn)行下一步操作。
6.編輯采集內(nèi)容規(guī)則。因?yàn)槭遣杉瘓D片,所以我們只需要編輯采集內(nèi)容的的規(guī)則就行了。
7.采集內(nèi)容規(guī)則如下設(shè)置:
8.勾選下載圖片和圖片保存路徑,保存。
9.發(fā)布內(nèi)容設(shè)置,保存,所以得設(shè)置完畢,開(kāi)始采集!
10.在火車(chē)頭采集器的【date】文件夾內(nèi)可以找到采集到的所有圖片。
下載地址
火車(chē)采集器
相關(guān)文章
網(wǎng)友評(píng)論
共0條評(píng)論本周最熱本周最新