火車頭采集器破解版(又名火車采集器)是一款可以采集互聯網上任意網站的輔助工具,功能強大的網絡數據/信息挖掘軟件,它的功能真的十分強大,可以采集任何信息,并且可以把采集的文件保存在本地、數據庫、網站發布等等,是信息采集人員和站長必備的一款工具。
火車頭采集器破解版亮點:
程序支持遠程下載圖片文件,支持網站登錄后的信息獲取,檢測文件的真實地址,支持代理,支持防盜鏈的收集,支持收集數據直接入庫,模仿人工發布等多種功能特征。
列車收集器支持從任何類型的網站收集所需的信息,如各種新聞網站、論壇、電子商務網站、求職招聘網站等。
同時具有強大的網站登錄采集、多頁和分頁采集、網站跨層采集、POST采集、腳本頁采集、動態頁采集等高級采集功能。
強大的php和c#插件支持,通過二次開發可以實現更強大的功能。
幾乎所有網頁都能采集
無論什么語言,
無論什么編碼。
速度是普通采集器的7倍
火車采集器采用頂級系統配置,
反復優化性能,讓采集速度快到飛起來!
和復制/粘貼一樣準確
采集/發布如同復制/粘貼一樣精準,
用戶要的全都是精髓,怎能有遺漏!
網頁采集的代名詞
獨具十年歷練,成就業界領先品牌,
想到網頁采集,就想到火車采集器!
火車頭采集器軟件特色
1.通用性強。
無論是新聞、論壇、視頻、黃頁、圖片、下載類網站,只要通過瀏覽器可以看到的結構化內容,指定匹配規則,就可以收集必要的內容。
2.穩定高效。
五年磨一劍,軟件不斷更新進步,采集速度快,性能穩定,占有資源少。
3、擴展性強,適用范圍廣。
定制網站發布,定制主流數據庫的保存和發布,定制本地php和.net外部編程接口處理數據,使數據能夠為您使用。
火車頭采集器功能介紹:
1.新建分組
新建一個任務分組,選擇所屬分組,確定分組名稱和備注。
2.新建任務
確定所屬分組,新建一個任務,填寫任務名稱并保存。
3.Web發布配置
Web發布配置定義了如何登陸一個網站以及向該網站提交數據。
主要涉及到登錄信息的獲取,網站編碼設定,欄目列表的獲取,以及使用數據測試發布效果。
4.Web發布模塊
可以定義網站登錄,獲取欄目列表,獲取網頁隨機值,內容發布參數,以及上傳文件,構造發布數據等高級功能。
5.數據庫發布配置
數據庫發布配置定義了數據庫鏈接信息的設置以及數據庫模塊的選擇。
6.數據庫發布模塊
用于編輯數據庫的發布模塊,方便我們將數據發布到配置好的數據庫中。
火車采集器可選mysql、sqlserver、oracle、access四種數據庫類型,在文本輸入框中填寫sql語句
(需有數據庫相關知識),并可使用標簽替換相應數據。也可在采集器模塊文件夾中加載某一模塊進行編輯。
7.計劃任務
設置列表中采集任務的啟動計劃,可每間隔、每天、每周、僅一次、或自定義Cron表達式,
(Cron表達式的寫法可參考相關術語中的介紹)。保存設置后,任務即可按照設置執行。
8.插件管理
插件是可以用來擴展火車采集器功能的程序
火車采集器V9支持PHP源碼、C#源碼、C#類庫三種類型的插件,
可用于擴展http請求、內容處理和文件下載的功能,并可以分別進行測試。
9.http二級代理
網絡中的服務器,可以讓網絡用戶去取得所需要的網絡信息。
代理的功能有可以突破自身ip的訪問限制訪問國外站點,訪問一些單位或團體內部資源,
突破電信的ip封鎖和隱藏真實的ip等。
火車采集器V9支持http代理、socket4和socket5代理。
10.http模擬請求
可以設置如何發起一個http請求,包括設置請求信息,返回頭信息。并具有自動提交的功能。
基本功能
1、規則定制-通過收集規則定義,可以搜索所有網站收集大部分類型的信息。
2、多任務,多線程-可以同時進行多個信息獲取任務,每個任務可以使用多個線程。
3、所見即所得-任務收集過程所見即所得,過程中經歷的鏈接信息、收集信息、錯誤信息等立即反映在軟件界面上。
4、數據保存-數據一邊收集一邊自動保存在相關數據庫中,數據結構可以自動適應,軟件可以根據收集規則自動制作數據庫,其中的表格和字段也可以通過導向庫靈活地將數據保存在客戶現有的數據庫結構中。
5、斷點連續采集-信息采集任務停止后,可以從斷點繼續采集,從此不用擔心你的采集任務意外中斷。
6、網站注冊-支持網站Cookie,支持網站可視化注冊,注冊時需要驗證代碼的網站也可以收集。
7.計劃任務-通過該功能,您的收集任務可以定期、定量或循環執行。
8、采集范圍限制-可根據采集深度和網站標志限制采集范圍。
9、文件下載-可以將收集的二進制文件(圖像、音樂、軟件、文件等)下載到當地磁盤或收集結果數據庫。
10、結果更換-可以根據規則將收集的結果更換為定義的內容。
11、條件保存-可根據某些條件確定那些信息保存,那些信息過濾。
12.過濾重復內容-軟件可以根據用戶的設定和實際情況自動刪除重復內容和重復網站。
13.特殊鏈接識別-使用該功能,可以識別使用JavaScript動態生成的鏈接或其他更奇怪的鏈接。
14.數據發布-可以通過定制接口將收集的結果數據發布到任何內容管理系統和指定數據庫。目前支持的目標發布媒體包括數據庫、sqlserver、mysql、oracle、靜態htm文件。
15、預約編程接口-定義多個編程接口,用戶可以在事件中利用PHP、C#語言進行編程,擴大收集功能。
特色功能。
1.支持所有站點代碼:完美支持收集所有代碼格式的站點,程序可以自動識別站點代碼。
2、多種發布方式:支持當前所有主流和非主流的CMS、BBS等網站程序,通過系統發布模塊可以實現收集器和網站程序之間的完美結合。
3、全自動:無人值守工作,配置程序后,程序根據您的設置自動運行,完全不需要人工干預。
4、當地編輯:當地可視化編輯收集的數據。
5、采集測試:這與其他類似的收集軟件無法比擬。程序支持直接檢查收集結果并測試發布。
6、管理方便:使用網站+任務方式管理收集節點,任務支持批量操作,更多的數據管理也很簡單。
注意:安裝火車采集器,要求電腦安裝.NET4.0框架,下載地址:NET4.8下載|.NET Framework 4.8中文版安裝包