火車采集器/火車頭采集器v9破解版是一款非常強大的網頁信息采集軟件,通過靈活的配置,我們可以輕松的抓去網頁上的文字、圖片等任何信息資源,是近幾年來十分流行的采集系統,為網絡用戶大批量采集網頁帶來了很大的便利。
火車頭采集器軟件功能:
程序流程支持遠程管理圖片文件,支持網站登錄后的信息獲得,支持檢測文檔真正詳細地址,支持代理,支持防盜鏈的采集,支持采集數據信息立即進庫和效仿人手工制作公布等很多功能特性。
列車采集器支持從一切種類的網站采集獲得您所必須的信息,如各種各樣新聞報道類網站、社區論壇、電商網站、招聘求職網站等。
另外具備強勁的網站登陸采集、多張和分頁查詢的采集、網站跨層采集、POST采集、腳本制作網頁頁面采集、動態性網頁頁面采集等高級采集功能。
強勁的php和c#軟件支持,讓您能夠 根據二次開發完成您所要想的一切更強勁的功能。
火車頭采集器特色:
1、實用性強
不管新聞報道、社區論壇、視頻、企業黃頁、圖片、下載類網址,要是根據電腦瀏覽器能見到的結構型的內容,根據特定配對標準,都能采集到您所必須的內容。
2、平穩、高效率
五年磨一劍,手機軟件不斷創新發展,采集速度更快,性能平穩,占有資源少。
3、可擴展性強、應用領域廣
自定義web公布,自定義流行的數據庫查詢的儲存和公布,自定義當地php及.net外界程序編寫插口解決數據信息,讓數據信息都能給你常用。
火車頭采集器亮點:
1、支持所有網站編碼:完美支持采集所有編碼格式的網頁,程序還可以自動識別網頁編碼。
2、多種發布方式:支持目前所有主流和非主流的CMS,BBS等網站程序,通過系統的發布模塊能實現采集器和網站程序間的完美結合。
3、全自動:無人值守工作,配置好程序后,程序將依據您的設置自動運行,完全無需人工干預。
4、本地編輯:本地可視化編輯已采集的數據。
5、采集測試:這是其它任何同類采集軟件所不能比的,程序支持直接查看采集結果并測試發布。
6、管理方便:使用站點+任務方式管理采集節點,任務支持批量操作,再多的數據管理也很輕松。
基本功能
1、規則自定義 - 通過采集規則的定義,可以搜索所有網站采集幾乎任何類型的信息。
2、多任務,多線程 - 可以同時進行多個信息獲取任務,每個任務可以使用多個線程。
3、所見即所得 - 任務采集過程所見即所得,過程中遍歷的鏈接信息、采集信息、錯誤信息等都會及時的反映在軟件界面中。
4、數據保存 - 數據邊采集邊自動保存到關系數據庫中,并且數據結構能夠自動適應,軟件可以根據采集規則自動創建數據庫,以及其中的表和字段,也可以通過導庫方式靈活的將數據保存到客戶已有的數據庫結構中。
5、斷點續采 - 信息收集任務可以在停止后從斷點開始繼續采集,從此你用不再擔心你的采集任務意外中斷了。
6、網站登錄 - 支持網站Cookie,支持網站可視化登錄,即使登錄時需要驗證碼的網站也能采集。
7、計劃任務 - 通過這個功能可以讓你的采集任務定時、定量或者一直循環執行。
8、采集范圍限制 - 可以根據采集的深度和網址的標識來限制采集的范圍。
9、文件下載 - 可以將采集到的二進制文件(諸如:圖片、音樂、軟件、文檔等等)下載到本地磁盤或者采集結果數據庫中。
10、結果替換 - 可以將采集的結果根據規則替換成你定義的內容。
11、條件保存 - 可以根據某個條件來決定那些信息保存,那些信息過濾。
12、過濾重復內容 - 軟件可根據用戶設置和實際情況對重復內容和重復網址自動刪除重復內容。
13、特殊鏈接識別 - 運用此功能可以將用JavaScript動態生成的鏈接或其他更古怪的連接識別出來。
14、數據發布 - 可以通過自定義接口,將已采集的結果數據發布到任意的內容管理系統和指定數據庫中。現在已支持的目標發布媒體包括:數據庫(access, sql server,my sql,oracle) ,靜態htm文件。
15、預留編程接口 - 定義多個編程接口,用戶可以在事件中利用PHP,C#語言進行編程,擴充采集功能。
更新日志:
1: 自動獲取cookie功能優化
2: 數據庫發布增加事務,優化數據庫發布速度
3: 數據轉換速度優化(針對Mysql和SqlServer數據庫的導入), 同時去除網址庫的清空邏輯
4: html標簽處理錯誤問題處理
5: json提取關于數字轉換為科學計數法問題處理
6: 發布測試時,圖片上傳無效的問題處理
7: 采集內容頁處理錯誤時,增加對于當前出錯標簽的提示,以便快速定位出錯標簽
8: 任務批量編輯,增加可操作范圍
9: 循環匹配匹配空格問題處理
10: 刷新分組中增加統計數據的刷新
11: post分頁處理
12: 部分功能邏輯優化