守望采集器是一個綠色免費的文章數據采集軟件,可用來在網上采集各種數據。支持采集過程斷點續采功能,不受瀏覽器意外關閉影響,重新啟動后不會重復采集。只需要簡單的鼠標復制剪貼即可生成完美的采集規則,無需煩瑣的過程,即便你是新手亦能游刃有余地使用守望采集器采集任何內容!
功能介紹
1、支持文章內容分頁采集;
2、支持論壇采集
3、支持UTF-8轉換到GB2312,可采集內容字符格式為UTF-8的目標;
4、支持把文章內容保存到本地;
5、支持站點+欄目管理方式,使采集管理一目了然;
6、支持文章鏈接替換功能;
7、支持采集器設置無限過濾功能;
8、支持文章內圖片采集保存到本地,自動替換文件名避免重復;
9、支持文章內FLASH文件采集保存到本地;
10、支持限制PHP FOPEN函數功能的虛擬主機;
11、支持采集結果人工篩選,并提供“空標題、空內容”的快速過濾刪除;
12、支持PHPWIND、Discuz論壇導庫,程序包內含2大論壇導庫規則及操作指南說明;
13、支持自定義入庫間隔時間,躲避虛擬主機并發數限制。
守望采集器優點
1、守望程序采用PHP開發支持跨平臺運行,無論Windows還是Unix類操作系統都可運行,是一個高效采集、完美入庫的在線應用軟件。
2、守望不受安裝地點限制,家里、單位電腦、網站服務器都可以;推薦直接安裝在網站服務器上運行,更能體會守望超強功能和方便之處。
3、采用服務器安裝,可將采集的圖片/Flash直接抓取到本機使用;無需像其他采集器采集到個人電腦還要將數據FTP上傳服務器。試想如果您當天采集圖片、Flash超過100M,上傳時間是個什么概念。
4、采用服務器安裝,可快速進行采集內容導入CMS文章系統或BBS論壇系統;若您使用非在線的采集器,遠程入庫或上傳SQL文件來入庫都會浪費時間。
5、守望獨有的斷點續采、重復采集過濾功能,更能節約您制作內容時間。
守望采集器使用教程
主要說下如何導入你的網站,至于怎么編寫采集規則,這個很簡單,這里就不再重復了!
導入原理:主要是利用系統的api函數,模擬打開瀏覽器,自動填寫采集的數據到表單,自動提交。
1.首先設置好你的網站參數,模擬導入不受網站系統、地理位置、編碼方式、網站語言……影響,即可導入任何可以連接的網站,所以本版本新加入dvbbs(動網)、php168、phpcms……導入程式,如果沒有你的網站的導入程式,你可以聯系我幫你寫!
2.經過測試可以導入gb2312、utf-8、big5……編碼的網站,但是big5編碼的網站導入后,可能會有少許亂碼現象(不多)。
3.導入時間間隔,這個參數很重要哦,如果你網站連接速度很慢的話,請設置這個參數哦,本地測試可設置為0。 單位:毫秒(1秒=1000毫秒)
4. 最重要一點了哦:→你必須在IE瀏覽器中登陸你的網站,再執行導入數據!
例如:你的網站(DZ) http://bbs.dz.com
首先啟動IE,連接你的網站,登陸,想用哪個用戶發貼就用哪個用戶登陸一下哦,cookie保存長點,登陸后,別關閉IE,最小化就行了。
然后采集數據,選擇目標,導入數據即可!
- PC官方版
- 安卓官方手機版
- IOS官方手機版