火車頭采集v9圖文教程
火車頭采集v9圖文教程,基礎小白的話可以多參考圖片。在使用火車頭采集器之前你需要有基本的HTML基礎,能看得懂網頁源碼,網頁結構。 同時如果用到web發布或數據庫發布,則對自己文章系統及數據存儲結構要非常了解。 如果您相關基礎薄弱,則需要花費更多的時間學習相關知識并多看才可以掌握程序的使用。小白如果沒有更多的時間或者基礎相當薄弱可以使用更簡單的采集器詳細如圖,只需要鼠標點幾下?。。。?/span>
1. html基礎 了解網頁的基本知識,幫助分析網頁結構
2. 正則表達式的使用
3. Http協議的相關知識 Http請求抓包的方法
4. Access,Mysql,Sqlserver,Sqlite,Oracle,Mongo數據庫的使用
5. 代理服務器,FTP服務器相關知識
6. 常見的SQL語句
7. 插件需要PHP或C#編程功底的支持
8. Apache或IIS服務器架設,網站的安裝
Web在線發布
①打開Web發布配置
②選擇發布模塊
③對發布模塊 編輯,新建,刪除,導入,導出 操作
④網頁編碼:與要發布的網站編碼,保持一致
⑤全局變量:可以在發布模塊中所有位置使用,方便設置和修改某些參數。
⑥網站地址:一般指網站域名,實際操作中根據發布模塊里的地址做實際調整,
需和模塊里的地址組合成一個完整的絕對地址
⑦登錄方式:分3種,內置瀏覽器登錄,數據包登錄,不登錄。
內置瀏覽器登錄:獲取瀏覽器標識和用戶信息。
數據包登錄:填寫用戶名,密碼以及獲取到的驗證碼后登錄。
此種方法需要發布模塊里 `網站自動登錄` 有對應設置。
不登錄:一般對接不需要登錄,或者免登陸發布接口使用。
⑧獲取列表:可刷新出欄目ID 和欄目名稱。需要發布模塊里 獲取欄目列表 有對應設置
⑨Web發布配置列表:管理所有的Web發布配置
具體的發布模塊制作教程,請參考后續視頻教程
其他
分析查看源代碼,分析得到:
主題內容開始字符串為id="postmessage_649823"> 因為不同的帖子,ID不同,
所以我們把649823這個數字設置為(*)通配符.
即開頭字符串為id="postmessage_(*)">
結尾字符串為</td></tr></table>
然后勾選下圖中的循環匹配,即可實現主題和回復的內容采集。
147SEO » 火車頭采集v9圖文教程