织梦php 文章采集规则,织梦输入网址采集单个网页功能发布 不需要写采集规则一键采集...
夢搏網絡一鍵采集不需要寫采集規則,系統自動識別文章正文內容和標題,現已經集成到織夢cms,使用織夢cms的站長有福了,完全可以替換織夢后臺自帶的“輸入網址采集單個網頁>>”的功能,首先分析對比下織夢系統自帶的“輸入網址采集單個網頁>>”和夢搏網絡一鍵采集有什么區別?
1、織夢自帶的“輸入網址采集單個網頁>>”需要在采集前些每個采集網站的采集規則,而且如果采集網頁布局不同也無法公用,這樣就導致了,采集網頁非常麻煩,還有很多站長并不會寫規則,這樣也就無法使用這個采集單個網頁的功能,編輯發布文章都需要復制標題,在復制內容來人工發布。
2、夢搏網絡一鍵采集主要功能是,改善織夢自帶的“輸入網址采集單個網頁>>”改善之后,只要輸入網址就可以采集,支持95%以上的網頁,尤其是文章類型的網站,不需要寫采集規則,采集前不需要寫規則,一切都是系統自動完成。采集的字段包含:標題、縮略圖、簡介描述、文章正文內容。
下面看下如何修改,只需要在系統的兩個文件上面加幾行代碼就可以,絕不影響系統以后升級。
打開織夢cms的后臺目錄文章發布文件,默認是:dede/aticle_add.php?和?dede/templets/aticle_add.htm
dede/aticle_add.php增加如下代碼/獲取文章最大id以確定當前權重
$maxWright = $dsql->GetOne("SELECT COUNT(*) AS cc FROM #@__archives");
//新增加夢搏網絡一鍵采集
$url="http://api.sinmeng.net/api/caiji/caiji.php?url={$_GET[url]}{$posturl}&key=你的key";
$caiji=json_decode(file_get_contents($url));
$caiji_lead_image_url= mb_convert_encoding($caiji->{'lead_image_url'},'gbk','utf-8');//圖片
$caiji_word_count= mb_convert_encoding($caiji->{'word_count'},'gbk','utf-8');//字數
$caiji_title= mb_convert_encoding($caiji->{'title'},'gbk','utf-8');//標題
$caiji_content= mb_convert_encoding($caiji->{'content'},'gbk','utf-8');//內容
$caiji_description=preg_replace("//si","",$caiji_content);//過濾html標簽
$caiji_description = mb_substr($caiji_description,0,80,'gbk');//簡介
//
include DedeInclude("templets/article_add.htm");
dede/templets/aticle_add.htm?文件修改如下代碼
?采集單個網頁-URL:?文章標題: ?縮 略 圖:| ?內容摘要: | <?php echo $description.$caiji_description; ?> | GetEditor("body",$body.$caiji_content,450); ?> |
代碼中http://api.sinmeng.net/api/caiji/caiji.php?url={$_GET[url]}{$posturl}&key=你的key?請聯系http://www.sinmeng.net/?獲取你的key
總結
以上是生活随笔為你收集整理的织梦php 文章采集规则,织梦输入网址采集单个网页功能发布 不需要写采集规则一键采集...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HP服务器固件升级(ILO及bios升级
- 下一篇: php采集规则编写,织梦dedecms图