aLing 发表于 2011-2-22 23:20:59

求火车头正则一条 感激不尽啊 真急

采集搜索页的 相关搜索关键词 需要替换链接 由于每个搜索页的相关搜索词都不是固定的 我对变量不是很了解 谁帮帮我

以 http://www.baidu.com/baidu?cl=3&tn=baidutop10&fr=top1000&wd=%CC%A8%CD%E5%D7%EE%C3%C0%D0%D8%B2%BF 为例

开始字符串 <div id="rs"><table cellpadding="0"><tr>
结束字符串 <div id="search">

采集出:<a href="s?wd=%CC%A8%CD%E5%D7%EE%C3%C0%B5%C4%D0%D8%B2%BF&rsp=0&oq=%CC%A8%CD%E5%D7%EE%C3%C0%D0%D8%B2%BF&f=1&tn=baidutop10&rsv_ers=xn0">关键词</a> 
<a href="s?wd=%CC%A8%CD%E5%D7%EE%C3%C0%B5%C4%D0%D8%B2%BF&rsp=0&oq=%CC%A8%CD%E5%D7%EE%C3%C0%D0%D8%B2%BF&f=1&tn=baidutop10&rsv_ers=xn0">关键词2</a> 
<a href="s?wd=%CC%A8%CD%E5%D7%EE%C3%C0%B5%C4%D0%D8%B2%BF&rsp=0&oq=%CC%A8%CD%E5%D7%EE%C3%C0%D0%D8%B2%BF&f=1&tn=baidutop10&rsv_ers=xn0">关键词3</a>其中一段是百度链接 关键词为GBK编码<a href="s?wd=%D7%EE%C3%C0%CF%B4%BD%C5%C3%C3&rsp=6&oq=%CC%A8%CD%E5%D7%EE%C3%C0%D0%D8%B2%BF&f=1&tn=baidutop10&rsv_ers=xn0">关键字</a>我想改成的格式<a href="?s=关键词UTF8编码">关键词</a>
<a href="?s=关键词2UTF8编码">关键词2</a>
<a href="?s=关键词3UTF8编码">关键词3</a>应该怎么写内容替换规则 一般能采集出10个相关的搜索词

[ 本帖最后由 aLing 于 2011-2-23 03:25 编辑 ]

yc260982 发表于 2011-2-22 23:25:42

思路卡带 是啥

aLing 发表于 2011-2-22 23:27:18

回复 2# 的帖子

俗称 短路了

Administrator 发表于 2011-2-22 23:36:58

Administrator 发表于 2011-2-22 23:38:17

Administrator 发表于 2011-2-22 23:42:23

xspoco 发表于 2011-2-23 00:17:52

yc017t A大 偶像啊~

wdlth 发表于 2011-2-23 00:25:28

用正则表达式

eudx 发表于 2011-2-23 00:40:15

A大绝对的技术大帝
埋头学习ING

大飞机 发表于 2011-2-23 00:45:20

牛逼。。啥都搞。。
页: [1] 2
查看完整版本: 求火车头正则一条 感激不尽啊 真急