不管你是待業(yè)還是失業(yè),在這個被互聯(lián)網(wǎng)圍繞的時代里,選擇python爬蟲和php爬蟲,就多了一項技能,還怕找不到工作?,還怕不好找工作?小編就來告訴你這個專業(yè)的優(yōu)勢到底體現(xiàn)在哪里:整理java,python,php各自爬蟲的寫法??。
1.整理java,python,php各自爬蟲的寫法
最近被面試官問:會不會寫爬蟲?我覺得我會用java,python,php三種語言寫法java/** * Http get請求 * @param httpUrl 連接 * @return 響應(yīng)數(shù)據(jù) */ public static String doGet(String httpUrl){ //鏈接 = null; is = null; br = null; result = new (); try { //創(chuàng)建連接 URL url = new URL(httpUrl); = () url.(); //設(shè)置請求方式 .("GET"); //設(shè)置連接超時時間 .(15000); //開始連接 .connect(); //獲取響應(yīng)數(shù)據(jù) if (.() == 200) { //獲取返回的數(shù)據(jù) is = .(); if (null != is) { br = new (new (is, "utf8")); String temp = null; while (null != (temp = br.readLine())) { result.append(temp); } } } } catch ( e) { e.(); } finally { if (null != br) { try { br.close(); } catch ( e) { e.(); } } if (null != is) { try { is.close(); } catch ( e) { e.(); } } //關(guān)閉遠(yuǎn)程連接 .(); } return result.toString(); } public static void main(String[] args) { String url = " String s = doGet(url); String p1 = ".*\\
.*?)\"\\>.*salary\"\\>(?.*?)\\<\\/span\\>.*\"text-city\" href\\=\".*\"\\>(?.*?)\\<\\/p\\>" +
".*\\.*?)\" title=\"(?.*?)\" target\\=\"_blank\"\\>" +
".*\\(?.*?)\\<\\/div\\>.*";
Pattern r1 = Pattern.compile(p1);
Matcher matcher = r1.matcher(s);
while (matcher.find()){
String jobname = matcher.group("jobname");
String salary = matcher.group("salary");
String address = matcher.group("address");
String comlink = matcher.group("comlink");
String comname = matcher.group("comname");
String content = matcher.group("content");
}
}php$url = "
$con = file_get_contents($url);
$reg = ".*.*salary\"\\>(.*?)\\<\\/span\\>.*\"text-city\" href\\=\".*\"\\>(.*?)\\<\\/p\\>" +
".*\\" +
".*\\(.*?)\\<\\/div\\>.*";
$result = preg_match_all($reg,$con,$match_result);
var_dump($match_result);_url = '
headers={"User-Agent":""}
postdata=urllib.parse.urlencode(data).encode('utf-8')
req=urllib.request.Request(url=base_url,headers=headers,data=postdata,method='POST')
response=urllib.request.urlopen(req).read()
html=response.decode()
results1 = re.findall('.*?(\d+).*?就拿大數(shù)據(jù)說話,優(yōu)勢一目了然,從事IT行業(yè),打開IT行業(yè)的新大門,找到適合自己的培訓(xùn)機構(gòu),進(jìn)行專業(yè)和系統(tǒng)的學(xué)習(xí)。
本文由 全國python學(xué)習(xí)中心 整理發(fā)布。更多培訓(xùn)課程,學(xué)習(xí)資訊,課程優(yōu)惠,課程開班,學(xué)校地址等學(xué)校信息,可以留下你的聯(lián)系方式,讓課程老師跟你詳細(xì)解答:
咨詢電話:400-850-8622
相關(guān)文章
python爬蟲的編寫,Python如何編寫爬蟲程序,附高級爬蟲實現(xiàn)思路
python3爬蟲一,python3爬蟲爬取視頻(一)
python的爬蟲程序,Python如何編寫爬蟲程序,附高級爬蟲實現(xiàn)思路
python爬蟲的,Python 爬蟲工具
python網(wǎng)絡(luò)爬蟲入門,20天學(xué)會Python爬蟲:*課-初識爬蟲
python什么寫爬蟲,python 怎么寫爬蟲
python爬蟲解析,Python爬蟲原理解析
python爬蟲入門6,Python爬蟲實戰(zhàn)入門六:提高爬蟲效率—并發(fā)爬取智聯(lián)招聘
python爬蟲基礎(chǔ)教程,Python 爬蟲工具
.*salary\"\\>(.*?)\\<\\/span\\>.*\"text-city\" href\\=\".*\"\\>(.*?)\\<\\/p\\>" +
".*\\" +
".*\\(.*?)\\<\\/div\\>.*";
$result = preg_match_all($reg,$con,$match_result);
var_dump($match_result);_url = '
headers={"User-Agent":""}
postdata=urllib.parse.urlencode(data).encode('utf-8')
req=urllib.request.Request(url=base_url,headers=headers,data=postdata,method='POST')
response=urllib.request.urlopen(req).read()
html=response.decode()
results1 = re.findall('.*?(\d+).*?就拿大數(shù)據(jù)說話,優(yōu)勢一目了然,從事IT行業(yè),打開IT行業(yè)的新大門,找到適合自己的培訓(xùn)機構(gòu),進(jìn)行專業(yè)和系統(tǒng)的學(xué)習(xí)。
本文由 全國python學(xué)習(xí)中心 整理發(fā)布。更多培訓(xùn)課程,學(xué)習(xí)資訊,課程優(yōu)惠,課程開班,學(xué)校地址等學(xué)校信息,可以留下你的聯(lián)系方式,讓課程老師跟你詳細(xì)解答:
咨詢電話:400-850-8622
相關(guān)文章
python爬蟲的編寫,Python如何編寫爬蟲程序,附高級爬蟲實現(xiàn)思路
python3爬蟲一,python3爬蟲爬取視頻(一)
python的爬蟲程序,Python如何編寫爬蟲程序,附高級爬蟲實現(xiàn)思路
python爬蟲的,Python 爬蟲工具
python網(wǎng)絡(luò)爬蟲入門,20天學(xué)會Python爬蟲:*課-初識爬蟲
python什么寫爬蟲,python 怎么寫爬蟲
python爬蟲解析,Python爬蟲原理解析
python爬蟲入門6,Python爬蟲實戰(zhàn)入門六:提高爬蟲效率—并發(fā)爬取智聯(lián)招聘
python爬蟲基礎(chǔ)教程,Python 爬蟲工具
就拿大數(shù)據(jù)說話,優(yōu)勢一目了然,從事IT行業(yè),打開IT行業(yè)的新大門,找到適合自己的培訓(xùn)機構(gòu),進(jìn)行專業(yè)和系統(tǒng)的學(xué)習(xí)。
本文由 全國python學(xué)習(xí)中心 整理發(fā)布。更多培訓(xùn)課程,學(xué)習(xí)資訊,課程優(yōu)惠,課程開班,學(xué)校地址等學(xué)校信息,可以留下你的聯(lián)系方式,讓課程老師跟你詳細(xì)解答:
咨詢電話:400-850-8622