服務內(nèi)容全部包含:
國內(nèi)網(wǎng)站(網(wǎng)頁):文檔、圖片等數(shù)據(jù)抓取,一些指定網(wǎng)站公開數(shù)據(jù)(必須是公開的),存儲到excel
簡單的程序代做(期末大作業(yè)等等)
服務優(yōu)勢:
編程能力:熟練掌握 Python語言,具備良好的編碼習慣和代碼質(zhì)量意識
爬蟲技術(shù):熟練掌握Requests、DrssionPage 等爬蟲框架工具,能夠靈活運用。
數(shù)據(jù)提取優(yōu)化:熟悉 Xpath ,正則表達式等提取技術(shù)。
數(shù)據(jù)存儲:熟悉excel的數(shù)據(jù)存儲技術(shù)
服務前需客戶提供的信息:
需要爬取的網(wǎng)站,需要爬取的具體內(nèi)容,爬取的數(shù)據(jù)量,以及需要將數(shù)據(jù)信息的存儲方式。如:爬取的招聘網(wǎng)站,爬取職位,多少條數(shù)據(jù),存儲到excel中,分析某個城市中特定職業(yè)的薪資水平;
其他:
盡量把具體要求說明白,我能做的到就會盡快做,做不到的你也可以找別人,大家都不用浪費時間
文本數(shù)據(jù)可視化統(tǒng)計數(shù)據(jù)可視化關(guān)系數(shù)據(jù)可視化