【引言】

最近有點時間,所以想著還是寫點什麼東西吧,比較巧,手上的一個項目快要開發完了,我們團隊針對文章中提到的想法已經進行了實現,近期就會上線,另外我們還圍繞這個命題進行了一系列的擴展工具開發,其中最重要的就要「郵箱自動抓取功能」,當然那個功能屬於商用功能,需要購置一批額外的硬體設備才能工作。

商用管商用,但本ID實際上今天想在這裡給大家上幾節課,教學目標基本圍繞著「怎樣自己開發一個郵箱抓取工具」,盡量做到簡單易懂,讓大家都能愉快的上手,最主要是不花錢,但考慮到大家畢竟不都是科班出身,而且女生佔了我們微信粉絲的大半江山(說到這裡了,我們是不是考慮要開發個外貿婚介功能啊,哈哈),所以在方法精細度上刪減了很多,以後等大家水平都上去了,我們再慢慢補回來。另外本課程需要各位有一定的動手能力,最起碼會照著打字吧,再不行去找個程序GGMM回來。

還有,這裡有些建議對於第一次上課的同學,想要最快,最好的完成本節課程,你可以這麼做:

1. 很快速的通讀一遍這篇文章,如果你確定文章最後展現的那個結果你是想要的,那麼做第二步

2. 很慢的細讀一遍,讀完後腦子裡已經對需要做的事情有個明確瞭解了,也能明白操作順序是怎麼銜接的,然後進入第三步

3. 打開電腦,照著手機的步驟一步步細心的執行,同時心裡默唸「52wmb,52wmb,52wmb」

【環境搭建】

開發工具選擇,我們這裡有學程序半路出家的吧,或者大家也多多少少聽到過一些程序語言的名字吧,例如C,JAVA(安卓的開發語言),PHP(外貿建站的基本都用這個)等等等等,這些是很好很強大,但我們今天不用,理由是太複雜了,如果本ID今天用上面這些東西來上課,那我們這個微信號就可以改名字了,叫「程序這點事」好了,殺雞豈能用牛刀,今天要用的是瑞士軍刀-PYTHON,其實本來還有一個更好的選擇RUBY,但那個東西是小日本搞出來的,本ID只接受日本的兩樣東西,所以還是算了。下載地址在這裡: python.org/downloads/re,下截圖裡的這個版本:

下載下來的是這個文件「python-2.7.12.msi」,下不下來的也沒關係,文章最後有網盤,雙擊運行,特別注意的是在組件選擇的那頁需要把一個關閉的選項打開來,別的界面一路next,有黑色彈出窗口也不要關閉,裝完自動會關閉,碰到系統彈出問題你「是」或「否」,都選「是」,參照下圖安裝示意操作:

圖一: 點next

圖二: 點next

圖三:右側下拉條往下拉,拉到能看到中間紅色橢圓的內容顯示出來

圖四:滑鼠點擊紅色橢圓處,出現下拉菜單

圖五:滑鼠移到下拉菜單的第二條 Entire feautre will .......... 這行,點擊確定

圖六:檢查中間那個紅橢圓是不是已經和上圖一致了,點next

圖七:點了圖六的next後,系統會彈出問你「確定」或「取消」,因為是系統界面,截不了圖,記住點「確定」就是了,然後就會出現圖七的進度條

圖八:結束畫面

裝完後(就是最後點了Finish),程序自己關閉,然後我們需要運行「命令提示符」,可以直接在開始菜單的「運行」中輸入CMD,或者在所有應用裏找到下面的這個,再找不到問問同事,總會有人知道的,下面第一個截圖是windows10的入口,第二個是windows7的入口:

啟動「命令提示符」後,按照下面命令分別輸入

pip install requests (回車,然後等下面第一個圖一樣的結果出來)

pip install beautifulsoup4 (回車,參照下面第二個圖)

另外如果提示你「pip 不是有效的命令」這種文字,重啟下電腦再執行命令就好了,這是windows的bug,但不是每一個人都會碰到的:

動手能力強的同學看到黃色字了麼,這個是告訴我們要升級版本(不升級也沒關係),照著打python -m pip install --upgrade pip 就可以了,女同學可以無視。

恭喜你,到這裡本課程的2/3已經上完了,其實上面這些東西倒翻個5年,裝什麼軟體基本都是這樣的,只不過現在大家都懶了,也被那些個大軟體綁架習慣了,像什麼360,QQ之類的,裝一個基本就給你自動裝一批了,有好也有不好的地方。至此,PYTHON已經正確的安裝和配置完成了,可以把顯示屏上所有新開出來的窗口都關閉了,就像什麼也沒發生過一樣。同學們也不用看上面這麼多截圖感到怕怕,其實實際操作起來,也就是3分鐘的事情,碰到問題大不了從頭來一遍好了,沒什麼可怕的,重要的是敢於實際操作,我們外貿都搞了,還怕個毛線程序啊,對吧。

【運行第一個腳本】

本節課的剩下部分就是教你運行第一個腳本了,其實這是個獎勵關卡,因為我們現在什麼都不懂,所以本ID就省掉了教大家一條條命令輸入了,只要運行本ID給你們的這個文件就可以馬上看到結果---2秒50個郵箱,也算是獎勵各位同學順利完成搭建運行環境這部分。去文章最後的網盤中下載class_1.py這個文件到計算機本地,放哪裡無所謂,但記住位置,比如我們現在就把這個文件存到了「桌面「上,然後我們滑鼠右鍵點擊這個文件,在彈出的菜單中選擇「Edit with IDLE」

然後我們就會看到以下這個界面了,裡面充實著很多現在看不懂的語言,不要急,我們現在不需要全看懂,只要知道這就是今天最後我們要運行的這個腳本就可以了,通過運行它,我們可能就會感嘆「我TMD的之前累死累活的找郵箱到底是為了什麼?」

注意,我們最後還需要修改一點東西才能符合你想要的,很簡單的,看到key =uFerreyros Saa這行字了嗎,這是本ID隨便輸入的一家公司名字,你可以換成任何你想搜索的公司名字或者產品關鍵字,比如我想搜LED,那麼這行文字可以變成 key = uled,想要更多的公司名字或者產品關鍵字,來52wmb.com吧,好了,這就是今天你所需要知道的全部東西了,最後讓我們一起來見證奇蹟,我們搞了這麼久不就是為了這高的一刻嗎?(還看到email = uhotmail.com這行嗎?聰明的你應該想到這是幹嘛的,後面有提示)

最後一步,按下鍵盤的F5快捷鍵,如果有任何彈出界面問你確定或者取消,老規矩,都點確定!看到了嗎?本ID沒有騙你們吧,是不是出現了一個新的窗口,裡面列印出了很多郵箱啊,看下面結果圖(也是今天最後一張圖了)

感謝你能耐心看到這裡,如果你能在電腦上運行出和本ID一樣的界面,我會真的感到很欣慰,因為程序界的明天可能又多了一個天才或者軟妹子,當然對於你自己來說,如果今天這些東西可以把你的工作效率提高一倍以上,本ID會非常非常非常的為你開心的。還有,所有完成本課程的同學都在評論裏簽到一下吧,這樣會鼓勵更多的同學去實踐,去嘗試。

【課後作業】

  1. 實際抓取的郵箱數並沒有到50個(根據關鍵字不同,數量會不同),如果我想抓1000個怎麼辦?
  2. 為什麼抓取的都是hotmail的郵箱,我如果想同時抓gmail和yahoo怎麼辦?(注意,是同時抓取,如果你想一類一類分開來抓取,只需要修改腳本里的email欄位就可以了)
  3. 為什麼是bing,而不是google,能改嗎?
  4. 我想直接導出EXCEL,可以嗎?
  5. 能不能直接就給這些郵箱自動發詢盤郵件呢?

這些作業也是我們以後會上課的內容,大家可以先想想,如果能自己動手解決裡面的2個問題以上的同學,而又想以後轉行做程序的,請務必給本ID留言。

百度網盤: pan.baidu.com/s/1mi2d1B

第二課:從50個郵箱到1000個:http://yue.52wmb.com/article/1994

第三課:從google抓取郵箱:http://yue.52wmb.com/article/1995

更多關於抓取郵箱的技巧可點擊:外貿找郵箱專題

原文出處:第一課:2秒鐘內獲取50個郵箱-邦閱

原作者:我真的是客服

推薦閱讀:

相關文章