作者:泡了個泡;

來源:牛客網;

鏈接:https://www.jianshu.com/p/5d5d672290a2

算法面經+春秋招總結(含BAT TM W等)

當對幸福的憧憬過於急切,那痛苦就在人的心靈深處升起。——加繆

本人真·末流985軟件工程本碩,研究方向推薦系統(但是整個實驗室也只有我自己在研究),JCR1區水刊論文一篇,對於機器學習也算是半路出家,從今年一月份纔開始系統的學習。

經歷了慘痛的春招與秋招之後,也積攢了一些面經,希望能對大家有所幫助。

春招

360 瀏覽器事業部 推薦算法工程師

一面

1.項目

2.關鍵字怎麼提取的,TF-IDF有改進麼,怎麼改進的

3.命名實體怎麼得到的,原理了解

4.LDA的原理是什麼,使用了哪個框架

5.狄利克雷分佈能具體說說麼

6.深度學習瞭解麼

7.RNN LSTM瞭解麼

8.有什麼比較熟悉的算法

9.xgboost的原理

10.有10個排好序的數據庫,那麼我要找整個的中位數,怎麼找

11.一個路口,一個小時通過一個車的概率是0.9,那麼20分鐘內通過車的概率是多少

12.我有一個32位的id是唯一的,那麼我想壓縮一下,讓他還唯一,怎麼壓縮

二面

1.項目

2.SVM原始問題爲什麼要轉化爲對偶問題,爲什麼對偶問題就好求解,原始問題不能求解麼

3.K-means 中我想聚成100類 結果發現只能聚成98類,爲什麼

4.進程中的內存分段是怎樣的

5.每個線程有哪些東西是自己獨享的

6.一枚不均勻的硬幣,我拋了100次,有70次朝上,那麼第101次朝上的概率是多少

這個概率怎麼樣,公示是如何推導出來的

7.給你個字符串,字符串是個數字,怎麼轉換爲int型,不用庫函數的話

8.4個海盜,100個金幣,每個人輪流提方案,如果你的方案有半數以上通過,那麼久可以,否則就會被殺掉,如果你是第一個人,那麼你怎麼提方案比較好

9.你的優點是什麼

有些問題回答的不夠好,面完二面以後HR讓等通知,幾天之後查狀態果然掛了

*********************************************************************************************************************************************************************************

美團點評 到店綜合 機器學習/數據挖掘工程師

一面

1.先聊了半天項目,從細節創新點,講到了整體的架構。聊了大概15分鐘左右。。

2.GBDT的原理,以及常用的調參的參數

3.xgboost的跟GBDT比優點都有哪些

4.一道SQL題,count(1),count(*),count(列名) 這三個有什麼區別

然後問了下什麼時候能來實習,實習多久

我問了他他這邊都做什麼,就這麼愉快的結束了面試

二面

1.L1、L2正則化,區別

2.項目,長短期興趣,如何驗證,時間敏感

3.文本內容推薦中有哪些內容可以應用到商品團購推薦當中去

4.Xgboost中的行抽樣,可以起到哪些作用

5.樣本少了不是會過擬合麼,爲什麼行抽樣可以防止過擬合

6.算法題,一個數組,找出第k大的數

這些方法的時間複雜度是多少

二面過後過了三四天左右,收到了offercall

*********************************************************************************************************************************************************************************

騰訊IEG安全部門一面(提前批)

1.說一下構建模型的過程

2.特徵選擇方法都有哪些

3.常用的損失函數和適用場景

4.LR和SVM原理

5.LR和SVM這兩個應用起來有什麼不同

6.PCA說一下

7.你都會什麼聚類方法

8.模型的評價方法有哪些

9.ROC怎麼畫

10.你知道SoftMax麼

11.野指針是什麼意思

12.快排的思想是什麼

13.Linux中查找符合一定規則的文件名怎麼查找,或者用腳本也行

14.C++會不會 虛函數是什麼意思

15.我有一個文本,那麼我要統計每個詞出現的頻率,Python上應該怎麼做

16.編代碼的時候如何申請內存,有哪些方法

17.你玩遊戲麼,都玩過哪些遊戲

由於提前批被撈的時候距離提前批流程結束已經沒幾天了,所以沒能完成後續面試

騰訊瀋陽現場一面

1.項目

2.特徵選擇方法都有用過哪些

3.隨機森林怎麼進行特徵選擇

4.用過哪些機器學習算法

5.加密方法知道哪些

6.MD5可逆麼

7.word2vec用過麼

8.極大似然估計是什麼意思

9.上過哪些課

10.排序算法哪些時間複雜度比較低

11.計算機網絡瞭解多少

20分鐘,問題除了加密的部分其他應該都答得還可以

然後出來之後被秒掛了

*********************************************************************************************************************************************************************************

阿里 新零售 天貓 算法工程師-機器學習

一面

先是一個簡單的自我介紹;

1.然後介紹了項目的框架和主要創新點;

2.說一下隨機森林和Adaboost,以及區別

3.說一下GBDT和Adaboost,以及區別

4.說一下LDA的原理

5.對於PCA,會有第一主成分、第二主成分,怎麼爲什麼第一主成分是第一,原因是什麼?

6.PCA的主成分是怎麼得到的

二面

先是簡單問了一些關於什麼時候可以實習,學校這邊的狀況如何的問題。

然後開始聊項目,項目聊得比較細,我做了哪些創新點,具體怎麼做的,有問題面試官都會追問清楚。

1.說一下SVM

2.聊了一下之前本科的實習經歷

3.面向對象的三要素

4.對深度學習瞭解多少

5.你覺得深度學習的方法和傳統機器學習比,有什麼大的優勢

二面通過了,之後流程也到了三面面試官的手裏,但是好像p9大佬一直很忙沒有時間面我,又趕上當時天貓週年慶。。。最後一直拖到流程結束,還是沒有緣分啊

*********************************************************************************************************************************************************************************

GrowingIO 機器學習工程師

一面

1.項目

2.當我們要求準確率很高,但是不在意召回率的時候,可以怎樣處理。

3.迴歸算法用於分類的閾值如何確定呢

4.xgboost,說一下原理,步長如何設定

二面

這次的二面問的問題都很open,都是一些如何讓我的推薦系統可以更好的應用於大數據的實際場景當中去的問題。

首先是一個1分鐘的簡短的自我介紹。

還是聊項目,創新點,以及系統架構和實現。

1.k-means中的k如何確定呢?

2.除了k-means,還可以用什麼聚類方法,或者你還熟悉什麼聚類方法

3.層次聚類的話,你又如何判斷聚成多少類合適?

二面之後還有個VP面,也簡單聊了聊技術,最後拿到了offer

*********************************************************************************************************************************************************************************

好未來

一面

1.用過什麼語言,用沒用過R,語言都幹什麼用的

2.樸素貝葉斯原理

3.TF-IDF原理

4.性能評價指標,準確率召回率是怎麼回事,二分類 和多分類的評價方法

5.除了推薦方面的東西,你還做過一些別的事情麼

6.用過scikit-learn numpy麼

7.LDA你是怎麼用的,LDA的表現如何,主題分的效果好不好

8.你覺得基於內容的方法和協同過濾有什麼不同

9.還有就是一些基本情況了,用沒用過數據庫啊之類的,數據庫用的怎麼樣 sql會不會

面試小哥說他們是做NLP的,感覺我比較適合推薦的組,說給我把簡歷遞過去,但是就沒有後續了

*********************************************************************************************************************************************************************************

數旦科技

一面

1.數據庫 三範式

2.bagging 和boosting 哪個可以讓結果的方差更小一些,爲什麼?

3.你都知道哪些分類算法

4.bagging 和boosting的區別是什麼

5.排序算法都有什麼?當一個數據特別亂序的時候使用哪個排序算法更好一些

6.你論文都怎麼搜索的,如何保證質量?

7.面向對象 多態 繼承 的關係

8.面對大數據量的推薦 應該如何實現

9.說說協同過濾是怎麼回事

10.你常用的推薦算法都有什麼

11.集成學習爲什麼要用簡單的基學習器,不用一個複雜一點的學習器

12.非線性的數據,可以使用什麼分類器進行分類

這個還有二面,但是二面沒問太多技術問題,後來就莫名其妙沒有後續了

*********************************************************************************************************************************************************************************

搜狐算法實習生

一面

先問項目,然後

1.LDA的原理是什麼?

5.推薦的時候矩陣一定是稀疏的,對於這個稀疏矩陣應該如何處理?

6.如何從文檔中提取關鍵字?

7.講一講tf-idf是什麼意思

8.hashmap你用過麼,底層是如何實現的?

9.計算機網絡你有學過吧,還記得什麼麼?

10. Android 的生命週期是什麼?

11.你用過Python 那麼你Python都用過哪些機器學習的庫?

12.你覺着你自己都有哪些優點呢?

這是春招初面,什麼都不會。。順利涼涼

搜狐(智能推薦平臺)

一面

主要問的都是項目

手擼代碼,不用庫函數求一個數的立方根,要求誤差小於0.01

代碼沒擼出來,再次涼涼

*********************************************************************************************************************************************************************************

以上是所有春招的面試經歷,除了這麼多一面就掛的,還有很多簡歷掛,筆試掛的。最終拿了美團點評和GrowingIO的offer,然後選擇了去美團實習,共三個月。

秋招

阿里 口碑 算法工程師-機器學習

一面

1、項目

2、如何在實際場景中實現項目,需要做哪些改變與考慮

3、代碼題,如何不使用庫函數(+-*/)實現一個加法計算函數,入參爲兩個字符串,返回值爲兩個字符串

4、邏輯迴歸的思想和過程,損失函數是什麼,如何訓練得到最優參數

5、如何防止過擬合

6、L1正則不是連續可導的,那麼還能用梯度下降麼,如果不能的話如何優化求解

7、樹模型的分裂依據都有哪些

8、支付寶年末要出一個年終總結,那麼我要對所有用戶的交易額度進行全量的排序,那麼內存肯定是不夠用的,這種情況下應該怎麼做

9、在一個座標系內,用戶和商戶都有自己的座標(x,y),那麼我想找到距離用戶最近的k個商戶,如何最快的得到

10、口碑要拉新客,我們的策略是發紅包,怎麼如何在預算有限的情況下發紅包能讓最多的用戶來安裝口碑呢

11、在美團都做了哪些工作,簡單說一下

秋招第一次面試,一面遇到P8大佬,準備不充分的情況下,順利涼涼

*********************************************************************************************************************************************************************************

百度 展示廣告部 機器學習/數據挖掘/自然語言處理工程師

一面 (電話)

1、介紹一下新聞推薦的項目

2、介紹一下美團實習的方向,負責的內容

3、GBDT+LR的原理

4、GBDT+LR中,如果GBDT有有1萬顆樹,每個樹有100個葉子節點,那麼輸入到LR的特徵會是一個高維稀疏的向量,那麼應該如何處理,使用PCA降維的話會造成損失,如果不想有損失的話應該怎麼辦

5、GBDT的原理

6、GBDT在迴歸和多分類當中有什麼不同,在預測的時候的流程是怎樣的

7、邏輯迴歸如何防止過擬合

8、L1、L2正則化的區別是什麼

9、L1正則相當於拉普拉斯先驗,那麼在損失函數爲最小二乘法的時候,如何通過拉普拉斯先驗推導出L1正則

10、L1正則是不可導的,那麼在這種情況下如何優化求解損失函數

11、座標軸下降法的原理是什麼,還有別的方法求解麼

12、你所使用的GBDT+LR的代碼中,LR的優化方法是什麼,是如何實現的(看源碼)

13、算法題,有一個n*n的數字矩陣,我要將其向右旋轉90度,應該如何實現,時間複雜度是多少

二面 (上研現場)

1、介紹實習的項目

2、GBDT不擅長處理離散特徵,你在應用的時候是怎麼處理的

3、項目中LR用的優化方法是什麼,有沒有用正則化,有沒有調整sgd的步長

4、你還知道哪些優化方法

5、GBDT+LR中LR輸入的特徵都有哪些,除了GBDT輸出的特徵 有沒有加入原始特徵

6、如何判斷模型有沒有過擬合

7、100塊錢,每次可以花1、2或者3塊,有多少種花法

8、算法題,用兩個棧實現一個隊列

9、手推邏輯迴歸

三面 (電話)

1、討論論文

2、tf-idf在提取關鍵字的時候有沒有遇到問題

3、userCF在現實場景中實現遇到的問題,如何解決

4、有一個特別長的數組,放不進內存的情況下,找出最小k個數

5、蓄水池抽樣

6、邏輯迴歸的特徵處理,連續值、離散值,離散化連續特徵的好處

7、L1、L2正則化

8、模型在線下可以得到很好的效果,但是上線後效果不好,有哪些原因

9、實習項目

10、項目中如何判斷是否擬合、如果離線數據不能很好反映全集的情況如何處理

11、進程間通訊都有哪些手段

12、父類變量指向子類實例的情況下,在調用方法時是如何判斷調用的是父類的方法還是子類的方法

13、多線程鎖

完成了三面,個人感覺良好,等了很久沒消息後,問了面試官,告知涼涼

*********************************************************************************************************************************************************************************

今日頭條 上海 算法工程師

一面

1、討論論文

2、user-cf、item-cf公式,原理區別

3、討論實習

4、手寫堆排序

5、手寫快排

二面

1、topk

2、手寫代碼實現lr的訓練與預測

當時的我還不會手寫堆排序。。涼涼

*********************************************************************************************************************************************************************************

美麗聯合 應用算法工程師

一面 20min

1.聊了實習裏面很小的一個點,大約3min

2.手撕代碼 最長連續合法括號子序列

最差的一次面試體驗,真的是不缺人?一定要吐槽一下,論文、實習的主要內容都不問,機器學習算法也不問,直接手撕LeetCode hard難度代碼,沒寫出來就掛人??

不缺人何必約面試呢。

*********************************************************************************************************************************************************************************

海康威視 研究院 大數據算法工程師

一面(電話)

1、GBDT原理

2、GBDT在處理onehot屬性時,當1或者0的數量很多的時候是否會發生問題

3、Xgboost 和GBDT區別

4、如何判斷是否過擬合

5、實習

6、既然GBDT處理onehot屬性時存在問題,爲什麼你們還要這麼做

後面通知了現場面試,但是由於當時有事過不去,只能鴿了

*********************************************************************************************************************************************************************************

網易遊戲 雷火 數據挖掘工程師

上午面了三面,發現雷火的數據挖掘實際是大數據開發,並不是算法崗。。

問了很多Hadoop

spark hive的底層內容和算法能沾邊的問題不多,如下:

1、SQL題

2、二叉樹中序遍歷,遞歸非遞歸

3、情境代碼題(具體記不清了)

4、user-cf中計算近鄰用戶的距離度量方法有哪些,如何選擇

5、激活函數比較

6、推導邏輯迴歸

互相不匹配,涼涼

*********************************************************************************************************************************************************************************

閱文集團 算法/機器學習工程師

一面

1、實習感受

2、實習內容

3、討論一個算法項目的流程

4、特徵處理與選擇

5、GBDT+LR

6、討論論文

7、主題模型

8、命名實體識別

二面

1、實習

2、論文,關於推薦系統的一些看法

3、邏輯迴歸的原理與推導

4、item-cf與user-cf與基於內容的推薦的區別

5、邏輯題(具體記不清了)

HR面

工作如何選擇

未來規劃

女朋友

東北人爲啥要來上海

薪資期望

由於很多問題都是根據論文和實習展開問的,所以顯得面試問題不是很多,其實面試時間都有50min左右。

很幸運趕上了閱文第一次提前批,來了東北大學。面試很效率,很友好。

十一之後收到了offer 小sp

*********************************************************************************************************************************************************************************

秋招就一共面試了這麼多家。還有一些做了筆試沒給面試機會的,比如:京東、網易互聯網、嗶哩嗶哩、滴滴。一些投了簡歷沒消息或直接掛了的,如:51信用卡、點我達、有贊。

最終拿到了閱文的sp offer 和美團實習留用的 sp offer,其他的都涼了或者在涼的路上。希望這些面經能對大家有所幫助。

相關文章