廣告定向@概述

定向,就是廣告演算法工程師提供給廣告主一些用戶屬性與條件,供廣告主用來找到自己的目標人群的。

  • 人群屬性定向(Demographic Targeting)

基於用戶基本屬性,如年齡、性別、教育背景、職業、婚姻狀態、收入、消費能力、工作場所等做人群定向,相對靜態,長期不變。

  • 上下文定向(Contextual Targeting)

基於用戶當前查詢的query、瀏覽的網頁、使用的 App 等語義分析結果定向,均為實時訪問上下文。另外,有些人喜歡把移動設備、LBS 地點、天氣也歸入此類,個人更傾向於特指內容型數據,如文本、視頻等。常見的定向屬性有關鍵詞(Google Adsense、Facebook、百度鳳巢)、否定關鍵詞(Google Adsense)、展示 URL(Google Adsense、百度網盟)、頁面主題(Google Adsense)、行業分類(百度網盟)等。

  1. 用規則將頁面歸類到一些頻道或主題分類,如將 auto.sohu.com 歸類到「汽車」的分類中
  2. 提取頁面的關鍵詞
  3. 提取頁面的入鏈錨文本中的關鍵詞,這需要一個全網的爬蟲作支持
  4. 提取網頁流量來源中的搜索關鍵詞,這種方法除了頁面內容,也需要頁面訪問的日誌數據作支持
  5. 用主題模型將頁面內容映射到語義空間的一組主題上
  • 行為定向(Behavioral Targeting)

基於用戶歷史行為數據挖掘用戶興趣,行為數據如網頁瀏覽、網頁點擊、查詢 query、UGC 內容(如微博、朋友圈等),一般需要區分長期、短期和實時興趣。常見的定向屬性就是興趣愛好,依靠人工定義一套層次化的類別體系,有些平台還會按照時間段(Google Adsense、百度網盟)或者商業性(品友互動)進一步區分。

  1. Transaction, 就是用戶購買行為
  2. Pre-transaction, 用戶購買前的一些行為,如商品瀏覽、加入購物車等
  3. Paid search click, 搜索廣告中的點擊行為
  4. Ad click, 廣告的點擊行為
  5. Search click, 搜索引擎上的點擊行為
  6. Search, 搜索引擎上的搜索行為
  7. Share, 分享行為,如微博等
  8. Page View, 瀏覽頁面的行為,注意這個頁面不是上面搜索出來的頁面,而是用戶在某個站點中只能看到的頁面(如貼吧),量大但是效果一般
  9. Ad view,看某個廣告的次數,但是帶來的效果往往是負面的
  • 重定向(Remarketing)

基於用戶歷史行為數據挖掘用戶興趣,行為數據如網頁瀏覽、網頁點擊、查詢 query、UGC 內容(如微博、朋友圈等),一般需要區分長期、短期和實時興趣。常見的定向屬性就是興趣愛好,依靠人工定義一套層次化的類別體系,有些平台還會按照時間段(Google Adsense、百度網盟)或者商業性(品友互動)進一步區分。

  • 相似用戶定向(Look-Alike Targeting)

側重基於確定的一小波人群,圈出更大規模類似的人群,保證定向效果的同時,擴大用戶覆蓋。因為挖掘相似用戶過程中,主要依據用戶基本屬性或興趣(長期),更新頻率不高。Google Adsense 將曾經到訪過廣告頁面的用戶作為基準定製人群,然後按照用戶在 Google Display Network 上的頁面訪問行為衡量用戶之間的相似性,以擴展更多用戶;而 Facebook 需要廣告主提交基準定製人群,比如 Email、Phone、Facebook Ids、App Ids,後台自動找到相似用戶。這部分與DSP 中的 audienceselection 非常類似。

  • 地理位置定向(Geo Targeting)

移動互聯網比較熱門的定向,可以定位城市、商圈、學校等區域。

  • 其他
    • 時間定向(TimeTargeting): 一天中的不同時間段。
    • 設備定向(DeviceTargeting): 如手機品牌、型號,操作系統,運營商等。
    • 天氣定向(WeatherTargeting): 對經常出現霧霾天氣的北京,投放口罩、空氣清新器應該是靠譜的。
    • 語言定向(LanguageTargeting): 一般具有國際化市場的廣告平台會提供,如 Google、Facebook。

廣告定向@架構

利用數據倉庫和集群計算,離線完成用戶的定向條件的挖掘後,其他團隊會根據數據建立索引。當廣告主過來下單的時候,可以查詢他的定向條件覆蓋的人數以及歷史售賣情況,根據這些信息廣告主進行出價和下單。廣告主下單後會建立廣告計劃,廣告計劃以及定向條件會載入到存儲器。離線挖掘好的用戶定向條件也會載入到線上存儲器。一個用戶過來後,線上服務會查詢廣告計劃的定向條件,也會查詢用戶的profile,根據這兩個東西的匹配來篩選適合投給這個用戶的廣告計劃。

廣告業務@架構

一個用戶過來後,這個廣告請求會進入到廣告投放平台。廣告投放平台會讀取一些索引,決定要不要進行投放,決定投放後,廣告投放平台會讀取廣告主服務頁推送過來的廣告計劃,做一些頻次上的控制,再把剩餘的廣告交給線上定向模塊。線上定向模塊從線上存儲器讀取用戶的profile數據,根據每個廣告計劃的定向條件去篩選,篩選剩下的廣告計劃就是適合投這個用戶的廣告;再對篩選剩下的廣告,做一個比較粗的選取,選擇其中質量較高的返回給下一個模塊,這個工作由線上定向模塊完成。

線上定向模塊過後,剩下的是相對優質的若干個廣告,開始對這若干個廣告進行預估ctr,預估ctr過程中需要去線上存儲器讀取特徵,一般還需要本地載入的一個模型。當ctr預估完成後,就進行算分排序,計算扣費,再加上一些業務策略,從而選出最合適的若干個廣告,返回給廣告投放平台。廣告投放後,會產生日誌,日誌會通過日誌收集系統收集到數據倉庫。

廣告演算法工程師會從數據倉庫裡面獲取各種投放日誌,提取特徵,把特徵導入到線上存儲器;還會根據投放日誌,生成訓練樣本,訓練模型,把模型推送到線上伺服器,由線上伺服器進行載入來給預估ctr使用。

扣費方法:

1. 廣義一階價格(GFP),就是廣告主開多少價,在廣告投放後就收多少錢。這樣廣告平台就會跟廣告主進行重複博弈,在每一輪拍賣結束後,廣告主會根據上一輪報價的情形決定下一輪的出價決策。這樣就很容易出現問題,一開始廣告主為了搶量不斷抬價(價格攀升階段),後面玩熟練了,大家一起壓價(價格崩潰階段)。這樣廣告平台就需要非常了解廣告主的估計,否則,價格不斷波動,流量會浪費很嚴重,廣告平台的生意很容易就搞砸了。2. 廣義二階價格(GSP),這個二階的意思就是下一位的出價,一個廣告支付的錢是排在下一個位置的廣告的出價,用術語來說就是:第i個廣告位的廣告每次展示或者點擊(分別對應兩種競價方式,按展示收費或者按點擊收費)所付的費用,等於第i+1個廣告位的廣告出價加上一個很小的值(一般是0.01)。

排序策略:

1. 競價排序:根據廣告的出價倒序排列,被點擊的廣告主付他下一家的費用。2. 收入排序:根據期望收益最大來排序,這裡的期望收益指的bid * ctr,被點擊的廣告主付的費用為bid(i+1) * ctr(i+1) / ctr(i);後面的那個ctr有時候也可以用score代替,即扣的費用計算公式也可以是bid(i+1) * score(i+1) / score(i),當然扣費不能超過廣告的出價,也不能低於一個最小值(各個平台自己定義的)。

推薦閱讀:

相关文章