Information Acquisition and Provision in School Choice: A Theoretical Investigation, Yan Chen and Yinghua He, 2019, WP

這篇

考察了boston mechaism(IA)和DA演算法

不過用了17年jpe那篇里的Chinese parallel mechanism框架將兩者統一了(具體見:sleepsoft:高考平行志願填報機制(Chen and Kesten,JPE,2017)

設定是uncertainty在preference上——奇特的地方同時存在ordinal的P和cardinal的V,而且都uncertain

最開始每個agent i都symmetric: 只知道prior分布 F,和購買信息成功的幾率a,b

timeline如下(具體見論文figure 1)

agent i決定買不買Pi的信息

不買直接去擇校,此時唯一信息是分布F

買則a幾率成功買到1-a幾率失敗,失敗了就直接去擇校

成功了再決定買不買Vi的信息

不買則在知道Pi的情況下去擇校,此時信息是Pi

買則b幾率成功買到1-b幾率失敗,失敗了就在知道Pi的情況下去擇校

買成功了則在知道Vi的情況下去擇校,此時信息是Vi

agent i的action space為購買信息與否,假設購買信息的payment分別為f,g,而a,b的大小也假設和f,g相關 ——假設a,b性質well-behaved:

a(0)=b(0)=0;lim_{f	oinfty}a(f)=lim_{g	oinfty}b(g)=1\ a,b>0; a,b<0\ 稻田條件

假設f,g都有界,每個agent的cost為C(f,g)

每個agent的信息集合為 w_iin (Pcup emptyset )	imes (Vcup emptyset)

將f,g當作signal通過貝葉斯勸說的技術可以寫出以下的signal的條件概率H(wi|f,g):

H(w_i=w_i^0=(emptyset,emptyset ) mid f,g)=1-a(f)\ H(w_i=w_i^1=(P_i,emptyset ) mid f,g)=a(f)cdot [1-b(g)]\ H(w_i=w_i^2=(P_i,V_i) mid f,g)=a(f)cdot b(g)

Recall 我們還有個prior分布F(V),所以我們能得出根據H的posterior分布F

F(V)=F(Vmid w_i) \ \=F(V) 	ext{ if } w_i^0\ \=F(Vmid P_i)	ext{ if } w_i^1\ \=1_{V_i} 	ext{ if } w_i^2

類似地也有個關於P的分布G

G(P|w_i)=G(P|F) 	ext{ if } w_i^0\ =1_{P_i} 	ext{ otherwise}

==================以上都是信息的部分===========

當agent知道信息/接收信號後進入擇校階段

每個agent i的行為是report一個list/preference R_iin P

agent的最後payoff為

u_i(V_i,R)=sum_{sin S} q_i^s(R) cdot v_i^s=Q_i(R)cdot V_i

其中S為學校的集合,q^s_i(R)表示action profile R時agent i被選進學校s的概率,Qi則為這樣的一個lottery

什麼叫SP就不說了,recall DA是SP的,但IA/波士頓不是

solution concept為symmetric Bayes Nash Equ(SBNE): recall這裡每個agent的戰略為一個tuple (f,g,sigma)=(fin[0,ar{f}],g:P	imes[0,ar{f}]	o [0,ar{g}] ,sigma:P	imes V	o Delta(P)) ,其中sigma為Ri的混合戰略

於是一個SBNE的profile分別滿足三種期望效用的最大化(因為是對稱的所以就把下標i省略了)

1-1	ext{)  } Pi(w,f^*_{-i},g^*_{-i})=\ intintint u(V,sigma_i,sigma^*(w_{-i})) d F(V|w)dF(V_{-i}|w_{-i}) d H(w_{-i|f^*(-i),g^*{-i}})\ 1-2	ext{)  } sigma^*(w)inargmax_{sigma_i} Pi(w,f^*_{-i},g^*_{-i})\ 2-1	ext{)  } E[Pi(cdot,f^*_{-i},g^*_{-i})]= {[int Pi(w^2,f^*_{-i},g^*_{-i})d F(V|P_i)]cdot b(g)+[1-b(g)]Pi(w^1,f^*_{-i},g^*_{-i})}  \ 2-2	ext{)  } g^*(P_i,f^*)inargmax_{g}  E[Pi(cdot,f^*_{-i},g^*_{-i})] -c(f^*,g)  	ext{   for all } P_iin P\ 3-1	ext{)  }  E{E[Pi]}= [1-a(f)]  cdot [Pi(w_i^0,f^*_{-i},g^*_{-i})]+ a(f)cdot int {max_{g(P_i,f)}E[Pi(cdot,f^*_{-i},g^*_{-i})]-c(f,g^*(P_i,f))}d G(P|F)\ 3-2	ext{) }  f^* inargmax_f  E{E[Pi]}

(所以為什麼我不喜歡做某些應用理論因為太ugly了……)

Prop 1:

i) f*>0 所有agent i都有incentive去買Pi的信息

ii) DA時: g*==0 沒人想買Vi

iii) IA時: exists F,exists P_iin P 	ext { such that }  g^*(P,f^*)>0

================以下為另一套信息=============

現在假設agent i可以花錢買V-i

此時每個agent i都知道Vi 了 (AKA wi=wi^2)

agent多出來一個戰略:花h買V-i,其中成功率為d(h)

此時定義一個新的signal ww_i,我們有分布

K(ww_i=ww_i^0=emptyset mid h)=1-d(h)\ K(ww_i=ww_i^1=V_{-i} mid h)=d(h)\ F(V_{-i}mid ww_i)=F(V_{-i} ) 	ext{ if ww_i=ww_i^0; otherwise 為} 1_{V_{-i}}

此時SBNE為pair (h^*(V_i),hat{sigma}^*(ww_i,V_i)) 分別最大化了以下兩個期待效用

max_{hat{sigma}} intint u(V_i,hat{sigma},hat{sigma}^*_{-i})  dF(V_{-i}mid ww_i) d K(ww_i mid h^*_{-i})=Z(V_i,ww_i,h^*{-i})\ max_{h}  {[1-d(h)]cdot Z(V_i,ww^0_i,h^*_{-i})+d(h)int Z(V_i,ww_i^1,h^*_{-i})d F(V_{-i})-Cost(h)}

結論如下

Prop 2:

i) DA時:h*(Vi)=0 for all Vi

ii)IA時:永遠存在一個F使h*>0

之後討論了下ex ante welfare,沒什麼意思

反正這篇文章也是剛寫成的 等以後人家改吧

推薦閱讀:

相关文章