接手到這份資料第二個禮拜,我們開始使用單一變數的比例分析,並想訂了一個主軸作為固定變因,看看會有甚麼特別的事情發生~~~~

 

我們想瞭解我們上週所選擇的3個變量,也就是一個國家的平均餘命、平均收入、網路使用率與該國家的開發程度的關係

首先我們要定義我們的級距,因此我們找查文獻,以未開發國家、開發中國家、已開發國家,做為級距目標的假設。

 

1.平均餘命2011年若死亡率保持不變,當年新生兒的平均壽命

西元 2000 年已開發國家總人口為 11 億 8 千 4 佰萬人,佔全球總人口 19.5%,已開發國家零歲平均餘命為 75 歲。其中,男性為 72 歲,女性為 79 歲,男女相差 7 歲。( 台灣零歲平均餘命為 75 歲,達到已開發國家水準 )

  • 開發中國家零歲平均餘命為 64 歲。其中,男性為 62 歲、女性為 66歲,男女相差 4 歲。
  • 已開發國家零歲平均餘命的 75 歲,比開發中國家的 64 歲,高出 11歲。其中,男性高出 10 歲,女性高出 13 歲。

http://cfh.com.tw/HealthTopic/快樂長壽/生活習慣與壽命/Mar--2012/近十年,各國平均壽命的變動.aspx(文獻三)

因此我們由此篇統計文獻定義出,未開發國家零歲平均餘命為< 64 歲 開發中國家零歲平均餘命為 64~75 歲已開發國家零歲平均餘命為> 75歲

 

2.平均年收入(美元)

每人平均國民所得、平均每人國民生產毛額(per capitaGNP):這也是常見的開發中國家定義。這種方法將國民所得或是國民生產毛額當作是一個國家整體經濟力量的展現,因此每個國民所分得的平均就當作是經濟發展程度的指標。由於通貨膨脹的因素,這項指標通常會隨著時間而作出相對應的調整。例如聯合國與世界銀行就是以這種方式來區分已開發國家與開發中國家,例如在1980年,世界銀行對於世界各國的區分標準為:

(一)低度開發國家:平均每人生產毛額低於415美元

(二)中收入國家(仍屬於開發中國家):平均所得介於415美元到4500美元

(三)已開發國家:平均所得超過4500 美元。到了1987年,這項標準已經調整成:平均所得不到480美元為低度開發國家平均所得介於480美元到6000 美元為開發中國家之中所得國家(其中1940美元以上者,被稱為上位中所得國家,表示其發展程度已接近已開發國家的程度),平均所得6000 美元以上為已開發國家, 通常產油國較容易有這種高所得,但是社會發展程度不夠的現象。

http://mypaper.pchome.com.tw/meiody729/post/1325592741 (文獻一)

因此我們由此篇統計文獻定義出,未開發國家平均收入<32美元  開發中國家平均收入介於480~6000美元已開發國家平均收入>6000美元

 

3.網路使用率2010每100人中的網路使用者)

  2005年 2010年 2014年
世界人口 65億 69億 72億
無使用網際網路 84% 70% 60%
有使用網際網路 16% 30% 40%
開發中國家的使用者 8% 21% 32%
已開發國家的使用者 51% 67% 78%

(資料來源https://zh.wikipedia.org/wiki/%E5%85%A8%E7%90%83%E7%B6%B2%E9%9A%9B%E7%B6%B2%E8%B7%AF%E4%BD%BF%E7%94%A8%E7%8E%87

 

因此我們由此統計圖表定義出,未開發國家的網路使用率<=21%  開發中國家網路使用率為21%~67%,已開發國家網路使用率>67%

 

結論:

我們發現,雖然三項變數皆區分成未開發、開發中和已開發國家,但各區間的國家數卻不盡相同,

因此我們得到,此三項變因雖與國家的發展有正相關,但單憑一項變因無法論定該國家發展型態,這與我們上週所提到的例子 --古巴(其為開發中國家,但是因為健全的醫療建設,平均壽命長,而網路普及卻較低),結果相似。


 

程式碼介紹:

我們使用到了python中功能極為強大的pandas套件,說到資料分析、機器學習......等,他可是不可或缺的重要角色呢!

我們使用到了最基礎的data convert的動作,將數據轉換成numeric之型態,

 

 

再來我們透過文獻一、文獻二、文獻三分別訂定個人收入、網路使用率、平均餘命之標準、去做基本的分類統計,我們所使用的統計方法是子個數除以母個數(類似pandas之normalize語法)

 

遺失值(missing value)處理:

我們在基本邏輯撰寫時就已經避開nan(not a number)的狀況因,以確保百分比無誤。

ps:以上作法與pands語法dropna有著異曲同工之妙。

 

資料來源:

文獻一:

http://mypaper.pchome.com.tw/meiody729/post/1325592741

文獻二:

https://zh.wikipedia.org/wiki/%E5%85%A8%E7%90%83%E7%B6%B2%E9%9A%9B%E7%B6%B2%E8%B7%AF%E4%BD%BF%E7%94%A8%E7%8E%87

文獻三:

http://cfh.com.tw/HealthTopic/%E5%BF%AB%E6%A8%82%E9%95%B7%E5%A3%BD/%E7%94%9F%E6%B4%BB%E7%BF%92%E6%85%A3%E8%88%87%E5%A3%BD%E5%91%BD/Mar--2012/%E8%BF%91%E5%8D%81%E5%B9%B4%EF%BC%8C%E5%90%84%E5%9C%8B%E5%B9%B3%E5%9D%87%E5%A3%BD%E5%91%BD%E7%9A%84%E8%AE%8A%E5%8B%95.aspx

 

 

 

 

 

 

相关文章