如何徒手製作數據集？

最近在研究人工智慧的圖像識別
各種平臺上大神們寫出的文章都是質量頗高但是在個人荷槍實彈的演練中，發現數據集是個難點

最頭疼的不是搭環境找模型，而是徒手分類加標籤！不甘心用已有數據集區分貓狗豬的我準備DIY無奈不知道應該分成什麼樣子，只能分分看找規律

分分看？！徒手加標籤200張就頭暈眼花500張就神智不清1000張？先打一百把王者榮耀再接著分吧...

【請問大牛，你是如何製作自己的數據集？】
【有什麼講究？要求？經驗？可供參考？】不想做伸手黨，不過提供一下背景：用的inception-resent-v2，想實現在一些隨意拍的圖片裡面識別出特定物品並且判斷其質量，

比如無聊的從各種自拍中識別天空然後給霧霾的顏色打分...
難道你們用的都是現成的數據集麼……

花錢買，完畢

不瞞你說年少時去某神所實習就是從徒手製作數據集開始的這個應該是避免不了不過在製作數據集的過程中可以發揚自己懶和喪的精神尋找各種好用的能夠實現自動化批處理的標註工具說不定還能造出來一個神馬論文

我現在也很頭疼這個問題，我覺得如何評判我做的數據集是比較好的數據集，很艱難

1是師姐那邊的數據絕對夠我用了，2是如果你是徒手分類太麻煩的話可以找一些分類器比如dbacl什麼的

公司常年有400+的實習生在做數據標註，加上正式員工，再加上購買的數據，基本還是夠我們用的。

你是想要大量的數據呢？還是想對大量的數據進行分析處理？

如果你是想要大量的數據，可以買，可以爬，有多種方式可以得到，

如果你是要對數據進行分析處理，現在大數據這麼給力（Hadoop，HPCC，Storm等）