- (60%)PubMed (WordCount)
- 參考程式(Hadoop WordCount 字數計算)
- 資料來源:
- (+20%) 2013,2014
- 找出『標題』出現最多的前20名的英文單字
- 找出『摘要』出現最多的前20名的英文單字
- (+20%) 根據『PubMedID』的最後一碼(如:25086856=>代表"6")
- 統計檔案出現次數。(0:?, 1:?,...,9:?)
- (+20%)(需更換Mapper 和 Reducer的 parameters type)
- 找出『PubMedID』(如:25086856)和你學號(10100006)最後一碼相同的『PubMedID』
- (40%)PubMed (Pattern History)