Data Mining
王經篤
jdwang@asia.edu.tw,
Room:I517, ext:1847
Time: Monday, 9:10am~12:00am, Room: I533 Outline
-
Reference
Book
- Pre-Request
-
成績
Grading
(最多遲交一週,逾期不收, 90%/per day)
- (FTP:120.108.115.115(port:8021),dm, dm???)
- 分組(2010.10.4前繳交分組名單, e-mail: 吳健瑋 woof211070@hotmail.com
)
- 課堂表現(10%):出席、提問、回答問題
- Project 1(15%) : Data
Collection and Preprocessing
- (2010.10.18)上台報告(2010.10.25)心得(書面)
- 動機與目的:
- 資料來源、收集方式、整理技巧
- 個別心得報告、個別貢獻度。
- Project 2(25%):Association Rule & Decision Tree
- (2010.11.1)上台報告(2010.11.8)心得(書面)
- 動機與目的:
- 方法:關連法則、決策樹
- 資料來源、資料統計
- 實驗結果:
- 個別心得報告、個別貢獻度。
- Project 3(25%): Classification
- (2010.12.6)上台報告(2010.12.13)心得(書面)
- 動機與目的:
- 方法:SVM, Cross-Validation (5-fold)
- 資料來源、資料統計
- 實驗結果(60%):
- Accuracy, Recall, Precision, F1 (kmer=1,2,,,,,6)
- Confusion Matrix (the Highest when
kmer=6)
- Bonus:
- (10%) (kmer=7) (正確率最高:第一(+10),第二(+8),第三(+6),第四(+5))
- 請列出Accuracy(Test)=? ( Training
log(c)=?,log(gamma)=?)
- (10%)
LIBLINEAR
vs LIBSVM (kmer=1,2,,,,,7)
- (10%) Accuracy,Confusion Matrix (kmer=8)
- (10%) Accuracy comparison with
Project 2.
- 封面須列出小組完成項目
- 個別心得報告、個別貢獻度。
- Project 4(25%): Clustering
- (2011.1.3)上台報告(2011.1.10)心得(書面)
- 動機與目的
- 方法:
- Weka
Clustering
- 選擇至少一種Cluster方法
- 資料來源、資料統計
- 利用Project 1 or Project 2 所收集的資料
- Weka所附資料 e.g. iris.
- 實驗結果:
- 如何使用所選擇Cluster方法(參數)
- 分群結果
- 個別心得報告、個別貢獻度。
- (5%)加分:對本課程的建議(讓老師可以改進的地方!謝謝!)