AWS Academy Learner Lab - Foundation Services [4976] EE300016 [A] 大數據資料處理(資工系)
上課時間:(一)456 (I627)
MS-Teams : (資工系)
成績(Score) [A] 大數據資料處理(資工系)
(資工系)期末專題分組名單 上課時間:(一)456 (I627)
Download: jdk-8u291-windows-x64.exe (Java 8 以前版本)
Windows 安裝 JDK 開發環境
Download: (Hadoop 2.7.1) windoop_2.7.1_with_HBase_jre8_x64_zh_TW.7z (感謝 Windoop 林奇暻 先生提供)
[2-1-1]:Windoop Download
[2-1-2]:Windoop Install
[2-1-3]:Windoop Start.bat
NameNode HDFS Web http://localhost:50070/
Resource Manager Web http://localhost:8088
[2-1-4]:Windoop Program Testing : PresentElection
匯入外部 jar
1. "\windoop\hadoop\share\hadoop\common\*.jar
2. "\windoop\hadoop\share\hadoop\common\lib\*.jar
3. "\windoop\hadoop\share\hadoop\hdfs\*.jar
4. "\windoop\hadoop\share\hadoop\mapreduce\*.jar
5. "\windoop\hadoop\share\hadoop\yarn\*.jar
修改"WordCount_jdwang.java"
參數:"input output_學號"
環境:
HADOOP_HOME=>${eclipse_home}\..\hadoop
PATH=> %PATH%;${eclipse_home}\..\hadoop\bin
(c)[5%] AWS EC2 執行 "word_count_你的學號.jar" WordCount Examples WordCount_jdwang_2016_10_12.zip
修改 "WordCount_jdwang.java" "Mapper_jdwang.java" "Reducer_jdwang.java" <
將"jdwang" 改成你的學號如:"WordCount_10500001.java" "Mapper_10500001.java" "Reducer_10500001.java"
(注意:需要調整"WordCount_10500001.java"的對應檔案)
(完成後,刪除"WordCount_jdwang.java" "Mapper_jdwang.java" "Reducer_jdwang.java")
並完成 compiler 後可以執行
書面報告(封面、完成項目(條列)、方法(畫面舉證)、心得與討論)+ YouTube (URL)(設定:半公開)
期中專題分組名單(跨領域學程) 上課時間:(四)234 (I628)
(1) 選一個你熟悉或想要觀察的匝道(說明你的動機:為何要選這個匝道?) <利用 Google Map 標示出來>利用>
(國道計費門架座標及里程牌價表104.09.04版.csv)
國道計費門架座標
如: "03F-186.0S"(國道三號 龍井-和美)=> GantryID="03F1860S"
高速公路計費匝道位置-Google Map 匯入教學
參考程式:
TDCS_GIDSequence_GantryID_VihicleType_Date_Weekday_24Hour_Statistics_jdwang_2020_10_28.zip(上交流道+下交流道)
(1) 修改:(main&mapper)匝道名稱 {String TargetGantryID = "01F0557N"; // 想要觀察的匝道}
(2) 修改 input path(輸入)
(3) 修改 output path(輸出)
以{龍井}交流道為例:
{上交流道}:
{從龍井南下}: 如: "03F-186.0S"(國道三號 龍井-和美)=> GantryID="03F1860S"
{從龍井北上}: 如: "03F-177.9N"(國道三號 龍井-沙鹿)=> GantryID="03F1779N"
{下交流道}:
{南下到龍井}: 如: "03F-177.9S"(國道三號 沙鹿-龍井)=> GantryID="03F1779S"
{北上到龍井}: 如: "03F-186.0N"(國道三號 和美-龍井)=> GantryID="03F1860N"
小組書面報告:(全組繳交一份即可)
題目:交通部高速公路閘道資料資訊擷取-以?閘道為例
報告格式: 題目 動機 目的 方法 執行步驟 結果(運算平台(軟硬體,執行時間效能比較)(週次比較(連假?)X 星期(Mon..Sun) X 24hour X 車種(31,32,41,42,5))X 方向(南下 vs 北上) 分工(個別貢獻百分比) 學習心得(每個組員都要)
小組成員:(學號+姓名)
個別貢獻百分比(全組總和=100%)(小組成績微調,如:兩人一組個別貢獻百分比 45% (小組成績*95%)和 55% (小組成績*105%)
Youtube 說明影片 URL(2~3分鐘)
小組會議記錄(至少2次)
個人心得(每個組員都要)
上台報告: (2021/12/27) 第一梯次 (2022/1/3) 第二梯次
書面報告(2022/1/11 Moodle (PPT+Report+YouTube))
(跨領域學程)期末專題分組名單 上課時間:(四)234 (I628)
上台報告: ((2022/1/6)
書面報告(2022/1/14 Moodle (PPT+Report+YouTube))
計算平台選擇: (計算時間比較)
(1)(+3%) Windoop (Single Node)
(2)(+5%) (1)+Windoop (Cluster)
(3)(+10%)(2)+ AWS EMR
JOB: Artificial Intelligence (AI) = Big Data + Data Science + Machine Learing + Cloud Computing)
1111人力銀行 (Big Data)
104人力銀行 (Big Data)