已關閉
資料整理匯出
案件編號 TK22012717VWLV02 ・2022/01/27 更新
期望完成日
2022/02/20
需求說明
1.案件說明: (1)需至「中國台灣網」搜尋關鍵字「媽祖」至少前二十頁的頁面進行爬蟲。 (http://zhannei.baidu.com/cse/search?q=%8B%8C%D7%E6&s=12472666198958497854&entry=1) (2)將搜尋出的每一則新聞頁面的:標題、網址、作者、發布日期、來源彙整成excel檔,並標號辨識。 (3)將搜尋出的每一則新聞頁面的內文,彙整成word檔,檔名以「標題_編號」進行辨識。 2.注意事項: (1)「中國台灣網」為新聞網站,希望可以有隨時更新取用新資料。 (2)日後可能需要用類似的方式於該網站搜尋其他關鍵字,希望能代換成其他關鍵字。
登入後即可完整查看

