數據分析顧問的全部最新 12 筆接案案件
擅長爬蟲與資料管理(詳需求說明)
2025/12/12
1萬~5萬
可遠端
一.長期配合/初期平均每日投入時間至少4小時/產出後須及時解決問題 二.每批行業開發3-5萬元+客戶使用時負責維運及程式增修2-5萬元/月 三.請留聯絡方式詳談細節 四.工作概要:按前端及AI需求爬取或彙整FB、IG、GOOGLEMAP、官網、.....之內容,後續負責爬蟲之維運。 五.能力需求 - 核心技能與經驗 1.熟悉Python或其他爬蟲相關程式語言,具備至少2年以上實際爬蟲開發經驗。 2.能閱讀、維護並重構既有爬蟲程式。 3.理解 HTTP Request / Response 機制,能處理登入驗證、Headers、Cookies、反爬機制等問題。 4.能依據現有流程圖為主軸進行程式設計,具備獨立分析與補充細節的能力,參考已開發程式進行優化與功能擴展。 5.熟悉Web Scraping框架與工具,如Scrapy、BeautifulSoup、Selenium或Puppeteer,並能根據需求選擇合適工具。 6.具備長期合作意願,能基於現有程式碼進行維護、調整與功能迭代,確保系統穩定性與持續改進。 程式與開發能力 - 社交媒體爬蟲專長 1. 具備爬取Instagram、Facebook等社交平台貼文、短影音(Reels、Stories等)及相關資訊(如留言、按讚數、分享數)的經驗。 2. 熟悉各大社交媒體平台限制規避技巧,確保資料抓取的穩定性與合法性。 3. 能處理動態網頁(JavaScript渲染)與反爬蟲機制(如CAPTCHA、IP封鎖)的挑戰。 - 資料庫系統設計、優化、與管理 1. 熟悉關聯式資料庫(如MySQL、PostgreSQL)的設計與應用,能設計資料結構與索引,具備針對大規模資料儲存與查詢的優化經驗。 2.熟悉 Linux 環境,具備部署與排程經驗(熟悉 cron、systemd、Docker,具 Kubernetes (k8s) 經驗尤佳)。 3. 能設計高效的資料結構與索引,支援跨行業、多帳號的社交媒體資料存儲與快速檢索。 4. 具備資料清理與正規化能力,確保爬取資料的一致性與可用性。 5.有能力管理資料庫。 - 其他技術要求 1. 熟悉Microsoft Azure雲端服務,具備在Azure環境中部署與擴展爬蟲系統的經驗,熟悉相關工具(如Azure Functions、Azure Blob Storage)。 2. 熟悉容器化技術(如Docker),以支援爬蟲系統的部署與管理。 3. 具備基本的資料分析能力,能將爬取資料進行初步結構化處理,方便後續分析應用。 4.版本控制與監控 • 具備 Git / GitHub 程式版本管理經驗。 • 熟悉 錯誤監控與日誌管理(如 Sentry、ELK,或可自製監控腳本)。 - 軟性技能與其他要求 1. 問題解決與獨立研究:具備優秀的問題解決能力,能獨立研究並解決技術難題,例如應對社交平台反爬蟲機制的變化或資料庫效能瓶頸。 2. 程式碼品質與文件紀錄:熟悉版本控制工具(如Git),撰寫乾淨、可讀的程式碼,並保持詳細的文件紀錄,確保程式碼易於維護與交接。 3. 資料隱私與合規性:深入了解資料隱私與法律規範(如GDPR、平台使用條款),確保爬蟲行為符合法規要求,並能在設計爬蟲系統時考慮倫理與法律約束。 4. 跨部門協作:具備良好的溝通能力,能與資料分析、產品開發及其他部門密切合作,理解業務需求並將其轉化為技術實現。 5. 長期維護與適應性:致力於長期合作,熟悉現有程式碼庫,能快速上手並進行功能調整、錯誤修復及效能優化,適應業務需求的變化。 6. 持續學習與技術更新:對新技術與社交平台API更新的保持敏感,持續學習以適應快速變化的爬蟲環境。 7.能快速理解既有程式邏輯並進行維護與改進。 8.具備良好的溝通能力與獨立解決問題的能力。
長期合作
- 軟體程式設計
- 爬蟲程式
- 資訊技術顧問
- 數據分析顧問
2025/12/12
7人提案中
可結構化資訊內容以製作評論之AI及資料工程師(部門王經理)
2025/12/12
1萬~5萬
可遠端
一.長期配合/初期平均每日投入時間至少4小時/產出後須及時解決問題 二.每批行業開發3-5萬元+客戶使用時負責維運2-4萬元/月 三.需留言LINEID及電話詳談細節 四.能力需求: 1. 自然語言處理(NLP)與語言學 * 熟悉 NLP 基本概念,如語意分析、詞向量(word embeddings)、語境理解等。 * 了解語法結構(Syntax)、語義(Semantics)、語用(Pragmatics)。 * 能有效運用關鍵詞、上下文、格式化輸入來影響 AI 輸出。 2. AI 及大型語言模型(LLM)知識 * 理解 Transformer、GPT、BERT 等 LLM 的基本原理與工作方式。 * 知道模型的限制(如幻覺、偏見、資訊不完整)並能設計 prompt 避免問題。 * 了解 Zero-shot、Few-shot Learning等prompt 技巧,提升 LLM 回應的準確性。 3. Prompt 設計與優化技巧 * 精確性(Precision):用簡單、明確的語言表達需求。 * 上下文設計(Context Design):提供適量資訊,確保 AI 理解目標。 * 約束與格式化(Constraints & Formatting):要求特定輸出格式,如 JSON、Markdown、表 格。 * 測試與調優(A/B Testing):針對不同 prompt 設計變體,找出最佳效果。 4. 程式設計與 API 整合 * 熟悉 Python 及各大公司 API / LangChain 等框架。 * 能撰寫腳本(.sh)來自動化 prompt 測試與分析 AI 輸出結果。 * 會使用正則表達式、文本處理技巧來提取與過濾 AI 產生的內容。 5. 資料分析與評估 * 分析 AI 回應的準確度、一致性、創造性,找出最佳 prompt 模式。 * 設計 AB 測試比較不同 prompt 的效果。 6. 領域知識(Domain Knowledge) * 針對不同應用場景(如程式碼生成、醫療診斷、法律、行銷、不同產業)調整 Prompt。 * 具備 UX / UI 設計思維,確保 AI 輸出對使用者有價值。 7. 創意思維與問題解決能力 * 能夠拆解複雜問題,轉化為 AI 可理解的輸入格式。 * 透過迭代測試找到最有效的 Prompt 組合。 * 思考如何讓 AI 生成更具創意、符合需求的內容。 8. 版本控制與協作 * 有專案合作經驗,看得懂其他人專案的程式碼 * 熟悉 Git / GitHub,能與開發團隊協作管理 Prompt 與程式碼版本。 * 具備技術文件撰寫能力,記錄進度 (Prompt、流程) 設計原則與最佳實踐。 9. 安全與道德考量 * 確保 Prompt 避免產生有害內容(如偏見、虛假資訊)。 * 瞭解 AI 法規與道德風險,如歧視、隱私保護、內容審查。 10.資料庫系統設計、優化、與管理 (1). 熟悉關聯式資料庫(如MySQL、PostgreSQL)的設計與應用,能設計資料結構與索引,具備針對大規模資料儲存與查詢的優化經驗。 (2).熟悉 Linux 環境,具備部署與排程經驗(熟悉 cron、systemd、Docker,具 Kubernetes (k8s) 經驗尤佳)。 (3). 能設計高效的資料結構與索引,支援跨行業、多帳號的社交媒體資料存儲與快速檢索。 (4). 具備資料清理與正規化能力,確保爬取資料的一致性與可用性。 (5).有能力管理資料庫。 11. 持續學習與研究 * 跟蹤 AI / NLP 最新技術(如 OpenAI 發布的新模型、論文、第一手知道Deepseek消息等 等)。 * 持續優化 Prompt 設計,以適應 AI 的進步與應用需求。 12.軟性技能與其他要求 (1). 問題解決與獨立研究:具備優秀的問題解決能力,能獨立研究並解決技術難題。 (2). 程式碼品質與文件紀錄:熟悉版本控制工具(如Git),撰寫乾淨、可讀的程式碼,並保持詳細的文件紀錄,確保程式碼易於維護與交接。 (3). 資料隱私與合規性:深入了解資料隱私與法律規範(如GDPR、平台使用條款),確保爬蟲行為符合法規要求,並能在設計爬蟲系統時考慮倫理與法律約束。 (4). 跨部門協作:具備良好的溝通能力,能密切合作,理解業務需求並將其轉化為技術實現。 (5). 長期維護與適應性:致力於長期合作,熟悉現有程式碼庫,能快速上手並進行功能調整、錯誤修復及效能優化,適應業務需求的變化。 (6). 持續學習與技術更新:對新技術與社交平台API更新的保持敏感,持續學習以適應快速變化的爬蟲環境。 (7).能快速理解既有程式邏輯並進行維護與改進。 (8).具備良好的溝通能力與獨立解決問題的能力。
長期合作
- 軟體程式設計
- AIGC內容創作
- AI大數據預測模型
- 全端系統開發
- AI開發應用
- 數據分析顧問
2025/12/12
5人提案中
細心的爬蟲程式設計師&資料管理工程師
2025/12/12
1萬~5萬
可遠端
一.按當月驗收完成之行業批量計費/每批行業3-5萬元 二.長期配合/初期平均每日投入時間至少4小時/產出後所需工作時數視維運及程式增修需求調整 三.請留聯絡方式詳談細節 四.工作概要:按前端及AI需求爬取或彙整FB、IG、GOOGLEMAP、官網、.....之內容,後續負責爬蟲之維運。 五.能力需求 - 核心技能與經驗 1.熟悉Python或其他爬蟲相關程式語言,具備至少2年以上實際爬蟲開發經驗。 2.能閱讀、維護並重構既有爬蟲程式。 3.理解 HTTP Request / Response 機制,能處理登入驗證、Headers、Cookies、反爬機制等問題。 4.能依據現有流程圖為主軸進行程式設計,具備獨立分析與補充細節的能力,參考已開發程式進行優化與功能擴展。 5.熟悉Web Scraping框架與工具,如Scrapy、BeautifulSoup、Selenium或Puppeteer,並能根據需求選擇合適工具。 6.具備長期合作意願,能基於現有程式碼進行維護、調整與功能迭代,確保系統穩定性與持續改進。 程式與開發能力 - 社交媒體爬蟲專長 1. 具備爬取Instagram、Facebook等社交平台貼文、短影音(Reels、Stories等)及相關資訊(如留言、按讚數、分享數)的經驗。 2. 熟悉各大社交媒體平台限制規避技巧,確保資料抓取的穩定性與合法性。 3. 能處理動態網頁(JavaScript渲染)與反爬蟲機制(如CAPTCHA、IP封鎖)的挑戰。 - 資料庫系統設計、優化、與管理 1. 熟悉關聯式資料庫(如MySQL、PostgreSQL)的設計與應用,能設計資料結構與索引,具備針對大規模資料儲存與查詢的優化經驗。 2.熟悉 Linux 環境,具備部署與排程經驗(熟悉 cron、systemd、Docker,具 Kubernetes (k8s) 經驗尤佳)。 3. 能設計高效的資料結構與索引,支援跨行業、多帳號的社交媒體資料存儲與快速檢索。 4. 具備資料清理與正規化能力,確保爬取資料的一致性與可用性。 5.有能力管理資料庫。 - 其他技術要求 1. 熟悉Microsoft Azure雲端服務,具備在Azure環境中部署與擴展爬蟲系統的經驗,熟悉相關工具(如Azure Functions、Azure Blob Storage)。 2. 熟悉容器化技術(如Docker),以支援爬蟲系統的部署與管理。 3. 具備基本的資料分析能力,能將爬取資料進行初步結構化處理,方便後續分析應用。 4.版本控制與監控 • 具備 Git / GitHub 程式版本管理經驗。 • 熟悉 錯誤監控與日誌管理(如 Sentry、ELK,或可自製監控腳本)。 - 軟性技能與其他要求 1. 問題解決與獨立研究:具備優秀的問題解決能力,能獨立研究並解決技術難題,例如應對社交平台反爬蟲機制的變化或資料庫效能瓶頸。 2. 程式碼品質與文件紀錄:熟悉版本控制工具(如Git),撰寫乾淨、可讀的程式碼,並保持詳細的文件紀錄,確保程式碼易於維護與交接。 3. 資料隱私與合規性:深入了解資料隱私與法律規範(如GDPR、平台使用條款),確保爬蟲行為符合法規要求,並能在設計爬蟲系統時考慮倫理與法律約束。 4. 跨部門協作:具備良好的溝通能力,能與資料分析、產品開發及其他部門密切合作,理解業務需求並將其轉化為技術實現。 5. 長期維護與適應性:致力於長期合作,熟悉現有程式碼庫,能快速上手並進行功能調整、錯誤修復及效能優化,適應業務需求的變化。 6. 持續學習與技術更新:對新技術與社交平台API更新的保持敏感,持續學習以適應快速變化的爬蟲環境。 7.能快速理解既有程式邏輯並進行維護與改進。 8.具備良好的溝通能力與獨立解決問題的能力。
長期合作
- 軟體程式設計
- 爬蟲程式
- 數據分析顧問
2025/12/12
7人提案中
Python 模型、資料分析
2025/12/05
5千以下
台北市
我期末報告剩兩個禮拜但我根本不知道怎麼做,要先找一個主題,在https://data.gov.tw/ 或 https://mopsov.twse.com.tw/mops/web/index 上面選主題看哪個主題可以觀察出什麼
急件
- 問卷分析
- 數據分析顧問
2025/12/05
11人提案中
公司資料搜尋
2025/11/27
1萬~5萬
可遠端
用於業務開發 1.到經濟部商業司所屬“公司登記查詢”網站(開放資料有api可串)抓取100多萬家公司名稱、地址、資本額、董監事、電話及傳真資料(一個費用) 2.可設定某個地標(址)多少公里範圍內有哪些公司(一個費用)
長期合作
- 爬蟲程式
- 數據分析顧問
2025/11/27
17人提案中
python
2025/11/27
5,001~1萬
可遠端
用於哪個行業: 細節說明:1. 市場範圍:上市 + 上櫃 2. 今日爆量(成交量 >5日均量 3. 當日成交量 > 5 日平均成交量 4. 當日成交量 > 過去 5 日平均成交量 5. 日 KD 黃金交叉(K > D,K值上升) 6. 月 KD 黃金交叉中或剛交叉 7. 法人(特別是投信)異常買超:同時滿足以下四個條件 • 當日投信買超張數 > • 當日投信買超張數 佔該股票當日總成交量 > • 投信近 5 日累計淨買超張數 > • 投信總持股比例 < 8. 股價站上月線 9. 股價突破關鍵壓力位: 當日收盤價突破過去 60 日新高,且突破時的當日成交量為該 60 日平均成交量的 2 倍以上 10. 融資增減比 < 11. 融資 5 日未爆增:過去 5 個交易日,該股票的融資餘額總增加幅度必須低於 10% 12. 基本面 EPS > 且 ROE > 13. 殖利率 > 14. 當日漲幅適中: 當日漲幅 < 15. 近期漲幅未過大: 近 5 個交易日累計漲幅 < 16. 排除地雷股 17. 排除處置 18. 排除連續3日連續漲停股 19. 法人近 5 日淨買超100 張 20. 當日成交量 > 1,000 張 預設應按「潛力分數」由高到低進行降序排列用 Excel 檔案輸出結果,包含股票代碼、名稱,以及符合條件的關鍵指標數據。
- 軟體程式設計
- 市場研究
- 數據分析顧問
2025/11/27
18人提案中
python
2025/11/27
5,001~1萬
可遠端
用於哪個行業: 細節說明:1. 市場範圍:上市 + 上櫃 2. 今日爆量(成交量 >5日均量 3. 當日成交量 > 5 日平均成交量 4. 當日成交量 > 過去 5 日平均成交量 5. 日 KD 黃金交叉(K > D,K值上升) 6. 月 KD 黃金交叉中或剛交叉 7. 法人(特別是投信)異常買超:同時滿足以下四個條件 • 當日投信買超張數 > • 當日投信買超張數 佔該股票當日總成交量 > • 投信近 5 日累計淨買超張數 > • 投信總持股比例 < 8. 股價站上月線 9. 股價突破關鍵壓力位: 當日收盤價突破過去 60 日新高,且突破時的當日成交量為該 60 日平均成交量的 2 倍以上 10. 融資增減比 < 11. 融資 5 日未爆增:過去 5 個交易日,該股票的融資餘額總增加幅度必須低於 10% 12. 基本面 EPS > 且 ROE > 13. 殖利率 > 14. 當日漲幅適中: 當日漲幅 < 15. 近期漲幅未過大: 近 5 個交易日累計漲幅 < 16. 排除地雷股 17. 排除處置 18. 排除連續3日連續漲停股 19. 法人近 5 日淨買超100 張 20. 當日成交量 > 1,000 張 預設應按「潛力分數」由高到低進行降序排列用 Excel 檔案輸出結果,包含股票代碼、名稱,以及符合條件的關鍵指標數據。
- 軟體程式設計
- 市場研究
- 數據分析顧問
2025/11/27
15人提案中
數據分析整理
2025/11/27
預算詳談
高雄市
用於哪個行業:運輸行業 細節說明:使用power bi歷年客戶資料統整與分析
長期合作
- 網站數據分析
- 數據分析顧問
2025/11/27
15人提案中
企業永續報告書編寫外包項目
2025/11/27
預算詳談
可遠端
需求名稱:企業永續報告書編寫 用於哪個行業:LED行業 細節說明:編寫一份6.5萬字、145頁的企業永續報告書。
想了解價格
- 企業ESG顧問
- 說明/技術文件撰寫
- 數據分析顧問
2025/11/27
13人提案中
財務報表自動化
2025/11/17
5,001~1萬
高雄市
目前公司財務是用 Google Sheet 登打 • 請款單、零用金申請 我希望把這些資料串成一個「自動化支出儀表板」,讓 AI 幫我整理與分類。 👨💻 我想做的東西 • 用 Google Sheet 當資料來源 • AI / 自動化流程幫我: • 讀取請款與零用金資料 • 自動分類(部門、費用類別、專案) • 產出簡單好懂的支出儀表板
需開立發票
長期合作
- 財務管理系統
- AI大數據預測模型
- 數據分析顧問
- AI自動化服務
2025/11/17
16人提案中
醫療評鑑資料整合專案:尋找Power BI與Excel專家
2025/11/03
預算詳談
台北市
需求名稱:POWER BI程式操作。行業:醫療評鑑。細節:尋找熟悉Power BI和Excel操作的專業人士協助完成資料整合。
想了解價格
- 前端開發
- 數據分析顧問
2025/11/03
16人提案中
EVERPADS 資料清理+資料原則與治理制度
2025/10/30
5,001~1萬
台中市
1) 專案目標 建立可長期維運的資料治理原則與命名/編碼規範,解決同物不同名、括號資訊混入主欄位、代碼誤用數值型別等問題;括號內容統一存成備註文字,不做區域/排放等結構化。 2) 工作範疇(Scope) A. 資料治理原則 分層:Staging → Standardized → Production 單一事實單一欄位、可復原、可追溯 型別策略:所有代碼(Type/Maker/Model Code、Machine code)一律 TEXT/VARCHAR 版本/變更治理與審核留痕(誰改、改什麼、何時) B. 命名與編碼規範 雙軌命名 model_display(展示名):保留原樣(大小寫/空格/符號/括號可存在) model_key(比對鍵):只允許 A–Z0–9,全大寫;移除空格、連字號、斜線、點與括號內容 規則示例:W210Fi、W 210 Fi、W-210-FI (2020) → model_key = W210FI 括號處理 括號內的任何資訊(年份、備註等)不解析成結構欄,統一放到 model_notes(TEXT) 主欄 model_base 僅保留型號主幹(不含括號、不含空格/連字號) 衍生欄 Machine full name = {Machine type}-{Maker}-{model_base}(由規則自動生成,不手填) 代碼規範 Type Code=2 碼、Maker Code=3 碼、Model Code=4 碼(可調),左側補零 C. 主數據管理與字典(Controlled Vocabulary) 受控清單:Maker、Machine type 新值申請與核准流程(白名單) D. 資料品質(DQ)與驗證 規則:長度、字元集(允許集)、必填、唯一性、外鍵、括號殘留檢查 例外佇列:未過字典、鍵衝突;處理SLA E. 角色/流程(RACI) Data Owner / Steward / Engineer / 業務視角窗口 變更申請 → 自動檢查 → 人工核准 → 發布 → 稽核 3) 交付物 資料原則文件(PDF/Markdown):政策、標準、流程 命名與編碼規範手冊:model_key/model_display/model_base/model_notes 定義與生成規則 字典與維護SOP:Maker、Machine type 資料品質規則清單(含 SQL/Python 偽碼) RACI 與變更流程圖(含表單/變更單模板) 導入建議:如何在 ERP/匯入表單強制規則(必填、正則、白名單)
急件
- 寫作服務
- 說明/技術文件撰寫
- 數據分析顧問
2025/10/30
3人提案中

