展開側邊欄位的漢堡樣式按鈕
top case tag

PDF 異質化產品型錄資訊提取技術開發(圖片 + 結構化資料)

案件編號 TK26051721CBDL68 ・2026/05/17 更新

  • 預算金額

    $100,000

  • 執行地點

    可遠端

  • 需求說明

    前情提要: 廠商需要從異質化的產品型錄中提取出產品資訊(廠商、代號、顏色、規格....),以及切出產品圖片 技術難點: Mistral OCR:單頁圖片文字比例差異過大,導致辨識時文字失真,且不支援圖片提取 PDF提取文字、圖片:文字&圖片相對位置缺失,無法辨識相關性 以下以測試過模型:文字辨識效果不錯,但是產品圖位置(bbox)時標註座標偏移,切到不相干的區域 Mistral OCR LlamaParse Figure Extraction LandingAI ADE Docling PyMuPDF GPT-5.5 Pro Gemini 3.1 Pro 尋求……..

登入後即可完整查看