
PDF 異質化產品型錄資訊提取技術開發(圖片 + 結構化資料)
案件編號 TK26051721CBDL68 ・2026/05/17 更新
預算金額
$100,000
執行地點
可遠端
需求說明
前情提要: 廠商需要從異質化的產品型錄中提取出產品資訊(廠商、代號、顏色、規格....),以及切出產品圖片 技術難點: Mistral OCR:單頁圖片文字比例差異過大,導致辨識時文字失真,且不支援圖片提取 PDF提取文字、圖片:文字&圖片相對位置缺失,無法辨識相關性 以下以測試過模型:文字辨識效果不錯,但是產品圖位置(bbox)時標註座標偏移,切到不相干的區域 Mistral OCR LlamaParse Figure Extraction LandingAI ADE Docling PyMuPDF GPT-5.5 Pro Gemini 3.1 Pro 尋求……..
登入後即可完整查看

