服務內容全部包含:
提取PDF關鍵維度的內容,生成結構化的段落。
對字符的字體和樣式做聚類分析,生成樣式和PDF高度一致的HTML頁面。
生成html高度還原PDF。
服務優(yōu)勢:
1. 利用PDF解析得到的字符,線,矩形框,文本行等元素的位置信息做聚類分析,精確定位表格,提高了解析的準確度。
2. 通過語義分析得到關鍵維度的內容,以HTML形式展示時,保留關鍵樣式信息,和PDF原文保持高度一致,改善了閱讀體驗。
服務前需客戶提供的信息:
PDF樣例需要覆蓋用到的所有PDF基本排版。
需求需要明確HTML還原哪些元素,比如是否需要樣式信息等。
解析性能要求比如錯誤率要求。
文字轉換軟件文字識別軟件B/S定制開發(fā)二次開發(fā)源碼交付成品購買