diff --git a/docs/blog/index.html b/docs/blog/index.html index fbf636c..d5fa92d 100644 --- a/docs/blog/index.html +++ b/docs/blog/index.html @@ -726,8 +726,8 @@

id: 3 , href: "\/TableStructureRec\/docs\/install_usage\/lineless_table_rec\/", title: "lineless_table_rec", - description: "简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。 在这里,我们做的工作主要包括以下两点: 将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR 模型转换ONNX link详情参考:ConvertLOREToONNX 安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 from lineless_table_rec import LinelessTableRecognition engine = LinelessTableRecognition() img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_str, elapse = engine(img_path) print(table_str) print(elapse) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.", - content: " 简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 from lineless_table_rec import LinelessTableRecognition engine = LinelessTableRecognition() img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_str, elapse = engine(img_path) print(table_str) print(elapse) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.74 70 23 Ella 26 女 1.60 58 23 Eartha 女 1.34 29 16 Thelonious 6 男 1.07 17 15 TARO 22 男 1.728 65 21.7 HANAKO 22 女 1.60 53 20.7 NARMAN 38 男 1.76 73 NAOMI 23 女 1.63 60 " + description: "简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = \"outputs\" img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f\"cost: {elasp:.5f}\") complete_html = format_html(html) os.makedirs(os.path.dirname(f\"{output_dir}/table.html\"), exist_ok=True) with open(f\"{output_dir}/table.html\", \"w\", encoding=\"utf-8\") as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f\"{output_dir}/table_rec_box.jpg\", logic_points, polygons ) plot_rec_box(img_path, f\"{output_dir}/ocr_box.", + content: " 简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = \"outputs\" img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f\"cost: {elasp:.5f}\") complete_html = format_html(html) os.makedirs(os.path.dirname(f\"{output_dir}/table.html\"), exist_ok=True) with open(f\"{output_dir}/table.html\", \"w\", encoding=\"utf-8\") as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f\"{output_dir}/table_rec_box.jpg\", logic_points, polygons ) plot_rec_box(img_path, f\"{output_dir}/ocr_box.jpg\", ocr_res) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.74 70 23 Ella 26 女 1.60 58 23 Eartha 女 1.34 29 16 Thelonious 6 男 1.07 17 15 TARO 22 男 1.728 65 21.7 HANAKO 22 女 1.60 53 20.7 NARMAN 38 男 1.76 73 NAOMI 23 女 1.63 60 " } ); index.add( diff --git a/docs/blog/lineless_table_rec/index.html b/docs/blog/lineless_table_rec/index.html index cfc2570..ac2e6c4 100644 --- a/docs/blog/lineless_table_rec/index.html +++ b/docs/blog/lineless_table_rec/index.html @@ -809,8 +809,8 @@

参考资料 3. 推理代码 参考资料 2023-11-19 update: id: 3 , href: "\/TableStructureRec\/docs\/install_usage\/lineless_table_rec\/", title: "lineless_table_rec", - description: "简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。 在这里,我们做的工作主要包括以下两点: 将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR 模型转换ONNX link详情参考:ConvertLOREToONNX 安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 from lineless_table_rec import LinelessTableRecognition engine = LinelessTableRecognition() img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_str, elapse = engine(img_path) print(table_str) print(elapse) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.", - content: " 简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 from lineless_table_rec import LinelessTableRecognition engine = LinelessTableRecognition() img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_str, elapse = engine(img_path) print(table_str) print(elapse) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.74 70 23 Ella 26 女 1.60 58 23 Eartha 女 1.34 29 16 Thelonious 6 男 1.07 17 15 TARO 22 男 1.728 65 21.7 HANAKO 22 女 1.60 53 20.7 NARMAN 38 男 1.76 73 NAOMI 23 女 1.63 60 " + description: "简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = \"outputs\" img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f\"cost: {elasp:.5f}\") complete_html = format_html(html) os.makedirs(os.path.dirname(f\"{output_dir}/table.html\"), exist_ok=True) with open(f\"{output_dir}/table.html\", \"w\", encoding=\"utf-8\") as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f\"{output_dir}/table_rec_box.jpg\", logic_points, polygons ) plot_rec_box(img_path, f\"{output_dir}/ocr_box.", + content: " 简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = \"outputs\" img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f\"cost: {elasp:.5f}\") complete_html = format_html(html) os.makedirs(os.path.dirname(f\"{output_dir}/table.html\"), exist_ok=True) with open(f\"{output_dir}/table.html\", \"w\", encoding=\"utf-8\") as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f\"{output_dir}/table_rec_box.jpg\", logic_points, polygons ) plot_rec_box(img_path, f\"{output_dir}/ocr_box.jpg\", ocr_res) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.74 70 23 Ella 26 女 1.60 58 23 Eartha 女 1.34 29 16 Thelonious 6 男 1.07 17 15 TARO 22 男 1.728 65 21.7 HANAKO 22 女 1.60 53 20.7 NARMAN 38 男 1.76 73 NAOMI 23 女 1.63 60 " } ); index.add( diff --git a/docs/index.html b/docs/index.html index a0f2153..9743e9f 100644 --- a/docs/index.html +++ b/docs/index.html @@ -786,8 +786,8 @@

id: 3 , href: "\/TableStructureRec\/docs\/install_usage\/lineless_table_rec\/", title: "lineless_table_rec", - description: "简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。 在这里,我们做的工作主要包括以下两点: 将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR 模型转换ONNX link详情参考:ConvertLOREToONNX 安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 from lineless_table_rec import LinelessTableRecognition engine = LinelessTableRecognition() img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_str, elapse = engine(img_path) print(table_str) print(elapse) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.", - content: " 简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 from lineless_table_rec import LinelessTableRecognition engine = LinelessTableRecognition() img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_str, elapse = engine(img_path) print(table_str) print(elapse) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.74 70 23 Ella 26 女 1.60 58 23 Eartha 女 1.34 29 16 Thelonious 6 男 1.07 17 15 TARO 22 男 1.728 65 21.7 HANAKO 22 女 1.60 53 20.7 NARMAN 38 男 1.76 73 NAOMI 23 女 1.63 60 " + description: "简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = \"outputs\" img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f\"cost: {elasp:.5f}\") complete_html = format_html(html) os.makedirs(os.path.dirname(f\"{output_dir}/table.html\"), exist_ok=True) with open(f\"{output_dir}/table.html\", \"w\", encoding=\"utf-8\") as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f\"{output_dir}/table_rec_box.jpg\", logic_points, polygons ) plot_rec_box(img_path, f\"{output_dir}/ocr_box.", + content: " 简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = \"outputs\" img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f\"cost: {elasp:.5f}\") complete_html = format_html(html) os.makedirs(os.path.dirname(f\"{output_dir}/table.html\"), exist_ok=True) with open(f\"{output_dir}/table.html\", \"w\", encoding=\"utf-8\") as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f\"{output_dir}/table_rec_box.jpg\", logic_points, polygons ) plot_rec_box(img_path, f\"{output_dir}/ocr_box.jpg\", ocr_res) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.74 70 23 Ella 26 女 1.60 58 23 Eartha 女 1.34 29 16 Thelonious 6 男 1.07 17 15 TARO 22 男 1.728 65 21.7 HANAKO 22 女 1.60 53 20.7 NARMAN 38 男 1.76 73 NAOMI 23 女 1.63 60 " } ); index.add( diff --git a/docs/install_usage/index.html b/docs/install_usage/index.html index 106b7d4..47400ad 100644 --- a/docs/install_usage/index.html +++ b/docs/install_usage/index.html @@ -709,8 +709,8 @@

id: 3 , href: "\/TableStructureRec\/docs\/install_usage\/lineless_table_rec\/", title: "lineless_table_rec", - description: "简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。 在这里,我们做的工作主要包括以下两点: 将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR 模型转换ONNX link详情参考:ConvertLOREToONNX 安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 from lineless_table_rec import LinelessTableRecognition engine = LinelessTableRecognition() img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_str, elapse = engine(img_path) print(table_str) print(elapse) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.", - content: " 简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 from lineless_table_rec import LinelessTableRecognition engine = LinelessTableRecognition() img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_str, elapse = engine(img_path) print(table_str) print(elapse) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.74 70 23 Ella 26 女 1.60 58 23 Eartha 女 1.34 29 16 Thelonious 6 男 1.07 17 15 TARO 22 男 1.728 65 21.7 HANAKO 22 女 1.60 53 20.7 NARMAN 38 男 1.76 73 NAOMI 23 女 1.63 60 " + description: "简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = \"outputs\" img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f\"cost: {elasp:.5f}\") complete_html = format_html(html) os.makedirs(os.path.dirname(f\"{output_dir}/table.html\"), exist_ok=True) with open(f\"{output_dir}/table.html\", \"w\", encoding=\"utf-8\") as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f\"{output_dir}/table_rec_box.jpg\", logic_points, polygons ) plot_rec_box(img_path, f\"{output_dir}/ocr_box.", + content: " 简介 linklineless_table_rec库源于阿里读光-LORE无线表格结构识别模型。\n在这里,我们做的工作主要包括以下两点:\n将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR\n模型转换ONNX link详情参考:ConvertLOREToONNX\n安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = \"outputs\" img_path = \"tests/test_files/lineless_table_recognition.jpg\" table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f\"cost: {elasp:.5f}\") complete_html = format_html(html) os.makedirs(os.path.dirname(f\"{output_dir}/table.html\"), exist_ok=True) with open(f\"{output_dir}/table.html\", \"w\", encoding=\"utf-8\") as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f\"{output_dir}/table_rec_box.jpg\", logic_points, polygons ) plot_rec_box(img_path, f\"{output_dir}/ocr_box.jpg\", ocr_res) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) 姓名 年龄 性别 身高/m 体重/kg BMI/(kg/m²) Duke 34 男 1.74 70 23 Ella 26 女 1.60 58 23 Eartha 女 1.34 29 16 Thelonious 6 男 1.07 17 15 TARO 22 男 1.728 65 21.7 HANAKO 22 女 1.60 53 20.7 NARMAN 38 男 1.76 73 NAOMI 23 女 1.63 60 " } ); index.add( diff --git a/docs/install_usage/index.xml b/docs/install_usage/index.xml index 999f392..66659c6 100644 --- a/docs/install_usage/index.xml +++ b/docs/install_usage/index.xml @@ -17,7 +17,7 @@ 在这里,我们做的工作主要包括以下两点: 将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR 模型转换ONNX link详情参考:ConvertLOREToONNX -安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 from lineless_table_rec import LinelessTableRecognition engine = LinelessTableRecognition() img_path = &#34;tests/test_files/lineless_table_recognition.jpg&#34; table_str, elapse = engine(img_path) print(table_str) print(elapse) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) &lt;html&gt; &lt;body&gt; &lt;table&gt; &lt;tbody&gt; &lt;tr&gt; &lt;td rowspan=&#34;1&#34; colspan=&#34;1&#34;&gt;姓名&lt;/td&gt; &lt;td rowspan=&#34;1&#34; colspan=&#34;1&#34;&gt;年龄&lt;/td&gt; &lt;td rowspan=&#34;1&#34; colspan=&#34;1&#34;&gt;性别&lt;/td&gt; &lt;td rowspan=&#34;1&#34; colspan=&#34;1&#34;&gt;身高/m&lt;/td&gt; &lt;td rowspan=&#34;1&#34; colspan=&#34;1&#34;&gt;体重/kg&lt;/td&gt; &lt;td rowspan=&#34;1&#34; colspan=&#34;1&#34;&gt;BMI/(kg/m²)&lt;/td&gt; &lt;/tr&gt; &lt;tr&gt; &lt;td rowspan=&#34;1&#34; colspan=&#34;1&#34;&gt;Duke&lt;/td&gt; &lt;td rowspan=&#34;1&#34; colspan=&#34;1&#34;&gt;34&lt;/td&gt; &lt;td rowspan=&#34;1&#34; colspan=&#34;1&#34;&gt;男&lt;/td&gt; &lt;td rowspan=&#34;1&#34; colspan=&#34;1&#34;&gt;1. +安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = &#34;outputs&#34; img_path = &#34;tests/test_files/lineless_table_recognition.jpg&#34; table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f&#34;cost: {elasp:.5f}&#34;) complete_html = format_html(html) os.makedirs(os.path.dirname(f&#34;{output_dir}/table.html&#34;), exist_ok=True) with open(f&#34;{output_dir}/table.html&#34;, &#34;w&#34;, encoding=&#34;utf-8&#34;) as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f&#34;{output_dir}/table_rec_box.jpg&#34;, logic_points, polygons ) plot_rec_box(img_path, f&#34;{output_dir}/ocr_box. diff --git a/docs/install_usage/lineless_table_rec/index.html b/docs/install_usage/lineless_table_rec/index.html index 4a0301a..993e73c 100644 --- a/docs/install_usage/lineless_table_rec/index.html +++ b/docs/install_usage/lineless_table_rec/index.html @@ -37,18 +37,18 @@ 在这里,我们做的工作主要包括以下两点: 将模型转换为ONNX格式,便于部署 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容 info 该库仅提供推理代码,如有训练模型需求,请移步LORE-TSR 模型转换ONNX link详情参考:ConvertLOREToONNX -安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 from lineless_table_rec import LinelessTableRecognition engine = LinelessTableRecognition() img_path = "tests/test_files/lineless_table_recognition.jpg" table_str, elapse = engine(img_path) print(table_str) print(elapse) $ lineless_table_rec -img tests/test_files/lineless_table_recognition.jpg 查看效果 link 识别结果(点击展开) <html> <body> <table> <tbody> <tr> <td rowspan="1" colspan="1">姓名</td> <td rowspan="1" colspan="1">年龄</td> <td rowspan="1" colspan="1">性别</td> <td rowspan="1" colspan="1">身高/m</td> <td rowspan="1" colspan="1">体重/kg</td> <td rowspan="1" colspan="1">BMI/(kg/m²)</td> </tr> <tr> <td rowspan="1" colspan="1">Duke</td> <td rowspan="1" colspan="1">34</td> <td rowspan="1" colspan="1">男</td> <td rowspan="1" colspan="1">1." /> +安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = "outputs" img_path = "tests/test_files/lineless_table_recognition.jpg" table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f"cost: {elasp:.5f}") complete_html = format_html(html) os.makedirs(os.path.dirname(f"{output_dir}/table.html"), exist_ok=True) with open(f"{output_dir}/table.html", "w", encoding="utf-8") as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f"{output_dir}/table_rec_box.jpg", logic_points, polygons ) plot_rec_box(img_path, f"{output_dir}/ocr_box." /> - + +安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = "outputs" img_path = "tests/test_files/lineless_table_recognition.jpg" table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f"cost: {elasp:.5f}") complete_html = format_html(html) os.makedirs(os.path.dirname(f"{output_dir}/table.html"), exist_ok=True) with open(f"{output_dir}/table.html", "w", encoding="utf-8") as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f"{output_dir}/table_rec_box.jpg", logic_points, polygons ) plot_rec_box(img_path, f"{output_dir}/ocr_box."/> @@ -489,14 +489,14 @@

使用 Python脚本使用 + id="cadefbTab" data-bs-toggle="tab" data-bs-target="#cadefb" + type="button" role="tab" aria-controls="cadefb" aria-selected="true">Python脚本使用 终端使用 + id="acfebdTab" data-bs-toggle="tab" data-bs-target="#acfebd" + type="button" role="tab" aria-controls="acfebd" aria-selected="true">终端使用 @@ -512,7 +512,7 @@

使用 + @@ -553,7 +570,7 @@

使用 + @@ -1050,8 +1068,8 @@

查看效果 使用 Python脚本使用 + id="ecfbdaTab" data-bs-toggle="tab" data-bs-target="#ecfbda" + type="button" role="tab" aria-controls="ecfbda" aria-selected="true">Python脚本使用 终端使用 + id="bdeacfTab" data-bs-toggle="tab" data-bs-target="#bdeacf" + type="button" role="tab" aria-controls="bdeacf" aria-selected="true">终端使用 @@ -504,7 +504,7 @@

使用 +
@@ -545,7 +545,7 @@

使用 +
@@ -996,8 +996,8 @@

查看效果 表格结构化识别 Buy me a Coffee +安装 link pip install lineless_table_rec 使用 link Python脚本使用 终端使用 import os from lineless_table_rec import LinelessTableRecognition from lineless_table_rec.utils_table_recover import ( format_html, plot_rec_box, plot_rec_box_with_logic_info, ) output_dir = &#34;outputs&#34; img_path = &#34;tests/test_files/lineless_table_recognition.jpg&#34; table_rec = LinelessTableRecognition() html, elasp, polygons, logic_points, ocr_res = table_rec(img_path) print(f&#34;cost: {elasp:.5f}&#34;) complete_html = format_html(html) os.makedirs(os.path.dirname(f&#34;{output_dir}/table.html&#34;), exist_ok=True) with open(f&#34;{output_dir}/table.html&#34;, &#34;w&#34;, encoding=&#34;utf-8&#34;) as file: file.write(complete_html) plot_rec_box_with_logic_info( img_path, f&#34;{output_dir}/table_rec_box.jpg&#34;, logic_points, polygons ) plot_rec_box(img_path, f&#34;{output_dir}/ocr_box. diff --git a/sitemap.xml b/sitemap.xml index c3aac93..9c3f160 100644 --- a/sitemap.xml +++ b/sitemap.xml @@ -12,7 +12,7 @@ 2023-11-21T09:41:44+08:00 https://rapidai.github.io/TableStructureRec/docs/install_usage/lineless_table_rec/ - 2024-03-10T14:48:18+08:00 + 2024-09-12T19:30:54+08:00 https://rapidai.github.io/TableStructureRec/docs/install_usage/wired_table_rec/ 2023-11-22T21:53:08+08:00 @@ -39,10 +39,10 @@ 2024-09-12T09:44:55+08:00 https://rapidai.github.io/TableStructureRec/docs/ - 2024-09-12T09:44:55+08:00 + 2024-09-12T19:30:54+08:00 https://rapidai.github.io/TableStructureRec/ - 2024-09-12T09:44:55+08:00 + 2024-09-12T19:30:54+08:00 https://rapidai.github.io/TableStructureRec/categories/