DeepSeek-OCR-2真实案例：医院检验报告单→结构化提取项目/结果/单位/参考值

lanjieying

117人浏览 · 2026-03-25 00:27:11

lanjieying · 2026-03-25 00:27:11 发布

DeepSeek-OCR-2真实案例：医院检验报告单→结构化提取项目/结果/单位/参考值

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

1. 项目简介

DeepSeek-OCR-2 是一个基于深度学习的智能文档解析工具，专门针对复杂排版文档的结构化信息提取而设计。与传统的OCR工具只能提取纯文本不同，这个工具能够精准识别文档中的表格、多级标题、段落等结构化元素，并将提取内容自动转换为标准的Markdown格式。

这个工具特别适合处理医院检验报告单这类结构化文档。传统的OCR工具提取检验报告单时，往往只能得到一堆杂乱的文字，需要人工重新整理项目名称、检测结果、单位和参考值。而DeepSeek-OCR-2能够自动识别这些信息的结构关系，直接输出格式清晰的Markdown文档，大大提高了工作效率。

2. 检验报告单解析实战

2.1 准备工作

首先确保你已经部署了DeepSeek-OCR-2工具。启动后通过浏览器访问工具界面，你会看到清晰的双列布局：

左侧是文档上传区域，支持拖拽或点击上传PNG、JPG、JPEG格式的检验报告单图片
右侧是结果展示区域，提取完成后会显示预览、源码和检测效果三个标签页

2.2 上传检验报告单

找一张医院检验报告单的图片，最好是包含常见项目如血常规、尿常规、生化指标等的报告。上传后左侧会显示图片预览，确保文字清晰可辨。

2.3 执行提取操作

点击中间的"一键提取"按钮，工具会开始处理图片。由于采用了Flash Attention 2加速技术和BF16精度优化，即使是复杂的检验报告单也能在短时间内完成处理。

处理过程中，工具会自动识别报告单中的表格结构，区分表头、数据行和备注信息。对于检验报告单，它会特别关注项目名称、检测结果、单位和参考值这些关键字段。

2.4 查看提取结果

处理完成后，右侧会显示三个标签页：

预览标签页：以渲染后的Markdown形式展示提取结果，可以看到整齐的表格格式
源码标签页：显示原始的Markdown代码，方便复制和使用
检测效果标签页：显示OCR识别过程中的检测框，可以看到工具是如何识别各个文字区域的

3. 实际效果展示

我使用了一张血常规检验报告单进行测试，报告单包含白细胞计数、红细胞计数、血红蛋白、血小板等常见项目。

提取前的报告单图片是一张典型的医院检验单，包含表格线和各种医学指标。经过DeepSeek-OCR-2处理后的Markdown结果令人印象深刻：

| 项目 | 结果 | 单位 | 参考值 |
|------|------|------|--------|
| 白细胞计数 | 6.5 | ×10⁹/L | 4.0-10.0 |
| 红细胞计数 | 4.8 | ×10¹²/L | 4.0-5.5 |
| 血红蛋白 | 145 | g/L | 120-160 |
| 血小板计数 | 210 | ×10⁹/L | 100-300 |

工具准确识别了表格结构，将项目名称、检测结果、单位和参考值完美地分离到不同的列中。即使是上标符号（如10⁹/L）也能正确识别和处理。

更令人惊喜的是，工具还能正确处理合并单元格和备注信息。比如报告单下方的"提示：建议复查"等备注文字，会被识别为单独的段落，不会混入表格数据中。