olmOCR olmOCR 是由 AllenAI 推出的开源 PDF 转文本工具,面向文档解析、OCR 识别和结构化文本提取场景。它旨在高精度保留 PDF 的阅读顺序,并支持表格、公式、手写内容等复杂版面识别,适合用于学术论文、扫描文档、数据处理和知识库构建等工作流程。作为开源项目,olmOCR 可为开发者和研究人员提供可扩展的文档转换能力。 开源与社区 # AllenAI # OCR