最资讯丨智能识别知识：光学字符识别技术(OCR)的含义及演变

我是弱电知识君，专业的弱电知识分享者，点击右上方“关注”，每天为您分享弱电行业干货。

(相关资料图)

#图像识别#

光学字符识别 (OCR) 被定义为一组用于从图像、屏幕截图和物理纸质文档等非结构化文档中自动识别和提取文本的技术和技术，具有高度的准确性，由人工智能和计算机视觉提供支持。本文解释了 OCR 的含义及发展。

什么是 OCR？

光学字符识别 (OCR) 是一组用于从图像、屏幕截图和物理纸质文档等非结构化文档中自动识别和提取文本的技术和技术，在人工智能和计算机视觉的支持下具有很高的准确性。

OCR 的核心是一个数字复制框架，它采用自动化将扫描文档转换为可编辑和可共享的 PDF 文件。

尽管当今世界主要是数字化的，但过渡尚未完成。无论行业或工作，纸质记录仍然无处不在。扫描物理文档以进行数字处理可能很耗时，但 OCR 技术可以加快转换过程并生成更多相关文件。

光学字符识别的主要优点是它通过启用文本搜索、编辑和存储来促进数据输入。它允许组织和个人将文件保存在他们的 PC、平板电脑和其他设备或云存储中，确保所有材料都可以普遍访问。这使您可以：

最小化文档管理成本为所有利益相关者加快流程自动化处理和验证营销、人力资源等领域的材料。在集中位置整合和保护数据。防止对纸张造成物理伤害（火灾、盗窃等）通过为员工提供对最新信息的访问权限来提高效率

OCR 提供了广泛的应用。这些不仅可以帮助用户改进工作流程，还可以提高他们的生活质量。对于有视力障碍的人，OCR 软件可以解码扫描文档中的内容，然后根据个人喜好大声朗读。

OCR 还可以帮助有阅读障碍等学习障碍的人。这使得它在全球范围内广泛用于教育环境。例如，有发育障碍学生的教师可以使用 OCR 来保证在虚拟教室中进行准确有效的交流。

随着 OCR 解决方案的可用性，语言障碍也被消除了。自定义设置允许用户将图像文件中的文字翻译成不同的语言。

OCR的演变

OCR 可以一直追溯到电报。第一次世界大战期间，科学家 Emanuel Goldberg 开发了一种可以将字符转换为电报码的系统。并且，在此之前，在 20 年代，他开发了一种电子文档检索系统——这是同类产品中的第一个。IBM 最终在美国获得了他的“统计机器”的专利。

Ray Kurzweil 于 1974 年创立了 Kurzweil Computer Products, Inc.。他的全字体光学字符识别 (OCR) 系统可以检测几乎任何字体书写的文本。他认为这项技术的理想用途是作为视障人士的工具。因此，他构建了一个具有文本到语音功能的阅读机。

1980 年，施乐收购了 Kurzwell 的公司，打算将纸质文本翻译商业化。

OCR 技术在 20 世纪 90 年代初流行，当时历史报纸被数字化。从那时起，出现了多项技术进步。现代方法能够提供近乎完美的 OCR 准确性。这主要是由于人工智能 (AI)的兴起，它可以同时处理更多的复杂和多变量数据。如今，OCR 基于机器学习 (ML) 和计算机视觉，这两个都是 AI 的子集。

关键词：

(责任编辑：黄俊飞)