Forgot password
 Register account
View 272|Reply 8

公式识别

[Copy link]

3211

Threads

7832

Posts

52

Reputation

Show all posts

hbghlyj posted 2022-8-5 01:20 |Read mode

光学字符识别(OCR/Optical Character Recognition)

假设您在屏幕或一张纸上写下您想要识别的内容,首先,您需要表示墨迹,使它适合计算机处理.有两种常用方法:光学字符识别和数字墨迹识别. 使用光学扫描仪或照相机扫描书写的页面会产生位图图像,即像素阵列.每个像素代表所捕获内容的一部分.OCR应用程序分析图像,从这些数据中提取形状信息,而这依赖于墨迹的视觉表现.
"hello" 位图 识别 扫描或拍照
因此,OCR必须从纸上区分手写和印刷.这可能会导致识别错误. 广为人知的mathpix API:mathpix.github.io/docs可识别印刷或手写的公式,每月1000次免费请求. Snip 是由 Mathpix 打造的一款出色的应用. 它可以帮助你提取文档中的公式,简单表格,或者文本将其转换为 LaTeX 和 MathML 格式,并每月提供给所有用户 50 次免费识别(通过 .edu 或 .ac.uk 邮箱注册每月获得 100 次识别).在 MathpixOCR API 以及 Image2LaTeX 这款补充应用的帮助下,你可以每月免费进行 1000 次的 OCR 识别.Image2LaTeX 是一个个人项目,仅保留了 Snip 的核心功能——将图片转换为特定 LaTeX 格式的公式或文本. 如果需要进阶功能,请每月 4.99 美元订阅 Snip. Detexify能将一个手写符号识别为LaTeX,每月2000次免费请求.(在线范例见http://detexify.kirelabs.org/classify.html)

数字墨迹识别(Digital Ink Recognition)

数字墨迹识别系统分析墨迹(二维点阵),它们由各种设备产生,包括:屏幕触摸或手写笔,数字笔和纸,位图的矢量化(虽然这很难做到).
"hello" 数字墨迹 识别 捕获

收集的数字墨迹记录了手写的笔迹.从落笔直到抬笔,它还可能包括有关书写的压力的信息.
因此,一系列"笔事件"对笔画进行建模.第一个事件是落笔,最后一个是抬笔,所有其他的都是移动.每个事件还包含空间和时间信息:(x,y,t,P).xy是笔的坐标,t是绝对时间,P是压力(可选).
所以数字墨水识别是一个动态过程.该方法根据笔画开始的位置,结束的位置以及绘制它们的顺序来执行字符,文本或形状识别.
MyScript(GitHub)仅使用数字墨迹作为输入执行在线识别,而不能识别图像(即OCR).
(开发工具包)
(注:有一个地方我不太理解,为什么在电脑屏幕上用鼠标写字也有压力信息?)
对于开源系统,SESHAT 是用 C++ 编写的,它能将手写的数学公式转换为 LaTeX 或InkML或MathML.作为巴伦西亚理工大学 PRHLT 研究中心博士论文的一部分开发的.在线范例:http://cat.prhlt.upv.es/mer/


参考资料:
https://developer.myscript.com/docs/concepts/digital-ink-vs-ocr/
https://stackoverflow.com/questi ... ertab=votes#tab-top

3211

Threads

7832

Posts

52

Reputation

Show all posts

original poster hbghlyj posted 2025-6-22 20:10
Detexify 的内部工作原理只会解释一些基础知识,因此无需具备模式识别或机器学习方面的丰富知识,但了解线性代数肯定会有所帮助。

Quick Reply

Advanced Mode
B Color Image Link Quote Code Smilies
You have to log in before you can reply Login | Register account

$\LaTeX$ formula tutorial

Mobile version

2025-7-20 06:02 GMT+8

Powered by Discuz!

Processed in 0.013501 seconds, 22 queries