找回密码
 快速注册
搜索
查看: 61|回复: 9

公式识别

[复制链接]

3149

主题

8387

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65396
QQ

显示全部楼层

hbghlyj 发表于 2022-8-5 01:20 |阅读模式

光学字符识别(OCR/Optical Character Recognition)

假设您在屏幕或一张纸上写下您想要识别的内容,首先,您需要表示墨迹,使它适合计算机处理.有两种常用方法:光学字符识别和数字墨迹识别. 使用光学扫描仪或照相机扫描书写的页面会产生位图图像,即像素阵列.每个像素代表所捕获内容的一部分.OCR应用程序分析图像,从这些数据中提取形状信息,而这依赖于墨迹的视觉表现.
"hello" 位图 识别 扫描或拍照
因此,OCR必须从纸上区分手写和印刷.这可能会导致识别错误. 广为人知的mathpix API:mathpix.github.io/docs可识别印刷或手写的公式,每月1000次免费请求. Snip 是由 Mathpix 打造的一款出色的应用. 它可以帮助你提取文档中的公式,简单表格,或者文本将其转换为 LaTeX 和 MathML 格式,并每月提供给所有用户 50 次免费识别(通过 .edu 或 .ac.uk 邮箱注册每月获得 100 次识别).在 MathpixOCR API 以及 Image2LaTeX 这款补充应用的帮助下,你可以每月免费进行 1000 次的 OCR 识别.Image2LaTeX 是一个个人项目,仅保留了 Snip 的核心功能——将图片转换为特定 LaTeX 格式的公式或文本. 如果需要进阶功能,请每月 4.99 美元订阅 Snip. Detexify能将一个手写符号识别为LaTeX,每月2000次免费请求.(在线范例见http://detexify.kirelabs.org/classify.html)

数字墨迹识别(Digital Ink Recognition)

数字墨迹识别系统分析墨迹(二维点阵),它们由各种设备产生,包括:屏幕触摸或手写笔,数字笔和纸,位图的矢量化(虽然这很难做到).
"hello" 数字墨迹 识别 捕获

收集的数字墨迹记录了手写的笔迹.从落笔直到抬笔,它还可能包括有关书写的压力的信息.
因此,一系列"笔事件"对笔画进行建模.第一个事件是落笔,最后一个是抬笔,所有其他的都是移动.每个事件还包含空间和时间信息:(x,y,t,P).xy是笔的坐标,t是绝对时间,P是压力(可选).
所以数字墨水识别是一个动态过程.该方法根据笔画开始的位置,结束的位置以及绘制它们的顺序来执行字符,文本或形状识别.
MyScript(GitHub)仅使用数字墨迹作为输入执行在线识别,而不能识别图像(即OCR).
(开发工具包)
(注:有一个地方我不太理解,为什么在电脑屏幕上用鼠标写字也有压力信息?)
对于开源系统,SESHAT 是用 C++ 编写的,它能将手写的数学公式转换为 LaTeX 或InkML或MathML.作为巴伦西亚理工大学 PRHLT 研究中心博士论文的一部分开发的.在线范例:http://cat.prhlt.upv.es/mer/


参考资料:
https://developer.myscript.com/docs/concepts/digital-ink-vs-ocr/
https://stackoverflow.com/questi ... ertab=votes#tab-top

3149

主题

8387

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65396
QQ

显示全部楼层

 楼主| hbghlyj 发表于 2024-1-31 02:14
升級Windows發現桌面多了Microsoft Copilot可以免费和您對話
可以在對話中插入圖片(或截圖Ctrl+Shift+S)
例如生成LaTeX代碼
Screenshot 2024-01-30 180830.png

点评

Windows系统自帶的東西,有的不好用(如My Phone),但這個Copilot我感覺非常厲害!  发表于 2024-1-31 02:24
其實應該是\bar B,它没看到 \bar  发表于 2024-1-31 02:31
Microsoft Copilot uses AI to respond, so mistakes are possible — send feedback to help us improve.  发表于 2024-1-31 02:35

3149

主题

8387

回帖

6万

积分

$\style{scale:11;fill:#eff}꩜$

积分
65396
QQ

显示全部楼层

 楼主| hbghlyj 发表于 2024-1-31 02:18
登录微軟帳號可以保存對話歷史。回應後會有气泡提示:例如上面的對話,它提示“What is a ball in mathematics”,因為B_{\epsilon的意思是Ball,竟然被它正確識别了😯(只是輸入了一個截圖,我没有提示它B_{\epsilon是什麼)
Screenshot 2024-01-30 181433.png
然後,它的第2個提示“...about sets and subsets”是從\subset得出來的,這個不難看出。

点评

不僅能識别LaTeX,還能解释公式的語義!  发表于 2024-1-31 02:20
它回應“This expression represents that the ball (B) with radius (\epsilon_{j+1}) centered at (y_{j+1}) is a subset of...”不是我预料的(我没問它語義),但完全正確!  发表于 2024-1-31 02:27
哦,它是可以聯網的,語義是網上搜的吧,這就不奇怪了  发表于 2024-1-31 02:28
“Copilot
Your everyday AI companion with Bing”
應該是從Bing上搜的  发表于 2024-1-31 02:53

手机版|悠闲数学娱乐论坛(第3版)

GMT+8, 2025-3-4 16:05

Powered by Discuz!

× 快速回复 返回顶部 返回列表