添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

您好,我们的需求是给定一张包含正常数字和手写数字的图片,模型能够对其进行识别。我们尝试了en_PP-OCRv4_rec,其识别手写数字的能力似乎不是很理想。
因此我们想要微调en_PP-OCRv4_rec,来增强其识别手写数字的能力。那么在做数据标注的时候,对于一张同时包含手写字体和正常字体图片,需要标注正常字体吗,还是仅标注手写字体?
另外在模型微调训练时,数据集需要额外增加只包含正常数字和字符的样本吗?

在数据标注时,建议标注图片中所有的文本(包括手写字体和正常字体)。同时,训练数据集需要包含正常字体的样本,以确保模型在混合场景中的表现。通过微调训练,结合数据增强和合适的训练策略,可以显著提升 en_PP-OCRv4_rec 模型对手写数字的识别能力。

Response generated by feifei-bot | chatgpt-4o-latest