You signed in with another tab or window.
   
    Reload
   
   to refresh your session.
  
  
   You signed out in another tab or window.
   
    Reload
   
   to refresh your session.
  
  
   You switched accounts on another tab or window.
   
    Reload
   
   to refresh your session.
  
  
   您好,我们的需求是给定一张包含正常数字和手写数字的图片,模型能够对其进行识别。我们尝试了en_PP-OCRv4_rec,其识别手写数字的能力似乎不是很理想。
   
   因此我们想要微调en_PP-OCRv4_rec,来增强其识别手写数字的能力。那么在做数据标注的时候,对于一张同时包含手写字体和正常字体图片,需要标注正常字体吗,还是仅标注手写字体?
   
   另外在模型微调训练时,数据集需要额外增加只包含正常数字和字符的样本吗?
  
  
   在数据标注时,建议标注图片中所有的文本(包括手写字体和正常字体)。同时,训练数据集需要包含正常字体的样本,以确保模型在混合场景中的表现。通过微调训练,结合数据增强和合适的训练策略,可以显著提升
   
    en_PP-OCRv4_rec
   
   模型对手写数字的识别能力。
  
  
   
    Response generated by
    
     feifei-bot
    
    | chatgpt-4o-latest