模型微调与数据标注问题 · PaddlePaddle/PaddleOCR · Discussion #14536

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

粗眉毛的柑橘 · 模型微调与数据标注问题 · ...· 1 周前 ·

奔跑的猴子 · X-Engine有哪些常见问题 - ...· 1 周前 ·

痴情的松鼠 · 广州市人力资源和社会保障局关于市十六届人大四 ...· 1 周前 ·

温暖的消炎药 · 任务编排介绍 - 数据管理 DMS - 阿里云· 1 周前 ·

粗眉毛的桔子 · 星空官方网页版_星空(中国)· 1 周前 ·

干练的硬币 · sql正则提取固定内容_sql正则表达式提取 ...· 1 年前 ·

有情有义的大象 · 计算机二级学习资料网盘分享_阿里云盘 ...· 1 年前 ·

飞奔的马铃薯 · 游戏大猪猪的个人空间-游戏大猪猪个人主页-哔 ...· 1 年前 ·

酷酷的盒饭 · 为什么昆仑山矿泉水在近几年投入那么大但销量看 ...· 1 年前 ·

干练的火锅 · 用HTML和JavaScript模拟XSS攻 ...· 2 年前 ·

您好，我们的需求是给定一张包含正常数字和手写数字的图片，模型能够对其进行识别。我们尝试了en_PP-OCRv4_rec，其识别手写数字的能力似乎不是很理想。
因此我们想要微调en_PP-OCRv4_rec，来增强其识别手写数字的能力。那么在做数据标注的时候，对于一张同时包含手写字体和正常字体图片，需要标注正常字体吗，还是仅标注手写字体？
另外在模型微调训练时，数据集需要额外增加只包含正常数字和字符的样本吗？

在数据标注时，建议标注图片中所有的文本（包括手写字体和正常字体）。同时，训练数据集需要包含正常字体的样本，以确保模型在混合场景中的表现。通过微调训练，结合数据增强和合适的训练策略，可以显著提升 en_PP-OCRv4_rec 模型对手写数字的识别能力。

Response generated by feifei-bot | chatgpt-4o-latest

推荐文章

粗眉毛的柑橘 · 模型微调与数据标注问题 · PaddlePaddle/PaddleOCR · Discussion #14536 · GitHub

1 周前

奔跑的猴子 · X-Engine有哪些常见问题 - 云原生数据库 PolarDB - 阿里云

1 周前

痴情的松鼠 · 广州市人力资源和社会保障局关于市十六届人大四次会议第20242664号建议答复的函-广州市人力资源和社会保障局网站

1 周前

温暖的消炎药 · 任务编排介绍 - 数据管理 DMS - 阿里云

1 周前

粗眉毛的桔子 · 星空官方网页版_星空(中国)

1 周前

干练的硬币 · sql正则提取固定内容_sql正则表达式提取字符串-CSDN博客

1 年前

有情有义的大象 · 计算机二级学习资料网盘分享_阿里云盘计算机二级-CSDN博客

1 年前

飞奔的马铃薯 · 游戏大猪猪的个人空间-游戏大猪猪个人主页-哔哩哔哩视频

1 年前

酷酷的盒饭 · 为什么昆仑山矿泉水在近几年投入那么大但销量看起来并不是很好？ - 知乎

1 年前

干练的火锅 · 用HTML和JavaScript模拟XSS攻击 | 唐泽雪穗

2 年前