Skip to content

【开源实习】GIT模型应用开发&&LayoutLMv3模型应用开发 #2027

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Open
wants to merge 2 commits into
base: master
Choose a base branch
from

Conversation

wujiu0411
Copy link

第一个自定义数据集上微调GIT模型进行图像描述的笔记本中,我将在一个小型图像描述数据集上微调

这是在Mindspore的训练过程图,50个epoch后loss稳定在0.06左右
ms训练图
这是在pytorch的训练过程图,50个epoch后loss稳定在0.09左右
torch训练图
下面是mindspore的推理图,可以看到推理结果与预期一致
ms推理结果图
下面是pytorch的推理图,可以看到准确度相较于mindspore差一点
torch推理结果图

第二个使用 GIT 进行图像/视频描述生成和图像/视频问答的笔记本中,演示了如何使用MindSpore的 GIT 模型来对图像或视频进行描述生成,以及在图像或视频上进行问答。

选择其中一个推理模型进行比较:
mindspore:
ms推理2
pytorch:
orch推理2
结果一致

@wujiu0411
Copy link
Author

任务

任务编号:#IAADHU
任务链接【开源实习】GIT模型应用开发
实现内容:实现了自定义数据集上微调GIT模型进行图像描述以及使用 GIT 进行图像/视频描述生成和图像/视频问答。

@wujiu0411
Copy link
Author

任务

任务编号:#IBLNVF
任务链接【开源实习】LayoutLMv3模型应用开发
实现内容:实现了在mindspore环境,昇腾910上基于FUNSD数据集上微调LayoutLMv3。
在mindspore环境,昇腾910上训练的loss变化:10个epoch后为0.15
loss_ms
在pytorch环境,英伟达T4上训练的loss变化:10个epoch后为0.41
loss_torch
在mindspore环境,昇腾910上训练后的评估结果
evl_ms
在pytorch环境,英伟达T4上训练后的评估结果
evaluate_torch
mindspore环境微调后的模型推理样例效果
example_ms
pytorch环境微调后的模型推理样例效果
example_torch
与原版基本一致

@wujiu0411 wujiu0411 changed the title 【开源实习】GIT模型应用开发 【开源实习】GIT模型应用开发&&LayoutLMv3模型应用开发 Apr 25, 2025
@cui0523
Copy link
Contributor

cui0523 commented Apr 29, 2025

验收通过,可以合入

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants