Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于分类器的疑问 #142

Open
csh589 opened this issue Sep 28, 2020 · 1 comment
Open

关于分类器的疑问 #142

csh589 opened this issue Sep 28, 2020 · 1 comment

Comments

@csh589
Copy link

csh589 commented Sep 28, 2020

作者大大好~首先感谢下这个优秀的项目。但是读文档的时候我有一个疑问,分类现在的做法是把视频用cutter分成不同阶段,再用不同阶段作为一个类别去训练分类器。同时,cutter的切分方法我也很粗略地读了一下,感觉像是提取图像特征然后用无监督的方法来先聚类。
有一个不成熟的想法是,如果是把视频帧分为stable和unstable两类去训练分类器的话,足量的训练是不是能让用户不需要重新训练自己的模型,而是一个模型到处通用。举例来讲,假设这个分类器足够精确,我们能够把任意一个视频分成stable和unstable的部分,然后用户根据自己的需求去组合不同的阶段。这样会避免cutter里需要指定block数的部分,同时,用户也不需要重新训练模型,可以避免用户的欠拟合等问题。
不知道之前进行项目的时候有没有思考过相关问题呢?希望多多指正

@williamfzc
Copy link
Owner

williamfzc commented Sep 28, 2020

你好,谢谢肯定:

  • cutter的部分其实不涉及聚类,只是逐帧进行相似度(ssim之类的)的计算来推断 stable 与 unstable;
  • 对于 stable 与 unstable 来说,这可能不是一个分类问题,因为变化过程是有上下文的,带有跟前后帧的时间关系,我们没有办法说具体某一帧是 unstable 。以一个状态栏下拉过程为例,这个下拉过程整体是unstable的,但是取其中一帧就不一定了。

我对这种方式是比较感兴趣的,但没有找到合适的方法。我之前想过的方法是将前后几帧作为一个整体来训练分类器,不过一个是没有时间去验证,另一个是客观来说我对模型的理解有限,不确定这是否是一个合适的方向。

如果有兴趣欢迎共建 :)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants