关于分类器的疑问 #142

csh589 · 2020-09-28T08:18:40Z

作者大大好～首先感谢下这个优秀的项目。但是读文档的时候我有一个疑问，分类现在的做法是把视频用cutter分成不同阶段，再用不同阶段作为一个类别去训练分类器。同时，cutter的切分方法我也很粗略地读了一下，感觉像是提取图像特征然后用无监督的方法来先聚类。
有一个不成熟的想法是，如果是把视频帧分为stable和unstable两类去训练分类器的话，足量的训练是不是能让用户不需要重新训练自己的模型，而是一个模型到处通用。举例来讲，假设这个分类器足够精确，我们能够把任意一个视频分成stable和unstable的部分，然后用户根据自己的需求去组合不同的阶段。这样会避免cutter里需要指定block数的部分，同时，用户也不需要重新训练模型，可以避免用户的欠拟合等问题。
不知道之前进行项目的时候有没有思考过相关问题呢？希望多多指正

williamfzc · 2020-09-28T12:57:16Z

你好，谢谢肯定：

cutter的部分其实不涉及聚类，只是逐帧进行相似度（ssim之类的）的计算来推断 stable 与 unstable；
对于 stable 与 unstable 来说，这可能不是一个分类问题，因为变化过程是有上下文的，带有跟前后帧的时间关系，我们没有办法说具体某一帧是 unstable 。以一个状态栏下拉过程为例，这个下拉过程整体是unstable的，但是取其中一帧就不一定了。

我对这种方式是比较感兴趣的，但没有找到合适的方法。我之前想过的方法是将前后几帧作为一个整体来训练分类器，不过一个是没有时间去验证，另一个是客观来说我对模型的理解有限，不确定这是否是一个合适的方向。

如果有兴趣欢迎共建：）

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于分类器的疑问 #142

关于分类器的疑问 #142

csh589 commented Sep 28, 2020

williamfzc commented Sep 28, 2020 •

edited

Loading

关于分类器的疑问 #142

关于分类器的疑问 #142

Comments

csh589 commented Sep 28, 2020

williamfzc commented Sep 28, 2020 • edited Loading

williamfzc commented Sep 28, 2020 •

edited

Loading