Skip to content

Jiaxing-star/FacialDynamic

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 

Repository files navigation

Dynamic Facial Expression Caption Dataset (DFEC)

本仓库提供视频描述标注文件(train.json 整理中,test.json 已发布),旨在增强多模态大模型对人物面部动态变化的细粒度理解能力,适用于视频描述生成、跨模态检索等任务。


数据集内容

标注文件

  • test.json(已发布)

    • 测试集结构
      • 已有数据集采样(800 条):从 AFEW-VA、DFEW 等 7 个公开数据集中筛选的多样化样本。
      • 团队采集视频(200 条,处理中):新增真实场景视频,正在标注审核。
    • 字段说明
      {
        "id": "样本唯一标识符",
        "video": "视频文件路径(对应原始数据集的相对路径)",
        "caption": "对人物面部动态的细粒度文本描述(英文)"
      }
  • train.json(整理中)

    • 计划发布 5000+ 条标注,覆盖更丰富的面部表情变化场景。

数据集意义

通过提供精细的面部动作时序描述(如眉毛微抬、嘴角紧绷),帮助模型建立视频帧序列与自然语言描述的细粒度关联,突破传统“情感标签”的粗粒度限制。


视频来源与版权声明

原始数据集

测试集中 800 条样本的视频来源如下(已验证描述准确性):

  1. AFEW-VA

    • 描述:带情感效价(Valence-Arousal)连续值标注的视频片段
    • 下载链接:AFEW-VA Dataset
  2. CAER_mp4

    • 描述:基于上下文场景的情感识别视频数据集
    • 下载链接:CAER GitHub
  3. DFEW

    • 描述:野外环境下动态面部表情视频数据集(7 种基础表情)
    • 下载链接:DFEW Dataset
  4. FERV39k

    • 描述:包含 39 种精细表情类别的大规模视频数据集
    • 下载链接:FERV39k GitHub
  5. MAFW

    • 描述:多属性标注的野外视频数据集
    • 下载链接:MAFW Dataset
  6. MER24

    • 描述:高帧率微表情视频数据集
    • 下载链接:MER24 Dataset
  7. RAVDESS

    • 描述:多模态(视频+音频)情感表达数据集
    • 下载链接:RAVDESS Download

版权声明

  • ⚠️ 本仓库不包含原始视频文件,仅提供标注信息。
  • 用户需自行下载原始数据集并遵守其许可协议(通常限研究用途)。

结果对比

以下是基于本数据集的基线模型性能对比(完整实验细节见技术报告):

DFEC Benchmark Comparison


引用

如果本数据对您的研究有帮助,请引用我们的技术报告(筹备中)或使用如下格式致谢:

@misc{zhao2025facialdynamicsvideoinstruction,
      title={Facial Dynamics in Video: Instruction Tuning for Improved Facial Expression Perception and Contextual Awareness}, 
      author={Jiaxing Zhao and Boyuan Sun and Xiang Chen and Xihan Wei},
      year={2025},
      eprint={2501.07978},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2501.07978}, 
}

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors