ほぼ完全にChatGPT製。READMEも含めて。
このスクリプトは、ResearchMap形式のJSONLファイルを読み込み、以下の形式で出力します。
- JSONL(1行1オブジェクト)
- カテゴリ分け済みCSV
研究業績データ(発表、論文、受賞など)を簡単に集約・分類・CSV化できます。また、ソート、重複除去、著者フィルターも可能です。
- 複数ファイルのマージ
- 日付(YYYY-MM-DD) による範囲指定フィルタ
- 著者(日本語/英語名)によるフィルタ(複数指定可)
- 重複(同日付+同タイトル)の除去オプション
- カテゴリ分け(国内発表/国際発表/招待講演/論文/受賞)
- 英日両タイトル&著者名を列分け
- Python 3.7 以上
- 標準ライブラリのみ(
json,argparse,csv,datetime,sys)
./researchmap_util.py [OPTIONS] file1.jsonl file2.jsonl …| オプション | 説明 |
|---|---|
--start-date YYYY-MM-DD |
取得開始日(inclusive) |
--end-date YYYY-MM-DD |
取得終了日(inclusive) |
--author NAME [NAME ...] |
著者名フィルタ(日本語/英語) |
--dedupe |
同一日付+タイトルの重複アイテムを一度だけ出力 |
--jsonl |
JSONL形式で出力 |
--csv |
カテゴリ分けCSVとして出力 |
--output, -o FILE |
出力先ファイル(デフォルト: stdout) |
Date, Category,
Title (En), Title (Ja),
Authors (En), Authors (Ja),
Publication/Award/Event,
Volume, Number, Start Page, End Page
- 全ファイルをマージして標準出力にJSON(整形済み)で出力
./researchmap_util.py data1.jsonl data2.jsonl
- 2024年度以降の国際発表のみ CSV 出力
./researchmap_util.py --start-date 2024-04-01 --csv data.jsonl > intl_presentations.csv - 特定著者の成果を重複除去して JSONL 化
./researchmap_util.py --author "Hokkai M." "北海 道大" --dedupe --jsonl a.jsonl b.jsonl > filtered.jsonl
This script ingests one or more ResearchMap-format JSONL files and outputs:
- JSONL (one object per line)
- A categorized CSV
It streamlines aggregation, classification, and CSV export of research achievements (presentations, papers, awards, etc.).
- Merge multiple input files
- Date-range filtering (
YYYY-MM-DD) - Author filtering (Japanese/English names, multiple)
- Duplicate removal by date+title
- Category assignment (Domestic Presentation / International Presentation / Invited Talk / Academic Paper / Award)
- CSV fields for
volume,number,starting_page,ending_page
- Python 3.7+
- Standard library only (
json,argparse,csv,datetime,sys)
./researchmap_util.py [OPTIONS] file1.jsonl file2.jsonl …| Option | Description |
|---|---|
--start-date YYYY-MM-DD |
Start date (inclusive) |
--end-date YYYY-MM-DD |
End date (inclusive) |
--author NAME [NAME ...] |
Filter by author name (Ja/En) |
--dedupe |
Remove duplicates with identical date+title |
--jsonl |
Output as JSONL |
--csv |
Output as categorized CSV |
--output, -o FILE |
Output file (default: stdout) |
Date, Category,
Title (En), Title (Ja),
Authors (En), Authors (Ja),
Publication/Award/Event,
Volume, Number, Start Page, End Page
- Merge all files and print pretty JSON:
./researchmap_util.py data1.jsonl data2.jsonl
- Export international presentations since 2024 as CSV:
./researchmap_util.py --start-date 2024-01 --csv data.jsonl > intl_presentations.csv - Filter for a specific author, remove duplicates, and output JSONL:
./researchmap_util.py --author "Hokkai M." "北海 道大" --dedupe --jsonl a.jsonl b.jsonl > filtered.jsonl