HWPX 직렬화 무손실 개선 + opengov 회귀 말뭉치 + 페이지붕괴 군집 해소 (#1586 통합 squash)#1597
Merged
Conversation
58d755a to
8f4e529
Compare
…ash) 활성 devel 통합 브랜치의 누적 작업을 upstream/devel 기준 단일 squash 커밋으로 정리. 포함 (직렬화/렌더 무손실): - edwardkim#1584 본문 인라인 ColumnDef 드롭 / edwardkim#1587 Ruby(덧말) / edwardkim#1588 선 도형 shapeComment - edwardkim#1592 빈 문단 spurious (0,0) / edwardkim#1594 holdAnchorAndSO + diff_documents 게이트 - edwardkim#1595 ClickHere CLICK_HERE (붕괴 지배원인) / edwardkim#1596 generic-shape 지오메트리 - edwardkim#1598 ellipse/arc 전용 지오메트리 파서+직렬화 회귀 게이트: edwardkim#1564 opengov 말뭉치/스냅샷, serializer/hwpx rustfmt 정리 조사: edwardkim#1589 페이지 붕괴 군집/오라클, edwardkim#1591 북마크 hoist(롤백) edwardkim#1589 누적 4종(holdAnchorAndSO/ClickHere/generic-shape/ellipse-arc) IR-invisible 직렬화 결함 해소. 검증: cargo test --lib 1970 passed 0 failed, fmt --all clean. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
8f4e529 to
e8718d5
Compare
Owner
|
이 PR 처리 후, #1533 PR 처리를 진행하겠습니다. @planet6897 님 작업으로 0.8 버전으로 올려야 하겠습니다. |
edwardkim
added a commit
that referenced
this pull request
Jun 27, 2026
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
Owner
|
merge 완료했습니다 (merge commit 138ebf8, origin/devel 포함 검증). 감사합니다, @planet6897! 8개 직렬화 무손실 작업을 단일 squash로 잘 정리해 주셨고, 무엇보다 'IR diff=0(게이트 PASS)인데 한글에서만 페이지 붕괴'하던 IR-invisible 결함 군집(~16%)을 한글 오라클로 분해한 접근이 인상적입니다. 검증:
특히 #1594에서 결함을 고치는 데 그치지 않고 diff_documents에 diff_hold_anchor(prevent_page_break) 검사를 추가해 IR-invisible 갭을 게이트가 검출하도록 강화한 점이 좋습니다 — 동종 회귀 재발을 구조적으로 막습니다. 페이지 붕괴 해소(오라클 92.5%)는 한글 환경 측정이라 로컬에서는 게이트/baseline으로 간접 검증했고, 한글 오라클 권위는 작업지시자 환경에 둡니다. 좋은 작업 감사합니다! |
This was referenced Jun 29, 2026
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
개요
활성
devel통합 브랜치의 누적 작업을 upstream/devel 기준 단일 squash 커밋으로 정리합니다. PR #1586을 대체합니다.closes #1586
포함 작업
직렬화/렌더 무손실
diff_documentsIR 게이트 (페이지 붕괴)회귀 게이트/말뭉치
serializer/hwpxroundtrip·table rustfmt 정리조사/도구
tools/verify_hangul_pages.py,mydocs/tech/hwpx_page_collapse_cluster.md)#1589 페이지 붕괴 군집 — IR-invisible 직렬화 결함 4종 누적 해소
IR diff=0(게이트 PASS)인데 한글에서만 페이지가 붕괴(예 3→2, 29→3)하는 군집(~16%)을 단락 이진탐색 + 한글 오라클(
PageCount)로 분해:CLICKHERE→CLICK_HERE(지배, 오라클 37/40 해소)→ 통제 비교 각 단계 악화 0, 잔여 표본 붕괴 미관측.
검증 (로컬, upstream/devel 기준)
cargo test --lib→ 1970 passed, 0 failedcargo clippy/cargo fmt --all -- --check✅opengov_corpus_snapshot/hwpx_roundtrip_baseline✅비고