Skip to content

DguFarmSystem/2025-OpenSource-AiSumDdat

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

60 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🔒 Alsumddak

<2025 오픈소스 개발자대회 참가작 / 개인정보 보호 오픈소스 프로젝트>

image

📖 About Alsumddak

생성형 AI에 포함되는 민감정보를 자동 탐지·마스킹하는 오픈소스 솔루션

image

 

최근 생성형 AI의 활용이 급격히 확산되면서, 사용자 입력(프롬프트)에 이름·계좌번호·연락처와 같은 민감정보가 그대로 외부로 유출될 위험이 커지고 있습니다. 이에 본 프로젝트는 이를 해결하기 위해 정규표현식 + KoELECTRA NER 모델을 활용하여 개인정보를 자동 탐지하고, 문맥을 보존한 채 안전하게 마스킹하는 기능을 제공합니다.

 


✨ 주요 기능

  1. 🔍 지능형 개인정보 자동 탐지

    • 단순히 정규표현식(regex)으로만 탐지하지 않고, KoELECTRA 기반 NER 모델을 함께 활용하여 다양한 개인정보(이름, 계좌번호, 연락처 등)를 정밀하게 식별합니다.
    • 특히 이 프로젝트는 탐지 과정 자체에서도 개인정보가 외부로 유출되지 않도록 전처리 단계에서 AI를 활용합니다. 즉, LLM에게 그대로 노출되기 전에 선제적으로 보호막을 형성하는 구조라 기존 보안 도구와 차별화됩니다.
탐지 예시 이미지
  1. 🛡️ 문맥 기반 마스킹 (Randomized Masking) *
    • 기존에 개인정보를 유사 맥락의 대체 값으로 변경하는 방식은 때때로 문맥상의 오류를 일으키는 문제가 있었습니다.
    • 이러한 점을 개선하기 위해, 이제는 개인정보를 '항목명'으로 대체하여 문맥의 의미 손실을 최소화합니다.
    • 단순히 "***" 같은 기호로 가리거나 유사한 의미의 단어로 바꾸는 대신, 생성형 AI가 쉽게 이해할 수 있는 항목명으로 변경합니다. 예: 국민은행 → [은행명] / 홍길동 → [이름]
    • 이러한 방식을 사용하면 AI 모델이 프롬프트를 처리할 때 내용의 흐름을 방해하지 않고도 개인정보를 안전하게 보호할 수 있습니다.
마스킹 예시 이미지
  1. 👆 사용자 선택적 원문 확인 및 보호 강도 조절

    • 마스킹된 항목을 클릭하면 원문을 확인할 수 있어, 사용자가 필요할 때만 실제 데이터를 열람할 수 있습니다.

    • 사용자는 마스킹 강도를 직접 설정할 수 있습니다.

      • 예: 모든 개인정보 마스킹 / 이름만 표시 / 계좌번호 일부만 마스킹 등
    • 이를 통해 보안성과 편의성 사이의 균형을 사용자가 직접 선택할 수 있습니다.

  2. 🧩 사용자 맞춤 템플릿 제공

    • 자주 쓰이는 입력 형태(예: 이력서 첨삭, 메일 작성, 요약 요청 등)를 템플릿으로 제공하여 사용자가 안전하게 프롬프트를 작성할 수 있습니다.
    • 사용자는 목적에 맞는 템플릿을 선택하고, 개인정보 마스킹이 자동 적용된 프롬프트를 바로 활용할 수 있습니다.
2025-08-19.15.27.07.mp4
  1. 🌐 크롬 확장 프로그램 지원

    • 별도의 프로그램 설치 없이, 웹 브라우저 환경에서 곧바로 마스킹 기능을 적용할 수 있습니다.
    • ChatGPT, Claude, Gemini 등 웹 기반 LLM 서비스에 바로 연결 가능하여 실사용자 친화적인 접근성을 보장합니다.
    • 또한 오픈소스 프로젝트로 확장성이 뛰어나, 누구나 기여하고 개선할 수 있는 구조입니다.
  2. 🧠 개인정보 없이도 사용 이력 저장 가능

    • 프롬프트 저장 기능은 상태 관리 방식으로 구현되어, 개인 식별 정보 없이도 사용 이력을 저장할 수 있습니다.
    • 이로 인해 서버에 별도 개인정보가 저장되지 않아 유출 위험을 원천적으로 차단할 수 있습니다.

🖥️ Architecture

image

⚡ Skills

Python PyTorch HuggingFace React Vite Node.js Chrome Docker GitHub


🎯 Repository Guide

  • 브랜치 전략

    • main ← 배포용
    • develop ← 통합 개발
    • ai / server / client ← 기능별 브랜치
  • 커밋 컨벤션 (Conventional Commits)

    • feat: 새로운 기능 추가
    • fix: 버그 수정
    • refactor: 리팩토링
    • docs: 문서 작성
    • chore: 설정 / 기타 작업
  • PR 규칙

    • 작업 단위별 PR → 최소 1명 리뷰 후 머지
    • 템플릿 기반 (PR 설명, 체크리스트, 관련 이슈 링크 포함 필수)

📌 License

MIT License

About

팜시스템 보안/웹 오픈소스개발자대회 02팀 프론트엔드 레포지토리

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 5