Skip to content

[FEATURE] LLM 모델 통합 및 대화 시스템 구현 #2

@kimsuckhyun

Description

@kimsuckhyun

목표

Unsloth Gemma-3 모델을 로드하고, 벡터 DB와 통합하여 졸업 요건 관련 질의응답 시스템 구축 및 대화 히스토리 관리

세부 작업

  • LLM 모델 로드 함수 구현

    • load_llm() 함수 작성
    • Unsloth FastLanguageModel을 사용한 Gemma-3 로드
    • 4bit 양자화 설정
    • 최대 시퀀스 길이 설정
  • 프롬프트 템플릿 준비 함수 구현

    • prepare_prompt_template() 함수 작성
    • 검색된 문서와 질문을 포함한 시스템 프롬프트 설계
  • 질의 실행 함수 구현

    • run_query() 함수 작성
    • 벡터 검색 통합
    • 대화 히스토리 관리
    • 프롬프트 구성 및 모델 추론 실행
    • 응답 후처리
  • 인터랙티브 UI 구현

    • ipywidgets을 사용한 입력 위젯 구성
    • 버튼 이벤트 처리
    • Markdown 출력 형식 설정

기술 스택

  • unsloth: 최적화된 LLM 추론
  • ipywidgets: 주피터 노트북 UI
  • torch: 텐서 연산

입/출력 형식

  • 입력: 사용자 질문 텍스트
  • 출력: 모델 응답 텍스트 (마크다운 형식)
  • 히스토리: 질문-답변 쌍 저장

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or request

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions