Skip to content

daeun6/SemanticSearch_Project

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

47 Commits
 
 
 
 
 
 
 
 

Repository files navigation

SemanticSearch_Project

1. 문제 정의

● 검색 엔진 구현 시, 시맨틱 요소를 반영해야 하는 이유
○ 기존 데이터셋 포털에서는 키워드 기반의 데이터 셋 검색을 제공
○ 사용자는 정확히 키워드가 일치하는 데이터 셋에 대한 결과만 얻음
○ 원하는 데이터를 찾기 위해 다양한 키워드로 검색을 수행해야 함

● 사용자가 검색되어진 결과를 다시 검색하는 문제를 방지하기 위한 방안이 필요
○ 단어와 구문의 의미를 해석하는 검색 엔진 기술인 시맨틱 검색을 활용한 검색 엔진 구현의 필요성 존재

2. 데이터

● 수집 날짜: 2024/04/09
● 수집 사이트: https://www.kurly.com/main
● 수집 카테고리: 정육·가공육·계란, 간편식·밀키트·샐러드, 생활용품·리빙, 건강식품, 헤어·바디·구강
● 총 데이터 크기: 500 X 21

Column 브랜드 상품이름 URL 가격 상품소개글 상세정보 베스트1 베스트2 베스트3 베스트4 베스트5 베스트6 베스트7 베스트8 베스트9 베스트10 리뷰수 태깅 상품정보 가장 비중이 높은 토픽


3. 방법론

프레임워크

4. 사용 방법

  1. Git Clone
git clone (https://github.com/alfks/SemanticSearch_Project.git)
  1. reqirements.txt 설치
pip intall requirements.txt
  1. input_keyword에 검색하고싶은 내용을 넣어서 검색 진행
input_keyword = "피로회복에 좋고 알약을 잘 못 삼키는 사람도 쉽게 먹을 수 있는 비타민"

참여 인원

송다은 김세인 문미란 신예린 정은지

About

좋은 벡터 만들기

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%