● 검색 엔진 구현 시, 시맨틱 요소를 반영해야 하는 이유
○ 기존 데이터셋 포털에서는 키워드 기반의 데이터 셋 검색을 제공
○ 사용자는 정확히 키워드가 일치하는 데이터 셋에 대한 결과만 얻음
○ 원하는 데이터를 찾기 위해 다양한 키워드로 검색을 수행해야 함
● 사용자가 검색되어진 결과를 다시 검색하는 문제를 방지하기 위한 방안이 필요
○ 단어와 구문의 의미를 해석하는 검색 엔진 기술인 시맨틱 검색을 활용한 검색 엔진 구현의 필요성 존재
● 수집 날짜: 2024/04/09
● 수집 사이트: https://www.kurly.com/main
● 수집 카테고리: 정육·가공육·계란, 간편식·밀키트·샐러드, 생활용품·리빙, 건강식품, 헤어·바디·구강
● 총 데이터 크기: 500 X 21
| Column | 브랜드 | 상품이름 | URL | 가격 | 상품소개글 | 상세정보 | 베스트1 | 베스트2 | 베스트3 | 베스트4 | 베스트5 | 베스트6 | 베스트7 | 베스트8 | 베스트9 | 베스트10 | 리뷰수 | 태깅 | 상품정보 | 가장 비중이 높은 토픽 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
- Git Clone
git clone (https://github.com/alfks/SemanticSearch_Project.git)
- reqirements.txt 설치
pip intall requirements.txt
- input_keyword에 검색하고싶은 내용을 넣어서 검색 진행
input_keyword = "피로회복에 좋고 알약을 잘 못 삼키는 사람도 쉽게 먹을 수 있는 비타민"
| 송다은 | 김세인 | 문미란 | 신예린 | 정은지 |
|---|---|---|---|---|
![]() |
