-
보이스 피싱 텍스트: 금융감독원 - 보이스피싱 체험관
-
일반 대화 텍스트 AI Hub - 감정분류를 위한 대화 음성 데이터셋 AI Hub - 텍스트 윤리검증 데이터
-
일반대화: 0,보이스피싱: 1으로 라벨링
- KoBERT/train.py
- KoBERT/model/train.pt : train model 저장
-
스프링 서버 요청받기
json형식으로 STT 결과값 text를 요청 받는다
{
"text": "네네 지금 보시면 이제 신용 등급 부분하고는 관계없이 저희쪽에서 연 이자 10프로 이하대에 저금리 대안상품으로 바꿔드림론 이런 상품으로 정부지원상품으로 지원차 연락을 좀 드린거고 현재 이용중이신 고금리건 어디어디 이용중이시죠"
}-
KoBert 모델 추론
KoBERT/predict.py
-
결과가 True인 경우 - 보이스 피싱 O
-
결과가 False인 경우 - 보이스 피싱 X
해당 json 형식으로 스프링 서버에 응답
{ "phishing" : "false", "level" : "0" }
-
static/csv/
500_가중치.csv
type_token_가중치.csv
-
위험도 측정
wordDetect/classification.py
20% 이하 : 0단계 [안전]
40% 이하 : 1단계 [의심]
60% 이하 : 2단계 [경고]
나머지 : 3단계 [위험]
-
최종 분석결과 응답
측정 결과를 해당 json 형식으로 스프링 서버에 응답하여
사용자에게 보이스피싱 위험도 단계 알림 서비스를 지원한다.
{ "phishing": "true", "level": 3 }