Posted On 2026년 02월 18일

NLP 기반 피싱 탐지 – 60% 탐지율 달성 프로토타입

nobaksan 0 comments
여행하는 개발자 >> 기술 >> NLP 기반 피싱 탐지 – 60% 탐지율 달성 프로토타입
red padlock on black computer keyboard

피싱 공격이 점점 정교해지고 있습니다. NLP 휴리스틱을 활용한 피싱 탐지 프로토타입을 소개합니다.

접근 방식

전통적인 URL 블랙리스트나 도메인 검사 대신, 이메일/메시지의 텍스트 자체를 분석하여 피싱 시도를 탐지합니다.

주요 휴리스틱

  • 긴급성 유도 표현: 즉시, 지금 바로, 24시간 내 등
  • 권위 사칭: 은행, 정부기관, 유명 기업 이름 언급
  • 문법/맞춤법 오류: 번역체나 어색한 표현 탐지
  • 개인정보 요청: 비밀번호, 카드번호 등 민감정보 요청
  • 의심스러운 링크 텍스트: 표시된 URL과 실제 URL 불일치

60% 탐지율의 의미

완벽하지 않지만, 1차 필터로서 가치가 있습니다. 다른 보안 레이어와 결합하면 효과적입니다. 특히 false positive를 최소화하는 것이 중요합니다.

개선 방향

BERT나 GPT 기반 분류기를 fine-tuning하면 90% 이상의 탐지율을 기대할 수 있습니다. 다국어 지원을 위해 다양한 언어 데이터셋으로 학습이 필요합니다.



이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

Related Post

컴퓨터공학 전공 이탈의 시대: 학생들은 어디로 향하는가

미국 UC 캠퍼스에서 이상한 일이 벌어지고 있다. 닷컴 버블 붕괴 이후 처음으로 컴퓨터공학 전공 등록률이…

PostgreSQL이 MySQL을 추월하고 있다

최근 몇 년간 PostgreSQL의 채택률이 급격히 올랐다. Stack Overflow 설문조사, HackerRank 보고서 모두 PostgreSQL의 인기…

gwt-zsh: 바보 같이 단순한 Git Worktree 관리

GitHub에서 발견한 작은 도구가 있다. gwt-zsh. Git worktree 관리를 위한 zsh 플러그인이다. "Stupidly simple"이라는 표현이…