Level2 (kakao)뉴스 클러스터링 *리팩토링*


Level2 (kakao)뉴스 클러스터링 *리팩토링*

https://programmers.co.kr/learn/courses/30/lessons/17677필요한 로직 : 문자열 처리[논리]1. 데이터 전처리(1) 슬라이싱 : 두 글자씩 끊어서 다중 집합을 만드는 과정(2) 문자 원소 제한 : 정규화식에 부합하는 원소만 남김(3) 카운터 객체 생성 : intersection과 union 원소 개수를 구해야 하기 때문에, 각 원소가 몇번씩 등장하느냐를 미리 카운트한다.2. intersection, union 처리 (본문의 RULE에 따름에 주의 - 특히 중복 처리)union은 intersection에서 출발한다. c1, c2 두 집합 모두에 존재하면 intersection 집합에 넣어준다. union은 intersection 정보에 c1,c2 에만 존재한 원소 정보까지 덧붙일 것이다.교집합 개수 : (interse..........



원문링크 : Level2 (kakao)뉴스 클러스터링 *리팩토링*