Notice
Recent Posts
Recent Comments
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 이런게4문제
- 삼성
- 레벨2
- BFS
- dp
- 2018
- dfs
- Set
- 모의SW역량테스트
- 코딩스킬
- STL
- 문자열
- 삼성SW테스트
- substr
- Map
- swea
- find
- 삼성SW역량테스트
- KAKAO
- 프로그래머스
- 코딩테스트
- 시뮬레이션
- 백트래킹
- 레벨3
- 브루트포스
- C++
- 완전탐색
- 백준
- priority_queue
- Sort
Archives
- Today
- Total
-
[프로그래머스_레벨2] 뉴스 클러스터링 (2018 KAKAO BLIND RECRUIT.) 본문
https://programmers.co.kr/learn/courses/30/lessons/17677
재밌는 문제다.
알파벳으로 이루어진 벡터 두 개에서 교집합과 합집합의 성질을 이용해 '자카드 유사도'라는 수치를 구하는 문제다.
C++ <map> 라이브러리를 활용해 풀었는데, 벡터에 길이가 2인 문자열들을 저장해두고 추후에 벡터를 루프돌면서 해당 문자열을 'key'삼아 'value'를 ++해주는 것이 중요하다.
이 과정을 거친 뒤 두 map 중 어느 하나를 잡아 순회하면서 상대 map에 동일 key의 value와 최소값을 구해 교집합에 들어갈 원소의 수를 더해주고 이를 반복하면 총 교집합의 원소의 수가 나오게 된다.
전체 집합의 크기에서 교집합의 수를 뺀 것이 합집합과 동일한 성질을 이용하면 위에서 구한 교집합을 이용해 합집합의 크기도 쉽게 구할 수 있고, 이를 통해 '자카드 유사도'를 계산할 수 있다.
최종적으로 mul 로 정의해둔 값과 '자카드 유사도'를 곱해 정수부를 반환하면 된다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
|
#include <string>
#include <vector>
#include <algorithm>
#include <map>
#include <iostream>
#define mul 65536
using namespace std;
int solution(string str1, string str2) {
int answer;
double jacard;
vector<string> v1, v2;
// 알파벳 아닌 것들 모두 제외.
if (!(('a' <= str1[i] && str1[i] <= 'z') || ('A' <= str1[i] && str1[i] <= 'Z'))){
continue;
}
else if (!(('a' <= str1[i + 1] && str1[i + 1] <= 'z') || ('A' <= str1[i + 1] && str1[i + 1] <= 'Z'))){
continue;
}
// 모두 대문자로 바꿈
for (int j = 0; j<2; j++)
if ('a' <= cur[j] && cur[j] <= 'z') cur[j] -= ('a' - 'A');
v1.push_back(cur);
}
if (!(('a' <= str2[i] && str2[i] <= 'z') || ('A' <= str2[i] && str2[i] <= 'Z'))){
continue;
}
else if (!(('a' <= str2[i + 1] && str2[i + 1] <= 'z') || ('A' <= str2[i + 1] && str2[i + 1] <= 'Z'))){
continue;
}
// 모두 대문자로 저장
for (int j = 0; j<2; j++)
if ('a' <= cur[j] && cur[j] <= 'z') cur[j] -= ('a' - 'A'); // 소문자면 대문자로.
v2.push_back(cur);
}
map<string, int> m1, m2;
for (int i = 0; i<v1.size(); i++) m1[v1[i]]++;
for (int i = 0; i<v2.size(); i++) m2[v2[i]]++;
double gyo = 0, hap, whole;
whole = (double)(v1.size() + v2.size());
// gyo 구하기 -> 끝
for (map<string, int>::iterator iter = m1.begin(); iter != m1.end(); iter++){
string this_str = iter->first;
int m1_cnt = iter->second;
int m2_cnt = m2[this_str];
int min_val = min(m1_cnt, m2_cnt);
if (min_val > 0) gyo += (double)min_val;
}
hap = whole - gyo; // 3 = 5 - 2 (tc#3)
//cout << gyo << " " << hap << " " << whole << '\n';
jacard = gyo / hap;
answer = (int)(jacard*mul);
return answer;
}
http://colorscripter.com/info#e" target="_blank" style="color:#4f4f4ftext-decoration:none">Colored by Color Scripter
|
http://colorscripter.com/info#e" target="_blank" style="text-decoration:none;color:white">cs |
'1-4. 프로그래머스' 카테고리의 다른 글
[프로그래머스_레벨2] 가장 큰 정사각형 찾기 (0) | 2020.02.15 |
---|---|
[프로그래머스_레벨 3] 오픈채팅방(2019 KAKAO BLIND RECRUIT.) (0) | 2020.02.11 |
[프로그래머스_레벨 3] 여행 경로 (DFS) (0) | 2020.02.10 |
[프로그래머스_레벨 3] 2 x n 타일링 (0) | 2020.02.10 |
[프로그래머스] 레벨 3 - 네트워크 (0) | 2020.02.09 |
Comments