알고리즘/프로그래머스 문제풀이

[프로그래머스] 뉴스 클러스터링

4Legs 2021. 3. 8. 19:15

문제풀이 : programmers.co.kr/learn/courses/30/lessons/17677

 

코딩테스트 연습 - [1차] 뉴스 클러스터링

뉴스 클러스터링 여러 언론사에서 쏟아지는 뉴스, 특히 속보성 뉴스를 보면 비슷비슷한 제목의 기사가 많아 정작 필요한 기사를 찾기가 어렵다. Daum 뉴스의 개발 업무를 맡게 된 신입사원 튜브

programmers.co.kr

문제 유형

구현, Map

 

두 문자열의 각 두 문자씩을 분리해 Map에 원소로 넣는다.

이 풀이에서는 map<string, pair<int, int>를 사용했으며,

value에 해당하는 pair의 first에는 str1의 해당 원소 개수, second에는 str2의 해당 원소 개수를 저장했다.

이 경우, 각 원소에 대해 합집합에서 해당 원소의 개수는 max(first, second)가 될 것이고

교집합에서 해당 원소의 개수는 min(first, second)가 될 것이다.

 

이렇게 구한 각 값들을 통해 정답을 구하면 된다.

 

[코드]

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
#include <string>
#include <algorithm>
#include <map>
#include <iostream>
 
using namespace std;
typedef pair<intint> p;
 
map<string, p> dict;    //value : (str1, str2)
vector<string> list;
bool alphabet[1001][2];
 
void memo(string str, int num){
    for(int i = 0; i < str.size() - 1; i++){
        string temp = str.substr(i, 2);
        if(!alphabet[i][num] || !alphabet[i + 1][num]) continue;
        
        list.push_back(temp);
        if(dict.find(temp) == dict.end()) dict.insert({temp, {00}});
        if(num == 0) dict[temp].first += 1;
        else dict[temp].second += 1;
    }
}
 
string prev_action(string str, int num){
    for(int i = 0; i < str.size(); i++){
        if('a' <= str[i] && str[i] <= 'z') {
            str[i] = toupper(str[i]);
            alphabet[i][num] = true;
        }
        else if ('A' <= str[i] && str[i] <= 'Z') alphabet[i][num] = true;
    }
    return str;
}
 
int solution(string str1, string str2) {
    int answer = 0;
    
    str1 = prev_action(str1, 0);
    str2 = prev_action(str2, 1);
    memo(str1, 0);
    memo(str2, 1);
    
    if(list.empty()) return 65536;
    
    sort(list.begin(), list.end());
    list.erase(unique(list.begin(), list.end()), list.end());
    
    int unions = 0, intersection = 0;
    for(int i = 0; i < list.size(); i++){
        p val = dict[list[i]];
        unions += max(val.first, val.second);
        intersection += min(val.first, val.second);
    }
    
    double rate = (double) intersection / unions;
    answer = rate * 65536;
    
    return answer;
}
cs