조금씩 꾸준히 완성을 향해

[Algorithm] 백준 20920 영단어 암기는 괴로워 with Python 본문

DataStructure & Algorithm/문제풀이

[Algorithm] 백준 20920 영단어 암기는 괴로워 with Python

all_sound 2023. 7. 16. 16:14

문제

화은이는 이번 영어 시험에서 틀린 문제를 바탕으로 영어 단어 암기를 하려고 한다. 그 과정에서 효율적으로 영어 단어를 외우기 위해 영어 단어장을 만들려 하고 있다. 화은이가 만들고자 하는 단어장의 단어 순서는 다음과 같은 우선순위를 차례로 적용하여 만들어진다.

  1. 자주 나오는 단어일수록 앞에 배치한다.
  2. 해당 단어의 길이가 길수록 앞에 배치한다.
  3. 알파벳 사전 순으로 앞에 있는 단어일수록 앞에 배치한다

M보다 짧은 길이의 단어의 경우 읽는 것만으로도 외울 수 있기 때문에 길이가 이상인 단어들만 외운다고 한다. 화은이가 괴로운 영단어 암기를 효율적으로 할 수 있도록 단어장을 만들어 주자.

입력

첫째 줄에는 영어 지문에 나오는 단어의 개수 과 외울 단어의 길이 기준이 되는 이 공백으로 구분되어 주어진다. (1≤N≤100000,1≤M≤10)

둘째 줄부터 번째 줄까지 외울 단어를 입력받는다. 이때의 입력은 알파벳 소문자로만 주어지며 단어의 길이는 10의 10승을 넘지 않는다.

단어장에 단어가 반드시 1개 이상 존재하는 입력만 주어진다.

출력

화은이의 단어장에 들어 있는 단어를 단어장의 앞에 위치한 단어부터 한 줄에 한 단어씩 순서대로 출력한다.

예제 입력 

7 4
apple
ant
sand
apple
append
sand
sand

예제 출력 

sand
apple
append

예제 입력 

12 5
appearance
append
attendance
swim
swift
swift
swift
mouse
wallet
mouse
ice
age

예제 출력 

swift
mouse
appearance
attendance
append
wallet

문제 자체는 간단해서 쉽게 구현 가능할 줄 알았는데, 생각보다 훨씬 복잡한 정렬 알고리즘을 짜야했다.

단순하게 생각했던 sorting 함수에 대해 더 깊게 이해할 수 있었던 참 좋은 문제라고 할 수 있겠다.

 

구체적으로는

1) lambda 함수를 사용해 sorting의 key 조건 지정하기,  2) dictionary의 정렬 방법 

등을 다시금 이해할 수 있었다. 

 

 

문제에서 요구하는 조건은 3가지이다.

sorted_words = sorted(set(words), key=lambda x: (-cnt_dict[x], -len(x), x))
  1. 자주 나오는 단어일수록 앞에 배치 : 단어의 빈도수를 value로 가지는 dictionary 생성 후 lambda 함수에 적용
  2. 해당 단어의 길이가 길수록 앞에 배치 : len()를 취해 lambda 함수에 적용
  3. 알파벳 사전 순으로 앞에 있는 단어일수록 앞에 배치 : 그냥 x로 넣을 경우 자동으로 알파벳 사전 순 정렬

 

전체 코드는 아래와 같다.

import sys
input = sys.stdin.readline
n, m = map(int, input().split())

# 특정 길이 이상의 문자열만 저장
words = []
for _ in range(n):
  temp = input().rstrip()
  if len(temp) >= m:
    words.append(temp)

# 빈도수 내림차순으로 정렬하기 위한 기준 만들기
cnt_dict = {}
for word in words:
    if word in cnt_dict:
        cnt_dict[word] += 1
    else:
        cnt_dict[word] = 1
        
# 총 3가지 조건으로 단어 list 정렬하기
sorted_words = sorted(set(words), key=lambda x: (-cnt_dict[x], -len(x), x))

for word in sorted_words:
  print(word)

 

 

https://www.acmicpc.net/problem/20920

 

20920번: 영단어 암기는 괴로워

첫째 줄에는 영어 지문에 나오는 단어의 개수 $N$과 외울 단어의 길이 기준이 되는 $M$이 공백으로 구분되어 주어진다. ($1 \leq N \leq 100\,000$, $1 \leq M \leq 10$) 둘째 줄부터 $N+1$번째 줄까지 외울 단

www.acmicpc.net