기록하는삶
[코딩 테스트 연습(파이썬/Python)] 백준(BOJ) 1701번 _ Cubeditor 본문
https://www.acmicpc.net/problem/1701
[문제]
Cubelover는 프로그래밍 언어 Whitespace의 코딩을 도와주는 언어인 Cubelang을 만들었다. Cubelang을 이용해 코딩을 하다보니, 점점 이 언어에 맞는 새로운 에디터가 필요하게 되었다. 오랜 시간 고생한 끝에 새로운 에디터를 만들게 되었고, 그 에디터의 이름은 Cubeditor이다.
텍스트 에디터는 찾기 기능을 지원한다. 대부분의 에디터는 찾으려고 하는 문자열이 단 한 번만 나와도 찾는다. Cubelover는 이 기능은 Cubelang에 부적합하다고 생각했다. Cubelang에서 필요한 기능은 어떤 문자열 내에서 부분 문자열이 두 번 이상 나오는 문자열을 찾는 기능이다. 이때, 두 부분 문자열은 겹쳐도 된다.
예를 들어, abcdabc에서 abc는 두 번 나오기 때문에 검색이 가능하지만, abcd는 한 번 나오기 때문에 검색이 되지를 않는다.
이렇게 어떤 문자열에서 두 번 이상 나오는 부분 문자열은 매우 많을 수도 있다. 이러한 부분 문자열 중에서 가장 길이가 긴 것을 구하는 프로그램을 작성하시오.
예를 들어, abcabcabc에서 abc는 세 번 나오기 때문에 검색할 수 있다. 또, abcabc도 두 번 나오기 때문에 검색할 수 있다. 하지만, abcabca는 한 번 나오기 때문에 검색할 수 없다. 따라서, 두 번 이상 나오는 부분 문자열 중에서 가장 긴 것은 abcabc이기 때문에, 이 문자열이 답이 된다.
[입력]
첫째 줄에 문자열이 주어진다. 문자열의 길이는 최대 5,000이고, 문자열은 모두 소문자로만 이루어져 있다.
[출력]
입력에서 주어진 문자열의 두 번이상 나오는 부분문자열 중에서 가장 긴 길이를 출력한다.
[아이디어]
1. kmp 알고리즘의 일부인 접두사와 접미사의 일치 길이를 구하는 방법을 활용한다.
2. 접두사와 접미사가 같다면 문자열 내에서 2번 이상 등장하는 부분 문자열이라 생각할 수 있다. 0부터 n-1까지의 시작 인덱스부터 끝까지의 문자열에 대하여 각각 접두사와 접미사가 일치하는 최대 길이를 구하면서, 그 최댓값을 업데이트한다.
# Pypy3로 제출
s=input()
n=len(s)
ans=0
for k in range(n):
ss = s[k:]
nn=n-k
t = [0]*nn
j = 0
for i in range(1,nn):
while j>0 and ss[i]!=ss[j]:
j = t[j-1]
if ss[i]==ss[j]:
j += 1
t[i] = j
ans = max(ans,j)
print(ans)
kmp 알고리즘에 대해 공부해 볼 필요가 있다.
'백준(Python) > 문자열' 카테고리의 다른 글
[코딩 테스트 연습(파이썬/Python)] 백준(BOJ) 2800번 _ 괄호 제거 (0) | 2022.03.22 |
---|---|
[코딩 테스트 연습(파이썬/Python)] 백준(BOJ) 12919번 _ A와 B 2 (0) | 2022.03.20 |
[코딩 테스트 연습(파이썬/Python)] 백준(BOJ) 16916번 _ 부분 문자열 (0) | 2022.03.19 |
[코딩 테스트 연습(파이썬/Python)] 백준(BOJ) 12904번 _ A와 B (0) | 2022.03.16 |
[코딩 테스트 연습(파이썬/Python)] 백준(BOJ) 1013번 _ Contact (0) | 2022.03.16 |