문자열 - 아호 코라식(Aho-Corasick)
아호 코라식(Aho-Corasick)에 대해 알아보자.
[1305 광고] https://www.acmicpc.net/problem/1305 .
KMP알고리즘 base의 failure function을 이용해서 문제의 답을 구한다.
광고 문구가 될 수 있는 것중 가장 짧은 광고문구를 찾는 문제이다 .
광고가 될수 있는 문구 1글자, 2글자, 3글자… 씩 늘려가며 이 문구가 광고가 될 수 있나 검사할 수도 있지만
이는 O(N^2)의 시간복잡도가 걸릴 것이다.
따라서 O(N)으로 작동하는 KMP(knuth-moris-pratt)알고리즘을 이용할 것이다.
이는 문자열(hey)을 검사할 때 검사하려는 문자(needle)의 pattern을 파악해 모든 부분을 검사하지 않고 넘기면서 검사하는 알고리즘이다.
그리고 그 pattern을 파악하는 부분도 KMP를 이용하고 이는 partial match table이라고 부른다.
그리고 pi 테이블을 만드는 함수를 failure function이라고 부른다.
이는 다른 블로그에서 간단하게 구현하는 것들이 있지만 나는 KMP알고리즘과 비슷하게 종만북을 참고하여 작성했다.
아래 코드는 pi table을 얻는 failure function이다.
vector<int> getPartialMatch(const string &N){
int size = N.size();
vector<int> pi(L, 0);
int begin = 1, matched = 0;
while (begin+matched<size) {
if(N[begin+matched]==N[matched]){
matched++;
pi[begin+matched-1] = matched;
}else{
if(matched==0) begin++;
else{
begin += matched - pi[matched-1];
matched = pi[matched-1];
}
}
}
return pi;
}
사실 pi를 만들었으면 게임 끝이다.
광고판에 나온 글자들은 어찌됐든 광고 문구안에 포함되어있는 문자들이다.
위 그림을 보면 PI의 마지막 값만 중요하다는 것을 알아낼 수 있다.
그러면 패턴하나의 크기만 알아내면 되므로
광고판 사이즈 - 마지막 PI의 값 = 정답!!!
딱히 주의할 점은 없다.
PI 테이블만 잘 만들면 문제 없기 때문이다.
#include <iostream>
#include <vector>
#include <algorithm>
#include <string>
using namespace std;
int L;
vector<int> part;
//pi를 만든다
vector<int> getPartialMatch(const string &N){
int size = N.size();
vector<int> pi(L, 0);
int begin = 1, matched = 0;
while (begin+matched<size) {
if(N[begin+matched]==N[matched]){
matched++;
pi[begin+matched-1] = matched;
}else{
if(matched==0) begin++;
else{
begin += matched - pi[matched-1];
matched = pi[matched-1];
}
}
}
return pi;
}
int main(){
cin.tie(NULL); cout.tie(NULL); ios_base::sync_with_stdio(false);
cin >> L;
string str;
cin >> str;
part = getPartialMatch(str);
cout << part.size()-part.back(); //tablesize - pi마지막값
}
아호 코라식(Aho-Corasick)에 대해 알아보자.
docker를 이해해보자
2060 염소줄서기 풀이 및 코드
분할정복을 이용한 다이나믹 프로그래밍 최적화
코드포스 다시 열심히! 블로그도 열심히!
rust 공부시작!
코드포스 블루 달성 후기
여름캠프 및 SUAPC 후기
2023-05-25-Edu Codeforce round 149 (Div.2)
2023-05-13-Edu Codeforce round 148 (Div.2)
HLD(Heavy Light Decomposition)
행렬 거듭 제곱
2023-05-02-It takes two
Codeforce round 868 (Div.2)
2월 11일 문제풀이
Codeforces#846, TypeDB Foreces 2023, Codeforces#848 업솔빙
ps5 게임 : 용과같이 제로 리뷰
백준 23877번 Convoluted Intervals 문제풀이
codeforce round #828(div 3), EDU #137(div 2) 업솔빙
codeforce round #823(div 2), #824(div 2) 업솔빙
AtCoder Beginner Contest 270 업솔빙
ps5 게임 : 용과같이 극 1 리뷰
백준 18719번 Binomal 문제풀이
백준 14288번 회사문화4 문제풀이
백준 3308번 Matching 문제풀이
백준 18186번 라면사기(large) 문제풀이
백준 4196번 도미노 문제풀이
백준 3176번 도로 네트워크 문제풀이
백준 16367번 TV Show Game 문제풀이
ps5 게임 : 페르소나 5 더 로열 리뷰
codeforce round #811(div 3), #812(div 2), CodeTon round 2 업솔빙
백준 21162번 뒤집기 K 문제풀이
codeforce round #808(div 2), #803(div 2, virtual) 업솔빙
codeforce round #807(div 2) 업솔빙
백준 10167번 금광 문제풀이
codeforce round #805(div 3), #806(div 4) 업솔빙
백준 18253번 최단경로와 쿼리 문제풀이
에듀 라운드 131 업솔빙
백준 1949번 우수 마을 문제풀이
백준 3665번 최종 순위 문제풀이
Trie 자료구조 이해하기
merge sort를 이용하여 inversion 개수세기
3솔의 벽이 너무 높다..
lazy propagation없이 구간 갱신하기
코드포스 폭망기념 upsolving
백준 11505 구간 곱 구하기 문제풀이
백준 1305 광고 문제풀이
백준 4386 별자리 만들기 문제풀이
백준 4803 트리
백준 2206 벽 부수고 이동하기 문제풀이
백준 2166 다각형의 면적 문제풀이
백준 12015 가장 긴 증가하는 부분 수열2 문제풀이
백준 10986 나머지합 문제풀이
스택 구현하기 ========== 자료구조의 기본이라고 하면 스택 과 큐가 있다 백준 10828번에서 마주친 스택
매우매우 많은 정렬이 있지만 그중 가장 안 어려운 3가지를 공부해보았다.
Leave a comment