문자열 - 아호 코라식(Aho-Corasick)
아호 코라식(Aho-Corasick)에 대해 알아보자.
[5670 휴대폰 자판] https://www.acmicpc.net/problem/5670 .
트라이 자료구조를 이용한다.
휴대폰의 자동완성 기능을 사용했을 때 버튼 누르는 횟수를 계산하는 문제이다.
트라이 자료구조를 이용하여 버튼을 누를 때마다 카운트를 해주면 된다.
트라이 자료구조는 원래 있던 문자면 따라가다가 달라지면 방향을 틀어 새로운 길을 만드는 트리구조이다.
생각하기는 편한 자료구조인데 처음보면은 구현은 어떻게 해야하지 싶다.
기본적으로는 연결리스트의 아이디어이다.
최적화할 때 맵을 이용하는 방법도 있지만 여기서는 알파벳 26개의 배열을 만들어서 트라이를 구현해보자!
트라이 구조를 만들고 단어가 끝날 때마다 bool형 isEnd에다가 체크를 했다.
그리고 그 단어들을 따라가며 isEnd가 나올 때마다 카운트를 해준다.
그러면 카운트된 수가 문자들을 치기 위해서 타이핑해야하는 숫자이고 이를 문자의 수로 나눠주면 평균이 된다.
이는 문자를 따라가며 단 한번만 수행 되므로 문자의 길이 즉, O(N)의 시간복잡도를 가질 것이다.
다만 알파벳이 새로 생길 때마다 공간을 할당하다보니 메모리의 소모가 크다.
동적할당을 했으면 delete를 이용하여 메모리를 비워야한다.
나머지 주의 할 점은 코드에 주석으로 처리했다.
#include <iostream>
#include <vector>
#include <algorithm>
#include <string>
#include <queue>
#include <cmath>
#include <set>
#include <map>
#define fast_io cin.tie(NULL); cout.tie(NULL); ios_base::sync_with_stdio(false);
using namespace std;
typedef long long ll;
const int ALPHABET = 26;
struct Trie{
Trie *children[ALPHABET];
bool isEnd;
Trie(){
isEnd = false;
for(int i=0;i<ALPHABET;i++) children[i] = NULL;
}
~Trie(){
for(int i=0;i<ALPHABET;i++)
if(children[i]) delete children[i];
}
};
void insert(Trie* root, string& key, bool isFirst, int idx){
Trie *pCrawl = root;
if(!pCrawl->children[key[idx]-'a']) {
pCrawl->children[key[idx]-'a'] = new Trie();
if(!isFirst){
pCrawl -> isEnd = true; //처음으로 갈라지거나 끝나는 부분을 체크했음
isFirst = true;
}
}
if(idx==key.length()) {
pCrawl -> isEnd = true;
return;
}
insert(pCrawl->children[key[idx]-'a'], key, isFirst, idx+1);
}
int search(Trie* root, string& key){
Trie * pCrawl = root;
int ret = 0;
for(int i=0;i<key.length();i++){
int idx = key[i]-'a';
if(pCrawl->isEnd) ret++;
pCrawl = pCrawl->children[idx];
}
return ret;
}
vector<string> strs;
int main(){
fast_io;
int num;
while (cin>>num){
strs = vector<string> (num);
Trie* root = new Trie();
for(int i=0;i<num;i++){
cin >> strs[i];
insert(root, strs[i], false, 0);
}
int res = 0;
for(int i=0;i<num;i++){
res += search(root, strs[i]);
}
cout << fixed;
cout.precision(2);
cout << (double)res/(double)num << '\n';
delete root;
}
}
아호 코라식(Aho-Corasick)에 대해 알아보자.
docker를 이해해보자
2060 염소줄서기 풀이 및 코드
분할정복을 이용한 다이나믹 프로그래밍 최적화
코드포스 다시 열심히! 블로그도 열심히!
rust 공부시작!
코드포스 블루 달성 후기
여름캠프 및 SUAPC 후기
2023-05-25-Edu Codeforce round 149 (Div.2)
2023-05-13-Edu Codeforce round 148 (Div.2)
HLD(Heavy Light Decomposition)
행렬 거듭 제곱
2023-05-02-It takes two
Codeforce round 868 (Div.2)
2월 11일 문제풀이
Codeforces#846, TypeDB Foreces 2023, Codeforces#848 업솔빙
ps5 게임 : 용과같이 제로 리뷰
백준 23877번 Convoluted Intervals 문제풀이
codeforce round #828(div 3), EDU #137(div 2) 업솔빙
codeforce round #823(div 2), #824(div 2) 업솔빙
AtCoder Beginner Contest 270 업솔빙
ps5 게임 : 용과같이 극 1 리뷰
백준 18719번 Binomal 문제풀이
백준 14288번 회사문화4 문제풀이
백준 3308번 Matching 문제풀이
백준 18186번 라면사기(large) 문제풀이
백준 4196번 도미노 문제풀이
백준 3176번 도로 네트워크 문제풀이
백준 16367번 TV Show Game 문제풀이
ps5 게임 : 페르소나 5 더 로열 리뷰
codeforce round #811(div 3), #812(div 2), CodeTon round 2 업솔빙
백준 21162번 뒤집기 K 문제풀이
codeforce round #808(div 2), #803(div 2, virtual) 업솔빙
codeforce round #807(div 2) 업솔빙
백준 10167번 금광 문제풀이
codeforce round #805(div 3), #806(div 4) 업솔빙
백준 18253번 최단경로와 쿼리 문제풀이
에듀 라운드 131 업솔빙
백준 1949번 우수 마을 문제풀이
백준 3665번 최종 순위 문제풀이
Trie 자료구조 이해하기
merge sort를 이용하여 inversion 개수세기
3솔의 벽이 너무 높다..
lazy propagation없이 구간 갱신하기
코드포스 폭망기념 upsolving
백준 11505 구간 곱 구하기 문제풀이
백준 1305 광고 문제풀이
백준 4386 별자리 만들기 문제풀이
백준 4803 트리
백준 2206 벽 부수고 이동하기 문제풀이
백준 2166 다각형의 면적 문제풀이
백준 12015 가장 긴 증가하는 부분 수열2 문제풀이
백준 10986 나머지합 문제풀이
스택 구현하기 ========== 자료구조의 기본이라고 하면 스택 과 큐가 있다 백준 10828번에서 마주친 스택
매우매우 많은 정렬이 있지만 그중 가장 안 어려운 3가지를 공부해보았다.
Leave a comment