Строки: суффиксный массив (21 октября 2024)
- [5 минут] Решение суфф массивом задач
- Напоминание, что суффмассив весит O(n) и мы его умеем строить в лоб за O(n2logn) и хешами за O(nlog2n)
- Поиск подстроки в тексте за O(|s|log|T|) и O(|s|+log|s|log|T|)
- [35 минут] Суффиксный массив за O(nlogn)
- Сортируем циклические сдвиги строки s#
- За O(Σ + n2) цифровой сортировкой
- От k переходим не к k+1, а к 2k, внутри используем сортировку подсчётом для пар, уже отсортированных по второй половине
- Учимся писать, должно получиться что-то типа моего
- [10 минут] Алгоритм Касаи LCP за O(n)
− Перерыв −
- [15 минут] Алгоритм поиска подстроки в тексте за O(|s| + log|T|)
- Собственно алгоритм: SM ≥ max(min(SL, ML), min(SR, MR))
- Вычисление ML и MR за O(1) с предподсчётом за O(n): дерево отрезков
- Доказательство того, что при SM++ увеличится на следующей фазе max(SL, SR)
- Бор, суфдерево
- Основа. Пример хранение
int next[N][26]
- Применения:
unordered_set
, set
, сортировка строк.
- Хранение для применений выше
- Суф.дерево, поиск строки в тексте
- Сжатое суфдерево, сжатый бор
− Перерыв −
- [25 минут] Доп лекция. Суффиксный массив за O(n). Алгоритм Каркайнена-Сандерса.
- Условие входа в функцию: дана строка длины n над алфавитом не более 2n.
- Новый алфавит − тройка подряд идущих символов. За O(n) цифровой сортировкой получили номера символов.
- SA(s): SA(s0s1) + Sort(s2) + Merge(s0s1, s2).
- Оценки времени: T(n) = O(n) + T(2n/3) + O(n) + O(n) = O(n).