План лекций

Хеширование (29 апреля)

Строчка Туэ-Морса (__builtin_popcount(i) mod 2, или рекурсивно: S_n = S_n-1 + not S_n-1). Оценка длины строки, чтобы была коллизия.
Тест против (P,MOD)-хеша
Что делать? Выбирать случайную точку P или случайный простой MOD! Лучше P.
Lm: если (P,MOD) фиксировано, MOD простое, мы берём случайный многочлен, то вероятность, что P − корень, равна 1/MOD
Lm: если многочлен и MOD фиксированы, MOD простое, мы берём случайное P, то вероятность, что P − корень, ≤ degree/MOD
Lm: если многочлен MOD фиксирован, MOD простое, мы берём случайное P и случайный многочлен, то вероятность, что P − корень равна 1/MOD

Хеш-таблица со списком, хеш-таблица с открытой адресацией
Матожидание средней длины списка.
Матожидание максимальной длины списка. Доказательство.
Двойное хеширование для списков. Матожидание максимальной длины списка. Набросок доказательства.
Двойное хеширование для открытой адресации. Оценка?!
[не успеем] Хеширование кукушки.

Принцип: выбирать случайную хеш-функцию из ``хорошего'' семейства
Опеределение: ∀ x, y : Pr_{h ∈ H} (h(x) = h(y)) ≤ 1/m. Свойства равномерной разности: h(x)-h(y) равномерно.
Пример: fix m, p > m ⇒ H = {x → (ax+b) mod p mod m}. |H| = p(p-1). Доказательство.