Этот математический лайфхак помог шпионам во Второй мировой. Простой способ сосчитать что угодно
Почему не нужно считать все подряд: честный разбор метода Линкольна-Петерсена
Представьте: вам нужно узнать, сколько рыбы в озере. Слить воду? Глупо. Переловить всю? Бессмысленно. Или вот другая задача: на заводе выпустили партию болтов. Как узнать долю брака, не проверяя каждый? А в сороковых годах союзники хотели знать, сколько танков производит Германия. Шпионы врали, разведка паниковала. Решение нашлось в простой статистике. Метод «отлова и повторного отлова» — он же индекс Линкольна-Петерсена — позволяет оценить численность чего угодно, от бабочек до танков. И работает он блестяще. Давайте разберем, как это устроено.
Как это работает: три шага к точности
Всё строится на простой пропорции. Сначала вы делаете выборку — «отлавливаете» несколько объектов. Маркируете их. Выпускаете обратно. Даете время перемешаться. Потом делаете вторую выборку. Считаете, сколько в ней помеченных. И экстраполируете.
Пошаговый совет:
- Отлов первой группы. Например, поймали 200 рыб.
- Метка. Пометьте каждую — краской, чипом, биркой. Отпустите.
- Повторный отлов. Через день снова ловите. Допустим, 100 рыб.
- Подсчет меток. Из 100 пойманных — 10 с меткой. Значит, метка встречается в 10% выборки.
- Расчет. Если 200 помеченных составляют 10% популяции, то вся популяция = 2000 рыб. Формула: N = (M * C) / R, где M — число помеченных в первом отлове, C — число во втором отлове, R — число помеченных во втором.
Просто? Да. Это работает, если метка не влияет на выживаемость, а популяция «закрыта» (нет миграции).
От рыбы к танкам: неожиданные применения
Самое красивое — метод не требует буквального отлова. Во Вторую мировую союзники анализировали серийные номера подбитых танков. Немцы нумеровали технику последовательно. Каждый захваченный танк — это «повторный отлов» из множества. Статистики оценили, что Германия производит около 250 «Пантер» в месяц. После войны цифры подтвердились. Шпионы же давали до 1500. Вот что значит математика.
Личное наблюдение: Недавно я заметил, что похожий метод используют в IT для оценки числа уникальных пользователей. Сервисы ставят cookie (метка), потом смотрят, сколько «старых» пользователей вернулось. По пропорции вычисляют общую аудиторию. Работает даже без регистрации.
А еще было исследование с чайными ложками в офисе. Ученые пометили 50 ложек, через месяц нашли 20 помеченных из 100 оставшихся. Оценили, что всего ложек было около 250. Реальность — 200. Точность высокая. Вывод: метод подходит для любых «подвижных» объектов.
Ограничения: почему не стоит слепо верить
Метод — не панацея. Он требует выполнения условий: метка не должна теряться, популяция должна быть случайной, а время между отловами — достаточным для перемешивания. Нарушите одно — получите фикцию. Например, если помеченные рыбы становятся мишенью для хищников, оценка будет занижена. Если ловить всегда в одном месте — завышена.
Сравним метод с альтернативами в контексте контроля качества на производстве:
| Метод | Преимущества | Недостатки |
|---|---|---|
| Линкольна-Петерсена | Требует малой выборки, дешев | Чувствителен к нарушениям допущений |
| Сплошной контроль | 100% точность | Дорогой, долгий, невозможно для разрушающих испытаний |
| Экспертная оценка | Быстрая | Субъективна, часто ошибочна (вспомните шпионов) |
Мое мнение: для большинства практических задач индекс Линкольна-Петерсена дает приемлемую точность при минимальных затратах. Но всегда проверяйте, закрыта ли система и случайна ли выборка.
«Чтобы понять целое, необязательно видеть его целиком. Иногда достаточно одной метки и двух заходов».
Итог от автора. Метод отлова-повторного отлова — элегантный инструмент, который экономит время и ресурсы. От экологии до производства — везде, где нужна оценка скрытой численности. Но помните: за красотой пропорции стоят жесткие допущения. Пользуйтесь им осознанно.

