Я чего-то не понимаю, или статья, которую Шнайер перепечатал в своем блоге - о том, что data mining не может быть эффективным в борьбе с терроризмом - действительно является бредом (несколько обьяснений почему - там в комментариях)? Т.е. вполне возможно, что вывод статьи как раз правильный, но из написаного в статье он не следует - как мне представляется - никак.
P.S. Расчеты у меня, кстати, с приведенными в статье не сошлись, но это может потому, что я не понял, как он применяет теорему об условных вероятностях...
P.S. Расчеты у меня, кстати, с приведенными в статье не сошлись, но это может потому, что я не понял, как он применяет теорему об условных вероятностях...
Tags:
no subject
The surveillance is, however, useful for monitoring political opposition and stymieing the activities of those who do not believe the government's propaganda.
Клиника.
no subject
no subject
Подобно истерикам вокруг клонирования, имеющих в виду модификации человеческого генома, Шнеер пугает своих читателей тем чего пока нет и. будем надеяться, не будет - автоматическим наказанием на основании решения компьютерной программы.
no subject
Let's take his first example, 60% false negatives and 0.01% false negatives, and apply the filter twice. Out of 300M, the system, applied once, gives 400 positives and 29600 false positives. How do real-life people use Bayes training? They apply it again. Let's apply it again, to the next batch of emails, blogs, phone calls, etc. Then we get this: 3 false positives and 160 terrorists.
That's the practice of the people that know what Bayes is about and know how to apply it to real-life data.
I wonder whether the author is a practicing professional or just a clueless "evangelist".
no subject
no subject
Floyd Rudmin is Professor of Social & Community Psychology
which explains why he's so poor with understanding probabilities, but doesn't explain why Schneier bought into it. Probably it sounded so wonderfully consistent with his views that he didn't bother to actually read the piece.
no subject
no subject
no subject
Зачем менять тему?
no subject
no subject
В первом случае, когда мы имеем 1000 террористов, из которых программа найдёт 40%, т.е. 400, плюс программа назовёт 0.01% невинных людей, т.е. 30,000, террористами.
Итого вероятность, что названный человек - террорист: p = 400/30400 ~= 0.0132.
Т.е. действительно маленькая вероятность, что впрочем очевидно, и наверное имеется ввиду, что подробно исследовать 30,000 это дорого... Хотя, если это поможет поймать 400 террористов...
no subject
no subject
With these suppositions, then the probability that people are terrorists given that NSA's system of surveillance identifies them as terrorists is only p=0.2308,
Я дико извиняюсь. Почти четверть из тех, кого система пометила как потенциальных террористов — настоящие террористы. И такую систему обозвать бесполезной? Да это же клад, а не система!
no subject
no subject
no subject
no subject
no subject