Понравился комментарий про модераторов фейсбука:
Inside that bubble they are almost literally engaged in the maintenance of a censorious conspiracy themselves! They cause to be censored everything the (Top Secret?) data labeling handbook says should be censored, whether or not the handbook is internally coherent (which (Fermi estimate): it isn’t), thereby literally cybernetically controlling the discourse of maybe 20% of the English speaking world, all while facing intense employer surveillance, and “social pressure to lie to your family about your job” that would in the past have been impressive for a CIA agent in the literal cold war to seriously play along with. At least the CIA agents in the 1950s mostly knew they were CIA agents, and got pensions in exchange for loyalty!
Seriously, is it any wonder that people in a bubble like that have begun to suspect that other conspiracies exist?
Inside that bubble they are almost literally engaged in the maintenance of a censorious conspiracy themselves! They cause to be censored everything the (Top Secret?) data labeling handbook says should be censored, whether or not the handbook is internally coherent (which (Fermi estimate): it isn’t), thereby literally cybernetically controlling the discourse of maybe 20% of the English speaking world, all while facing intense employer surveillance, and “social pressure to lie to your family about your job” that would in the past have been impressive for a CIA agent in the literal cold war to seriously play along with. At least the CIA agents in the 1950s mostly knew they were CIA agents, and got pensions in exchange for loyalty!
Seriously, is it any wonder that people in a bubble like that have begun to suspect that other conspiracies exist?
Tags:
no subject
no subject
И при этом да, именно на них, по сути дела, лежит контроль за тем, о чём можно говорить на фейсбуке, а о чём нет. Ситуация довольно безумная.
А победители капсорвенования - т.е. те, кто в настоящем фейсбуке работает и всю эту систему строит - они таки да, считают, что всё хорошо. Ну, может, отдельные перегибы на местах, но не надо же очернять. А скоро мы ещё магические алгоритмы подгоним, и вообще всё прелестно станет. Вместо того, чтобы копеечные морлоки банили реальных юзеров, которые могут пожаловаться, они будут тренировать беспристрастные безошибочные алгоритмы, и уж те будут банить юзеров. А на алгоритм кто может пожаловаться, он же железный, разве у него могут быть пристрастия?!
no subject
в интернете левых больше чем правых (это факт), поэтому Гугл алгоритм выбирает левые новости. Но как получается 90% левых новостей, если разница между левыми и правыми: 55/45 в лучшем случае?
А получается просто, если стратегия: чтобы тебя выбирали в макс количестве случаев. Из гейм теории видно, что если всегда выбирать только ответы интересные большинству - выходит максимальная вероятность. (Хинт: я посчитал, и это правда)
no subject
Это ещё почему? В интернете больше всего китайцев и индийцев, думаю - но Гугл почему-то не выдаёт информацию на мандарине и хинди по умолчанию :)
Это всё из той же оперы, что я описывал - мы типа только делаем независимые беспристрастные алгоритмы, а у них как-то сам выходит bias, а как так получилось - ну так уж получилось, ничего не поделаешь. Но это ж враньё, причём враньё очевидное. Самое смешное тут то, что когда им надо, они сами отлично это понимают - попробуйте их спросить про diversity на почве пола или там расы - и тут же обнаружится, что они всё знают и про systemic bias, и про algorithmic bias, и про hidden assumptions, и про то, как надо и не надо тренировать модели... Это всё не секрет, они же сами эти статьи и писали, наверняка. Но как-то вот, когда надо, всё тут же из памяти выпало, и нам пытаются скормить "это само так случайно вышло, что 90% наших новостей - это CNN/NBC, просто остальные уж очень непопулярны". Да щас.
no subject
Но я тут про не очень очевидный вывод из теории вероятности, что стратегия: выдавать 100% левацкого контента, если леваков больше даже на пару процентов, приносит максимум бабла.
no subject
Так отсутствие горилл и есть ручной твикинг, не?
что стратегия: выдавать 100% левацкого контента, если леваков больше даже на пару процентов, приносит максимум бабла
Где ж это максимум? Давайте посмотрим: если выдавать 99.9% левацкого и 0.1% нелевацкого контента, то очевидно, что 51% леваков это не возмутит настолько, чтобы они все или их значительная часть свалили, зато 49% не-леваков это сделает из не-клиентов клиентами. По-моему, максимума не выходит.
no subject
Нет, это ковровая бомбардировка.
> зато 49% не-леваков это сделает из не-клиентов клиентами
Не понял логики
no subject
Нет, это ковровая бомбардировка.
Так в гугловских масштабах по-другому и нельзя. Вон, когда публика возмущалась оружием, они просто выпилили подстроку "gun" из поиска, срубив сотни ни в чём ни повинных товаров, включая бургундское.
Не, то есть вру, возможно и по другому - и, думаю, делается по-другому. Но гораздо проще так, поэтому во многих случаях будет делаться именно так - просто всунуть в нужное место ломик.
no subject
Отход от какой точки? Представим себе белые и черные шарики в мешке, мы их достаем и складываем обратно. На белый положительная реакция у 55% населения. Выигрышная стратегия: всегда доставать белый. Посчитай.
> просто всунуть в нужное место ломик
Ломиком никак не объяснить биас. Если ломик - там сразу 0%/100%
no subject
Не совсем понимаю, какой процесс в Гугле можно так моделировать. Моя модель проста - представим алгоритм, который полностью блокирует все правые ресурсы, напрочь. Очевидно, партийцы-демократы против такого гугля возражать не будут, а все остальные - будут, т.к. им известно, что хоть какие-то правые ресурсы существуют, т.е. Гугль очевидно не даёт им полной информации. Теперь модифицируем алгоритм так, чтобы он блокировал не все правые ресурсы, а небольшую часть пропускал. Для меня очевидно, что большинство партийцев-демократов останутся в аудитории гугля, и некоторые не-партийцы в неё добавятся, так как даже малого числа находимых гуглем ресурсов им будет достачно, чтобы считать, что гугль справедливо проводит поиск, а сравнительно малое количество правых ресурсов обьясняется их низкой популярностью. Таких людей может быть не очень много, но они будут. Таким образом, мне представляется ясным, что с точки зрения величины аудитории, как целевой функции, алгоритм "100% левых и вообще нет правых" проигрывает алгоритму "большинство левых, но немножко правых". Где находится точка оптимума у последнего - я не знаю, возможно, в месте "не подкручивать результаты вообще", а возможно - в месте "показывать левые ресурсы в 10 раз чаще правых" - я не очень пока понимаю, как это определить. Но мне ясно, что "100% левых" не может быть тут максимумом.
Ломиком никак не объяснить биас
Ломиком нет. Но ломик применяется не всегда - он слишком заметен, и легко доказуем. Поэтому иногда ломик, иногда тоньше, иногда просто перенос собственного "все нормальные люди так думают" биаса гугловца в софт. По сумме в среднем по больнице и выходит биас.