Previous Entry Share Next Entry
Выборы-выборы
ejafarov
Оригинал взят у eugenyboger в Выборы-выборы
UPD: В связи с публикацией на Ленте, подкорректировал текст. Выводы по этим картинкам отличаются от того, что написал Андрей Коняев, дописал частично в текст.


Просто картинки:
Вся россия:

Процент за единую россию от явки (график взвешен на размер участка).


Наблюдаем вбросы, реальный результат за ЕдРо - середина по вертикали большого эллиптического пятна снизу и слева (нормальная составляющая). Итого 30%.

Явка (репрезентативнее следующая картинка)


Взвешенная на количество избирателей на участке явка




Теперь смотрим на "регионы с особой электоральной культурой": Хабаровск, Киров и Вологду (области целиком). Список произвольный.

Хабаровск, мало вбросов, похоже довольно большой процент за едро. Кривые почти гауссовы:





Киров, чуть больше вбросов





Вологда:





Сволочи в общем.
По такому случаю предлагаю пойти 5ого, в понедельник сюда http://5dec.org/

UPD: Новые данные, Москва и область:

Москва, самые чудеса:


Тоже самое, только в цветах (чем краснее точка, тем больше таких УИКов)


Взвешенная явка:


Обратите внимание на два гаусса. Это разительно отличается от картинок по другими регионам: в хороших регионах один обычный "колокол" (мало фальсификаций), в плохих - длинный правый хвост (вброс). В москве ДВА независимых распределения, как будто москва разделена на две статистически разные части. При этом не географически, а как-то ещё. Простейшее этому объяснение состоит в том, что второй гаусс (и широкое пятно над нормальным пятном на двумерной гистограмме - первой картинке) есть результат случайно нарисованных результатов. Вброс, как я говорил, приводит к правому хвосту на гистограмме и вытянутому лучу на двумерных графиках (см. самую первую картинку в посте).

Это всё поразительным образом согласуется с множеством рассказов о результатах по участкам в Москве, которые совершенно отличались от наблюдательских.



Область, не вбросили:






==========

Все результаты в экселе-читаемом виде, номера полей как в цик, первый столбец - код региона
http://peregrins.com/elect/results.csv.gz

Поля посмотреть тут например: http://www.vologod.vybory.izbirkom.ru/region/region/vologod?action=show&root=352000016&tvd=2352000326463&vrn=100100028713299®ion=35&global=true&sub_region=35&prver=0&pronetvd=null&vibid=2352000326463&type=242


Скрипты, чтобы забирать данные: http://peregrins.com/elect/get_data.py и чтобы рисовать http://peregrins.com/elect/plot_results.py (нужен ROOT).


Про предыдущие выборы:

http://esquire.ru/elections
http://trv-science.ru/2009/10/27/statisticheskoe-issledovanie-rezultatov-rossijskix-vyborov-2007-2009-gg/


  • 1
Блин, ну и где ж вы были с такой прекрасной интерпретацией (про два гаусса я, если честно, даже не подумал - это очень изящно), когда я текст-то писал? Добавил ссылку на это в текст комментария (хотя уже, в принципе, поздновато)

Это не я, это перепост. Благодарности автору eugenyboger, который сделал такой прекрасный анализ. Я сам занимаюсь матфизикой и просто он на моем языке объяснил все, что происходило в России ночью 4-го декабря:)

а где ссылка на ваш текст?

Да, мне как-то это в голову пришло уже после того, как выложил картинки и я так и не сподобился обновить пост. Жаль, что вы мне не написали, когда текст писали.

У нас в Ленте.Ру срок написания любой крупной статьи - 3-5 часов, не больше. Так что тупо не хватило времени.

(Deleted comment)
Автор поста eugenyboger сделал великолепный статистический анализ. Дело в том, что обычно распределение больших данных подчиняется простому Гауссовскому распределению. Данные по выборам то же самое. Если нет, то значит над данными играли, на них делали исправления. Тогда возникает вопрос, неужели исправили все и везде. А ответ такой, что это невозможно, пока существуют хотя бы какие-то наблюдатели где-то или у кого то совесть не позволяет этого делать. Из-за того, что в базе до сих пор реальные данные вместе с исправленными, то можно сделав анализ, увидеть где реальные данные, а где исправления. По реальным данным можно узнать кто где сколько жульничал. Из анализа видно что, за едро голосовали около 30% в целом. В Хабаровске, Кирове, Вологде вроде все издалека напоминает Гауссовое распределение. Но Москва бардак. Два гауссиана вообще кошмар. видимо, уже в какой-то момент решили отказатся от всяких каруселей и писали данные просто с себя. Поэтому, надо бы посмотреть в каких участках высокая явка и высокие проценты за едро. Тогда будет понятно, до скольких часов принимали более-менее нормальные протоколы с нормальной явкой и процентами, а во сколько начались эти приписки, не поддающиеся разумному математическому анализу.

(Deleted comment)
Как-раз если в отдельности собрать вместе все эти почти 100%-ные явки, которые в основном из воинских частей и исправительных учреждений, то увидите что, они тоже подчиняются Гауссовскому распределению. Для этого, просто нужно набрать много событий вместе. Вы отдельности, вы увидите что, они тоже друг от друга отличаются. В одном 97, в другом 97,3 и т.д.

Могут конечно. Большинство может голосовать за определенную партию. Но, все равно, 70% должно иметь какое-то объяснение. А так, за что в републике Тыва голосовали так? огромная зарплата, уровень жизни выще чем в санкт-петербурге или все таки жульничество? Это конечно не мое дело, я не гражданин России, но то что, "снимали фальшивое кино" не объяснение. Хотя бы могли посадить тех жуликов, которых разные люди снимали на видео при соверщении преступления.

У меня дедушка умер в 102 года, он был 1898-го года рождения. Покойный рассказывал, что в 30-ые годы после того, как арестовали многих членов его семьи в деревне, включая его родителей, то в один день ему пришло сообщение что, советская власть в Баку отобрала у него право голоса. После потери этого права, уже никто с ним в деревне не здоровался, потому что, тогда сначала отбирали право голосования и потом уже следующим шагом отправляли в лучшем случае в сибир, а в худщем расстреливали прям в центре Баку (что и сделали с его родителями). Он и его товарищ вдвоем (оба были простыми крестянами), как он рассказывал, сидели неделью у дверей НКВД, пока один сотрудник с совестью не заступился за них чисто случайно.

Так что, для того чтоб получить 70-80%, надо это заслужить, а не красть голоса у людей.

Одним словом, ваши примеры могут иметь место и наверно такие вещи случались, но тут анализ ведется по достаточно большому числу событий, чтобы описывать общую картину. В частных случаях, когда выборка маленькая, то другие статистические методы работают.

(Deleted comment)
Вы пишите мне так, как будто я против единой россии и за коммунистов или какой то организации солидарность. У меня нет политических взглядов по отношению россии, потому что я гражданин другого государства:) россия для меня дружественная страна и в принципе, мне где бы то я не был, приятно посчитать русскоязычных ближе к себе, чем каких то немцев, французов и т.д.:)

Вы знаете, тут не надо оправдываться или закрыть глаза на все, думая что ничего не произошло. Каддафи, Мубарак и др. стреляли на своего народа, говорили что народ их поддерживает, и что? Решили проблему? Нет. Поэтому, всем понятно, что была тотальная фальсификация в российских выборах. Государство должно было посадить хотя бы тех, кто попался при фальсификации. Немедленно. А Путин, Медведев, Чуров начали нести чепуху. У народа есть гнев. У него украли голос. Пока, кто-то не будет накажен, этот гнев просто так не пройдет. Потому что, российский народ очень образованный, все видит и понимает. Еще гордый, непредсказуемый, давным давно освобожденный от ига своих соседей. Просто так, сказав что это все кино снимали, не отделаются.

А стат анализ, который был сделан автором блога, прост хороший математический анализ. Не часто можно иметь доступ ка такому огромному количеству данных. Вот и человек взял и сделал хорошие рассчеты и показал, примерно каким образом избиркомы жульничали. Но, юридической силы, конечно эти анализы не имеют и ничего не доказывают.

(Deleted comment)
Хорошо, давайте не будем. Двухпиковое распределение означает, что есть два разных типа избирательных участков. Чем они отличаются?
Одна из возможных гипотез, объясняющих и распределение явки, и зависимость % голосов за ЕР от явки- фальсификация (вброс). Если он действительно был, то можно предсказать совершенно определенное поведение власти и УИК, и оно, судя по многочисленным свидетельствам, действительно наблюдалось. Т.о. вброс не противоречит ни результатам, ни имеющимся свидетельствам.
Про вашу ссылку на голосование "за компанию". Каждый участок - это 500-1000 голосовавших, и чтобы сдвинуть результат на 15%, нужно хотя бы 80 невинно голосующих "за компанию" за одну и ту же партию. В половине московских участков. Если предположить, что действительно было много голосований "за компанию" за ЕР, то почему не на всех участках? Не годится.
Объяснения, связанные с разными социальными условиями на разных участках, возможно, пригодны для объяснения особенностей голосования Кавказа, но Москве не работают - какие тут разные социальные условия в спальном районе с разных сторон улицы (см. картинки в http://myugor.livejournal.com/18444.html , кстати, если ЦИК честно исполняет свои функции, то просто напрашивается идея пересчитать голоса хотя бы на этих двух УИК, 2264 и 2276. Но ЦИК не хочет их пересчитывать, а находит участки где-то в Московской области. Почему?)
Дайте другие объяснения, и попробуйте сами проверить их на зуб. Пока, за отсутствием других внятных объяснений можно принять вброс в качестве рабочей гипотезы.

Эх, как же я вас проглядел!
Посмотрите на мои картинки по Самарской области - там картинка еще более яркая, чем по Москве, там три кластера.

У меня (один из спальных районов СПБ) тоже 3 кластера! Считал сам.
При этом каждый из них в отдельности примерно соответсвует нормальному. Но вот все вместе они вообще никакого распределения не образуют, они вообще даже не пересекаются! В первом среднее ~28%, во втором ~55% в 3м ~85%/

После подробного анализа (не только за Ер, а по всем партиям) осноная гипотеза:
1й кластер - чистый честный подсчет
2й кластер - липовый протокол в котором большую часть голосов у СР и Я списали в пользу ЕР
3й кластер - вообще почти все списали в пользу ЕР (оставили по 1-3% остальным ради приличия).
Причем это все один район - участки часто вообще в одном квартале или на другую сторону улицы перейти.

Анализ делал через 2 дня после выборов.
А вот сегодня подоспело документальное подтверждение - по 2 УИК из моего 2го кластера (куда всего вошло 32 участка) всплыли копии протоколов выданные наблюдателям, по которым подверждается исходная стат. гипотеза - а именно списывание голосов от СР и Я в пользу ЕР уже ПОСЛЕ подсчета голосов. (подделка протокола или модификация данных в ГАС это уж суд выяснять должен, пока факт только то, что копия наблюдателей сильно не равна данным ЦИК)

Какая классная полосочка на 75 процентах на самой верхней картинке - подгоняли к трем четвертям голосов.

Несколько соображений

Спасибо за продуктивный аналитический подход.

Несколько дополнительных соображений, если позволите:

1) Обратите внимание на "вертикаль уплотнения" по правому срезу самого верхнего графика -- "облака" распределения процента голосов за ЕдРо как фунции процента явки. Похоже, что вброс происходил и за другие партии. Если бы только за ЕдРо, то вместо вертикальной полосы по правому краю мы имели бы пятно в северо-восточном углу... Есть ли на этот счет мнения?

2) Практически прямо-пропорциональная зависимость процента голосов за ЕдРо от процента явки, особенно в Москве, в принципе, может объясняться повышенной отмобилизованностью электората этой партии: люди знают, за кого им голосовать и полны решимости реализовать свое право голоса. Здесь необходим некоторый дополнительный анализ. В частности:

а) Неоднократно приводились случаи предвыборного нажима на электорат по месту работы, по линии Народного фронта и т.д. Тем самым оказывается подмоченной гипотеза о добровольно-сознательной высокой явке в пользу ЕдРа.

б) Поскольку единицей учета является избирательный участок, можно предположить географически-уплотненное распределение электората ЕдРа - наличие у этой партии, своего рода, многочисленных микро-географических "очагов" поддержки. Это однако сомнительно, учитывая политическую аморфность и беспрограммность ЕдРа. Пожалуй единственной географической "базой" партии можно считать российскую глубинку и места дислокации воинских частей -- в силу того, что там местному начальству легче запрограммировать людей на желаемый для него (начальства) исход голосования и выгнать людей на избирательные участки. Очень важно, мне кажется, увидеть в восходяще-ориентированном облаке на Ваших графиках не только результат вбрасывания, но и упомянутый "эффект подневольности". Почему это важно? -- Потому что это статистически поддерживает требование перевыборов не только в силу нелегитимности практики голосования, но и в силу нелегитимности практики предвыборного нажима на электорат. Тем самым, поддерживается и требование отмены фактически неконкурентных выборов: отсутствие достойных альтернативных партий и программ привело к электоральной пассивности людей, что в свою очередь, ослабило их иммунитет к нажиму и манипуляциям.

  • 1
?

Log in