| Comments: |
в одном отличном аналитическом разборе всплески к словам типа дефлорация, аборт, и.т.п. очень хорошо разбирались. происхождение этих всплесков на 99% искусственное
Что значит - искусственное? Если можно, чуть подробнее. Или, может, ссылочка на упомянутый обзор завалялась?
Спасибо. Обязательно прочту, и внимательно.
Угу. Денис любит излагать свысока, но стоит прочитать.
Осилил текст, не без труда. Из текста ясно, что определенные пики стимулируются искусственно. Вместе с тем, общеизвестно, что всплески поисковых запросов вызывают информационные поводы. От реальных событий до того, что в конкретный день шло по ТВ. В текстике сказано, например, про День борьбы со СПИДом 1 декабря и соответствующий скачок запросов. Как отличить первую ситуацию от второй? Только тщательным анализом всех параметров, которые выдает Яндекс. Без этого сказать, что всплеск искусственный, нельзя. А от доказать, что он естественный, можно опираясь на обычные аналитические механизмы. Попытка революции в Молдове - и всплеск запросов с этим словом. Ясно только, что в этом контексте искусственность всплесков - это не 99% и, думаю, даже не 70...
а у естественных всплесков без труда находятся естественные причины:)
P.S. а цифра 99 относилась к дефлорации, а не к всплескам ВООБЩЕ.
Понятно. Вообще, вычислить инфоповод для всплеска интереса к дефлорации очень сложно...
> происхождение этих всплесков на 99% искусственное Понятно, что не солнышком пригрело :-) Но пока не знаем, откуда именно такой пик, говорить не о чем. (В общем, там вся запись была про то, что сначала соберите данные, посмотрите, что да как, поймите, что они означают, а потом делайте выводы). В случае с "Пульсом" данные сами на тарелочке падают, грех их не собрать. Еще полезно знать, что цифра вообще означает - в данном случае это количество упоминаний этого слова в записях (под вопросом - и комментариев) в блогах, индексируемых Яндексом, деленное на общее количество записей в тот день. Скажем, первый пик пришелся на 3 августа 2008 - 10 августа 2008. Вводим этот период в пульс, чтобы найти конкретную дату - получаем, что весь интерес пришелся на один день - 9 августа. При наведении на пик - нам кажут ссылку: 09.08.2008 — 10.08.2008 по запросу дефлорация. Только эту ссылку мы слегка отредактируем. В конце нужно дописать &rd=0, чтобы показались все записи, включая похожие с точки зрения Яндекса, потому что при построении Пульса они учитываются. И теперь тупо смотрим выдачу. Вот по тому, что я вижу - это какой-то уже забаненный мудила автоматом запостил в полторы тысячи коммьюнити опрос с вопросами типа "Сколько Вам лет?", "Любите ли вы веселиться на ночной вечеринке?"... Ну и в конце - "у женщин это называется дефлорацией, а как у мужчин?", "причем тут дефлорация? опрос дурацкий". Исключаем сообщения этого мудака, добавив к запросу ~~ "опрос дурацкий", получаем 14 сообщений за 2 дня, в рамках нормы. Т.е. весь первый всплеск объясняется запощенным автоматом опросом одного мудака. Разбор второго всплеска оставляю в качестве домашнего задания :-)
Большое спасибо за тонкую и тщательную проработку вопроса. Теперь все вроде бы ясно. Но меня мучает один вопрос - а зачем эти мудаки делают безумное количество автоматических запросов на слова "аборт" или "дефлорация"? Я имею некоторое отношение к гуманитарным наукам, и этот феномен не укладывается ни в какие из известных мне аберраций индивидуального или массового сознания. В чем смысл? Это что, такое самоутверждение?
В случае с "абортом" - конкретно он никому не нужен был. Тогда искали форумы по куче тем, количество разных запросов исчислялось десятками тысяч, и "аборт" в их числе либо просто не отфильтровали, либо отнесли к медицинской тематике. С "дефлорацией" - запощенный опрос был посвящен вечеринкам (можно его целиком в кэше посмотреть), а "дефлорация" там просто в конце затесалась, в порядке шутки.
Спасибо за информацию, что-то я, конечно, из написанного Вами вынес, но, к сожалению, меньше, чем хотелось бы. Материя для меня сложная. Но одно очевидно - к пульсу блогосферы теперь буду относиться с бо-ольшим подозрением...
Пара апдейтов: 1. Пик пришелся, конечно, на два дня, 9-10 августа. Это я зачем-то воспринял это как период. 2. В конце для наглядности можно построить новый пульс с запросом 'дефлорация ~~ "опрос дурацкий"'. 3. То, что Яндекс не исключает при построении Пульса похожие записи, - глупость полная. 4. Графики, в которых изначально точечные данные соединены "для наглядности" линиями этими, - мудачество, только затрудняющее понимание. Детишкам понятнее, но работать с ними совершенно невозможно.
Ну, невозможно... Вы же работаете. Сопоставляете с другими источниками информации, с данными того же Гугла. Смотрите информационный фон. Используете здравый смыл и логику такого общего рода, не связанную непосредственно с интернетом...
Круто  | |