November 2019

S M T W T F S
      12
34 5 678 9
10111213141516
17181920212223
24252627282930

Style Credit

Expand Cut Tags

No cut tags
Friday, February 15th, 2008 04:08 pm
Скажи же мне скорей, что это неправда!

"Для Я.ру временем сообщения считалось не время его написания, а время его скачивания в ППБ."

Это ответил мна саппорт на вопрос о том, почему пост в я.ру от 29 января находится в ППБ с датой 12 февраля. Нет-нет, я не могу поверить, что всё НАСТОЛЬКО плохо.

Upd. Хотя если сравнить даты в http://blogs.yandex.ru/search.xml?server=ya.ru&author=kukutz&ft=blog&duration=1&no_group=1 и в http://kukutz.ya.ru/replies.xml?item_no=3246, то начинает казаться, что правда :(
Sunday, February 17th, 2008 08:20 pm (UTC)
> Если у вас есть примеры проиндексированных нами постов, автор которых
> утверждает, что они публичными никогда не были - я буду вам очень благодарен
> за указание на них и обещаю провести расследование и принять меры.


Вы знаете, я не работник Яндекса и специально не стану изыскивать классифицировать отдельные случаи. Но если они и вправду вам интересны - ваш же поиск по блогам к вашим услугам, ключевые слова вы знаете.

> Если вы знаете примеры ошибочного исключения каких-либо записей или
> журналов из поиска - пожалуйста, приведите их.


См. мой ответ выше.

> Мы не скрываем и никогда не скрывали, что у нас есть как автоматические способы
> разметки журналов, так и контент-менеджеры, которые этим занимаются вручную (или
> помогают настраивать автоматику). Если бы всего этого не было, результаты поиска по
> блогам давно были бы заполнены спамом, новостями и другими неформатными потоками.


Разумеется, это понятно. Непонятно только, где кончается полиция и начинается Беня автоматическая разметка и начинается ручная.

Совершенно понятно, что если целиком полагаться на автоматику, то накрутка и спам будут забивать выдачу; не менее понятно также, что контент-менеджер тоже человек и, следовательно, действует субъективно, при этом отсутствие ясных, однозначно толкуемых, публичных и, главное, апеллируемых критериев его деятельности рано или поздно приводит к волюнатризму, вкусовщине, "комплексу вахтёра", а то и к сведению личных счетов.

Поэтому ваша задача - пройти по тонкой грани и обеспечить максимально релевантную и полную выдачу и сдвиг на незначащие позиции в ней спама и накруток. Как мне (и не только мне) кажется, вы справляетесь с этой задачей всё хуже и хуже. Ваши действия против спама и накрутки часто портят выдачу и обессмысливают сам смысл поиска. "Клюв вытащил - хвост увяз".

Я понимаю сложность вашей задачи. В условиях, когда сотни и тысячи энергичных придурков занимаются "оптимизацией", очистить выдачу от дерьма очень непросто, верю.

Но вы взялись за эту работу, так делайте же её достойно.

И ещё раз повторю: главная претензия к вам - это не поиск, там проблемы есть, но их немного. Главная претензия - рейтинги. Вот это настоящая мерзость, которая испортила и продолжает портить русскоязычную блогосферу. Уберите с ЯППБ рейтинги - и получится прекрасный сервис.
Sunday, February 17th, 2008 08:34 pm (UTC)
1,2: Конечно, все случаи, все случаи, находящиеся поиском, я мониторю. Как я уже сказал раньше, ни одного случая индексации изначально-подзамочного поста пока не выявлено.

3: Ваши действия против спама и накрутки часто портят выдачу и обессмысливают сам смысл поиска. "Клюв вытащил - хвост увяз".
Увы, вы продолжаете говорить метафорами и не приводите конкретных примеров :(

У нас есть собственные способы мониторинга спама, и мы за ними, конечно, внимательно следим.

При этом ни одна из известных мне популярных поисковых систем чётких критериев спама не определяет. Поверьте, внутренний контроль за всем, что делают контент менеджеры, - есть, и весь спам, который они вычищают - довольно очевидный и неоспоримый.

В любом случае - спасибо за ваши замечания, мы учтём их при планировании развития Поиска по блогам.
Sunday, February 17th, 2008 08:37 pm (UTC)
Да хрен с ним, с поиском, он всё-таки пока ещё приемлемый, лучше рейтинги уберите.

Или хотя бы доведите до ума: сделайте его критерии неизменными, ясными, публичными и аудируемыми.
Wednesday, February 20th, 2008 06:11 pm (UTC)
А что вы собираетесь делать с рейтингом?

http://plutovstvo007.livejournal.com/526757.html - свежий пример
Sunday, February 24th, 2008 08:16 pm (UTC)
Вот, кстати, ещё вопрос (http://pe3yc.livejournal.com/776314.html).
Sunday, March 2nd, 2008 08:10 pm (UTC)
А зачем сегодня выкинули из топа пост про оргию в музее? Из соображений общественной нравственности?
Sunday, March 2nd, 2008 08:12 pm (UTC)
О, вернули уже, как я вижу.

Эх, хвост-чешуя. Напозоритесь вы ещё с этим рейтингом..
Monday, March 3rd, 2008 12:59 am (UTC)
И не возвращал никто ничего тоже. Рейтинг устроен так, чтобы быстро обновляться. Никакой пост не может долго висеть в топе, если на него не ставят много новых ссылок. И чем дольше он там висит, тем больше новых ссылок должно быть, чтобы он в рейтинге остался на своём месте.
Monday, March 3rd, 2008 07:24 am (UTC)
А вот это всё ваша секретность. Если бы внятно сообщили, какой срок давности, не было бы вопросов.

А так - будете регулярно огребать.
Monday, March 3rd, 2008 12:56 am (UTC)
Никто ничего не выкидывал, она ушла сама из-за давности (оба поста там висели почти два дня). Если на них поставят много новых ссылок - они вернутся.