Сегодня сайтом дня объявляется проект WOT (Web of Trust), вне всякого сомнения относящийся к "сайтам, которые должен знать каждый". Сайт WOT накапливает информацию о том, насколько тот или иной сайт заслуживает доверия, а потом отображает эту информацию в браузере при помощи расширений. При помощи WOT можно узнать, насколько стоит верить тому, что заявляет или обещает некий сайт, насколько безопасно на этом сайте что-то покупать, можно ли ему доверять свои личные данные, и стоит ли туда пускать детей. Понятно, что идеальной системы рекомендаций и рейтингов не существует и не может существовать, но для реального мира WOT - это неплохой вариант с вполне простительными погрешностями. Для неопытного пользователя WOT - это намного лучше, чем ничего.
Отдельно проект WOT интересен как полигон для отработки технологий сбора массовых рейтинговых данных. Это куда более сложная проблема, чем может показаться. Дело в том, что ни в одной области не существует однозначно достоверного источника данных для рейтингов и рекомендаций. Таким проектам, как WOT, приходится совмещать неидеальные источники, стараясь компенсировать их слабые места. Методы, применяемые в WOT, интересны прежде всего потому, что данные от WOT действительно похожи на правду, и как минимум обгоняют по достоверности и базы антивирусных компаний, и социальные рекомендательные сайты и сложные аналитические алгоритмы. Пока никто не набрался смелости заявить, что у него есть данные, заметно круче, чем у WOT.
В первую очередь WOT опирается на UGC. Без этого было бы невозможно добиться доверия к самому проекту. Однако WOT не играет в демократию, то есть не сваливает на "народ" ответственность за свои ошибки. Если сайт отмечен зелёным кружочком WOT (то есть признан безопасным), то за эту оценку отвечает WOT, а не "сообщество". На сайте WOT весь "юзер-генерейтед контент" проходит жесточайшую модерацию, причём не живыми субъективными модераторами (при таких объёмах данных это было бы невозможно), а постоянно совершенствуемыми математическими алгоритмами, которые оценивают правдоподобность пользовательских данных, репутацию самих оценщиков, и много чего ещё. Такой подход позволяет победить две основных уязвимости UGC: некомпетентность массового пользователя (субъективность, необразованность, глупость, безответственность, нужное подчеркнуть) и индустрию недобросовестных оценок (накрутки, чёрный пиар и джинса). Кроме того, команда WOT в значительной мере полагается на данные экспертов, таких как Panda Security, PhishTank, TRUSTe и hpHosts. Сами по себе эти данные отличаются нишевостью и неполнотой, но в сочетании с остальной базой позволяют получить прекрасные результаты.
Напоследок хочу напомнить, что WOT - это всего лишь инструмент, значительно снижающий вероятность ошибки, но не исключающий её полностью. Эксперты рекомендуют сочетать WOT с логикой, здравым смыслом, интуицией и опытом.
Знаете ещё хорошие сайты? Пишите на sitesoftheday@ferra.ru.