The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Открыт исходный код поискового движка Gigablast, opennews (??), 03-Авг-13, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


41. "Открыт исходный код поискового движка Gigablast"  +/
Сообщение от DmAemail (??), 04-Авг-13, 17:28 
У гугла кроме поисковой системы есть ещё куча логов(журнальных файов) от действий пользователя( учёт его запросов, содержания писем и сообщений), а результат поиска гугл выдаёт с учётом своей поисковой системы и с учётом анализа журнальных файлов. Так называемый пузырь фильтров. Поэтому если вы хотите, чтобы ваша личная поисковая система удовлетворяла пользователей(выдавала всё что им нужнов первых строчках) нужно начать собирать информацию о пользователе. Тем кто хочет вырваться из пузыря фиьтров в помощь эта статья на хабре "Пузырь фильтров (filter bubble), а также 10 шагов, как вырваться из плена своих интересов" http://habrahabr.ru/post/132191/
Децентрализованная поисковая система YaCy  поможет самому индекировать нужные сайты так часто, насколько того вы хотите.  Можно разрешить использовать свой узел Yacy всем остальным людям на планете и построить таким образом распределённую поисковую систему. Версии Yacy  есть под Windows, Linux, MacOSX, устанавливается за 5 минут сразу можно натравить её на нужные сайты или отсканировать диапазон адресов и загнать в поиск всю подсеть. Гугл  даже в отдалённой перспективе не сможет проиндекировать весь интернет! Yacy в перспективе возможно сможет. Хорошо бы в каждом регионе России иметь по узлу Yacy ищущей по всему региональному интернету! И в какие то сутки проиндекировать весь Интернет!
Gigablast - это опять тысячи серверов в одних руках, скорей всего коммерческих -поэтому опять пузырь фильтров, опять сбор информации о пользователях, опять продажа сведений об интересах рекламным компаниям и спецслужбам.
Молодое поколение выросшее на поисковых системах(Google,Yandex) использующих "пузырь фильтров" уже просто не могут сформулировать правильный запрос для поисковых систем, которые не используют пузырь фильтров.
DuckDuckGo если запомнить несколько ключей для поиска, то можно использовать не хуже гугла. "Лента друзей" в социальных сетях Facebook, Вконтакте (vk.com), odnoklassniki тоже используют пузыри фильтров и видите только то в Интерене, чем сами интересуетесь(новости, результаты поиска, даже рекламу)! Вы сидите в пузыре фильтов как в матрице и чаще всего даже не хотите из этой матрицы вылезать, потому что удобно - вы сообщаете о себе всё этим социальным сетям и поисковым системам, в обмен они на вас зарабатывают деньги через рекламу и ищут только то, что вы хотите найти.
Ответить | Правка | Наверх | Cообщить модератору

45. "Открыт исходный код поискового движка Gigablast"  +/
Сообщение от arisu (ok), 04-Авг-13, 17:43 
у YaCy, к сожалению, очень глючный проксь. тратить время на допилку кода я не готов, я готов помочь, если оно будет нормально (т.е. удовлетворительно для меня) работать. поэтому YaCy-ноду я пока прикрыл. попробую ещё раз через годик.
Ответить | Правка | Наверх | Cообщить модератору

46. "Открыт исходный код поискового движка Gigablast"  +/
Сообщение от DmAemail (??), 04-Авг-13, 19:19 
> у YaCy, к сожалению, очень глючный проксь. тратить время на допилку кода
> я не готов, я готов помочь, если оно будет нормально (т.е.
> удовлетворительно для меня) работать. поэтому YaCy-ноду я пока прикрыл. попробую ещё
> раз через годик.

А какую версию использовали? 1.4 или 1.6? Там есть на админке обновление вручную -показывает какая версия последняя и предлагает скачать, оставив каталог Data. В 1.6 мне показалось меньше неработающих пунктов меню и глюков. Новые Solr и Lucene 4.3

Ответить | Правка | Наверх | Cообщить модератору

47. "Открыт исходный код поискового движка Gigablast"  +/
Сообщение от arisu (ok), 04-Авг-13, 19:39 
> А какую версию использовали? 1.4 или 1.6?

1.4, судя по всему. претензии у меня, собственно, к работе в режиме «использовать яку как прокси-сервер»: иногда оно нереально тупило, периодически намертво зависало (не сама яка, просто проксь принимал запросы и не отвечал), тупило с кукишами и какие-то заголовки портило (уже не помню точно, какие).

поскольку с жабой я дружить не хочу, то разбираться детальней не полез, а отложил «на потом».

Ответить | Правка | Наверх | Cообщить модератору

60. "Открыт исходный код поискового движка Gigablast"  +/
Сообщение от Аноним (-), 07-Авг-13, 17:04 
YaCy уже научился в релевантные результаты поиска?
Ответить | Правка | К родителю #41 | Наверх | Cообщить модератору

61. "Открыт исходный код поискового движка Gigablast"  +/
Сообщение от arisu (ok), 07-Авг-13, 17:12 
> YaCy уже научился в релевантные результаты поиска?

а ты уже поставил у себя паучка, чтобы индекс рос? индекс, знаешь ли, из астрала не прилетит, его делать надо. а ты как думал?

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру