The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Microsoft открыл код библиотеки векторного поиска, используемой в Bing

17.05.2019 10:18

Компания Microsoft опубликовала исходные тексты библиотеки машинного обучения SPTAG (Space Partition Tree And Graph) с реализацией алгоритма приблизительного поиска ближайшего соседа. Библиотека разработана в исследовательском подразделении Microsoft Research и центре разработки поисковых технологий (Microsoft Search Technology Center). На практике SPTAG применяется в поисковой системе Bing для определения наиболее релевантных результатов с учётом контекста и задания поисковых запросов на естественном языке. Код написан на языке С++ и распространяется под лицензией MIT. Поддерживается сборка для Linux и Windows. Имеется обвязка для языка Python.

Ключевое отличие векторного поиска от поиска по ключевым словам заключается в том, что векторы учитывают смысл и сходство данных, а не только символьные совпадения. Векторы формируются на основе модели машинного обучения, которая учитывает также сопутствующую статистику, уточняющую связи и позволяющую более точно оценить суть запроса (например, учитываются связь запроса с последующими переходами в поисковой выдаче). Несмотря на то, что идеи применения векторных хранилищ в поисковых системах витают уже достаточно давно, на практике их внедрению мешает большая ресурсоёмкость операций с векторами и ограничения в масштабируемости.

Совмещение методов глубинного машинного обучения с алгоритмами приблизительного поиска ближайшего соседа позволило довести производительность и масштабируемость векторных систем до уровня, приемлемого для крупных поисковых систем. Например, в Bing для векторного индекса размером более 150 миллиардов векторов время выборки наиболее релевантных результатов укладывается в 8 мс.

В состав библиотеки включены средства для построения индекса и организации поиска векторов, а также набор инструментов для сопровождения распределённой системы online-поиска, охватывающей очень большие коллекции векторов. Предлагаются следующие модули: index builder для индексации, searcher для поиска с использованием индекса, распределённого в кластере из нескольких узлов, сервер для запуска обработчиков на узлах, Aggregator для объединения нескольких серверов в одно целое и клиент для отправки запросов. Поддерживается включение новых векторов в индекс и удаление векторов на лету.

Библиотека подразумевает, что обрабатываемые и представленные в коллекции данные оформлены в виде связанных векторов, которые можно сравнивать на основе евклидовых (L2) или косинусных расстояний. При поисковом запросе возвращаются векторы, расстояние между которыми и исходным вектором минимально. В SPTAG предоставляется два метода организации векторного пространства: SPTAG-KDT (K-мерное дерево (kd-tree) и граф относительных окрестностей) и SPTAG-BKT (дерево k-средних (k-means tree и граф относительных окрестностей). Первый метод требует меньше ресурсов при работе с индексом, а второй демонстрирует более высокую точность результатов поиска при очень больших коллекциях векторов.

При этом векторный поиск не ограничивается текстом и может применяться к мультимедийной информации и изображениям, а также в системах автоматического формирования рекомендаций. Например, в одном из прототипов на базе фреймворка PyTorch была реализована векторная система для поиска с учётом сходства объектов на изображениях, построенная с использованием данных из нескольких эталонных коллекций с изображениями животных, кошек и собак, которые были преобразованы в наборы векторов. При поступлении входящего изображения для поиска оно преобразуется с использованием модели машинного обучения в вектор, на основе которого при помощи алгоритма SPTAG из индекса выбираются наиболее похожие векторы и как результат возвращаются связанные с ними изображения.

  1. Главная ссылка к новости (https://blogs.microsoft.com/ai...)
  2. OpenNews: Доступна СУБД EuclidesDB, использующая элементы машинного обучения
  3. OpenNews: Facebook открыл код библиотеки классификации текста fastText
  4. OpenNews: Интересные варианты реализации хэшей в Perl
  5. OpenNews: Выпуск spaCy 1.0, библиотеки для обработки информации на естественном языке
  6. OpenNews: Intel открыл систему машинного обучения для обработки информации на естественном языке
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/50698-ai
Ключевые слова: ai, search, text
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (91) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, InuYasha (?), 11:35, 17/05/2019 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    Поскольку M$ трудно обвинить в альтруизме, можно предроложть, что им потребовался аутсорс на поиск ошибок :)
     
     
  • 2.3, Аноним (3), 11:41, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +13 +/
    Можно сразу опередить всех умников и сразу написать EEE.
     
  • 2.19, Аноним (-), 14:12, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Ненужная библиотека ненужного поиска, который ищет хуже, чем Duckduckgo.
     
     
  • 3.40, донни (?), 16:41, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Какой поисковик лучший?
     
     
  • 4.43, fske (?), 17:14, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    По каким критериям?
     
     
  • 5.63, Канделябры (?), 19:43, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Гугл. К сожалению. По любым критериям.
     
     
  • 6.65, Anonymouss (?), 20:11, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Спорно. рускоязычный контент таки яндекс лучше индексирует.
     
     
  • 7.75, Аноним (75), 23:31, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    По хабру и жж гугл норм ищет. А какой ещё бывает полезный русскоязычный контент в сети?
     
     
  • 8.79, Аноним (79), 10:12, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Стыдно такое писать на опеннете... текст свёрнут, показать
     
     
  • 9.86, Аноним (86), 20:46, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Так по опеннету гугл тоже лучше яндекса ищет Какие еще остались варианты полезн... текст свёрнут, показать
     
     
  • 10.99, X86 (ok), 05:24, 21/05/2019 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Только что проверил поиск по фразе Так по опеннету гугл тоже лучше яндекса ище... текст свёрнут, показать
     
  • 8.97, Аноним (97), 21:49, 20/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Русскоязычный контент Глупее выражения трудно придумать ... текст свёрнут, показать
     
  • 4.82, Аноним (82), 14:45, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Никакой )
     
  • 3.62, Канделябры (?), 19:42, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +2 +/
    А что, бывает поиск ещё хуже чем у утки? Но это точно не про Bing.
     
  • 3.64, anon4334 (?), 19:59, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +4 +/
    этот ваш ненужный поиск используется в Duckduckgo "DuckDuckGo's results are a compilation of "over 400" sources,[15] including Yahoo! Search BOSS; Wolfram Alpha; Bing; Yandex; its own Web crawler (the DuckDuckBot); and others.[4][15][16][17] It also uses data from crowdsourced sites, including Wikipedia, to populate knowledge panel boxes to the right of the results.[17]" https://en.wikipedia.org/wiki/DuckDuckGo
     
     
  • 4.84, OpenEcho (?), 15:58, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    я уж забыл когда последний раз видел в логах DuckDuckBot
     
  • 3.93, Аноним (93), 09:22, 19/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    DuckDuckGo ничего не ищет. Он просто проксирует результаты из Bing.
     
     
  • 4.101, xm (ok), 19:29, 22/05/2019 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Умные...
     
  • 2.28, нах (?), 15:37, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Поскольку M$ трудно обвинить в альтруизме, можно предроложть, что им потребовался аутсорс
    > на поиск ошибок :)

    скорее можно предположить что бинг отправится следом за йожом :-(

    видимо, в новом хромойоже поменять дефолтный поисковик индусы не справились

     
     
  • 3.35, Joac (?), 15:49, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    насколько я знаю ддг ище на инглише как правило опираясь на бинг
     
     
  • 4.41, пох (?), 16:42, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    > насколько я знаю ддг ище на инглише как правило опираясь на бинг

    ну будет искать, опираясь на яндекс, по слухам, оттуда давно уже берется большая часть его содержимого.


     
  • 2.60, Аноним (60), 19:09, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Вполне возможно, что просто перешли на что-то новое, существенно лучшее, а это выкинули в качестве дезинформации для тех, кто сам исследованиями не занимается. Удобно же, потенциальные конкуренты сидят на старье и уверены, что у них всё как у М$
     
     
  • 3.73, пох (?), 23:02, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    вообще-то гораздо удобнее, когда потенциальные клиенты покупают ключи для api, а данные хранит гугл...зачеркнуто, MS.
    И никакого кода никому не давать, даже устаревшего.

    Но корпорация - зла.

     

  • 1.2, Аноним (3), 11:40, 17/05/2019 [ответить] [﹢﹢﹢] [ · · · ]  
  • +7 +/
    Потому что нафиг эта либа никому не упёрлась.
     
     
  • 2.68, Ordu (ok), 21:01, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    А мне нравится. Прикольно было бы в засунуть в WorldBrain's Memex[1], чтобы искать по истории с учётом семантики, а не тупо по регекспам.

    [1] https://worldbrain.helprace.com/

     
     
  • 3.76, Аноним (75), 23:33, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Что это за штука и что она делает?
     
     
  • 4.78, Ordu (ok), 02:15, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    > Что это за штука и что она делает?

    Историю браузера индексирует. Не только заголовки и теги, но ещё и содержимое страниц. Позволяет искать по истории всякими интересными запросами, а не так как это по дефолту сделано убого. Короче круть несусветная.

     
  • 4.89, пох (?), 22:29, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    > Что это за штука и что она делает?

    правильный линк - lmgfy:memex...зачеркнуто, https://worldbrain.io/

    ну и как обычно - работает в последнем-распоследнем хроме, хроме, хроме, и еще иногда и с глюками в распоследнем фуфлофоксе из-за любви к нескучным js тулкитам, разумеется, самых распоследних версий. (Попутно сливает массу инфы о юзвере - как обещается, отключаемо. Впрочем, нескучные тулкиты и нагромождение зависимостей не оставляют возможности это действительно проверить.)
    По этой же причине с ms'овской поделкой ее связать не получится, у той нет нескучного npm модуля.

     

  • 1.4, Аноним (4), 11:46, 17/05/2019 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    Гипертекстового?
     
  • 1.6, Попугай Кеша (?), 12:06, 17/05/2019 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Даже не представляю, что должно случиться с человеком, что произойти в жизни, чтобы он в этом стал копаться, разбираться?
     
     
  • 2.7, пох (?), 12:13, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +6 +/
    ну, например, человеку может захотеться нормального поиска по собственным серверам, не сливающего данные дяде и не зависящего от канала в сторону дяди.

    И при этом у него может найтись на это время, вдохновение, и кое-какое образование.

     
     
  • 3.8, Ключевский (?), 12:25, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Такой человек пойдет https://sphinxsearch.com/ сюда и обретет там счастья полные штаны
     
     
  • 4.11, IRASoldier (?), 12:47, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +5 +/
    А еще более такой человек сравнит разные методологии и архитектуры, а значит - пойдёт не только по одной ссылке.
     
  • 4.22, пох (?), 14:23, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +5 +/
    ну я же вроде сказал про образование...
    как минимум позволяющее отличить примитивный индексатор с поиском по побуквенным совпадениям от нечеткого поиска с самообучающимся алгоритмом, умеющим отличить картинку кошки от собаки.

     
     
  • 5.32, Ключевский (?), 15:46, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –5 +/
    > ну я же вроде сказал про образование...
    > как минимум позволяющее отличить примитивный индексатор с поиском по побуквенным совпадениям
    > от нечеткого поиска с самообучающимся алгоритмом, умеющим отличить картинку кошки от
    > собаки.

    Ну и расскажи про примитивный индексатор с поиском по буквам в поиски википедии, а над тобой поржет весь опеннет

     
     
  • 6.36, пох (?), 15:52, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Ну и расскажи про примитивный индексатор с поиском по буквам в поиски
    > википедии, а над тобой поржет весь опеннет

    !
    (это палец, поржи)

    P.S. в викивракии именно примитивный индексатор с поиском по буквам - найти не может ничего и никогда, кроме такого, что проще "искать" прямо в строке url
    Впрочем, я охотно поверю, что альтернативно-одаренные опеннетчики поржут, поскольку никогда им не пользовались, но свято верят в чудо.

    https://vectorsearch.azurewebsites.net/ - для ниасиливших прочитать по английски.
    конечно же, для викивракии это давно пройденый этап, она читает мысли прямо из головы.


     
  • 4.27, sena (ok), 15:22, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Написано "open source" и нет ссылки на исходники. В загрузках предлагают скачать бинарники. Морды своей, я так понял нет, нужно где-то искать?
     
     
  • 5.29, пох (?), 15:44, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Написано "open source" и нет ссылки на исходники.

    у вас очки запотели - меньше др..те на лошадок в интернетах. Возможно, сумеете после этого расслеповать репо на гитхабе.

    > В загрузках предлагают скачать
    > бинарники. Морды своей, я так понял нет, нужно где-то искать?

    это низкоуровневая библиотека векторного поиска. Ее можно использовать в своем индексаторе, ага, когда и если ты его напишешь.

     
     
  • 6.46, sena (ok), 17:37, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    >> Написано "open source" и нет ссылки на исходники.
    > у вас очки запотели - меньше др..те на лошадок в интернетах. Возможно,
    > сумеете после этого расслеповать репо на гитхабе.

    Это что-ли?

    3.0 and up sources are currently only available under a delayed FOSS or commercial licenses for several reasons; going back to regular plain old GPL is planned but timing is moot; so email us if you require the sources immediately.

    >> В загрузках предлагают скачать
    >> бинарники. Морды своей, я так понял нет, нужно где-то искать?
    > это низкоуровневая библиотека векторного поиска. Ее можно использовать в своем индексаторе,
    > ага, когда и если ты его напишешь.

    То есть нет не только морды, но и краулера?

     
     
  • 7.54, Аноним (54), 18:57, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Вы что издеваетесь?
     
     
  • 8.72, пох (?), 22:59, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +1 +/
    это я издеваюсь, а он реально не понимает P S а меж тем там уже пачка issues ... текст свёрнут, показать
     
  • 7.55, пох (?), 18:57, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –2 +/
    > Это что-ли?

    еще меньше др..м на лошадок, и очки промойте - вы их, похоже, забрызгали и оно там присохло, а к нему прилипла газета Красная Звезда, кою вы и читаете.
    Потому что в SPTAG нет никаких версий "3.0"

    > То есть нет не только морды, но и краулера?

    какого в $опу краулера? Оно не про веб вообще.
    Оно про поиск векторов, голая математика.

     
     
  • 8.83, sena (ok), 15:47, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    При чём тут SPTAG Ты хоть почитай о чём ветка обсуждения А то выходит живая ил... текст свёрнут, показать
     
     
  • 9.85, пох (?), 18:48, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    а, так ты о свинксе Я думал, эту тему мы сразу проехали, ненужное ненужно Надо... текст свёрнут, показать
     
  • 3.44, Michael Shigorin (ok), 17:27, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Мне для такого хватало xapian+omega (ну ладно, и ещё немножко рукоприкладства -- жаль только, не выложил никуда).
     
     
  • 4.47, Аноним (47), 17:46, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +2 +/
    В чем проблема выложить? Если просуммировать время на написание всех комментов, где ты сокрушаешься о невыкладывании, -- получится больше, чем время на публикацию своего "рукоприкладства".
     
     
  • 5.59, Michael Shigorin (ok), 19:07, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –2 +/
    > В чем проблема выложить?

    Сделано было лет десять назад, те машины offline уже лет пять, сохранились ли диски или копии -- не знаю.  Сам локти грызу, а переизобретать колёсико пока лень.

     
  • 2.74, forum reader (?), 23:09, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    то же, что заставляет копаться в любом опенсорсе?
     

  • 1.9, Аноним (47), 12:42, 17/05/2019 [ответить] [﹢﹢﹢] [ · · · ]  
  • –2 +/
    > Код написан на языке С++ и распространяется под лицензией MIT.

    Нет ведь написать на чистом Си и распространять под GPLv3+.
    EEE и корпоративные грязные приемы во все поля.
    Спасибо, не нужно.

     
     
  • 2.10, IRASoldier (?), 12:46, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Дарёному коню в лицензию не смотрят.
     
     
  • 3.12, Andrey Mitrofanov (?), 12:54, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > Дарёному коню в лицензию не смотрят.

    А ведь и точно!  Троянскому коню -- сразу на авторстве разворот от ворот.

    "Микрософт открыл", "Интел выпустил", "Оракл пофиксил"...  [I]Охохонюшки, опенетушки...

     
     
  • 4.13, IRASoldier (?), 13:28, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    >Троянскому коню

    Давай, расскажи нам, код какого трояна ты нашёл в этой майкрософтовской библиотеке.

     
     
  • 5.16, Andrey Mitrofanov (?), 13:49, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +2 +/
    >>Троянскому коню
    > Давай, расскажи нам, код какого трояна ты нашёл в этой майкрософтовской библиотеке.

    Ты плохо помнишь сказку про Трою?

    "Нашли"-то как раз те, что открыли ворота и втащили.

    Та-а-а-шта...  ты нам расскажи -- как оно...  "там".

     
     
  • 6.18, IRASoldier (?), 14:06, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Мне вот интересно - ты дурачка строишь или таки взаправду? Повторяю вопрос: какой вредоносный или потенциально вредоносный код ты обнаружил в библиотеке из новости?

     
     
  • 7.20, Аноним (47), 14:14, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Я скачал код - там в некоторых местах обнаружил замаскированный EEE (я знаю C++ если что). Опенсорсному сообществу надо быть на чеку.
     
     
  • 8.25, IRASoldier (?), 14:35, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Ага, не всё так просто, я дочь офицера ... текст свёрнут, показать
     
     
  • 9.45, Аноним (45), 17:31, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Ну ты и спалился, солдат ... текст свёрнут, показать
     
  • 7.21, Andrey Mitrofanov (?), 14:22, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Мне вот интересно - ты дурачка строишь или таки взаправду? Повторяю вопрос:

    Не больше, чем ты.

    > какой вредоносный или потенциально вредоносный код ты обнаружил в библиотеке из
    > новости?

    Повторяю ответ. В заголовке ж.  Новости.  С первого раза не понятно.  Почему.

     
     
  • 8.24, IRASoldier (?), 14:34, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Потому что в заголовке новости ничего не сказано про троянских коней или ещё как... текст свёрнут, показать
     
  • 7.69, виндотролль (ok), 21:14, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Перед началом дискуссии на опеннете рекомендую читать ник собеседника.

    Посмею предположить, что ваш вопрос остался вашим собеседником непонятым, потому что ответ — взаправду.

     

  • 1.14, rioko (?), 13:31, 17/05/2019 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Давайте сразу признаем что ищет BIng так себе )
     
     
  • 2.15, Аноним (15), 13:39, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Зато у него все шаги записаны.
     
  • 2.17, Ключевский (?), 13:55, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Давайте сразу признаем что ищет BIng так себе )

    А он вообще что-то ищет?
    Помнится я как-то пытался им искать, у меня создалось впечатление, что он не ищет что-то в сети, а показывает ссылки на рандомные сайты в надежде угадать :-D

     
     
  • 3.23, пох (?), 14:26, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –2 +/
    > А он вообще что-то ищет?

    секс с конями мне ни разу не находил.

    так что да, ищет, а не подбирает подходящее по истории твоей веб-активности. Видимо, у ms (по крайней мере - моей) нет.

    P.S. а еще у него картинки

     
     
  • 4.34, Ключевский (?), 15:48, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    >> А он вообще что-то ищет?
    > секс с конями мне ни разу не находил.
    > так что да, ищет, а не подбирает подходящее по истории твоей веб-активности.
    > Видимо, у ms (по крайней мере - моей) нет.
    > P.S. а еще у него картинки

    Ну секс с конями я не пробовал искать ни там, ни в гугле, ни альтависте. Как-то мне не нужно.
    А вот когда пробовал искать по делу он искал ну чуть лучше покойного спутника.

    А поиск по картинкам очень качественный есть у гугла и яндекса, узнай же это.

     
     
  • 5.38, пох (?), 16:05, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Ну секс с конями я не пробовал искать ни там, ни в
    > гугле, ни альтависте. Как-то мне не нужно.

    а я вот пробовал - регулярно и старательно. И теперь даже если набираю "алгоритмы векторного поиска" - в пару кликов вылезают лошадки (что и было целью, если еще не дошло). Что как бы говорит нам о том, как именно работает "поиск" гугля последние десять лет. До 2008го - да, было лучше.

    Разумеется, я могу его обмануть, но в этих случаях релевантность поиска сравнима нынче уже с duck-duck - зачем улучшать алгоритмы поиска, когда можно вместо этого улучшать алгоритмы слежки?

    > А поиск по картинкам очень качественный есть у гугла и яндекса, узнай

    я рад за гугля с яндексом, но вам же сказали - эта либа - для тех кто сам себе хочет быть гугляндексом (и готов на это потратиться, поскольку там нет готового). А вы притащили корявого свинкса, который только сегфолтиться хорошо умеет.

    Кстати, возможно, яндексу и пригодится - его "очень качественный" лажает на элементарных вещах (сунул ему первую попавшуюся фотку с дачи, чисто поржать - нет, за последние годы лучше не стало. У гугля стало. Кстати, ЭТОТ поиск результаты слежки, видимо, не использует, про дачу гугль знает.)
    хотя скорее всего лажает от того что обучать ленятся, а не от того что алгоритм плох.

     
     
  • 6.42, Sw00p aka Jerom (?), 17:08, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –1 +/
    не вижу описание алгоритмической сложности сего поделия, ткните, ну или бенчмарки какие-нить
     
     
  • 7.52, пох (?), 18:47, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    э... бенчмарки - чего? говорят тебе - это библиотека. Ты ей вектор, она тебе - "похожий".
    Можно было бы сравнивать с другими библиотеками векторного поиска, на одном и том же массиве данных, если бы они у тебя были.

     
     
  • 8.53, Sw00p aka Jerom (?), 18:54, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    В состав библиотеки включены средства для построения индекса и организации п... текст свёрнут, показать
     
     
  • 9.57, пох (?), 19:02, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    ну У тебя есть какая-то более другая библиотека для поиска векторов и набор эти... текст свёрнут, показать
     
     
  • 10.61, Sw00p aka Jerom (?), 19:23, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    а почему нет алгоритмы известны И в случае с МС, ничего нового тут нету а зач... текст свёрнут, показать
     
     
  • 11.71, пох (?), 22:56, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    откуда ж я знаю, почему у тебя ее нет У MS вот, оказываетсо, есть Ничего новог... текст свёрнут, показать
     
     
  • 12.77, Sw00p aka Jerom (?), 00:16, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    https en wikipedia org wiki K-d_tree раздел Open source implementations, есть ... текст свёрнут, показать
     
     
  • 13.90, пох (?), 22:32, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    видимо, так написали, что пользы никому от них никакой А из этой ms умудрилась ... текст свёрнут, показать
     
  • 2.49, Аноним (49), 17:47, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Потому и библиотека халявная.
     
  • 2.56, Аноним (54), 19:01, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    А вы у у гугла без истории поиска поищите результат примерно тот же будет что и у бинг. Вот до чего терпеть не могу m$, но поиск в целом нормальный.
     
     
  • 3.58, пох (?), 19:04, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    тут, конечно, еще вопрос, история чего есть у bing.
    С учетом search suggestions и не только.

    (нет, не предлагайте мне кормить его конями и понями, это надо несколько лет к ряду делать, чтобы результат увидеть, у меня давным-давно нет столько времени)


     

  • 1.67, Аноним (67), 20:41, 17/05/2019 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    обвязка есть, а надстройку сделать забыли?
     
     
  • 2.70, пох (?), 22:54, 17/05/2019 [^] [^^] [^^^] [ответить]  
  • –1 +/
    не забыли, bing называетсо.
    Исходники зажали, это да. Ну чо ты хошь, корпорация - зла!

    (я сегодня читал про особенности администрежа windows core через, блжад - ssh - плакал. Такое и впрямь только от большого зла можно наколбасить. И кто тут нынче пуссиэкзешники?)

     

  • 1.80, Аноним (-), 13:31, 18/05/2019 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    От Майкрософт нам ничего не нужно.
     
     
  • 2.88, alexschka (?), 21:11, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • –1 +/
    У них денег много, стимулируют почёсывая гениталии того кто при делах и устроят как им нужно... А многочисленные проплаченные хомячки дружно одобрят "не сектантсквое" начинание, а адепты млкомягкой кроссплатформенности начнут выть как это прекрасно и всем пингвино юзающим полезно!
     
  • 2.91, пох (?), 22:33, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • –3 +/
    > От Майкрософт нам ничего не нужно.

    вы - ненужно.

     
  • 2.102, Аноним (102), 11:32, 23/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    тема хоть и нишевая но очень острая. Приблизительное сравнение множеств с неограниченным числом вариантов за фиксированное время из области не решаемого.
     

  • 1.81, ALex_hha (ok), 14:24, 18/05/2019 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А что, кто-то пользуется бингом для поиска? о_О
     
     
  • 2.87, alexschka (?), 21:01, 18/05/2019 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Дарёному ослику под хвост не заглядывают?
     
  • 2.92, MSDOS 6.22 (?), 07:36, 19/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Да, я пользуюсь Бингом.
    Его игнорируют SEO оптимизаторы, поэтому он ищет лучше Гугла.
     
     
  • 3.94, KonstantinB (ok), 16:17, 20/05/2019 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Хреново он ищет. Точнее, неверно расставляет приоритеты.
    Гугл первым ставит официальные мануалы, бинг же - не всегда, но часто - всякие stackoverflow.
     
     
  • 4.95, MSDOS 6.22 (?), 20:52, 20/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Где лежат официальные мануалы и так известно без Гугла.
    А редкие специфические вещи Бинг находит лучше Гугла и Яндекса.
     
     
  • 5.96, KonstantinB (ok), 21:48, 20/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Ну и что, что известно? Написать в поисковой строке браузера что-то вроде "javascript reduce" и сходить по первой ссылке все равно быстрее.

    Редкие специфичные - хм, это какие? Где-то слышал, что Bing порнуху ищет лучше :-)

     
     
  • 6.98, MSDOS 6.22 (?), 22:23, 20/05/2019 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Про порнуху не в курсе, но как то раз захотелось перечитать одну статью по специфической эзотерической практике. Оказалось, что сайт исчез в месте со статьей и на archive.org ее нет.
    Должна же быть где-то копия на просторах инета?
    Гугл меня упорно держал в поисковом пузыре. Искуственный интеллект предлагал, что по его мнению ищут обычные люди по подобным словам. По ссылкам все, что угодно, кроме копии статьи.
    Яндекс тоже не смог ничего найти.
    А Бинг нашел сразу на первой странице выдачи и копии статьи и обсуждения статьи на форумах.
    После этого случая я Бинг зауважал.
     
     
  • 7.100, Аноним (100), 11:12, 21/05/2019 [^] [^^] [^^^] [ответить]  
  • +/
    Порнуху тоже. В целом это удивительно, но он зачастую успешней других находит релевантные _нужные_ результаты. А из гугла просто всё удаляют, там ничего не ищется, как ни начнёшь искать что-то конкрентное.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру