Полiт.ua Государственная сеть Государственные люди Войти
28 мая 2018, понедельник, 12:51
Facebook Twitter VK.com Telegram

НОВОСТИ

СТАТЬИ

АВТОРЫ

ЛЕКЦИИ

PRO SCIENCE

СКОЛКОВО

РЕГИОНЫ

09 августа 2010, 09:30

Шмуглы

 

Альтернативные поисковики

Нынешний поисковый гигант Google неуклонно рос с момента рождения (1998 г.), но теперь заговорили о том, что его доля стала сокращаться под напором конкурентов, которые тоже осваивают новые технологии и методы и набирают популярность. Недавно на сайте CNN Money опубликовали статью с подробным анализом того, кто и на каком основании конкурирует с Google и какие у этого могут быть последствия (пересказ статьи по-русски можно найти здесь). В числе его конкурентов, в частности, называют Apple с его операционной системой (iOS), гораздо более популярный, чем ее аналог Android, который теперь принадлежит Google; растущие социальные сети (прежде всего FaceBook) как более надежный и эксклюзивный источник информации; поисковики YahooBaidu и Microsoft Bing [1], которые по эффективности поиска уже мало уступают Google (а в России, скажем, Google заметно отстает от Яндекса).

Но помимо Google и его мейнстримных конкурентов, в сети есть масса так называемых «альтернативных» поисковиков, число которых неизменно растет. Среди них есть и коммерческие, и любительские, и исследовательские проекты. Каждый поисковик обычно специализируется на разработке какого-то определенного принципа.

«Нишевые» поисковики

По-английски их называют “niche search engines”, и это, пожалуй, самый распространенный тип поисковиков. Их задача в том, чтобы отбирать ссылки определенной тематики – например, только картинки (например, Picsearch), аудио (Poiskm) или видеозаписи (Blinx). Поиск текстовый: в строку вводятся ключевые слова, и система выдает подборку более или менее релевантных ответов. Специализаций существует множество: Technorati.com ищет по англоязычным блогам; FilesTube и DownloadAnyStuff ищут всё, что можно скачать; Scirus ищет размещенные в Интернете материалы научной тематики; Интернет-архив, появившийся в 1996 г., использует сервис WayBack, позволяющий смотреть, как выглядела та или иная страница в прошлом, даже если этой страницы больше нет.

Бывают совсем экзотические поисковики. Например, FindSounds специализируется на звуках (храп, коровье мычание, скрип двери и многое другое); ищет по английским, французским, немецким и испанским ключевикам. Наконец, встречаются устройства, которые показывают, какие из ближайших магазинов сейчас открыты, ищут цитаты и крылатые выражения и рецепты разных блюд.

Классифицирующие поисковики

Кластеризующие поисковые системы стали появляться с середины 2000-х гг. Это поисковики, которые выдают результаты, группируя их по темам. В 2005 г. в России появилась такая система – Nigma.ru. В ответ на запрос (например, «Полiт.UA») она выдает список тематических групп (в случае с Полiт.UA – «полiт», «политика», «публичные лекции», «Полит.ру», «Украина» и т.д.). Если выбрать одну из групп, откроется ряд подгрупп, которые тоже можно выбирать, уточняя таким образом подборку ссылок в соответствии с поисковым запросом. При этом она ищет как по собственной базе, так и с помощью крупных поисковиков. Немного раньше появился аналогичный американский поисковик Clusty, который потом переименовали в Yippy. В свое время о нем писали как о серьезном конкуренте Google (на том основании, что ранжирование страниц, благодаря которому Google стал поисковым гигантом, позволяет только отсеивать заведомо неинформативные рекламные сайты, а кластеризация подразумевает интеллектуальную обработку материала и тематический подбор). В 2006 г. появилась еще одна российская кластеризирующая система Quintura.

Мультимедийные поисковики

Год назад Google провел исследование, чтобы выяснить, чего хотят пользователи от современных поисковиков. Как и следовало ожидать, основная масса пожеланий свелась к тому, чтобы система читала мысли пользователя (а также понимала человеческую речь «на слух», угадывала настроение, говорила человеческим языком, оберегала детей от зла и т.п.). Так как технических средств, чтобы добиться всего этого сразу, не хватает, разработчики идут разными путями.

3D

Одно из направлений напрямую связано с расширением мультимедийных возможностей у современных компьютеров. С одной стороны, в сети становится всё больше аудио и видеофайлов, с другой стороны, у нынешних компьютеров появляются такие параметры, которые позволяют загружать тяжеловесные страницы с анимацией и 3D. В связи с этим, например, стали развиваться так называемые 3D поисковики, которые, правда, пока остаются в основном громоздкими системами с претензией на развлекательность. Таков, например, запущенный в 2008 г. проект ExitReality. ExitReality – это браузерный плагин, показывающий любой вебсайт в формате 3D, иными словами в виде помещения, по которому можно перемещаться в качестве аватара или без него, щелкать по ссылкам, просматривать видео (отображаются в виде изображения на теле/киноэкране) или картинки (размещенные на стенах). В качестве поисковика ExitReality специализируется на поиске 3D-контента: например, если там набрать «Paris» (по-русски система не понимает и кириллицу не распознает), то выпадут ссылки на 3D-симуляторы окрестностей Триумфальной арки, по которым опять же можно ходить в виде аватара. Зачем это нужно, не вполне ясно, из-за обилия расчетов страшно тормозят даже вполне быстрые компьютеры, и пользовательских симпатий система не завоевала. Те, кому нужен обширный 3D-чат с Триумфальной аркой и Красной площадью, видимо, обитают в сети Second Life, принцип которой проект ExitReality пытался применить к работе в Интернете.

Тем не менее, элементы 3D в оформлении поисковиков продолжают использовать. Такие системы становятся известными, прежде всего, благодаря своему внешнему виду и формату, в котором они выдают данные. Space Time 3D представляет собой скорее интерфейс поисковика. Результаты берутся из крупнейших поисковых систем (запросы можно делать только латиницей) и оформляются в виде скриншотов вебстраниц в разной степени удаленности от пользователя. Классификации страниц нет, релевантность весьма относительная, скорость очень низкая. Единственное достижение системы — необычный внешний вид и, действительно, своего рода 3D.

Еще один пример — поисковик изображений и видео (на основе результатов Google) SearchCube. Он выдает результаты в виде картинок, налепленных на грани куба, который можно вращать во все стороны и выбирать понравившиеся. Работает тоже довольно медленно и носит, по-видимому, развлекательный характер.

Нетекстовый поиск

Эти поисковики совершенно иного рода. Их разработчики пытаются создать систему, которая бы искала не по словам. У текстового поиска, при несомненных достоинствах, есть серьезные ограничения. Например, если нужно определить музыкальное произведение по мелодии (а иногда других данных нет), текстовый поиск не поможет. Обычно в таких случаях приходится обращаться к сообществу социальных сетей, что тоже не всегда эффективно. В качестве промежуточного варианта создаются специальные сообщества, где можно напеть/наиграть/загрузить мелодию, чтобы другие члены сообщества попытались определить, что это. В этом смысле наиболее прогрессивное решение предложил проект Musipedia (музыкальная энциклопедия, созданная по образцу Википедии). Этот поисковик позволяет вводить запрос в нескольких форматах — записать музыкальный фрагмент нотами, наиграть на флеш-пианино, напеть, выбить на клавиатуре ритм. Всё это можно сопровождать текстовыми дополнениями. Musipedia в основном использует собственную базу данных, пополняемую пользователями, а также ищет MIDI-файлы по сети. Эффективность поиска относительна. Musipedia хорошо, хотя и неидеально, находит академическую музыку, но пока доступные ей базы далеки от всеохватности.

Поисковики изображений ставят перед собой аналогичные задачи. Помимо текстового поиска, они предлагают пользователю загружать картинки со своего компьютера и ищут подобные им; предполагается, что таким образом удастся определить, что изображено на картинке. Поиск осуществляется примерно так же, как в случае с текстом. В тексте выделяются ключевые слова, в изображении — ключевые элементы (например, композиция, форма, цвет). В качестве примера можно привести такие системы, как TinEye.com, Sapir (довольно слабый поисковик, разработанный IBM) или отечественный Piccolator. Наконец, некоторые разработчики уделяют особое внимание поиску по загруженным видеофрагментам. Здесь дело осложняется тем, что нужно в сжатые сроки обрабатывать файлы очень большого размера. Таких поисковиков пока нет, зато есть несколько проектов. В 2009 г. в Интернете промелькнуло несколько статей о запуске инновационного проекта DIVAS, использовавшего метод идентификации видео по параметрам, которые называли «цифровыми отпечатками пальцев» (digital fingerprints). Но страницы с бета-версией уже не существует, а о проекте больше не говорят. Этот проект разрабатывался в рамках программы Европейской комиссии CORDIS, которая занимается IT-проектами. На сайте комиссии можно найти целый список проектов, развивающих технологии мультимедийного поиска.

Человеческий язык

Как показали данные опроса Google, потребность в голосовом общении с поисковиками у пользователей есть. В сети пока практически нет поисковых систем, которые бы отзывались на человеческий голос. В принципе, такую возможность предполагает экспериментальный поисковик Voccal, но чтобы вступить с ним в устное взаимодействие (по-английски), нужно сначала договориться с операционной системой на своем компьютере и настроить в ней расшифровку речи, если это предусмотрено. Более серьезные шаги в этом направлении предпринимает Google, который открыл бета-версию сервиса GOOG-411, позволяющий американским пользователям связаться с поисковой системой с помощью мобильного телефона.

Но распознавания речи и реагирования на ключевые слова еще недостаточно: в идеале система должна разговаривать с пользователем, задавать ему уточняющие вопросы, понимать, в каком смысле он употребляет слова. Этим занимаются разработчики многочисленных «интеллектуальных» поисковиков, ставящие себе задачей обучить машину так, чтобы она учитывала человеческий фактор.

Среди таких разработок выделяется целая категория систем, специализирующихся на разговоре с пользователем (по-английски это называется natural language search engines). Одной из первых попыток стала система Ask.com (есть русскоязычный вариант, но возможностей у него гораздо меньше), которая, с одной стороны, может искать по ключевым словам (с тематической группировкой результатов), а с другой стороны, умеет отвечать на обычные вопросы (например, «Который час?» - здесь она попросит уточнить, где пользователь находится).

Поисковик Lexxe.com тоже отзывается на некоторые вопросы. Если его о чем-нибудь спросить, он сначала выдаст собственный ответ (да/нет/краткую информационную справку), а ниже покажет результаты поиска. Некоторые ответы, правда, иногда далеки от истины. Например, на вопрос «Do you speak Russian?» система отвечает “Yes”, но на русскоязычные запросы, тем не менее, не реагирует.

Забавный поисковик START, созданный в Массачусетском технологическом университете, скорее похож на виртуального бота-собеседника, но заточен именно под информационные запросы. При этом его задача — ответить на вопрос, а не дать максимальную подборку релевантных ссылок. Поэтому ответом, скорее всего, будет выжимка из какой-нибудь (англоязычной) статьи в Википедии со ссылкой на источник.

Поисковик Powerset, использующий алгоритм семантического поиска и заточенный под Википедию (по-русски не ищет), реагирует на вопросы и при этом, исходя из запроса, предоставляет обширный инструментарий и навигационные приспособления для извлечения информации из Википедии.

Любопытный эксперимент представляет собой созданный, видимо, забавы ради англоязычный поисковик Omnipelagos.com. Эта система устанавливает связи между двумя понятиями (например, между вороном и письменным столом — правда, довольно условно).

Совсем недавно, в 2010 г., запустили поисковик Yebol. Наряду с поисковиками Hakia и Powerset, эта система использует алгоритм семантического поиска, который подразумевает интерпретацию запроса и призван решать гораздо более сложные задачи, чем те, с которыми работает, скажем, Google (система, в основе которой лежит поиск по ключевым словам и ранжирование страниц). У Yebol удобный интерфейс — он сразу распределяет результаты по различным категориям (с учетом «Твиттера», новостных лент, форумных обсуждений и пр.), — и в ответ на простые запросы он выдает вполне полезные ресурсы. С другой стороны, пока нельзя сказать, чтобы результаты его поиска значительно отличались от результатов Google, хотя иногда ему быстро добираться до не самых очевидных, но полезных ресурсов. Впрочем, вероятно, пользователям, со своей стороны, нужно учиться по-новому формулировать задачи по мере развития поисковых возможностей.

[1] Один сотрудник Microsoft – по его утверждению совершенно бескорыстно, для развлечения, - сделал сайт BlindSearch, который обрабатывает запрос в трех поисковиках (Bing, Google и Yahoo) одновременно. Результаты выдаются в трех колонках, причем какая колонка какому поисковику принадлежит – не видно. Пользователь должен проголосовать за колонку с лучшими, на его взгляд, результатами, и только тогда выяснится, какой это был поисковик.

Обсудите в соцсетях

Система Orphus
Loading...

Главные новости

12:50 В Госдуме оценили планы Польши по размещению базы США
12:36 Врачи разрешили отправить главу кузбасского МЧС в СИЗО
12:29 Спасший ребенка малиец получит французское гражданство
12:24 Глава Якутии сообщил об отставке
12:21 ЕС предупредил Венесуэлу о новых санкциях
12:13 Канцлер Австрии назвал США «ненадежным партнером» для Европы
12:09 «Русал» раскрыл список кандидатов в новый совет директоров
11:51 Российские вузы не вошли в топ-100 всемирного рейтинга университетов
11:35 Цена нефти марки Brent снизилась до 75,2 доллара за баррель
11:30 Основатель Amazon назвал колонизацию Луны шансом на выживание
11:27 В России начался основной период сдачи ЕГЭ
11:14 «Мегафон» первым из операторов решил запустить 5G
11:05 Минздрав предложил ежегодно повышать акцизы на алкоголь и сигареты на 10-20%
10:59 Кадыров поручил провести ДНК-тест среди жителей Чечни
10:49 Cтраховщик сотрудников МВД лишился лицензии
10:43 В Кузбассе назначен омбудсмен по трагедии в ТРЦ «Зимняя вишня»
10:39 ФСБ пригрозила посадкой арестовавшим «Норд» украинским пограничникам
10:20 Президенту Италии пригрозили импичментом
10:13 Российское рыболовное судно протаранило моторную лодку в Японском море
10:06 Правозащитники обжаловали в ЕСПЧ ограничение митингов во время ЧМ-2018
10:05 Пациенты с протезами рук получат новую платформу для реабилитации
09:59 В атаке на российских военных могли участвовать бойцы Свободной сирийской армии
09:52 В саммите Трампа и Ким Чен Ына примет участие президент Южной Кореи
09:39 En+ предложила поднять тарифы для населения
09:31 Для выполнения майского указа Путина НДС могут повысить до 20%
08:50 СМИ узнали о переезде Бориса Минца с семьей в Лондон
08:40 Польша предложила два миллиарда долларов за базу США
08:21 Экс-президент США Джордж Буш-старший госпитализирован
08:06 В Кремле одобрено переизбрание глав четырех регионов
27.05 21:09 Китай заявил о вторжении кораблей ВМС США на свою территорию
27.05 20:50 ФСБ задержала следователя СКР за вымогательство
27.05 20:28 Джонни Депп побывал в мавзолее Ленина
27.05 20:11 Футболист ЦСКА выплатил долги 40 заключенных в Нигерии
27.05 19:50 Названа пятерка претендентов на «Золотого Букера»
27.05 19:30 Священник Грозовский этапирован в мурманскую колонию
27.05 19:02 В Казани и Набережных Челнах эвакуировали вокзалы
27.05 18:43 Израиль начал строить морской барьер для изоляции сектора Газа
27.05 18:23 Делегация США прибыла в КНДР для подготовки саммита
27.05 16:55 В Рязанской области разбился легкомоторный самолет
27.05 16:41 Пьяный челябинец поджог венок у монумента «Защитникам Отечества»
27.05 16:24 Журналисты узнали о планах Лондона задержаться в ЕС
27.05 15:52 В Берлине прошли многотысячные демонстрации националистов и их противников
27.05 15:24 Во время боя в Сирии помимо российских военных погибли двое «вагнеровцев»
27.05 15:05 В Хабаровском крае сгорел склад древесины площадью 10 соток
27.05 14:26 Премию «Национальный бестселлер» получил роман о гриппе
27.05 14:09 В Ростовской области мать с двумя детьми попала под товарный поезд
27.05 13:51 Роналду допустил уход из мадридского «Реала»
27.05 13:33 В аэропорту Лондона произошел сбой из-за удара молнии
27.05 13:19 Волонтер нашел потерявшихся в лесу на Кубани подростков
27.05 12:51 Летевший в Турцию самолет экстренно сел в Казани из-за упавшей в обморок пассажирки
Apple Bitcoin Boeing Facebook Google iPhone IT NATO PRO SCIENCE видео ProScience Театр Pussy Riot Twitter Абхазия аварии на железной дороге авиакатастрофа Австралия Австрия автопром администрация президента Азербайджан акции протеста Александр Лукашенко Александр Турчинов Алексей Кудрин Алексей Навальный Алексей Улюкаев алкоголь амнистия Анатолий Сердюков Ангела Меркель Антимайдан Антон Силуанов Аргентина Аркадий Дворкович Арктика Армения армия Арсений Яценюк археология астрономия атомная энергия аукционы Афганистан Аэрофлот баллистические ракеты банковский сектор банкротство Барак Обама Басманный суд Башар Асад Башкирия беженцы Белоруссия Белый дом Бельгия беспилотник беспорядки биатлон бизнес биология бокс болельщики «болотное дело» большой теннис Борис Немцов борьба с курением Бразилия Валентина Матвиенко вандализм Ватикан ВВП Великая Отечественная война Великобритания Венесуэла Верховная Рада Верховный суд взрыв взятка видеозаписи публичных лекций «Полит.ру» визовый режим Виктор Янукович вирусы Виталий Мутко «ВКонтакте» ВКС Владивосток Владимир Жириновский Владимир Маркин Владимир Мединский Владимир Путин ВМФ Внуково военная авиация Волгоград ВТБ Вторая мировая война вузы ВЦИОМ выборы выборы губернаторов выборы мэра Москвы Вячеслав Володин гаджеты газовая промышленность «Газпром» генетика Генпрокуратура Германия ГИБДД ГЛОНАСС Голливуд гомосексуализм госбюджет Госдеп Госдума госзакупки гражданская авиация Греция Гринпис Грузия гуманитарная помощь Дагестан Дальний Восток декларации чиновников деньги День Победы дети Дмитрий Медведев Дмитрий Песков Дмитрий Рогозин доллар Домодедово Дональд Трамп Донецк допинг дороги России драка ДТП Евгения Васильева евро Евровидение Еврокомиссия Евромайдан Евросоюз Египет ЕГЭ «Единая Россия» Екатеринбург ЕСПЧ естественные и точные науки ЖКХ журналисты Забайкальский край закон об «иностранных агентах» законотворчество здравоохранение в России землетрясение «Зенит» Израиль инвестиции Ингушетия Индия Индонезия инновации Интервью ученых интернет инфляция ипотека Ирак Ирак после войны Иран Иркутская область искусство ислам «Исламское государство» Испания история История человечества Италия Йемен Казань Казахстан казнь Калининград Камчатка Канада Кемерово Киев Ким Чен Ын кино Киргизия Китай климат Земли КНДР Книга. Знание Компьютеры, программное обеспечение Конституционный суд Конституция кораблекрушение коррупция Космодром Байконур космодром Восточный космос КПРФ кража Краснодарский край Красноярский край кредиты Кремль крушение вертолета Крым Ксения Собчак Куба культура Латвия ЛГБТ ЛДПР Левада-Центр легкая атлетика Ленинградская область лесные пожары Ливия лингвистика Литва литература Лондон Луганск Малайзия Мария Захарова МВД МВФ медиа медицина междисциплинарные исследования Мексика Мемория метро мигранты МИД России Минздрав Минкомсвязи Минкульт Минобороны Минобрнауки Минпромторг Минсельхоз Минтранспорта Минтруд Минфин Минэкономразвития Минэнерго Минюст «Мистраль» Михаил Саакашвили Михаил Ходорковский МКС мобильные приложения МОК Молдавия монархия Мосгорсуд Москва Московская область мошенничество музыка Мурманская область МЧС наводнение Надежда Савченко налоги нанотехнологии наркотики НАСА наука «Нафтогаз Украины» недвижимость некоммерческие организации некролог нефть Нигерия Нидерланды Нобелевская премия Новосибирск Новые технологии, инновации Новый год Норвегия Нью-Йорк «Оборонсервис» образование обрушение ОБСЕ общественный транспорт общество ограбление Одесса Олимпийские игры Ольга Голодец ООН ОПЕК оппозиция опросы оружие отставки-назначения офшор Павел Дуров Пакистан палеонтология Палестинская автономия Папа Римский Париж ПДД педофилия пенсионная реформа Пентагон Петр Порошенко пищевая промышленность погранвойска пожар полиция Польша похищение Почта России права человека правительство Право правозащитное движение православие «Правый сектор» преступления полицейских преступность Приморский край Продовольствие происшествия публичные лекции Рамзан Кадыров РАН Революция в Киргизии Реджеп Эрдоган рейтинги реклама религия Республика Карелия Реформа армии РЖД ритейл Росавиация Роскомнадзор Роскосмос «Роснефть» Роспотребнадзор Россельхознадзор Российская академия наук Россия Ростов-на-Дону Ростовская область РПЦ рубль русские националисты РФС Санкт-Петербург санкции Саудовская Аравия Сахалин Сбербанк Свердловская область связь связь и телекоммуникации Севастополь сельское хозяйство сепаратизм Сербия Сергей Лавров Сергей Нарышкин Сергей Полонский Сергей Собянин Сергей Шойгу Сирия Сколково Славянск Следственный комитет следствие смартфоны СМИ Совбез ООН Совет по правам человека Совет Федерации сотовая связь социальные сети социология Сочи Сочи 2014 «Спартак» спецслужбы «Справедливая Россия» спутники СССР Ставропольский край стихийные бедствия Стихотворения на случай страхование стрельба строительство суды суицид Счетная палата США Таджикистан Таиланд тарифы Татарстан театр телевидение телефонный терроризм теракт терроризм технологии Трансаэро транспорт туризм Турция тюрьмы и колонии убийство уголовный кодекс УЕФА Узбекистан Украина фармакология ФАС ФБР Федеральная миграционная служба физика Филиппины Финляндия ФИФА фондовая биржа фоторепортаж Франсуа Олланд Франция ФСБ ФСИН ФСКН футбол Хабаровский край хакеры Харьков Хиллари Клинтон химическое оружие химия хоккей хулиганство цензура Центробанк ЦИК ЦРУ ЦСКА Челябинская область Чехия Чечня ЧМ-2018 Швейцария Швеция школа шоу-бизнес шпионаж Эбола эволюция Эдвард Сноуден экология экономика экономический кризис экстремизм Эстония этология Южная Корея ЮКОС Юлия Тимошенко ядерное оружие Якутия Яндекс Япония

Редакция

Электронная почта: politru.edit1@gmail.com
Адрес: 129090, г. Москва, Проспект Мира, дом 19, стр.1, пом.1, ком.5
Телефон: +7 495 980 1894.
Яндекс.Метрика
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003г. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2014.