19 мая 2006 г.

Мой Office открыт для всех

Переход с Windows XP на Linux остался мною почти незамеченным. Примерно за год до этого события я заменила весь коммерческий софт на бесплатные open source аналоги, которые почти все оказались кросс-платформенными. А начинала я с тотальной деинсталляции MS Office. Его функции на моей машине взялся выполнять Open Office.

Первая версия Open Office заметно уступала майкрософтоским продуктам, хотя и тех скромных возможностей хватало, если использовать их с умом, а не пытаться внедрить в тело текстового документа автокадовский чертеж (такое тоже бывает). OO 2.0 оказаллся на два порядка лучше своего предшественника и гораздо приятнее MS. Проблем с совместимостью за год работы у меня не возникло ни разу, хотя заказчики подкидывали в качестве исходных материалов всякое — и doc с галереей картинок, и xls со сложной системой макросов, и презентации в PowerPoint вместо отчета, сведенного в простую таблицу.

В комплекте с Ubuntu идет Open Office 2.0, при чем уже с проверкой русского языка, так что мне даже не пришлось скачивать дополнительные словари. Переустановка системы у меня выпала на горячую пору, когда дэдлайны чередовались один за другим. Я не потеряла ни дня — пакет офисных программ, уже знакомый мне до мелочей, встал и заработал, как будто ничего не произошло.

А не так давно знакомые стали дружно жаловаться, что соответствующие отделы милиции наносят визиты, недобро любопыствуют и неслабо штрафуют за использование громоздкого, напичканного ненужными функциями и жутко дорогого M$ Office. Я, хоть и сочувствую жертвам копирайта, но не понимаю, зачем себя подставлять? Ведь любой и каждый может установить у себя совершенно бесплатный Открытый Офис. Вот хоть прямо сейчас, щелкнув по этой кнопке:

 Use OpenOffice.org

Кстати, желающие могут поддержать проект, разместив у себя на сайте кнопку — такую же или помельче.

13 мая 2006 г.

Поиск блогов и в блогах

Периодически у меня возникает необходимость искать информацию в блогах. Обычно, я обращаюсь к блогам для того, чтобы узнать 1) что пользователи говорят о каком-то предмете 2) какие новости происходят в той или иной области. В первом случае задача сводится к тому, чтобы найти в разных блогах как можно больше записей по интересующей меня теме, а во втором — к тому, чтобы найти несколько специализированных блогов, подписаться на их фиды и регулярно читать новые публикации (хвала всемогущей технологии RSS!)

Поисковые гиганты давно осознали специфичность блогосферы и разработали сервисы, осуществляющие поиск по блогам и новостным сайтам. Cреди пользователей, говорящих на русском языке, наибольшей популярностью пользуются сервисы Яndex. Поиск по блогам и Google Blog Search. Хотя они созданы для решения одной и той же задачи — искать информацию в блогах — принципы и результаты их работы существенно различаются.

Яndex. Поиск по блогам

Как и весь Яndex, сервис поиска по блогам ориентирован, в первую очередь, на русскоязычный контент, поэтому огромное место в этой службе отводится ЖЖ. Любовь моих соотечественников к платформе LiveJournal видна с первой страницы яндексовского сервиса: в Top10 самых популярных блоггеров восемь — это публицисты ЖЖ: Сергей Лукьяненко, Антон Носик, Алекс Экслер и другие известные в Рунете личности. Для тех, кто только начинает осваиваться в блогосфере, этот список может стать своеобразным справочником “кто есть кто” и источником новых фидов (если, конечно, вы доверяете мнению большинства и хотите быть в курсе светских новостей).

Определенную ценность для маркетологов, оптимизаторов, социологов и всех, кому любопытно узнать, чем живет среднестатистический пользователь Рунета, представляет срез общественного мнения, публикуемый на главной странице Поиска по блогам представляет . В момент, когда я создавала эту запись, в коллективном разуме доминировали мысли о вечном и прекрасном. Самыми популярными темами оказались: фото, картинки, жизнь, музыка, юмор, стихи:

Влияние ЖЖ сказывается на результатах поиска Яndex. Желая пополнить свой RSS-ридер новыми интересными подписками, я искала блоги, посвященные семантической сети (semantic web). На мой запрос Яndex. Поиск по блогам выдал 15579 результатов, релевантных слову «semantic» и больше миллиона страниц, релевантных слову «web». Примерно каждая третья ссылка вела в ЖЖ, на посты с забавными рассуждениями пользователей (отнюдь не специалистов по семантике) о том, почему semantic web — это несерьезная трепотня сумасшедших профессоров / жадных мега-корпораций/ недоучек из Microsoft (они всегда виноваты, как велосипедисты), а первая стоящая внимания ссылка в результатах, упорядоченных по релевантности, оказалась на 45-м месте. На запрос “SEO” блогопоиск от Яndex предложил несколько тематических ресурсов, и на первом месте опять же ЖЖ-комьюнити Ru_SEO.

Здесь, в сервисе Яндекса, я впервые столкнулась с таким явлением, как спамблоггинг — мне попалась страница, которая прикидывалась блогом о семантической паутине, но на самом деле, там оказался фрейм с немецкой порнушкой (ссылку не дам, и не надейтесь). Удивительно, что несуществующие/ удаленные (404) страницы среди первых результатов поиска попадались тоже, хотя, судя по доступным мне серверным логам, робот этого сервиса посещает блоги чуть ли не каждый час.

Google Blog Search

Сервис Google Blog Search с английским интерфейсом выдает не совсем те же результаты, что русифицированный гугловский поиск. Несовпадения временами оказываются существенными, но общего между англо- русско- говорящим Google все же больше, чем между поиском по блогам от Яndex и Google.

На мой запрос “semantic web” Google выдал пол-дюжины тематических блогов (в английской версии эту часть поисковых результатов называют “related sites”, а на русский перевели почему-то “похожие сайты” — между собой они, что ли, похожи?) и сотни тысяч ссылок в общем списке. Я пролистала пару страниц, и в итоге мой RSS-ридер обогатился несколькими интересными подписками. Информации о семантической паутине на английском языке оказалось не в пример больше, и качество ее было ощутимо выше — на первых позициях оказались блоги специалистов, занимающихся разработкой в данной области, а не рассуждения ЖЖ-юзеров о том, почему кругом говно, а я в белом фраке та или иная идея несостоятельна.

Примечательно, что на запрос, сформулированный по-русски («семантическая сеть»), пришло всего 66 результатов, по качеству содержания сопоставимых с ссылками, предложенными Яндексом. Я подумала было, что в России семантика непопулярна и не развивается.

Для чистоты эксперимента, а так же потому, что хотелось найти толковые ресурсы по оптимизации, я задала Google blog search аббревиатуру SEO. В ответ я получила пол-дюжины related сайтов и 560 000 страниц с публикациями на эту тему. Сортировка результатов по дате показывает, что Google не забывает регулярно обновлять свою базу (на запрос SEO самый свежий отобразившийся пост был всего трех часов отроду). И снова улов — парочка любопытных блогов попала ко мне в подписку.

Кто ищет лучше?

Я делала один и тот же поисковый запрос, но получала совершенно разные результаты, хотя обе службы призваны выполнять одну и ту же работу — искать в блогах информацию. Первое объяснение этому — ориентиры на разную аудиторию. Яndex заявляет о приоритете русскоязычных ресурсов, тогда как Google стремится быть интернациональным, в нем очевидна доминанта английского языка, ставшего, как когда-то латынь, языком общения людей, занятых интеллектуальным трудом.

Если вспомнить о том, что блогосфера отражает состояние общественной мысли, то станет понятна и вторая причина разницы между результатами работы двух схожих поисковых систем. Среди зарубежных блогов много информационного мусора, “дыбров” и чепухи, но не мало и толковых профессиональных ресурсов, специализирующихся на определенной тематике. В ЖЖ, на который приходится значительная доля всех русскоязычных блогов, мусора предостаточно, а вот журналов, создаваемых профессионалами для профессионалов, практически нет. Наша блогосфера существует не в постах, а в комментах. Нам, таким широким, душевным людям, что, как сказал Достоевский, “сузить бы надо”, важнее поговорить, а не поделиться информацией.

Пользоваться сервисом Яndex.Поиск по блогам лучше всего тогда, когда вы хотите получить срез мнений русскоязычного населения Интернета о чем угодно. Российские онлайн-магазины, телевидение, музыка, реклама, местные власти, политика — все это горячо обсуждается в блогах, написанных на русском языке, и Яndex найдет самые актуальные публикации на данные темы.

Google blog search ищет информацию по русским блогам не так резво, как Яndex и не придает большого значения платформе liveJournal, но в нем проще находить специализированные ресурсы.

6 мая 2006 г.

Yandex посинел?

Ресурс Searhengines.ru пишет о появлении новой поисковой системы Adre с открытыми исходными кодами на базе механизма Nutch:

“система не только дает доступ к исходным кодам, но и предоставляет свободный доступ к данным каталога Adre.ru (в виде XML)”.

Название статьи (Оптимизаторы скоро лишатся работы?) придумано с расчетом если не эпатировать публику, то, как минимум, вызвать некоторое любопытство. Думаю, что компания Adre, разместившая пресс-релиз на Searchengine.ru, добилась своей цели, потому что я ощутила в себе желание поспорить. И не только я. На блоге СоНоты читаем:

“Наверняка в ближайшем будущем появятся и другие поисковики, специализированные, вертикальные и т.п., построенные на движках с открытым исходным кодом. Тем самым работа у оптимизаторов не убудет, несмотря на то, что все алгоритмы ранжирования будут открыты. Как минимум оптимизаторам придётся заботиться о том, чтобы подопечные сайты хорошо ранжировались в максимально возможном числе таких поисковиков (конечно не забывая о столпах: Яндекс, Рамблер, Google).”

По своему опыту знаю, что большинству клиентов фиолетово — открыт код или закрыт. Клиент умеет вести торговлю, но не разбирается в коде, поэтому платит деньги тому, кто занимается кодингом, но не умеет вести торговлю. Все просто.

Кстати, по поводу цветовой гаммы. Вам внешний вид новой системы ничего не напоминает?

И последнее: если у вас так же, как у меня, на главной не будут раскрываться ссылки на все остальные страницы поисковика, поставьте в адресе www, помогает :)