Тим Бернерс-Ли: Google придется потесниться

Тим Бернерс-ЛиСоздатель Would Wide Web Тим Бернерс-Ли (Tim Berners-Lee) заявил TimesOnline, что Google будет вытеснен новой структурой Всемирной паутины так называемым Semantic Web (семантическая паутина). Над этим проектом Тим Бернерс-Ли работает уже много лет. Он считает, что Google хорошо работает только с текстовыми интернет-страницами, но сегодня интернет представляет собой гораздо более разнообразную информацию и для ее объединения методов Google уже недостаточно.

Тим Бернерс-Ли возглавляет Консорциум WWW (The World Wide Web Consortium – W3C), который основан MIT (Massachusetts Institute of Technology and the University of Southampton). Здесь уже много лет продолжаются исследования Semantic Web. Читать далее Тим Бернерс-Ли: Google придется потесниться

Морфологический анализатор — php библиотека

Open Source библиотека по морфологическому анализу текстов — русских, английских, немецких.

http://sourceforge.net/projects/phpmorphy/

features

  • Для входного слова умеет находить:
  • — Псевдо корень
  • — Нормальную форму
  • — Все словоформы
  • — Грамматическую(и не только ;)) информацию
  • Скорость нахождения нормальной формы ~700 слов в секунду(это для php5.1.1, WinXP, Duron-800), имеется возможность загрузить словарь в память, при этом скорость возрастает примерно на 20-25%.
  • Основной словарь содержит около 3млн словоформ
  • Есть два режима предсказания ненайденных слов – по суффиксу и по специально подготовленному словарю(подробнее см. http://www.aot.ru/docs/sokirko/Dialog2004.htm, я реализовывал этот алгоритм). Качество предсказания — так себе… ;)
  • Размер словаря ~4Mb
  • Для работы необходим php4.3.x, php5(пробовал php4.3.7 и php5.1.1)
  • Лицензия LGPL

В качестве основы был взят проект AOT, в частности словари и алгоритм предсказания были взяты из него.

Homepage: phpMorphy
Demo: phpMorphy — Demo

Документации пока нет(ибо опенсурс ;)), но есть example.php в дистрибе ;). Будут вопросы\пожелания задавайте

PS: библиотека понемногу развивается, вот скорость уже стала в 2 раза выше. Следите за проектом, надеюсь что автор его не забросит.

Как определить непот?

Методика с форума

В последнее время на форумах активно обсуждается методика, позволяющая определить наличие непот-фильтра на сайте. Суть методики в следующем:

  1. Проверяется индексация отдельной взятой ссылки на платной площадке
  2. Задается следующий запрос («запрос»<<url=»www.мойсайт.ru»).
  3. Далее задается запрос anchor#link=»www.мойсайт.ru»[«запрос»] Читать далее Как определить непот?

Непот фильтр или просто “непот” — что это такое

Название восходит к термину непотизм или “кумавство”. Раздача римскими папами доходных должностей, высших церковных званий или земель близким родственникам.
В SEO фильтр, скорее всего автоматический, накладываемый на сайты-сателлиты и сайты продающие ссылки. При наложении этого фильтра внешние ссылки со страницы/сайта либо прекращают работать, либо дают более слабый эффект, либо теряют эффект ссылочного.

Гипотезы
По большому счеты существование непота, тоже гипотеза. Эти данные не подтверждены, но есть вероятность, что это так:

Наложение фильтра автоматическое, фильтр может автоматически быть снят.
При наложении фильтра ссылка прекращает передавать ссылочное.
Непот фильтр может накладываться на отдельную страницу (например, на морду).
Наложения непота на сайт не влияет пагубным образом на результаты выдачи сайта по запросу.

Алгоритмы определения непота
Сейчас существует несколько алгоритмом определения непота — оба проверяют, работает ли ссылочное влияние ссылки или нет, путем нахождения страницы донора по анкору ссылки. Один из них сложнее, но выдает более “правильный” результат, другой легче. Под терминами сложность, легкость подрузумеваеться время, которое будет затрачено на определение. Читать далее Непот фильтр или просто “непот” — что это такое

За какие слова Adwords-рекламодатели платят больше $1,000,000 в месяц?

Google периодически публикует список самых дорогих ключевых слов в Adsense. Но являются ли фразы с высокой ценой клика самыми прибыльными с точки зрения адсенсного сайта? Для ответа на этот вопрос нужно знать не только стоимость, но и количество кликов в месяц.

С помощью базы ключевых слов мы провели исследование, в котором получили список слов, за которые Adwords-рекламодатели платили в 2006 году больше $1,000,000 в месяц: Читать далее За какие слова Adwords-рекламодатели платят больше $1,000,000 в месяц?

Поисковые операторы Google

Этот систематизированный материал, собранный из открытых источников и проверенный на собственном опыте, может пригодиться как карманный справочник при составлении сложных комплексных запросов для Google. Таблица разделена на пять колонок: оператор, область его применения (другими словами, базы данных Google, в которых данный оператор работает наилучшим образом), пример запроса, если он необходим, и примечания. Последняя колонка нужна в первую очередь для того, чтобы выделить операторы, требующие особого отношения. Некоторые из них, например, не могут применяться в одиночку или плохо сочетаются с другими операторами — это важный нюанс, о котором лучше знать заранее. Читать далее Поисковые операторы Google

Favicon — как сделать иконку (favicon.ico) для своего сайта или блога

favicon.gif

Чтобы иконка Вашего сайта отображалась в результатах поиска Yandex и в тулбаре браузера нужно сделать вот что:

1. Создать изображение в формате .gif или jpg. Точный размер значения не имеет, но пропорции сторон должны быть одинаковыми, например 150х150 пикселей.

2. Для создания картинки в формате .ico я использую сервис www.favicon.ru. Кроме иконки для поиска и тулбара там можно сделать иконки для Рабочего Стола. Поэтому изображение должно быть не меньше чем 44х44 пикселя. Если иконка получилась немного «кривой» — можно войти в специальный редактор и исправить.

3. Загрузите полученный файл в корневую директорию вашего сервера.

4. В заголовках страниц между тэгами, прописать мета-тэги которые приводятся на сайте www.favicon.ru

Все готово! Наслаждайтесь новым атрибутом персонализации вашего ресурса!

Библиотека сайтостроительства

 Замечательная подборка статей на темы:

Новое в разделе
Управление web-проектами
Web-дизайн
Web-программирование
CSS
HTML/DHTML
Web-графика
Adobe Photoshop
Flash
Оптимизация сайтов
Раскрутка сайта
Интернет-реклама
Рассылка
Инструменты вебмастера
Контент для сайта
Web-студии