05.09.2011
Вот например понадобилось мне сделать тематический поиск ?у, я как бы знаю, что лучше сразу забить, дело гиблое, прошлый век и т.д - однако понадобилось, не вдаваясь в детали.
Есть куча доменов (штук 500 для начала), как-то там отобранных, где мой поиск должен что-то находить ?елательно, конечно, все что нужно находить ?ходные данные такие:
- хостов - 500 штук
- документов - в пределах миллиона
- держать индексатор+поиск у себя - никакого желания
- зато легко можно обвешаться рекламой что твой московский метро до собянина
- и хорошо бы как-то своими руками настраивать отображение серпа
Насоветуйте чего-нибудь ? пока под катом напишу, что вспомнилось.
Еще много букв →
06.03.2008
Народ в очередной раз задался вопросом, как бы так закрыть часть документа от индексации, чтоб при этом все было валидно ?о мотивам статьи от Ayavryk'а сделал свой вариант.
В основе лежит ровно та же идея: отдаем на клиент документ, в котором контент, не предназначенный для индексации, спрятан в комментариях, а затем при помощи XSLT достаем его оттуда.
Основная засада заключается в том, что Mozilla Firefox не знает о disable-output-escaping, поэтому исходный метод переставал работать, если в контенте, который мы прячем, встречались вложенные теги ?обственно, эту проблему я решил черезвычайно тупо: дополнительным XSL-преобразованием на сервере.
Еще много букв →
01.02.2008
Представим, что у нас есть система, в которой каждый модуль собирает кусок XML-дерева ?отом результат каким-то образом проворачивается через XSLT-процессор и отдается юзеру ? нас есть желание закэшировать результат работы модуля средствами файловой системы ?обственно, я придумал 3 способа как это сделать и набросал небольшой тестик ?одробности под катом.
Еще много букв →
|
|