Собственно, проблема заключается в том, что имя домена и текст ссылки приходят в разных кодировках. Анкор и околоссылочный текст - в UTF-8, а домен - в windows-1251.
Я решил не трогать клиент, а поправить свой модуль, выводящий сапу, благо он один на все сайты.
Предполагается, что файл с этим кодом сохранен в кодировке windows-1251:
// вот так получаем блок ссылок
$block_html = $sape->return_block_links(3, 0, array(
'block_orientation' => 0,
'block_no_css' => true
));
// найдем в нем все последовательности буков в windows-1251
// и заменим на такие же, но в utf-8
$block_html = preg_replace_callback(
"~[а-я]+~i",
function($matches) {
return iconv('windows-1251', 'utf-8', $matches[0]);
},
$block_html
);
После этого в $block_html должен оказаться HTML-код, пригодный для вывода на экран, целиком в utf-8.
Обратите внимание, в качестве коллбэка используется анонимная функция. Это значит, что для PHP < 5.3 нужно преобразовать ее в не-анонимную и вызвать по имени. Ха-ха, лузеры, обновитесь уже :)
Если вдруг сапа сама решит починить этот момент, такой код продолжит незаметно работать вхолостую, и его надо будет при случае грохнуть, чтобы не расходовал ресурсы.
Сегодня в рубрике "культура и обычаи современных хипстеров" мы поговорим о суевериях. Хотя хипстеры считают себя прогрессивными представителями социума, за счет своей инфантильности они зачастую оказываются очень суеверны. Вчера в магазине "Республика" молодые люди рассуждали о совместимости полов по гороскопу (почитать про совместимость можно тут: http://azodiak.ru/muzhchina-oven-i-zhenshhina-strelec-sovmestimost), в частности прозвучало утверждение, что мужчина-хипстер-овен вполне может ужиться с женщиной-хипстером-стрельцом. Что ж, совет да любовь, че!