Вот я теперь в непонятках... Кодировку-то я поменял в заголовке, но подействовало, или нет - пока не знаю, и вообще, правильно ли поступил. И вообще, как реагирует робот жж на редирект русского апача...
Хотел к тебе, кстати, за помощью обратиться, но потом постеснялся...
Судя по сбою кодировки, ЖЖ-шный робот маскируется под нормальный браузер, и русский апач ему подсовывает Win-кодировку. Причём не только в HTTP-заголовке (это ещё ладно), но и сам XML выдаёт в CP1251. А поскольку в начала файла написано <?xml version="1.0" encoding="KOI8-R"?>, то роботу башню и сносит. Надо уж либо в XML-е CP1251 прописать либо я даже не знаю, что... лучше, конечно, русский апач отключить:)
Ошибка у него какая-то странная -- непонятно, 500 или parse error? XML-то там, вроде, вполне правильный.
Не! Кои я поставил только после того, как у меня в ленте вылезла абракадабра! стояла-то там 1251. И то, что сейчас в жж - это то, что он нафетчил с 1251. я сменил кодировку в заголовке и добавил запись. Жду, что будет, когда робот дойдет
Ага, похоже, заработало. Но всё равно это не есть хорошо. Если ты будешь этот фид выставлять публично, то клиентские читалки (которые обычно работают через MSIE и от его имени -- т.е. получат текст в CP1251) могут таких игр с кодировками и не понять. У меня так с Кулером было -- он тоже выдавал RSS через русский апач, и мой ActiveRefresh его не мог правильно прочесть.
no subject
Date: 2004-01-07 04:24 pm (UTC)no subject
Date: 2004-01-07 04:31 pm (UTC)Кодировку-то я поменял в заголовке, но подействовало, или нет - пока не знаю, и вообще, правильно ли поступил.
И вообще, как реагирует робот жж на редирект русского апача...
Хотел к тебе, кстати, за помощью обратиться, но потом постеснялся...
В данный момент имею
Последняя проверка: 2004-01-07 23:30:40 (Parse error)
Сообщение об ошибке: 500 read timeout
это из http://www.livejournal.com/userinfo.bml?user=aug32_afisha
фид, соответственно, здесь:
http://aug32.hole.ru/afisha/feed.php
no subject
Date: 2004-01-07 04:45 pm (UTC)Судя по сбою кодировки, ЖЖ-шный робот маскируется под нормальный браузер, и русский апач ему подсовывает Win-кодировку. Причём не только в HTTP-заголовке (это ещё ладно), но и сам XML выдаёт в CP1251. А поскольку в начала файла написано <?xml version="1.0" encoding="KOI8-R"?>, то роботу башню и сносит. Надо уж либо в XML-е CP1251 прописать либо я даже не знаю, что... лучше, конечно, русский апач отключить:)
Ошибка у него какая-то странная -- непонятно, 500 или parse error? XML-то там, вроде, вполне правильный.
no subject
Date: 2004-01-07 04:53 pm (UTC)Кои я поставил только после того, как у меня в ленте вылезла абракадабра!
стояла-то там 1251. И то, что сейчас в жж - это то, что он нафетчил с 1251.
я сменил кодировку в заголовке и добавил запись.
Жду, что будет, когда робот дойдет
no subject
Date: 2004-01-08 02:12 am (UTC)Но всё равно это не есть хорошо. Если ты будешь этот фид выставлять публично, то клиентские читалки (которые обычно работают через MSIE и от его имени -- т.е. получат текст в CP1251) могут таких игр с кодировками и не понять. У меня так с Кулером было -- он тоже выдавал RSS через русский апач, и мой ActiveRefresh его не мог правильно прочесть.