Тема: Поддержка UTF-8
Добрый день
Есть ли проблемы с UTF у данного движка?
Если нет - не дадите небольшое how-to по смене кодировки на UTF-8 (интерфейс iconv'ом уже переконвертировал)?
Вы не вошли. Пожалуйста, войдите или зарегистрируйтесь.
PunBB 1.2 → Установка и настройка → Поддержка UTF-8
Чтобы отправить ответ, вы должны войти или зарегистрироваться
Добрый день
Есть ли проблемы с UTF у данного движка?
Если нет - не дадите небольшое how-to по смене кодировки на UTF-8 (интерфейс iconv'ом уже переконвертировал)?
Вроде как работает. Например, на mozilla.ru форум в UTF. Правда, он у них "глобоко замодированный".
с ЛЕМЪ МЕ ПЮАНРЮЕР ОНХЯЙ РЕЙЯРЮ МЕ ascii Б UTF-8 - БННАЫЕ МЕ БШДЮЕР ПЕГСКЭРЮРНБ.
йРН-МХАСДЭ ГМЮЕР ЙЮЙ КЕВХРЭ?
вот сейчас попробовал установить utf-8 кодировку.
на локальной системе денвер+мускуль4+пхп4
взял редактор и все файлы русские переохранил в utf8
затем создал базу и сделале ей коллате utf8
потом установил форум, потом в файлах где встретилось iso-
заменил на utf-8
поставил русский язык в профиле- все окей.
Да не тут то было:

тоесть русская заглавная "И" и строчная "ш" превращаются в какую то гадость.
но на хостинге - все работает нормально..
и еще - когда я делаю эту же строку например в имени темы - она говорит что длина не может превышать 70 символов...
оттакота..
Кто мне сможет доходчиво объяснить, зачем на ру форуме UTF-8?
Точнее нафига, делать лишнюю работу, ведь и так всё работает отлично.
maximum
в этой теме есть сообщение - http://punbb.ru/viewtopic.php?pid=3274#p3274
Если бы в то время на форуме был утф, мы бы прекрасно понимали, что там было написано.
Всё равно - win-1251 для ру аудитории лучше, если и делать выбор.
Всё равно - win-1251 для ру аудитории лучше, если и делать выбор.
Аудитории монопенисуально, что там в тегах написано, win-1251, утф или ещё что, ей больше по душе когда они видят то, что ожидают увидеть, а не кракозябры.
Кто мне сможет доходчиво объяснить, зачем на ру форуме UTF-8?
Спецзнаки?
Что есть "спецзнаки", общаюсь с компьютером уже 11 лет, и досихпор незнаю. ![]()
Что есть "спецзнаки", общаюсь с компьютером уже 11 лет, и досихпор незнаю. big_smile
Не вот это - ©?
Кто мне сможет доходчиво объяснить, зачем на ру форуме UTF-8? Точнее нафига, делать лишнюю работу, ведь и так всё работает отлично.
пожалуйста:
у меня форум по боевым искусствам. как вы думаете - товарищи из китая могут должны иметь возможность писать на ПУТУНХУА? иероглифами?
а теперь представьте что я хочу читать и ероглифы и русские - на одной страничке
Добавлено Wed Dec 6 02:56:17 2006 :
ну что - поможете мне? - правда - надо ОЧЕНЬ!!!
помогите!
надо чтото изменить теперь в конфиге - чтобы длины всех полей пришли в норму!!!
и тчобы потом такого же глюка не вылазило, как щас на денвере (у зхочтера итак не вылазит, но тут то вылазит - и мне неспокойно!!!
А вы не считаете, что китайцам на вашем форуме не место?
Да читайте, кто вам мешает, правильное отображение возможно, если даже на странице жёстко не прописана кодировка.
maximumб utf-8 полезен для русскоязычного форума:
- не надо лишать себя возможности использовать любой язык, кроме русского. понадобится вставить какой-нибудь литовский умляут или иероглиф - пожалуйста.
- медленно, но верно в УРЛах появляются символы сверх 8bit ascii. если не хочешь проблемм со ссылками с форума - используй UTF, тогда ссылка вида "somesite.ru/пейзажи/" будет правильно читаться и правильно работать.
- аргументы типа "Opera - фуфло, Windows - must die, Китайцы - пофигу" - это детский максимализм. форумы создаются не для себя, а для людей. надо учитывать их потребности, а не свои.
по моему опыту сложности с punbb+utf сводятся к поиску НЕмультибайтных строковых функций в движке и плагинах и замене их на mb_* аналоги.
кстати, в моем денвере mbstring отсутствовал - пришлось апгрейдить PHP
А для меня главный (-) utf8 - это то что трафик на таких сайтах чуть ли не в 2 раза больше, чем мог бы быть (трафик дорогой).
А для меня главный (-) utf8 - это то что трафик на таких сайтах чуть ли не в 2 раза больше, чем мог бы быть (трафик дорогой).
при условии gzip компрессии (а она практически на всех форумах) - трафик почти не увеличивается ![]()
при условии gzip компрессии (а она практически на всех форумах) - трафик почти не увеличивается
Здесь слово "почти" - не аргумент.
70 тысяч символов win1251 страницы ужимается в 12 килобайт
70 тысяч символов utf8 страницы ужимается в 18 килобайт.
Кому-то покажется несущественной мелочью, а для меня не совсем. И я предпочту форуму на utf8 форум на win1251
Мне иероглифы не нужны. И недостатков в win1251 кодировки лично я не вижу. Если бы в ходу был дореволюционный русский (с ятями и фитами), тогда можно было бы еще и подумать.
Увеличение трафика пожалуй самый серъёзный аргумент "против"
если кто плохо прочел - форум посвящен боевым искусствам. в том числе например было бы очень удобно писать не "беый журавль машет крыльями" и не "бай хе лян чи" а прямо иероглифами выводить.
кроме того как вы понимаете (тоесь видимо не понимаете) люди кои занимаются китайскими единоборствами - они с китайцами общаются, японскими - с японцами, корейскими.. нц вы поняли, да?
а еще есть бразильско-африканская капоэйра.. хихи)
вобщем пока я понял что моих нулевых знаний не хватит чтобы сделать форум в UTF.
буду ждать пока какой нибудь добрый человек напишет руководство (по шагам - как хаки) - как взять и настроить намано русскоязычный utf - punbb форум и чтобы там всякие страхи потом не преследовали по поводу пропажзи заглавных И и строчных ш, и чтобы наманая длина полей была (названия и т.п.) и чтобы поиск был без различий строчных/заглавных...
Ну ты вроде все правильно для утф сделал. Punbb.ru тоже в утф. Дриугое дело что денвер сам по себе инструмент непригодный для подобных экспериментов. К примеру у меня на винде дома стоит бигапач (сборная солянка из всех необходимых компонентов) немного старый. мускул + пых я сам ставлю. И все нормально работает. Заметь, что и на хостинге у тебя все нормально работает, так что ищи причину в денвере (выкинь его и поставь всё сам).
70 тысяч символов win1251 страницы ужимается в 12 килобайт
70 тысяч символов utf8 страницы ужимается в 18 килобайт.
другими словами добавка порядка 50% ???
Извини, но приведенные цифры вызывают сомнения. Давай внесем ясность для потомков.
Русский непожатый текст в UTF больше аналогичного win1251 почти в два раза. Почти - потому что символы пунктуации, пробелы проч. спецсимволы укладываются в один байт.
Теперь взгляни на html код вот этой страницы форума - это локализованный форум с русским текстом внутри, но русские буквы занимают примерно половину всего объема - то есть прирост на UTF составит порядка 25%.
Теперь жмем его gzip - спорю на шелбан (c) - разница получится еще меньше. С учетом графики, css, js и служебного трафика прирост объема становится совсем мизерным - не более 3-5%.
Все эти выкладки я привожу именно для форума. Мы ведь обсуждаем утфикацию punbb?
да какая разница?????????
человек ходит на форум по ПАНбб а не на форум с русской кодировкой!!!
и ко мне человек пойдет, даже если я щас все переведу на ipb1.3 или фообще на какой нибуть левый движок.. - потому что в Омске других форумов по боевым искусствам НЭТУ.
просто будет НЕ удобнее пользоваться. И мне очевидно что понадобится поддержка иероглифов - а значит када бы ее сделать - будеть УДОБНЕЕ пользоваться. потому и надо ее сделать.
Ну ты вроде все правильно для утф сделал. Punbb.ru тоже в утф. Дриугое дело что денвер сам по себе инструмент непригодный для подобных экспериментов. К примеру у меня на винде дома стоит бигапач (сборная солянка из всех необходимых компонентов) немного старый. мускул + пых я сам ставлю. И все нормально работает. Заметь, что и на хостинге у тебя все нормально работает, так что ищи причину в денвере (выкинь его и поставь всё сам).
насчет денвера - я уже понял. Я про другое - меня напугали что в утф неправильно работает поиск и это связано в регистром какимто.. кроме того не подсвечиваются какие то результаты поиска (модом хайлайтсеарчрезультс) и главное - в чем я сразу же столкнулся - -
он не дает делать имя темы (например) нормальной длины. 35 символов мало.
я давно-давно видел тему - там говорилось где чо зменить чтобы стало например не 70 а 140, да тока ведь он будет на 70-ти уже орать - что максимум 140 ![]()
меня это смущает.
и еще смущает что - ПОЛЕЙ ТО ЦЕЛАЯ КУЧА. я даже не знаю всех полей в которых надо максимум символов увеличивать ![]()
может кто что по этому поводу напишет умного???
maximum пишет:Что есть "спецзнаки", общаюсь с компьютером уже 11 лет, и досихпор незнаю. big_smile
Не вот это - ©?
Не только, и даже не столько.
Интересуют, в первую очередь, тире, неразрывный пробел, правильные кавычки-елочки, разрывный моноширинный пробел, лигатуры (Æ, Œ,æ œ), ударные буквы (á, ó). Ну и прочая шушера: §, µ, ζ, λ, ξ, π, φ, ‰.
еще в копилку "how-to по utf-8":
если провайдер использует "Русский Апач" и у вас возникают необъяснимые глюки с кодировками, попробуйте поместить в .htaccess такие строчки:
CharsetDisable On
AddDefaultCharset utf-8
CharsetRecodeMultipartForms Offпоследняя строка помогает, есои не аплодятся картинки на сервер на Русском Апаче. прямого отношения к PunBB это не имеет, но пока есть проблемы с хостингом вообще - будут и с форумом в частности ![]()
Чтобы отправить ответ, вы должны войти или зарегистрироваться
PunBB 1.2 → Установка и настройка → Поддержка UTF-8
Форум работает на PunBB, при поддержке Informer Technologies, Inc
Сгенерировано за 0.089 секунды (86% PHP — 14% БД) 11 запросов к базе данных
Технологии с открытым исходным кодом, несомненно, обладают серьезным преимуществом над аналогичными продуктами, распространяемыми по ограниченным лицензиям. И совершенно неважно, что это. Возможно это:
Впрочем, неважно. Что бы это ни было, важно всячески поощрять и поддерживать Open Source в любом виде. Тем более, что вы знаете, PunBB распространяется по лицензии GPL/GNU. И спасибо за внимание.