Занимательный ЛС: парсер

Был неприятно удивлен ковырянием на дне парсера ЛС некоторыми особенностями обработки текста.


  1. Оказывается, парсер ЛС спасает его пользователей от гневных топиков с множеством знаков восклицания, а именно — вы не сможете неразрывно напечатать больше 3-х знаков восклицания подряд:
    
    !!!
    

    все они будут заменены на это количество. Но также парсер считает что два знака восклицания это тоже не кошерно, поэтому и два знака восклицания станут тремя:

    !!! — здесь 4 шт
    !!! — три
    !!! — было два


    но после публикации все равно будет 3.

  2. Тоже самое касается и точек

    ...


    сколько бы вы их не поставили подряд — их будет только 3:

    … — их тут семеро.

  3. А также это касается ?..... и !..., причем, если написать код:

    
    А также это касается ?..... и !.....
    

    то парсер его заменит на:
    
    А также это касается?.. и!..
    

    также текст будет по-другому обработан если, например, заключить его в какой-нибудь тег (как в примере — жирный) и тогда данная уловка не сработает. И вообще в различных комбинациях тегов текст будет обрабатываться по-разному.


Это все не касается тега
кода
и
цитаты

А вот вопросительных знаков разрешается ставить сколько угодно.

Возможно, кому-то это было интересным, ведь раньше вряд ли кто-то это замечал.

З.Ы. Посмотреть самому можно в jevix.class.php в

protected function punctuation()

25 комментариев

avatar
Хмм. Странная логика, интересно для чего она сделана именно такой…
avatar
чтобы из блога не превращать в сборище… так уж и быть, в сборище восклицательных и вопросительных знаков
avatar
Учите русский язык, господа, в ЛС все еще очень даже хорошо.
Для начала почитайте что такое восклицательный знак (и другие) ru.wikipedia.org/wiki/%D0%92%D0%BE%D1%81%D0%BA%D0%BB%D0%B8%D1%86%D0%B0%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D0%B7%D0%BD%D0%B0%D0%BA
А потом спрашивайте у специалистов, если сами не можете разобраться.
forum.eksmo.ru/viewtopic.php?t=16731
www.gramota.ru/spravka/buro/?page=59
avatar
тема не о русском языке, а об особенностях работы парсера, который встроен в ЛС, которые скрыты даже не в его конфиге, а глубоко в самой библиотеке. Я, например, только вчера увидел это.
avatar
Видимо, NeAngel только что пришел(шла) с электива по лингвистике.
avatar
А если много пробелом написать (боле 5 пробелов)вот так например…
avatar
+ к топику, пробелы тоже кушаются:
— Проблемы -> < — (более 5)
— Табуляция -> < — (более 5)

как видим, тоже обрезается.
avatar
Парсер тут ни при чем, это особенности разметки.
avatar
кстати да что то я не подумал что такое возможно.
avatar
Был неприятно удивлен ковырянием на дне парсера ЛС некоторыми особенностями обработки текста.
Вообще-то Jevix это свободная библиотека для типиграфирования текста. Уже лет 5 как… или того больше.
avatar
Спасибо, а то за много лет не знал что там стоит. Я речь вел о том, что не копался в исходниках жевикса и не знал о таких мелких возможностях.
avatar
Офигеть, я уж на что далека от программирования и от сайтостроения в целом, и то давно знаю все выше описанное; значит, это вообще все знают, и оч странен мне удивленный тон поста. Никогда бы не подумала, что на такую очевидную тему можно что-то писать — и пост никто не заминусует! Давайте вообще описывать своими словами движок и попадать с этим на первую страницу, ха-ха-ха.
avatar
и то давно знаю все выше описанное;
Что вы знаете? Правила русского языка? А текст о чем? Или вы на пару с NeAngel решили блеснуть?
и оч странен мне удивленный тон поста
Проходите мимо. Странности привлекают.

Давайте вообще описывать своими словами движок и попадать с этим на первую страницу, ха-ха-ха.
Давайте. Делайте. Можете начать с документации. А то много таких было которые хотели что-то сделать и исчезли. А вы наверное после этого комментария сразу в бой пойдете?.
avatar
Ну вот теперь, после нервных четырех минусов, стало совершенно понятно, что Пснет имеет права администратора, он же ставит минусы, руководствуясь только своей нервностью, и он же выводит свои посты на главную, какими бы никчомными они ни были.
avatar
вам, я вижу, совсем плохо.
какими бы никчомными они ни были.
перечислите, пожалуйста, мои никчемные посты. А меня за грамматику журили.

З.Ы. Надо кому-то показать этот комментарий, ржать будем вместе.
avatar
Вы только и делаете, что ржоте, унижаете и лишаете прав своих пользователей; думаете, кто-то удивится? Над вами ржут не меньше, кстати; молва о жлобском отношении на вашем сайте к покупателям — идет впереди вас; и вы это знаете, конечно: вы все читаете хотя бы хабр.
По существу: этот пост — никчомный пост. Ему не место на главной.
avatar
унижаете и лишаете прав своих пользователей;
где и кого?
Над вами ржут не меньше, кстати;
только вот вы пытаетесь.
молва о жлобском отношении на вашем сайте к покупателям — идет впереди вас; и вы это знаете, конечно: вы все читаете хотя бы хабр.
на каком моем сайте?

Я так и не понял — что вас сегодня с утра укусило что вы ко мне прицепились?

По существу: этот пост — никчомный пост. Ему не место на главной.
Правильно, нужно Максима попросить чтобы выдать вам скипетр — будете управлять и направлять нужные посты (как вам угодно) на главную. Всех остальных пользователей — в подвал, а то что это они тут пишут и голосуют?
avatar
Как во всех девчачьих драках, вам важно последнее слово. Ну, давайте, я вот это напишу, а потом вы свою реплику глухой скандалистки; и я вам отвечать не стану, ваше слово будет последнее, обещаю. ))
avatar
поумничали, а теперь дайте ответы на вопросы из пред. комментария.
комментарий был удален
комментарий был удален
комментарий был удален
avatar
А можно ли направить подобное вмешательство в пользу — бороть тех, кто пишет капсом?
Например если больше 10-20 букв подряд большие, то превращать их в маленькие. Желательно оставляя заглавными знаки нового предложения.
avatar
Да, написать код которого там нет.
avatar
А еще в тексте топика съедается пробел перед знаком препинания. Я так понимаю это тоже дело рук парсера? Как решить эту проблему?
Нужно что бы была возможность в топике написать например так
слово , слово
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.